Grab 核心派单系统中的高质量数据集的收集与应用

所属专题:高可用架构

所属领域: 架构

嘉宾 : 沈玉梁 | Grab核心派单系统团队负责人

会议室 : 305

讲师介绍

专题演讲嘉宾:沈玉梁

Grab 核心派单系统团队负责人

2016 年加入 Grab, 一直从事派单系统的策略实现与性能调优相关工作。现为 Grab 核心派单系统团队负责人。

议题介绍

地点:305
所属专题:高可用架构
所属领域:
架构

演讲:Grab 核心派单系统中的高质量数据集的收集与应用

Grab 的核心派单系统在不断的演化中逐步引入了机器学习的解决方案以适应快速升级的复杂业务需求。同时,新的解决方案不断提升派单的有效性和准确性。而如何提供实时、高质量的数据集是保证机器学习结果的重中之重。现有派单系统的机器学习模型中,特定区域内的乘客、订单和司机形成了多维度的特征矩阵。假设单一城市平均每秒发生100 个订单请求,每个订单平均需要为 100 个司机进行模型运算,每个司机需要为此提取 50 个特征,而平均生成每个特征需要 10 次额外运算。与此同时,整个系统需要为东南亚几乎所有的重要城市提供派单服务。如何及时生成、存储、提取数百万/秒的特征数据集是整个派单系统内的一个技术难点。我们通过内置于 FeatureBank 系统中的一系列优化策略和降维算法有效地降低了复杂度和延迟,极大地提高了派单结果的准确性和有效性。

主要内容

1. 机器学习对高质量数据集的高度依赖;

2. 如何过滤、提取、存储业务中实时海量的数据集;

3. 高质量数据集在核心派单系统中的应用。

听众收益

1. 了解复杂业务驱动的数据收集与应用;

2. 了解数据网络效应在大规模系统中的实际应用;

3. 了解基于高质量数据集的派单策略与算法调优。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+8613269076283