周家英(徒离),蚂蚁金服资深技术专家,现负责数据技术部在线计算团队。2011 年加入支付宝后,一直参与支付宝数据相关工作。经历了蚂蚁金服从离线数据,实时数据,到目前在线数据的不同的阶段,参与过蚂蚁实时数据平台,Serverless Streaming,在线作业调度,计算元数据,以及新一代计算引擎的建设。熟悉蚂蚁数据技术架构演进历史,对分布式环境下的在线计算场景及高可用方案有切身体会。
周家英(徒离),蚂蚁金服资深技术专家,现负责数据技术部在线计算团队。2011 年加入支付宝后,一直参与支付宝数据相关工作。经历了蚂蚁金服从离线数据,实时数据,到目前在线数据的不同的阶段,参与过蚂蚁实时数据平台,Serverless Streaming,在线作业调度,计算元数据,以及新一代计算引擎的建设。熟悉蚂蚁数据技术架构演进历史,对分布式环境下的在线计算场景及高可用方案有切身体会。
伴随着大数据时代的来临,越来越多的业务场景开始依赖机器学习进行商业上的升级。同时随着计算及 AI 体系的逐步成熟,以及业务对于机器学习的越发依赖,分布式机器学习从传统的离线学习逐渐开始向在线学习演进。相比于传统的离线机器学习,在线学习可以带来更快的模型迭代速度,让模型预测效果更贴真实情况,对于线上的波动更加敏感,因此,一套好的在线学习架构就格外重要。在最近两年,国内的各个一线互联网厂商分别推出自己的在线学习技术体系及相关架构,蚂蚁金服从 2018 年 7 月开始,在基于新的 Ray 分布式引擎之上,自研了金融级的在线学习系统,与传统在线学习框架相比,在端到端延迟,稳定性,研发效率等方面都有不同程度的提高。希望可以通过本次介绍,让大家对于蚂蚁金服的在线计算体系有所了解。