10 年+ 研发和广告系统架构设计经验,先后负责过广告检索系统、⽤户画像系统,最近一直负责特征⼯程平台建设,解决广告业务中多模型对特征的存储、计算方⾯的问题,致力于通过⼤数据研发解决机器学习中数据⼯程问题,提升模型优化的效率和效果,发挥数据的价值。对大数据研发、分布式存储计算、深度学习系统建设有着浓厚的兴趣。
10 年+ 研发和广告系统架构设计经验,先后负责过广告检索系统、⽤户画像系统,最近一直负责特征⼯程平台建设,解决广告业务中多模型对特征的存储、计算方⾯的问题,致力于通过⼤数据研发解决机器学习中数据⼯程问题,提升模型优化的效率和效果,发挥数据的价值。对大数据研发、分布式存储计算、深度学习系统建设有着浓厚的兴趣。
在 AI+Big Data+Cloud Computing 的时代里,从海量数据⾥提炼出特征,并通过深度学习进行模型优化来提升⼴告投放效果。为了系统化地解决广告系统在初选、精选阶段上多模型优化中对特征数据的需求,我们建设了统⼀的特征工程平台。本分享简要介绍广告系统如何使用模型特征优化业务指标,重点介绍特征工程平台的架构,包括特征生产、存储和计算调度等工作内容,最后给出如何系统化地解决多模型的特征共享,调研环境和⽣产环境下的计算优化,特征在线与离线应⽤上的数据一致率等问题。
内容大纲:
听众受益: