LinkedIn Derived Data Platform

所属专题:硅谷人工智能与云计算技术

所属领域:

嘉宾 : 严岩 | LinkedInStaff Engineer

会议室 : 第五会议厅CD

讲师介绍

专题演讲嘉宾:严岩

LinkedIn Staff Engineer

严岩,拥有10年从业经验,先后就职于Oracle、人人网、Google、LinkedIn,体验过从传统软件行业到互联网行业的转变,也历经了从国内到硅谷的工作生活变迁。曾任人人网高级架构师、技术委员会主席,负责基础架构部门,主导搭建了人人网大数据平台。

2015年加入LinkedIn Data Infrastructure部门,参与开发分布式key-value数据库Voldemort。现负责构建LinkedIn新一代deserved data platform,整合了从批量计算和实时计算获取的多种数据源,并通过跨大洲的多机房备份,为上层系统提供全球范围内可靠的高性能的数据服务。

议题介绍

地点:第五会议厅CD
所属专题:硅谷人工智能与云计算技术
所属领域:

演讲:LinkedIn Derived Data Platform

本次分享将介绍Linkedin derived data platform以及其如何帮助Linkedin更好的管理机器学习的结果数据集。

主要内容

  1. Linkedin机器学习的基本流程,着重于如何将结果数据集应用于线上application,并阐述原有流程的痛点。
  2. 介绍derived data platform的整体设计以及几个关键技术点,例如如何合并批量和实时数据。
  3. 通过几个实例,例如数据标准化和相关性计算,来介绍derived data platformr如何存储海量结果数据集,并为线上application提供高可用,高性能的服务。
  4. 最后将总结在新平台上线和迁移过程中的一些经验,例如如何进行对用户无感知的迁移。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方