构建现代化数仓: 将MPP DBMS迁移至Spark

所属专题:大数据系统架构

所属领域: 大数据、 架构

嘉宾 : 俞育才 | eBay大数据架构师

会议室 : 百宴厅4

讲师介绍

专题演讲嘉宾:俞育才

eBay 大数据架构师

俞育才,毕业于上海交大,eBay大数据架构师,负责Spark数据平台的设计与优化。12年软件开发经验,Apache Spark的活跃开发者,熟悉系统软件的性能分析与调优,为Spark设计和实现了自适应执行引擎和层次化存储。在加入eBay之前,俞育才在英特尔工作了9年,领导团队研究各种前沿的硬件技术加速云和大数据计算。

议题介绍

地点:百宴厅4
所属专题:大数据系统架构
所属领域:
大数据、 架构

演讲:构建现代化数仓: 将MPP DBMS迁移至Spark

eBay使用MPP数据仓库已经有二十年的历史,我们的系统有60PB的数据,上万张的核心表,他们支撑着eBay最核心的商务逻辑和站点功能。从17年开始,eBay将这个庞大的数仓向Spark做迁移,使用我们开发的工具,这其中90%的工作都可以自动化地完成,并且通过优化Spark框架,我们节省了一半的内存。本次演讲我们将分享这迁移过程中的实践,经验与优化。

听众受益

  • 自动化数据迁移工具集:元数据管理,SQL转换器,管道生成器,数据验证,工作流控制等;
  • 数据的物理布局:如何对表做bucket和partition;
  • 使用Spark的Adaptive Execution简化参数配置,优化内存使用,处理数据倾斜;
  • 使用Spark的Indexed Bucket提升大量核心表的查询性能。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:17310043226