俞育才,毕业于上海交大,eBay大数据架构师,负责Spark数据平台的设计与优化。12年软件开发经验,Apache Spark的活跃开发者,熟悉系统软件的性能分析与调优,为Spark设计和实现了自适应执行引擎和层次化存储。在加入eBay之前,俞育才在英特尔工作了9年,领导团队研究各种前沿的硬件技术加速云和大数据计算。
俞育才,毕业于上海交大,eBay大数据架构师,负责Spark数据平台的设计与优化。12年软件开发经验,Apache Spark的活跃开发者,熟悉系统软件的性能分析与调优,为Spark设计和实现了自适应执行引擎和层次化存储。在加入eBay之前,俞育才在英特尔工作了9年,领导团队研究各种前沿的硬件技术加速云和大数据计算。
eBay使用MPP数据仓库已经有二十年的历史,我们的系统有60PB的数据,上万张的核心表,他们支撑着eBay最核心的商务逻辑和站点功能。从17年开始,eBay将这个庞大的数仓向Spark做迁移,使用我们开发的工具,这其中90%的工作都可以自动化地完成,并且通过优化Spark框架,我们节省了一半的内存。本次演讲我们将分享这迁移过程中的实践,经验与优化。