Delta Lake: Open Source Reliability for Data Lake with Apache Spark

所属专题:大数据分析的支撑技术

所属领域: 大数据

嘉宾 : 李潇 | DatabricksEngineering Manager

会议室 : 百宴厅4

讲师介绍

专题演讲嘉宾:李潇

Databricks Engineering Manager

李潇现就职于 Databricks,管理一跨国团队,专注于 Apache Spark 和 Databricks Runtime 的开发和建设。他是 Apache Spark 项目管理委员会成员。本科毕业于南京理工大学,后在佛罗里达大学(University of Florida)获计算机博士学位, 曾就职于 IBM,获发明大师称号(Master Inventor),在数据处理领域发表专利十余篇。(Github: gatorsmile)

议题介绍

地点:百宴厅4
所属专题:大数据分析的支撑技术
所属领域:
大数据

演讲:Delta Lake: Open Source Reliability for Data Lake with Apache Spark

Delta Lake(Delta.io)是一个给数据湖提供可靠性的开源存储层软件。Delta Lake 提供了 ACID 事务性,可扩展的元数据处理,以及统一了流处理和批处理。它可以运行在现有的数据湖,并且完全兼容 Apache Spark APIs [Spark 2.4.3+]。

听众受益

1. 了解 Delta Lake 可以帮助解决哪些数据质量的问题;
2. 如何将你现有的应用转移到 Delta Lake;
3. Delta Lake 的事务协议是如何实现的;
4. Delta Lake 的未来项目规划;
5. Delta Lake 在 Spark 3.0 的使用。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86 17310043226