如何基于 Flink + Iceberg 构建高时效数据湖

所属专题：实时数据分析

嘉宾 : 胡争 | 阿里巴巴技术专家

会议室 : 第二会议厅B

讲师介绍

专题演讲嘉宾：胡争

阿里巴巴技术专家

胡争，阿里巴巴技术专家，花名子毅，目前专注于 Apache Flink 数据湖的设计和研发。此外，还担任 Apache HBase PMC 成员，著有《HBase 原理与实践》一书。开源技术爱好者，长期活跃在 Apache 开源社区，热衷技术分享。

议题介绍

地点：第二会议厅B

所属专题：实时数据分析

演讲：如何基于 Flink + Iceberg 构建高时效数据湖

数据湖已经成为各个公司的标配，为了更好地帮助 Flink 用户无缝对接数据湖场景，我们联合 Apache Iceberg 社区正积极地推动 Flink 实时数据湖技术方案的落地。

内容大纲

1. 为什么选择Apache Iceberg作为Apache Flink的开源数据湖技术方案

Databricks Delta、Apache Iceberg、Apache Hudi 三个产品的对比
推导得出数据湖技术方案的共同特征
Flink 用户对数据湖方案的需求
推导得出 Flink 数据湖的最终特点及最终选型

2. Flink+Iceberg 实时数据湖的核心场景及应用价值

常用的场景
应用价值

3. 为了落地 Flink+Iceberg 数据湖技术方案，我们在 Apache Iceberg 社区所做的一些工作

Iceberg 现状
Iceberg 对接 Flink，让 Iceberg 能作为 Flink 的 source 和 sink
如何实现增量消费 Iceberg 数据
如何解决低延迟的增量消费

听众受益

理解 Flink 数据湖场景背后的核心需求
了解 Flink 数据湖在 Delta、Iceberg、Hudi三个项目之间的选型以及背后的理由
理解 Flink+Iceberg 数据湖技术方案的核心设计

适合人群

对实时数仓和数据湖比较感兴趣的人群，最好有一些批处流处理的了解。

本专题下其他演讲

关注主办方（InfoQ）

联系我们

交通指南

全球 QCon 大会 2020

扫一扫在手机端查看
在报名过程中如有任何问题，欢迎微信扫描左方二维码联系我们的票务经理



想要批量报名或更多优惠？

立即联系票务小姐姐 Ring

或致电：+86 17310043226

下班了，给我们留言吧

罗震霄

Twitter

Sr. Staff Engineer

张云帆

字节跳动

高级研发工程师

黄辉

字节跳动

高级研发工程师

陈怡

腾讯

高级工程师

丁定华

快手

大数据架构团队分布式存储方向负责人

杨华

T3 出行

大数据平台负责人

覃永靖

奇安信

实时安全分析引擎团队架构师

如何基于 Flink + Iceberg 构建高时效数据湖

所属专题：实时数据分析

嘉宾 : 胡争 | 阿里巴巴技术专家

会议室 : 第二会议厅B

讲师介绍

专题演讲嘉宾：胡争

阿里巴巴技术专家

议题介绍

地点：第二会议厅B

所属专题：实时数据分析

演讲：如何基于 Flink + Iceberg 构建高时效数据湖

内容大纲

听众受益

适合人群

本专题下其他演讲

罗震霄

Twitter

Sr. Staff Engineer

张云帆

字节跳动

高级研发工程师

黄辉

字节跳动

高级研发工程师

陈怡

腾讯

高级工程师

丁定华

快手

大数据架构团队分布式存储方向负责人

杨华

T3 出行

大数据平台负责人

覃永靖

奇安信

实时安全分析引擎团队架构师

关注主办方（InfoQ）

联系我们

交通指南

全球 QCon 大会 2020

伦敦/3月2日-6日

圣保罗/5月4日-6日

纽约/6月15日-19日

北京/10月15日-17日

旧金山/11月16日-20日

上海/12月18日-20日