阿里巴巴Blink流计算平台介绍与实践

所属专题:深度培训

嘉宾 : 王绍翾(大沙) | 阿里巴巴高级技术专家,Apache Flink Committer

会议室 : 北京·国际会议中心

讲师介绍

培训讲师:王绍翾(大沙)

阿里巴巴 高级技术专家,Apache Flink Committer

王绍翾,淘宝花名"大沙",加州大学圣迭戈分校计算机工程的博士,2015年加入阿里巴巴集团,目前就职于阿里巴巴计算平台事业部。加入阿里之前,曾在Facebook开发分布式图关系数据库TAO。

加入阿里之后,王绍翾一直从事阿里新一代实时计算平台blink的研发工作。早期负责搜索事业部的离线大数据处理,利用半年的时间带领团队将阿里淘宝天猫的搜索离线数据处理的计算全部迁移到了blink计算平台之上。之后负责blink计算平台的查询和优化。用了半年多的时间,打造了一套功能完备高性能的实时计算blink SQL&Table API,并成功的将阿里的实时计算机器学习平台整体的迁移到这套API之上。王绍翾是Apache flink的committer,除了自己,他在团队内部还培养出另外2位apache flink committer。

培训讲师:邓小勇

阿里巴巴 技术专家

邓小勇,阿里巴巴技术专家,流计算平台负责人,曾先后在阿里巴巴搜索、实时数据同步、离线数据同步等岗位任职,并从无有一手搭建阿里流计算平台。经过3年的磨砺,该平台已在阿里集团内部、公共云和专有云服务各类客户。

培训介绍

地点:北京·国际会议中心
所属专题:深度培训

阿里巴巴Blink流计算平台介绍与实践

随着大数据技术的快速发展,“大规模”已经在应用中逐渐落地,“实时流”正在成为应用新的诉求,本课程上半场将首先分析目前开源大数据生态中常用的几种流计算技术;然后重点介绍Apache Flink核心技术,以及阿里巴巴为何选择了Apache Flink;最后介绍阿里巴巴在其自身超大规模和复杂实时业务场景下,对Apache Flink进行深度优化定制发布了Alibaba Blink,以及Blink对Flink的各种改进和社区回馈。

本课程下半场将介绍阿里巴巴基于Blink引擎打造出的流计算平台,并向用户展示在阿里巴巴内部如何利用Flink API快速开发出一套流计算应用,然后介绍如何通过丰富的实时监控指标和工具进行在线分析,以及行业应用经验总结。

上午

(讲师:王绍翾)

1. 开源大数据生态中的各种流计算技术分析

介绍目前开源大数据业界中常用的各种主流流计算技术,例如:Storm,Heron,Sparking Streaming,Flink等,并对比各种流计算技术的优缺点和适用场景,并给出未来流计算技术的发展趋势判断,有助于用户根据自己的场景进行技术选型

2. Apache Flink核心技术讲解

介绍Apache Flink流计算技术的核心概念,系统架构,编程API和生态体系,重点介绍Apache Flink中的几个关键技术点,例如:Checkpoint/State,Window/Watermark和Table API/SQL等,让用户可以快速学习到Flink的核心技术

3. Alibaba Blink技术介绍以及在阿里的应用

介绍Alibaba Bink相对Apache Flink在多项核心架构上进行了优化和扩展,例如:分布式部署架构、调度和容灾能力、Checkpoint/State性能,异步I/O等,以及大幅完善了Table API和SQL。此外,Blink已经将很多改进都贡献回了社区,并产生多名Committer,在社区产生了重要的影响力。

下午

(讲师:邓小勇)

1. 实时流计算应用搭建从入门到精通

首先介绍阿里巴巴基于Blink引擎打造出的流计算平台,并向用户展示在阿里巴巴内部如何利用Flink API快速开发出一套流计算应用,然后介绍如何通过丰富的实时监控指标和工具进行在线分析,例如:任务的延迟、吞吐和反压等信息,让用户快速学习到如何对自己的流计算任务进行分析和调优,开发出高质量的流计算应用。

2. 阿里巴巴流计算经典案例分享和总结

阿里巴巴集团庞大的电商场景以及阿里云平台上都有着丰富的实时业务场景,例如:双11媒体大屏,搜索/推荐/广告,风控预警,IoT和城市大脑等,我们将从这些经典场景中抽取出各种典型案例,以及在这些场景中遇到的问题和深度的思考,向听众分享经验并产生启发。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方