Twitter ZB 级实时数据分析实践

所属专题：实时数据分析

嘉宾 : 罗震霄 | Twitter Sr. Staff Engineer

会议室 : 第二会议厅B

讲师介绍

专题演讲嘉宾：罗震霄

Twitter Sr. Staff Engineer

罗震霄负责 Twitter 大数据引擎的开发与运营，主要负责项目 Druid、Prest、Spark、Hive。在加入 Twitter 之前，在 Uber、Netflix、Facebook 从事大数据相关的研发与管理工作。是 Presto Foundation committer 和技术委员会委员。他于复旦大学获得学士学位，并于 University of Wisconsin Madison 获得硕士学位。

议题介绍

地点：第二会议厅B

所属专题：实时数据分析

演讲：Twitter ZB 级实时数据分析实践

对海量数据进行实时查询是 Twitter 一直以来面对的技术挑战，为了提高大数据系统的性能，部署规模，和信息安全，Twitter 大数据团队对 Presto 和 Druid 进行了大量的改进与优化，包括 Presto Druid Connector、Aggregation and Predicate Pushdown、LDAP 为基础的数据授权和安全保护、Druid Native Indexing以及利用缓存对 Druid 性能的提升。本次分享会讨论系统设计和技术实现，以及 Twitter 在实践中遇到的经验和教训。