张云帆,字节跳动大数据架构工程师,2015 年加入字节跳动,先后负责过 ZooKeeper、Kafka、Storm、Flink 等组件的开发与优化,目前主要专注于 OLAP 方向查询优化方面的工作。
张云帆,字节跳动大数据架构工程师,2015 年加入字节跳动,先后负责过 ZooKeeper、Kafka、Storm、Flink 等组件的开发与优化,目前主要专注于 OLAP 方向查询优化方面的工作。
黄辉,负责字节跳动广告数据平台 Druid 引擎相关工作,在性能优化和应用方面都有深入的探索。曾就职于滴滴出行大数据架构部,负责 Hive 相关的工作,在 Hive 数据治理和权限管理方面都做过探索和实践。
如何从大量的事件中快速有效地分析数据,对决策能够起到至关重要的影响。Druid 是目前比较流行的开源 OLAP 引擎之一,国内外的很多公司都在使用。一方面,Druid 的数据导入即可实时查询,很好的满足了数据实时性需求;另一方面,在数据达到一定规模后,集群的稳定性、数据摄入性能和查询延迟都成为瓶颈。本次分享会介绍字节跳动在大规模数据场景下如何管理和优化 Druid,满足在字节跳动的需求。
最好对 Druid 或者相关 OLAP 系统有一定了解。