快手大数据架构分布式存储方向负责人,2009 年硕士毕业于中国科学院计算技术研究所,11 年存储领域系统研发经验, 熟悉 Linux 内核存储栈和分布式存储相关技术,先后在中国科学院计算技术研究所、360、快手从事内核文件系统、集群文件系统和 Ceph、HDFS 等分布式存储系统的研发与应用工作。
快手大数据架构分布式存储方向负责人,2009 年硕士毕业于中国科学院计算技术研究所,11 年存储领域系统研发经验, 熟悉 Linux 内核存储栈和分布式存储相关技术,先后在中国科学院计算技术研究所、360、快手从事内核文件系统、集群文件系统和 Ceph、HDFS 等分布式存储系统的研发与应用工作。
海量数据分析正在从离线走向实时,面向行业需求与趋势,Kafka、Flink、Druid、ClickHouse 等引擎随之而生,并获得了快速发展。快手有很多实时计算的场景,如模型实时训练与更新、数据实时分析/监控、日志实时传输等,其业务以及集群规模都非常巨大,对系统造成了很大的冲击,同时也提出了很大的挑战。本次分享将介绍我们在实时处理上所面临的挑战,以及为了应对这些挑战在存储引擎建设上的演进过程。
1. 快手实时处理链路主要场景,以及链路上 Kafka、Flink、ClickHouse 等系统面临的主要问题与挑战
2. 快手的解决方案
1) Kafka 存储计算分离方案:Kafka On HDFS
2) Flink 引擎状态存储分布式化方案:SlimBase
3) ClickHouse 存储计算分离方案:ClickHouse On HDFS
3. 未来计划