罗震霄负责 Twitter 大数据引擎的开发与运营,主要负责项目 Druid、Prest、Spark、Hive。在加入 Twitter 之前,在 Uber、Netflix、Facebook 从事大数据相关的研发与管理工作。是 Presto Foundation committer 和技术委员会委员。他于复旦大学获得学士学位,并于 University of Wisconsin Madison 获得硕士学位。
罗震霄负责 Twitter 大数据引擎的开发与运营,主要负责项目 Druid、Prest、Spark、Hive。在加入 Twitter 之前,在 Uber、Netflix、Facebook 从事大数据相关的研发与管理工作。是 Presto Foundation committer 和技术委员会委员。他于复旦大学获得学士学位,并于 University of Wisconsin Madison 获得硕士学位。
对海量数据进行实时查询是 Twitter 一直以来面对的技术挑战,为了提高大数据系统的性能,部署规模,和信息安全,Twitter 大数据团队对 Presto 和 Druid 进行了大量的改进与优化,包括 Presto Druid Connector、Aggregation and Predicate Pushdown、LDAP 为基础的数据授权和安全保护、Druid Native Indexing以及利用缓存对 Druid 性能的提升。本次分享会讨论系统设计和技术实现,以及 Twitter 在实践中遇到的经验和教训。
对大数据感兴趣的技术人员,产品经理,数据分析师。