Google 千亿规模系统设计的考量和原则

所属专题:架构演进

嘉宾 : 吴锡 | GoogleSenior Software Engineer

讲师介绍

专题演讲嘉宾:吴锡

GoogleSenior Software Engineer

专注分布式架构的设计和研发 10 年,主要研发领域包括分布式计算、分布式调度、大数据访问等。 原就职于百度网页搜索部,负责离线建库系统的研发、分布式调度系统研发,百度 BVC (Baidu Volunteer Computing) 系统主要负责人,该系统负责管理百度多个集群的超过 5w 台机器的资源及任务调度,获得了 2012 年百度最高奖。 随后来到谷歌中国,就职于 Google Core System 部门。参与了 Google 新一代 indexing system 的设计和研发,该系统是 Google 搜索离线架构近 10 年来最大的升级。现主要负责 Google 内部大数据访问的设计和研发,谷歌中国第三位获得 Go Readability (Go 语言代码规范) 工程师,谷歌中国 Go@Google 101 课程讲师。 

议题介绍

演讲:Google 千亿规模系统设计的考量和原则

谷歌索引了千亿级别的网页,每秒可以处理超过百万的网页,并达到最短仅数秒的端到端延迟。本演讲将介绍在设计这样一个大规模实时处理系统时的一些考量和原则。

内容大纲

1. 建库系统介绍

  • 一篇网页的一生
  • 页面内容标注
  • 建索引
  • 基于微服务的分布式建库系统架构

2. 大规模离线建库系统设计

  • 微服务架构
  • 数据交互
  • 并发与多线程
  • 调研实验支持
  • 可调试性
  • 研发效率

听众受益

1. 系统规模变大后常遇到的问题;

2. 现代在做折衷时的一些考量点;

3. 多语言混合开发中的一些坑。

适合人群

架构方向工程师,有一定分布式系统研发经验、多线程研发经验。 

英文介绍

Google Search indexed hundreds of billions of web pages and processes over a million of web pages per second with shortest a few seconds end-to-end latency.This presentation will introduce the generic considerations and principles of designing such a large-scale realtime processing system.

Outlines

1. Intro to indexing system 

  • Life of a web page
  • Annotate page content 
  • Create index 
  • µService-based indexing system architecture 

2. Large-scale Indexing system design 

  • The µService architecture 
  • Data Exchange 
  • Concurrency and multithread 
  • Experiment support 
  • Debuggability 
  • Developer velocity 

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86-17310043226