慕腾飞,现任 LinkedIn 基础架构部门技术经理,负责领导和架构下一代数据中心集群管理系统,主要集中于 Kubernetes 还有 Docker 容器相关的云原生生态系统落地。在加入领英之前,他是 Uber 计算平台团队的技术主管经理,负责管理在线集群调度团队。他还致力于落地全活数据中心和微服务架构。在 Uber 之前,他是 Google 的搜索广告部门的软件工程师。
慕腾飞,现任 LinkedIn 基础架构部门技术经理,负责领导和架构下一代数据中心集群管理系统,主要集中于 Kubernetes 还有 Docker 容器相关的云原生生态系统落地。在加入领英之前,他是 Uber 计算平台团队的技术主管经理,负责管理在线集群调度团队。他还致力于落地全活数据中心和微服务架构。在 Uber 之前,他是 Google 的搜索广告部门的软件工程师。
LinkedIn(领英)是全球领先的职场社交平台,其基础架构覆盖多个数据中心和数十万台主机资源。LinkedIn 现在有一套完整的集群资源调度系统,支持调度大规模的长时间运行的服务和批处理任务,目标是提高开发人员的工作效率和服务器利用率。
随着机器学习多样化计算任务需求增加以及未来 Azure 迁移的战略目标,我们开始设计落地 Kubernetes 还有 Docker
容器相关的云原生开源技术方案,包括如何无缝集成落地到现有的大规模基础设施中非常具有挑战性。我们首先介绍领英的集群管理系统架构和规模,然后探讨我们落地开源技术方案遇到的挑战以及解决方案,最后再分享我们在生产和集成过程中吸取的经验教训。
1.本讲座为大规模的互联网公司集群管理生态系统提供了案例研究。它包括集群管理器,工作流协调器,网络策略实施,容器运行时等。所有这些协同工作为大规模以应用程序为中心的基础架构提供了坚实的基础。向听众展示这些大规模系统的见解是非常有价值的,特别是在有特定大规模系统设计权衡的基础上,哪些方法运作良好以及可以改进哪些方面。
2.本讲座分享在大规模的生产环境中整合新的开源技术 Kubernetes 和 Docker 容器期间吸取的经验教训。尤其是将新的技术无缝集成落地到现有的基础设施中遇到的挑战。这些经验可以让听众权衡自己的系统整合落地方案,少走很多弯路。