冯翼,纽约城市大学研究中心计算机博士, 现任 Facebook 性能架构工程师,主要负责 instagram 和信息安全系统的架构和性能优化。此前在微软和领英任职。工作内容涵盖了性能诊断和优化的大部分领域,包括 CPU,内存,网络 IO,存储空间,平台包括 Windows Server 和 RHEL,语言和 runtime 包括 C#,Java,C++;规模从单机单进程到 20 万台前端服务器集群。工作之余爱美食,做运动车改装,跑赛道。
冯翼,纽约城市大学研究中心计算机博士, 现任 Facebook 性能架构工程师,主要负责 instagram 和信息安全系统的架构和性能优化。此前在微软和领英任职。工作内容涵盖了性能诊断和优化的大部分领域,包括 CPU,内存,网络 IO,存储空间,平台包括 Windows Server 和 RHEL,语言和 runtime 包括 C#,Java,C++;规模从单机单进程到 20 万台前端服务器集群。工作之余爱美食,做运动车改装,跑赛道。
作为全球领先的社交网络公司,Facebook 的基础架构在很多方面都面临性能和规模的挑战。为了增加用户数量和提高用户得使用体验,我们越来越多的使用统计学习并进行多角度预测,为用户快速地提供新鲜的感兴趣的信息。这就需要系统做到软件的快速部署和信息的实时更新,其中软件部署是互联网服务运维的主要工作之一。保证软件部署速度和数据实时更新会直接关系到系统维护成本和运营收入,特别是保证大规模分布式系统里面大模块内存数据的实时性是极具挑战性的工作。
我们首先介绍 Facebook 服务的基本架构和规模,在此基础上我们会分析软件部署速度和数据实时更新对于运维成本和运营收入的影响。我们通过两个具体用例来说明如何巧妙运用传统点对点加速部署并保证更新。这两个实例将分别展示:
1. 如何大幅度降低软件部署所需要的时间和成本;
2. 如何提高分布式系统中灾难恢复的速度。
最后和听众分享我们在应用中遇到的一些问题和解决方法。
这个演讲会由广及深,涵盖大规模互联网服务的基础架构,营收,运维,和技术实现四个层面;面向听众涵盖经理人,产品经理,运维和开发工程师。