王昕是阿里中间件技术团队高级技术专家,开源消息和流处理技术标准 OpenMessaging 布道师。具有 10 多年软件系统开发和架构经验,在分布式系统领域经验丰富,长期参与高可用中间件系统、云平台基础管理系统和云原生自动运维系统的构建。在国内外有 10 多项授权和在审软件技术发明专利。
王昕是阿里中间件技术团队高级技术专家,开源消息和流处理技术标准 OpenMessaging 布道师。具有 10 多年软件系统开发和架构经验,在分布式系统领域经验丰富,长期参与高可用中间件系统、云平台基础管理系统和云原生自动运维系统的构建。在国内外有 10 多项授权和在审软件技术发明专利。
大型电商平台和云计算平台的后台服务都是典型的超大规模分布式系统。作为企业用户的基础服务商,一方面平台的稳定性和高可用能力不容有失,另一方面需要在分布式系统规模持续扩大的情况下避免运维成本的上升,因此声明式自愈系统的设计成为必须。本次分享将结合分布式系统理论和作者在多家互联网和云计算企业的工作经验,围绕高可用分布式系统的设计之道分享以下内容:
1. 对分布式系统分析和建模的理论方法;
2. 无状态和有状态分布式系统面临的问题;
3. 分布式系统高可用能力的测试和验证;
4. 声明式自愈系统从设计到实现的最佳实践总结。
1. 了解对分布式系统分析和建模的理论方法;
2. 了解无状态和有状态高可用服务的设计方法;
3. 了解分布式系统的高可用能力的测试方法;
4. 了解大规模分布式消息系统的设计和实现经验;
5. 了解从高可用系统的设计到实现的实践经验。