亚马逊 AWS 专业服务团队云架构咨询顾问,负责企业级客户的云架构设计和优化、DevOps 组织咨询和技术实施。在软件研发领域有多年架构设计、运维和团队管理经验,对 DevOps、云原生微服务治理框架、容器化平台运维、混沌工程实践等有深入的研究和热情。
亚马逊 AWS 专业服务团队云架构咨询顾问,负责企业级客户的云架构设计和优化、DevOps 组织咨询和技术实施。在软件研发领域有多年架构设计、运维和团队管理经验,对 DevOps、云原生微服务治理框架、容器化平台运维、混沌工程实践等有深入的研究和热情。
随着越来越多的企业上云,应用架构由于业务深度的增加以及业务方向的多样,纷繁的组件依赖或调用链传递成为难以察觉的潜在系统风险。这些“隐藏的”系统故障,给企业带来了代价高昂的损失:一小时的宕机将带来超过 10 万美元的损失,一次服务中断会损失数百万美元,等待下一次系统故障并非解决方案。如何在保障企业应用稳定可靠的前提下,通过合理设计和实施混沌工程对照实验,提前探知和解决潜在的系统风险,降低“隐藏”故障带来的损失,真正实现云上韧性架构,成为当前用户对混沌工程的主要诉求。
本次分享会从 AWS 云上混沌工程实践的具体案例出发,介绍混沌工程对照实验场景和环境的设计方法,实验工具的选型要求,以及不同架构类型的实施方案比较,并从中总结 AWS 云上混沌工程对照实验的实践原则。