专题:深度培训

6月20日:DevOps运维体系建设实践

6月21日:阿里巴巴混沌工程探索与实践

 

by 李晶磊(孙巨)

阿里巴巴
高级技术专家

by 肖长军(穹谷)

阿里巴巴
技术专家

随着系统架构的演进和业务规模的扩大,系统的复杂度极大的增加,系统的稳定性面临着难以察觉的潜在风险,很难说清单个故障对整个系统的影响。并且随着云原生概念的兴起,越来越多的企业服务上云,往云原生系统演进过程中如何保障系统的稳定可靠也是当前大家比较关心的问题。 近几年混沌工程得到越来越多企业的关注,阿里从最早引入混沌工程解决微服务的依赖问题,到业务服务、云服务稳态验证,进一步升级到公共云、专有云的业务连续性保障,积累了比较多的实践经验。本课程上午会从混沌工程的发展出发,给大家详细介绍目前业界的工具和阿里内部使用的平台,让大家了解混沌工程本身和相关平台工具。下午会从企业如何落地混沌工程主题出发,介绍混沌工程在阿里巴巴内部的发展,并通过具体案例分享实施混沌工程的价值。

内容大纲(上午)

  1. 混沌工程国内外发展现状;
  2. ChaosBlade 介绍及在阿里巴巴内部的应用;
  3. AHAS Chaos 混沌工程平台介绍。

内容大纲(下午)

  1. 阿里巴巴混沌工程组织文化从 0 到 1;
  2. 阿里巴巴混沌工程案例分享;
  3. 混沌工程如何在企业落地的思考。

听众收益

  • 了解混沌工程国内外发展现状;
  • 了解阿里巴巴故障演练平台建设;
  • 了解阿里巴巴如何落地混沌工程;
  • 了解自身企业该如何落地混沌工程。

目标受众

架构师、运维、测试或者对此感兴趣的技术人员。

by 赵成

蘑菇街
平台技术总监

当前业界分布式架构和微服务理念,已经渐趋完善,已然成为企业 IT 技术转型的主要方向。但是分布式架构引入带来的系统复杂度,却是大大超出一般企业运维能力的范畴。

这里一方面是需要人员技能模型的更新迭代,需要加速人员技能成长,另一方面,也需要从一个全新的角度去看待在这种技术架构下的组织架构建设。

随着 DevOps 理念的广泛传播,以及 SRE 在不同行业的落地,我们从中总结出很多的经验和技巧,本次课程,将从实践出发,结合业界案例,提炼出的方法、经验和技术。

课程大纲

一、业界技术演进趋势

1、业界技术发展趋势及带来的挑战

  • 分布式带来的挑战
  • 技术体系建设思路:大中台、小前台策略

2、国内外运维组织架构建设分享

  • Google SRE 模式
  • Netflix NoOps 模式
  • 蘑菇街案例分享

3、我们应该如何选择和借鉴

二、应用为核心的 DevOps 体系设计

1、标准化体系建设

  • 对象建模
  • 五步法标准化
  • 标准化设计

2、应用架构管理的基石-CMDB

  • 传统 CMDB 及应用 CMDB 的区别对比
  • 五大能力 1:元数据和元关系管理能力
  • 五大能力 2:数据采集能力
  • 五大能力 3:数据同步能力
  • 五大能力 4:模型拓展能力
  • 五大能力 5:拓扑展现能力

3、应用生命周期管理

  • 生命周期管理的重要性
  • 如何从生命周期的视角去分析运维对象和场景

4、案例介绍

三、SRE 稳定性运营体系建设

1、Google SRE 实践

  • SRE 的关键原则
  • 3S(SLO、SLI、SLA)稳定性体系实践
  • SLO 设计分组练习,讲师点评

2、科学的故障管理模式

  • 定级 & 定性 & 定责标准
  • 关键角色岗位:技术支持
  • 鼓励做事,而不是惩罚错误

3、业界应用稳定性保障体系介绍

四、持续最佳交付实践

1、持续交付全流程介绍
2、持续交付-多环境管理

  • 集成测试环境
  • 项目环境
  • 预发环境
  • Beta 环境
  • 生产环境

3、持续交付-发布/部署模式

  • 蓝绿部署
  • 金丝雀(灰度)发布
  • 滚动发布


五、云计算和 5G 时代的到来,如何做好运维?

1、云计算带来的挑战和思考

  • 传统运维模式下所面临的问题和挑战
  • 私有云、混合云和公有云选型及演进模式
  • 未来发展,5G 和边缘计算

2、未来的挑战,应用层的云架构解决方案

  • Spring Cloud
  • CNCF

目标受众

系统和应用运维、运维开发、架构师、技术 Leader。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86-17310043226