资深 DevOps 和运维专家,华为电信软件行业 7 年工作经验,现任蘑菇街平台技术总监,腾讯云 TVP,极客时间运维专栏作家,著有《进化:运维技术变革与实践探索》一书,个人专注于云计算和 AI 时代的技术架构和团队转型。
资深 DevOps 和运维专家,华为电信软件行业 7 年工作经验,现任蘑菇街平台技术总监,腾讯云 TVP,极客时间运维专栏作家,著有《进化:运维技术变革与实践探索》一书,个人专注于云计算和 AI 时代的技术架构和团队转型。
当前业界分布式架构和微服务理念,已经渐趋完善,已然成为企业 IT 技术转型的主要方向。但是分布式架构引入带来的系统复杂度,却是大大超出一般企业运维能力的范畴,这里一方面是需要人员技能模型的更新迭代,需要加速人员技能成长,另一方面,也需要从一个全新的角度去看待在这种技术架构下的组织架构建设。
DevOps 理念的广泛传播,以及近些年在不同行业内的落地实践,我们得以从中总结出很多实践经验。本次课程,就是从自身建设实践,以及业界案例的总结中,提炼出的方法、经验和技术。
内容大纲:
1. 业界技术发展趋势(国内外案例)
2. 为什么会是 DevOps?
• 分布式带来的挑战
• 技术体系建设思路:大中台、小前台策略
• 探讨:微服务是银弹吗?
1. 标准化体系建设:
• 对象建模
• 五步法标准化
• 标准化设计分组练习,讲师点评
2. 应用架构管理的基石-CMDB:
• 传统 CMDB 及应用 CMDB 的区别对比
• 五大能力1:元数据和元关系管理能力
• 五大能力2:数据采集能力
• 五大能力3:数据同步能力
• 五大能力4:模型拓展能力
• 五大能力5:拓扑展现能力
3. 应用生命周期管理:
• 生命周期管理的重要性
• 如何从生命周期的视角去分析运维对象和场景
4. 基于 CMDB 的运维自动化和持续交付建设
5. 运维到 DevOps 角色的转变
三、稳定性体系建设
1. 如何保证稳定性?
• 稳定性保障的纲举目张策略
• 核心原则
2. Google SRE 实践:
• SRE 的关键原则
• 3S(SLO、SLI、SLA)稳定性体系实践
• SLO 设计分组练习,讲师点评
3. 科学的故障管理模式:
• 定级&定性&定责标准
• 关键角色岗位:技术支持
• 鼓励做事,而不是惩罚错误
4. 电商业务应用稳定性保障体系介绍:
• 电商的极端业务场景
• 容量规划
• 限流降级
• 开关预案
• 全链路跟踪
四、DevOps 组织架构建设(探讨类题目)
1. 国内外运维组织架构建设分享:
• Google SRE 模式
• Netflix NoOps 模式
• 阿里技术保障部模式
2. 我们应该如何选择和借鉴?
3. 云计算和AI时代,我们应该如何转型?
听众受益:
1. 深入理解当前软件技术发展的趋势,以及面临的挑战;
2. 掌握 DevOps 落地关键思路和实践技能;
3. DevOps 对组织架构的转型要求。