微服务创新与实践

会议室:203
出品人:王晓波

微服务在过去几年中已在各行各业的系统技术架构中实践的如火如荼,在三四年前可能还会... 展开 >

专题出品人:王晓波

同程艺龙机票事业群 CTO

专注于高并发互联网架构设计、分布式电子商务交易平台设计、大数据分析平台设计、高可用性系统设计。

拥有十多年丰富的技术架构、技术咨询经验,深刻理解电商系统对技术选择的重要性。

地点:203

专题:微服务创新与实践

微服务在过去几年中已在各行各业的系统技术架构中实践的如火如荼,在三四年前可能还会有否要选择微服务架构的问题,但在今天几乎不会有这样的“用”还是“不用”的问题,基本变成了如何升级现有的微服务基础设施的问题。特别是在当前大红大紫的云原生时代,“微服务”再次被提上了讨论系统升级的风口浪尖。比如 Service Mesh 就在过去两年中迅速在业界走红,并有了很落地的实践。那么为什么会有这么多的 Service Mesh 实践,它背后的原因是什么?是我们在之前的微服务实践过程遇到什么问题吗?另外在这多年的“全民”微服务的实践运动之后,在这个时间点我们也应该去复盘一下微服务架构的“好”与“坏”,任何架构都会有它的适用场景,今天的我们是否要在微服务架构之外再去实践新的架构方式以解决当前遇到的新问题呢?种种疑问和新想法将在我们的专题中来一一讨论和分享,本专题将聚焦于在微服务架构的发展及 Service Mesh 等在业界的落地实践。

With the rapid development of micro-service technology, Service Mesh has gradually matured and become the most eye-catching technology hotspot at present. This topic will focus on micro-service innovation and practice. 

by 朱龙云

腾讯科技
增值服务部互娱 AMS 监控系统负责人

随着业务迅速扩张,越来越多后端团队采用微服务设计方案。微服务设计在降低业务开发门槛同时,对系统基础设施提出更高要求。微服务场景中,后台服务数量迅速膨胀,各个服务技术选型多样化。两个问题显的突出:

第一是系统整体负载保护。微服务场景中,各个服务之间调用 Topo 关系复杂,各种服务技术选型多样化,性能/健壮性参差不齐,有些服务具有"玻璃体质"。各种业务流量变化无常,有些纯粹 bug 引起,单个服务负载保护,不能防止整个系统"崩溃",需要一种机制整体负载保护机制保证各种业务流量安全运营,确保系统任何情况下都不发生"雪崩”。

第二是系统整体监控。系统异常时如何在噪声很大的信息量中迅速定位系统问题,并为系统设计优化提供建议或方案:如确定系统中哪些技术选型或设计方案是不合理的;系统正常时如何减少不必要的报警骚扰;系统亚健康时如何提供预警;确保监控为系统安全运营提供一层安全网。

内容大纲

1. 微服务理解

  • 软件设计演进史
  • 微服务哲学
  • 微服务基础设施

2. 系统负载保护

  • 负载保护设计方案和原则
  • 负载保护的职责和边界
  • 上游流控设计方案
  • 本机负载保护设计方案
  • 下游熔断方案
  • 负载保护效果
  • 流控在业务特性功能的应用拓展

3. 系统监控

  • 监控的历史和未来发展
  • 监控系统的境界,职责和边界
  • 监控方法比较以及与智能关系
  • 监控对象和数据上报方案
  • 监控定位问题方案和相关架构
  • 基于曲线检测的高频报警监控方案
  • 监控可视化和线下治理

听众受益

  1. 微服务环境上游流控/本机负载保护/下游熔断方案相结合的整体系统负载保护方案
  2. 微服务环境下监控设计的方案,与传统监控差异,以及未来可能的发展方向

by 张义飞

阿里巴巴
高级工程师

阿里巴巴集团在内部很早就开始使用 Service Mesh 了,是国内 Service Mesh 应用规模最大的公司之一,为了在集团大规模落地 Service Mesh,在内部对 Envoy 和 Istio 做了大量优化,同时也将这些优化贡献给了社区,目前阿里巴巴是国内对于 Envoy 贡献最多的公司,给 Envoy 贡献了 Dubbo filter、内存优化、EGDS 等。在阿里巴巴内部集群的规模很大,上百万 Endpoint 的集群是很常见的,一个应用通常都会使用上百个服务,频繁的服务上下线都会导致大量的 xDS 推送,我们对 Envoy 和 Istio 做了很多优化以解决这些问题。通过本次的分享,你可以了解到 Envoy 和 Istio 在大规模落地时会遇到的一些问题,以及如何来解决,如 Envoy Subset 重复计算和内存占用大、Istio 全量推送 EDS 导致数据面产生大量的 CPU 开销、Envoy 连接池优化、优雅热升级等问题。

内容大纲

1. 运维和架构

  • Service Mesh 的架构演进思路
  • 如何控制 Service Mesh 上线的风险
  • Service Mesh 在阿里巴巴内部的部署和运维

2. Service Mesh 内部落地所遇到的问题和价值

  • 服务规模大
  • 接入 Service Mesh 成本高
  • Serivce Mesh 价值短期很难体现
  • 为什么要落地 Service Mesh

3. 开源和内部优化

  • EGDS (解决频繁推送问题)
  • Subset 优化(解决 Envoy CPU 和内存高的问题)
  • 连接池优化 (解决连接数过多的问题)
  • Dubbo filter 优化(解决数据面带来的 RT 损耗)
  • 优雅热升级 (数据面频繁升级如何不影响业务)
  • 透明拦截 (方便接入 Mesh,控制风险)

4. 未来展望

  • 下一步的规划

听众收益

  1. 了解 Service Mesh 落地可能会遇到的一些问题
  2. 了解 Service Mesh 所带来的一些价值
  3. 了解 Service Mesh 在大规模场景下存在哪些问题,如何解决

适合人群

CIO、架构上、运维、希望在 Istio/Envoy 上做二次开发的人,对 Service Mesh 感兴趣的人。

by 舒超

美团
资深技术专家

业界 Mesh 化趋势如火如荼,从 2019 年开始,美团基于公司海量场景及业务形态从 0 到 1 搭建起了 Service Mesh 体系。本文主要分享美团 Service Mesh 的架构演进历程,如:运维部署、性能优化、业务推进策略,以及无缝兼容公司原有服务治理体系的过程。 

内容大纲

1. 美团 Service Mesh 历史概况

  •    美团为什么选择 Service Mesh
  •    早期美团 Service Mesh 的发展状况

2. 美团 Service Mesh 公司全面落地面临的挑战

  •    性能上的挑战
  •    服务治理兼容性上的挑战
  •    运维部署上的挑战

3. 美团 Service Mesh 性能优化

  • 流量转发优化
  • 策略缓存优化
  • 序列化反序列化优化
  • 其它优化   

4. 美团 Service Mesh 与服务治理生态的兼容

  •     服务注册
  •     SDK 兼容
  •     服务路由
  •     流量录制
  •     服务鉴权
  •     熔断限流

5. 美团 Service Mesh 部署运维

  • 如何在十几万节点中部署运维
  • 如何做到业务无感知热升级   
  • 如何做到系统自身容灾降级
  • 如何做端到端全链路巡检
  • 美团 Service Mesh 未来规划

适合人群

适合了解基本的分布式系统、服务治理及云原生领域相关知识的开发者、架构师、技术 Leader 等。

by 杨华辉

字节跳动
基础架构函数计算负责人

函数计算遵循服务函数化理念,支持一键创建和部署函数,屏蔽资源和运维细节,极大降低了开发者的开发运维成本。函数的轻量化和快速启动能力,允许平台针对函数自动扩缩容,极致优化资源成本。平台还提供了各种常用的触发器作为底层各个基础组件的粘合剂,开发者可以轻而易举完成相关领域的开发需求。本次演讲将着重分享函数计算的核心架构和关键技术点,介绍函数平台在字节跳动处理千万级别 QPS 的落地经验,探讨字节跳动函数计算的特色创新以及未来的发展前景。

内容大纲

  1. 字节跳动函数计算的架构高可用设计、冷启动优化、自动扩缩策略、轻量级虚拟化等
  2. 字节跳动函数计算的特色和创新
  3. 函数计算在字节跳动的核心落地场景
  4. 函数计算的发展方向以及展望

前沿亮点

  1. 函数计算是目前计算领域的热点
  2. 洞悉和公有云函数计算的对比
  3. 了解如何做到极致的冷启动
  4. 对于千万 QPS 吞吐的消息处理
  5. 基于 Kubernetes 落地应用于生产环境的函数计算

听众受益

  1. 了解 Serverless 的价值
  2. 解析函数计算的核心架构和演进思路
  3. 了解企业实施 Serverless 面临的问题以及落地的关键点

适合人群

对 Serverless、Kubernetes 有浓厚兴趣的开发者,函数计算使用者以及同行。

by 冯常健

网易
架构师、技术专家

网易部分业务(严选、传媒等)自 2016 年起便开始探索用 Service Mesh 架构支撑微服务体系建设,并于 2017 年进行了落地,我们称之为 Mesh 1.0,这套架构在支撑业务快速发展的同时,也暴露出其在管控能力、流量治理方面存在的不足,于是在 2019 年开始落地基于定制 Istio 和扩展 Envoy 的云原生 Mesh 2.0 架构,Mesh 2.0 通过对 Mesh 1.0 架构的平滑升级,很好地支撑了业务度过大促、大事件等大规模高并发场景,取得了较好的落地效果。

内容大纲

  1. 网易的 Mesh 1.0 架构以及为什么要做架构升级
  2. 网易落地 Service Mesh 架构的前提条件
  3. 网易 Service Mesh 架构落地和升级的关键点,重点关注可落地性,比如平滑升级和迁移,以及这个过程中需要的系统改造、性能优化、支撑平台设计等

听众受益

  1. 了解 Service Mesh 系统建设的技术价值和真实收益
  2. 了解网易 Service Mesh 的基本架构和演进思路
  3. 了解企业实施 Service Mesh 架构会面临哪些问题、如何应对以及落地关键点

适合人群

有容器、微服务技术平台相关的项目经验,具备 K8s、Service Mesh、API 网关、服务框架、云原生等知识储备。

by 曹福祥

快手
系统架构师

春晚活动是对快手技术架构的一次重大考验,也为服务治理平台带来了一系列挑战。为了确保动态配置分发、服务发现、流量治理等基础服务治理能力在功能、可用性和容量上都能满足业务的要求,快手微服务团队对服务治理平台从需求、架构、部署、流程等方面进行了系统的梳理和改进,并推动业务团队进行了必要的可用性改造。本次演讲将回顾当时面临的问题和挑战,给出我们的分析和解法,并总结整个实施落地过程中的一些经验和心得。

内容大纲

1. 快手服务治理平台的演进和现状

2. 春节活动流量对服务治理平台的压力和需求

3. 服务治理平台的高可用高可伸缩方案

  • 动态配置分发是各类紧急降级方案的基础,重中之重
  • 通过弹性扩容应对突增流量,服务发现不能掉链子
  • 服务故障不扩散,流量治理是关卡

4. 一些复盘和经验总结

5. 未来的挑战和计划

听众受益

  1. 了解快手万亿级服务治理平台的设计理念
  2. 在有限的人力和资源下,服务治理应对春晚级活动的技术实践

适合人群

服务端开发人员,微服务平台开发人员,架构师。  

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86 17310043226