微服务在过去几年中已在各行各业的系统技术架构中实践的如火如荼,在三四年前可能还会... 展开 >
专注于高并发互联网架构设计、分布式电子商务交易平台设计、大数据分析平台设计、高可用性系统设计。
拥有十多年丰富的技术架构、技术咨询经验,深刻理解电商系统对技术选择的重要性。
微服务在过去几年中已在各行各业的系统技术架构中实践的如火如荼,在三四年前可能还会有否要选择微服务架构的问题,但在今天几乎不会有这样的“用”还是“不用”的问题,基本变成了如何升级现有的微服务基础设施的问题。特别是在当前大红大紫的云原生时代,“微服务”再次被提上了讨论系统升级的风口浪尖。比如 Service Mesh 就在过去两年中迅速在业界走红,并有了很落地的实践。那么为什么会有这么多的 Service Mesh 实践,它背后的原因是什么?是我们在之前的微服务实践过程遇到什么问题吗?另外在这多年的“全民”微服务的实践运动之后,在这个时间点我们也应该去复盘一下微服务架构的“好”与“坏”,任何架构都会有它的适用场景,今天的我们是否要在微服务架构之外再去实践新的架构方式以解决当前遇到的新问题呢?种种疑问和新想法将在我们的专题中来一一讨论和分享,本专题将聚焦于在微服务架构的发展及 Service Mesh 等在业界的落地实践。
With the rapid development of micro-service technology, Service Mesh has gradually matured and become the most eye-catching technology hotspot at present. This topic will focus on micro-service innovation and practice.
随着业务迅速扩张,越来越多后端团队采用微服务设计方案。微服务设计在降低业务开发门槛同时,对系统基础设施提出更高要求。微服务场景中,后台服务数量迅速膨胀,各个服务技术选型多样化。两个问题显的突出:
第一是系统整体负载保护。微服务场景中,各个服务之间调用 Topo 关系复杂,各种服务技术选型多样化,性能/健壮性参差不齐,有些服务具有"玻璃体质"。各种业务流量变化无常,有些纯粹 bug 引起,单个服务负载保护,不能防止整个系统"崩溃",需要一种机制整体负载保护机制保证各种业务流量安全运营,确保系统任何情况下都不发生"雪崩”。
第二是系统整体监控。系统异常时如何在噪声很大的信息量中迅速定位系统问题,并为系统设计优化提供建议或方案:如确定系统中哪些技术选型或设计方案是不合理的;系统正常时如何减少不必要的报警骚扰;系统亚健康时如何提供预警;确保监控为系统安全运营提供一层安全网。
1. 微服务理解
2. 系统负载保护
3. 系统监控
阿里巴巴集团在内部很早就开始使用 Service Mesh 了,是国内 Service Mesh 应用规模最大的公司之一,为了在集团大规模落地 Service Mesh,在内部对 Envoy 和 Istio 做了大量优化,同时也将这些优化贡献给了社区,目前阿里巴巴是国内对于 Envoy 贡献最多的公司,给 Envoy 贡献了 Dubbo filter、内存优化、EGDS 等。在阿里巴巴内部集群的规模很大,上百万 Endpoint 的集群是很常见的,一个应用通常都会使用上百个服务,频繁的服务上下线都会导致大量的 xDS 推送,我们对 Envoy 和 Istio 做了很多优化以解决这些问题。通过本次的分享,你可以了解到 Envoy 和 Istio 在大规模落地时会遇到的一些问题,以及如何来解决,如 Envoy Subset 重复计算和内存占用大、Istio 全量推送 EDS 导致数据面产生大量的 CPU 开销、Envoy 连接池优化、优雅热升级等问题。
1. 运维和架构
2. Service Mesh 内部落地所遇到的问题和价值
3. 开源和内部优化
4. 未来展望
CIO、架构上、运维、希望在 Istio/Envoy 上做二次开发的人,对 Service Mesh 感兴趣的人。
业界 Mesh 化趋势如火如荼,从 2019 年开始,美团基于公司海量场景及业务形态从 0 到 1 搭建起了 Service Mesh 体系。本文主要分享美团 Service Mesh 的架构演进历程,如:运维部署、性能优化、业务推进策略,以及无缝兼容公司原有服务治理体系的过程。
1. 美团 Service Mesh 历史概况
2. 美团 Service Mesh 公司全面落地面临的挑战
3. 美团 Service Mesh 性能优化
4. 美团 Service Mesh 与服务治理生态的兼容
5. 美团 Service Mesh 部署运维
适合了解基本的分布式系统、服务治理及云原生领域相关知识的开发者、架构师、技术 Leader 等。
函数计算遵循服务函数化理念,支持一键创建和部署函数,屏蔽资源和运维细节,极大降低了开发者的开发运维成本。函数的轻量化和快速启动能力,允许平台针对函数自动扩缩容,极致优化资源成本。平台还提供了各种常用的触发器作为底层各个基础组件的粘合剂,开发者可以轻而易举完成相关领域的开发需求。本次演讲将着重分享函数计算的核心架构和关键技术点,介绍函数平台在字节跳动处理千万级别 QPS 的落地经验,探讨字节跳动函数计算的特色创新以及未来的发展前景。
对 Serverless、Kubernetes 有浓厚兴趣的开发者,函数计算使用者以及同行。
网易部分业务(严选、传媒等)自 2016 年起便开始探索用 Service Mesh 架构支撑微服务体系建设,并于 2017 年进行了落地,我们称之为 Mesh 1.0,这套架构在支撑业务快速发展的同时,也暴露出其在管控能力、流量治理方面存在的不足,于是在 2019 年开始落地基于定制 Istio 和扩展 Envoy 的云原生 Mesh 2.0 架构,Mesh 2.0 通过对 Mesh 1.0 架构的平滑升级,很好地支撑了业务度过大促、大事件等大规模高并发场景,取得了较好的落地效果。
有容器、微服务技术平台相关的项目经验,具备 K8s、Service Mesh、API 网关、服务框架、云原生等知识储备。
春晚活动是对快手技术架构的一次重大考验,也为服务治理平台带来了一系列挑战。为了确保动态配置分发、服务发现、流量治理等基础服务治理能力在功能、可用性和容量上都能满足业务的要求,快手微服务团队对服务治理平台从需求、架构、部署、流程等方面进行了系统的梳理和改进,并推动业务团队进行了必要的可用性改造。本次演讲将回顾当时面临的问题和挑战,给出我们的分析和解法,并总结整个实施落地过程中的一些经验和心得。
1. 快手服务治理平台的演进和现状
2. 春节活动流量对服务治理平台的压力和需求
3. 服务治理平台的高可用高可伸缩方案
4. 一些复盘和经验总结
5. 未来的挑战和计划
服务端开发人员,微服务平台开发人员,架构师。