随着云成为应用的第一运行平台,“云原生”的概念开始崭露头... 展开 >
王旭目前是蚂蚁金服系统部的资深技术专家,也是开源项目 Kata Containers 的架构委员会创始成员,在过去几年中活跃在国内的开源开发社区与标准化工作中。在加入蚂蚁金服之前,他是音速神童的联合创始人和 CTO,他们在 2015 年开源了基于虚拟化技术的容器引擎 runV,在 2017 年 12 月,他们和 Intel 一起宣布 runV与Clear Containers 项目合并,成为 Kata Containers 项目,该项目于 2019 年 4 月被董事会通过成为了 OpenStack 基金会 2012 年以来的首个新开放基础设施顶级项目。在创立音速神童之前,王旭曾工作于盛大云计算和中国移动研究院的云计算团队。2011 年王旭曾经主持过杭州 QCon 的云计算主题,同时,也曾经是一位活跃的技术作者、译者和老 blogger。
随着云成为应用的第一运行平台,“云原生”的概念开始崭露头角,不可变基础设施(Immutable Infrastructure)概念开始为人们广泛接受,服务网格(ServiceMesh)与容器、编排系统一道构成了云原生时代的基础设施,“无服务器化”被预言成为未来的云计算模式。那么,支撑高并发的互联网服务是如何利用云原生架构来提高业务敏捷性、降低成本的?需要高可用、强可信的金融技术又是怎么改造自己的云原生服务架构来应对各种挑战的?云服务商是如何有效利用资源来为云原生应用提供无服务器服务的?在无服务器趋势下,有状态服务又是如何演化的?本专题中,我们会邀请云原生领域的实践者们探讨他们是如何看待、解决这些问题的。
随着云计算边界不断向边缘侧延展,5G 和物联网技术的蓬勃发展给边缘计算带来了巨大机遇的同时,也带来了极大的挑战,传统 runc 容器已无法满足用户对不可信、异构工作负载的运行安全诉求,边缘 Serverless、边缘服务网格等更是对容器安全隔离提出了严苛的要求。本演讲将展示边缘计算场景如何构建安全运行时技术基座,分享安全容器在架构、网络、监控、日志、存储、以及 K8s API 兼容等方面的遇到的困难挑战和优秀实践。
1. 了解边缘容器架构和要点;
2. 了解业界安全沙箱容器技术的整体情况;
3. 了解安全容器在边缘 K8s 中的架构和优秀实践,如何让安全容器的使用体感像 runc 容器一样简单;
4. 了解安全容器在落地过程中在网络、监控、日志、存储以及 K8s API 兼容等方面遇到的种种困难和挑战以及解决方案。
一方面是 “Operator” 模式迅速走红,为开发者扩展 Kubernetes 编排能力提供了趁手兵器,另一方面是 Local PV 正式 GA,高性能本地盘似已开箱即用——在 Kubernetes 上运行有状态负载的“黄金时代”似乎已经到来。然而,真正的魔鬼还在细节中:本地磁盘的不可靠性对编排和应用本身提出了更高的挑战,控制循环中复杂性与灵活性的矛盾带来了更多的设计抉择,如何验证 Operator 本身的正确性与稳定性更是把有状态负载推向生产级可用的必答题。在本次演讲中,我们将先以 TiDB Operator 为引子,向大家分享我们解决这些问题的策略。然后对比多个可选的解决方案,深入剖析我们如何基于 TiDB 的场景进行设计权衡,并进一步地对既有决策进行反思——哪些我们做对了,又有哪些我们本可以做得更好。最后,我们将总结 PingCAP 在 Kubernetes 上高效编排有状态负载的实践与思考。
对应用进行测试和调优,是提高应用稳定性、性能进而优化用户体验和成本的重要手段。常用的基于数据构造的测试方式数据准备和维护过程成本较高,录制回放的方式又无法进行实时对比,阻碍了研发的大规模使用。测试和生产环境的性能诊断因为其操作过程和数据解读繁琐且门槛较高,在公司内一向属于少数人掌握和使用的高级技术。应用大规模迁移到容器后,因为容器的权限、动态性也给应用测试和调优带来了诸多困难。本次分享将以内部产品 PerfLabs 来介绍我们在 Cloud Native 下对应用测试和调优方式的探索,如何利用 K8s 的能力,推动技术的普适性,让研发能够像使用水和电一样方便地对程序的稳定性和性能进行优化。
1. 了解携程研发人员在应用测试和调优方面遇到的典型问题;
2. 了解 PerfLabs 产品思路和设计;
3. 了解自研流量镜像 Sidecar 原理,与社区方案的异同和取舍;
4. 了解应用 CPU、MEM 调优的常见方法;
5. 了解 K8s Operator 在 PerfLabs 中性能诊断模块中的应用;
6. 了解 PerfLabs 在实际使用中解决的典型问题和收益。
随着云原生概念的兴起,越来越多的公司意识到了云原生架构对于基础设施建设带来的巨大收益,开始了应用服务上云的实践。但是,有状态应用需要使用 on-premise 的分布式存储,其 I/O 性能对有状态应用云化提出了很大的挑战。本次演讲将主要介绍云原生的分布式文件系统 ChubaoFS 的整体框架和技术特点,以及 ChubaoFS 在京东是如何支撑大量的有状态应用服务的。 目前,ChubaoFS 的应用场景主要有以下四类:海量数据的离线备份存储;替换传统的分布式文件系统,如 HDFS,CephFS,MooseFS,GlusterFS 等;在线的日志存储服务,如 Nginx logs 等;对于 POSIX 文件系统语义要求较高的应用,如 ElasticSearch,TensorFlow,Spark 等。
ChubaoFS的一些设计及经验总结也受到了学术界的认可,论文可参考Haifeng Liu, et al., CFS: A Distributed File System for Large Scale Container Platforms. SIGMOD‘19, June 30-July 5, 2019, Amsterdam, Netherlands。同时,项目代码也已经开源,github.com/chubaofs/chubaofs 。
1. 如何做到多租户,共享存储资源,提高资源利用率。
2. 如何通过两种复制协议支撑顺序和随机的读写。
3. 如何支撑高并发的文件系统元数据操作。
4. 如何针对小文件做性能优化。
5. 如何在 POSIX 文件系统语义和性能之间做取舍。