PingCAP Cloud 工程师,毕业于浙江大学,热爱云原生与开源技术,开发并维护 kubectl-debug, aliyun-exporter 等开源项目,同时也是专注于云原生技术的博客作者,现负责 TiDB Operator 研发。曾负责酷家乐数据同步平台与容器监控系统的研发。
PingCAP Cloud 工程师,毕业于浙江大学,热爱云原生与开源技术,开发并维护 kubectl-debug, aliyun-exporter 等开源项目,同时也是专注于云原生技术的博客作者,现负责 TiDB Operator 研发。曾负责酷家乐数据同步平台与容器监控系统的研发。
一方面是 “Operator” 模式迅速走红,为开发者扩展 Kubernetes 编排能力提供了趁手兵器,另一方面是 Local PV 正式 GA,高性能本地盘似已开箱即用——在 Kubernetes 上运行有状态负载的“黄金时代”似乎已经到来。然而,真正的魔鬼还在细节中:本地磁盘的不可靠性对编排和应用本身提出了更高的挑战,控制循环中复杂性与灵活性的矛盾带来了更多的设计抉择,如何验证 Operator 本身的正确性与稳定性更是把有状态负载推向生产级可用的必答题。在本次演讲中,我们将先以 TiDB Operator 为引子,向大家分享我们解决这些问题的策略。然后对比多个可选的解决方案,深入剖析我们如何基于 TiDB 的场景进行设计权衡,并进一步地对既有决策进行反思——哪些我们做对了,又有哪些我们本可以做得更好。最后,我们将总结 PingCAP 在 Kubernetes 上高效编排有状态负载的实践与思考。