黄杰,饿了么框架工具部,监控平台负责人。2015 年加入饿了么,负责整个监控平台的构建及周边工具链的建设。整个监控也经历了饿了么异地多活地洗礼。之前曾在携程、eBao 等多家公司工作,在监控、消息系统及大数据等领域积累了丰富经验。
黄杰,饿了么框架工具部,监控平台负责人。2015 年加入饿了么,负责整个监控平台的构建及周边工具链的建设。整个监控也经历了饿了么异地多活地洗礼。之前曾在携程、eBao 等多家公司工作,在监控、消息系统及大数据等领域积累了丰富经验。
随着饿了么业务及系统越来越复杂,特别是在异地多活之后,对监控依赖也越来越重,尤其是如何通过监控快速发现定位问题,这些都给我们带来了很大的挑战。本此分享主要讲述饿了么如何从全链路监控开始,一步步发展到业务监控/应用监控/PaaS/IaaS 各层打通,如何支撑起每年几倍数据量的增长,过程中遇到了哪些困难及我们是如何来解决这些问题。
整个监控系统的背景及历史演进过程;
整体架构;
如何解决大数据冲击下的计算和存储问题;
如何做好监控标准化及场景化;
平时我们是如何用这套系统来发现和定位问题。
通过对整个架构演进的剖析,了解到如何实现一套完善的监控体系;
如何在没有任何搜索功能的前提下,做到快速定位问题;
如何做好监控邻域的场景化及标准化。