IT总部监控研发总监,15年的从业背景, 数学与计算机科学系毕业,师从中科院自然语言信息处理黄和燕老师,目前从事智能监控领域,亲自构建苏宁一体化监控体系,参与保障苏宁历年的线上大促平稳运行, 对监控领域有非常深厚的理解,尤其对智能化监控的研究和构建有独到的见解。
IT总部监控研发总监,15年的从业背景, 数学与计算机科学系毕业,师从中科院自然语言信息处理黄和燕老师,目前从事智能监控领域,亲自构建苏宁一体化监控体系,参与保障苏宁历年的线上大促平稳运行, 对监控领域有非常深厚的理解,尤其对智能化监控的研究和构建有独到的见解。
在当今互联网时代,企业大都采用分布式系统设计和服务化,内部关系错综复杂,从系统提供的上层服务对用户的体验感知到整体系统的健康稳定的智能化监控已成为企业发展的标配能力,但是也存在着异常故障定位缓慢,甚至找不到问题根源,虽有众多日志监控工具,但没有全链路,各产品分散集成度不高;定位问题及根因分析耗时长,缺乏决策并自动控制(自愈)机制,基本靠人工,且监控机制混乱,对数据中心的性能、安全、稳定性影响缺乏量化及合理性规划;面对大规模高并发的场景,很难兼顾性能与稳定性、可用性。如何解决上述痛点,实现真正的从“检测”到“分析”再到“控制”的监控体系化建设?本次演讲将和大家一起分享构建苏宁立体式监控的实践。