毕业于中国科技大学,2012 年前后加入科大讯飞,目前担任科大讯飞移动广告平台(voiceads)数据分析团队技术总监。重点关注 spark 技术生态,在大数据收集、处理、分析与挖掘均有所研究与深入实践,打造了鹰眼系统以解决无效流量鉴别问题。
毕业于中国科技大学,2012 年前后加入科大讯飞,目前担任科大讯飞移动广告平台(voiceads)数据分析团队技术总监。重点关注 spark 技术生态,在大数据收集、处理、分析与挖掘均有所研究与深入实践,打造了鹰眼系统以解决无效流量鉴别问题。
据第三方监测公司数据显示,2016 年机器人模拟和黑 IP 等手段导致的非人恶意流量高达 30%,低质量无效流量的问题一直存在,并逐步蚕食着整个生态,Invalid Traffic 甄别已迫在眉睫。
Invalid Traffic 甄别可归为两方面。第一:规则系统与统计分析,全面了解黑产手段,有针对性的防护,同时积累样本数据。第二:机器学习,依托海量的广告行为数据以及自有业务行为数据,结合 DeepLearning 与传统机器学习,能有效防护不断变化的黑产攻击。