孙宇,百度自然语言处理部主任架构师,NLP智能客服技术团队负责人。2011年加入百度,长期从事自然语言处理、机器学习、信息检索等领域的技术研发工作,在深度学习、文本语义计算、搜索排序等技术方向有丰富的研究与实践经验。主导研发的百度语义匹配框架SimNet、Query语义理解等技术在百度搜索、百度资讯流、百度地图等百度众多产品广泛应用。参与项目曾3次进入百度最高奖final round。当前主要负责语义解析与匹配、智能客服技术方向。
孙宇,百度自然语言处理部主任架构师,NLP智能客服技术团队负责人。2011年加入百度,长期从事自然语言处理、机器学习、信息检索等领域的技术研发工作,在深度学习、文本语义计算、搜索排序等技术方向有丰富的研究与实践经验。主导研发的百度语义匹配框架SimNet、Query语义理解等技术在百度搜索、百度资讯流、百度地图等百度众多产品广泛应用。参与项目曾3次进入百度最高奖final round。当前主要负责语义解析与匹配、智能客服技术方向。
近年来深度学习作为人工智能的核心技术在图像、语音、自然语言处理等领域都取得了很大突破。在自然语言处理方面,深度学习在句法分析、语义分析、文本匹配、机器翻译等方向都有很多进展。文本匹配作为一个基础技术在搜索、推荐、对话等场景中有着广泛应用。
百度NLP于2013年设计研发了一种有监督的神经网络语义匹配模型SimNet,显著提升了文本匹配效果。随后几年,我们持续积累该技术,于2017年进一步提出语义匹配框架SimNet2.0,该框架无论匹配效果还是场景扩展性都有很大飞跃。基于该框架,我们在百度搜索、百度资讯流等产品取得很多成功应用。尤其在百度搜索上,我们累计上线相关项目20余个,显著改善长冷query搜索效果,极大提升搜索智能化体验。
本次演讲主要介绍百度NLP的神经网络语义匹配技术,分享其在百度搜索中的实践经验。