最近三年人工智能在世界各地各个行业都发展得如火如荼,这也是未来各方一致看好的将对... 展开 >
张俊林,中国中文信息学会理事,目前在新浪微博AI Lab担任资深算法专家。在此之前,张俊林曾经在阿里巴巴任资深技术专家,以及在百度和用友担任技术经理及技术总监等职务。他的研发兴趣集中在:深度学习、搜索技术、推荐系统、自然语言处理等方面,并在以上领域有多年学术界研究经历及工业界实践经验。同时他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届输出版优秀图书奖)、《大数据日知录:架构与算法》的作者。
他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在ACL、COLING、IJCNLP等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部DARPA主持的TREC高精度检索系统评测中取得综合排名第一名的优异成绩。
最近三年人工智能在世界各地各个行业都发展得如火如荼,这也是未来各方一致看好的将对人类生活产生重大影响的现象级方向。而深度学习是推动2015年开始的这波人工智能热潮的发动机,目前深度学习在图像理解,自然语言处理,语音识别等很多领域产生了重大的技术飞跃,这是支撑人工智能真正落地的基石。
目前各大互联网公司的不同类型业务也处于从传统机器学习方法向深度学习方法升级与迁移的过程中,借鉴这些做前沿探索的专家经验对于实践者有很大的帮助作用。本专题希望能够深入介绍深度学习在各个方向的前沿技术进展,以及深度学习在各互联网公司的实际落地应用。
本次演讲将聚焦计算广告领域,重点介绍深度学习在快报/应用宝广告投放中的三大应用:
视频内容观看目前已经成为互联网上用户消费深度最高,消费时间最长的内容消费方式,爱奇艺作为视频领域的领头羊,拥有互联网上最多的视频观看用户,我们的目标是利用大数据的机器学习和人工智能算法,为这些用户精确分发推荐个性化的视频内容,并且打造良好的内容生态,持续促进内容的生产和消费。
我将介绍爱奇艺视频Feed推荐的整体架构,以及我们如何利用人工智能和机器学习算法打造个性化推荐的排序、召回,视频内容理解等重点模块,并且重点介绍我们在推荐的每个阶段深入的引入深度学习模型来提高推荐的效果,包括:
文档资料的内容自动化处理有广阔的应用前景,在大型集团企业、政府、教育、金融等行业客户中代替人工来自动化进行文档处理,是人工智能技术落地的关键应用之一。在对篇幅较长的文本进行内容理解和信息挖掘过程中,如何应用深度学习技术来进行更好的进行分析挖掘。另外还将探讨深度学习模型和统计语言模型的相互结合,以及工程实践中值得注意的应用点等实践知识。
随着移动化时代人们对信息获取方式的不断变化,如何提升Feed流的内容分发效率成为了业界互联网公司不断探索研究的热点问题。例如:给用户分发哪些内容?这些内容如何排序?如何评价用户是否对内容真正感兴趣?如何精准的链接内容与用户?
本次演讲将与大家分享微博信息流如何基于海量的用户行为数据进行大规模模型构建,模型优化与排序策略优化,深度学习在Feed流排序的实践与应用相关工作。
近年来深度学习作为人工智能的核心技术在图像、语音、自然语言处理等领域都取得了很大突破。在自然语言处理方面,深度学习在句法分析、语义分析、文本匹配、机器翻译等方向都有很多进展。文本匹配作为一个基础技术在搜索、推荐、对话等场景中有着广泛应用。
百度NLP于2013年设计研发了一种有监督的神经网络语义匹配模型SimNet,显著提升了文本匹配效果。随后几年,我们持续积累该技术,于2017年进一步提出语义匹配框架SimNet2.0,该框架无论匹配效果还是场景扩展性都有很大飞跃。基于该框架,我们在百度搜索、百度资讯流等产品取得很多成功应用。尤其在百度搜索上,我们累计上线相关项目20余个,显著改善长冷query搜索效果,极大提升搜索智能化体验。
本次演讲主要介绍百度NLP的神经网络语义匹配技术,分享其在百度搜索中的实践经验。
随着深度学习在工业界的大规模应用,搜索算法领域迎来了全新的技术革命,在视频领域的技术变革更加明显。和电商的搜索不同,在电商领域具备天然的结构化类目体系和标签体系,视频搜索领域仅仅依靠文本理解远远不够,这给深度学习在视频内容理解、NLP、语义模型、内容分发提供了更为宽广的实践空间。本次分享将结合实际应用介绍优酷视频搜索算法利用深度学习解决语义模型、内容理解、数据分发方面的深入思考和实践经验。
随着互联网金融的发展以及PayPal接入越来越多的商家和平台,各业务部门都在极力推进机器学习的应用尤其是风控模型的应用。然而,无论是从业务方还是平台部门角度来讲,构建机器学习的平台可以更加快速有效的帮助用户快速构建原型、部署模型、做线上实验等。本议题主要介绍PayPal在构建机器学习平台方面做的相关工作和经验。