人工智能应用与实践

会议室:宴会厅1
出品人:张俊林

人工智能正在各行各业产生着日益重要的作用,尤其是图像视频,自然语言处理,搜索推荐... 展开 >

专题出品人:张俊林

新浪微博 机器学习团队 AI Lab 负责人

张俊林,中国中文信息学会理事,中科院软件所博士。目前担任新浪微博机器学习团队 AI Lab 负责人。在此之前,张俊林曾经在阿里巴巴任资深技术专家并负责新技术团队,以及在百度和用友担任技术经理及技术总监等职务。他是技术书籍《这就是搜索引擎:核心技术详解》(该书荣获全国第十二届优秀图书奖)、《大数据日知录:架构与算法》的作者。

他本科毕业于天津大学管理学院,之后在中科院软件所直接攻读博士学位,研究方向是信息检索理论与自然语言处理,就学期间曾在 ACL2006、COLING2004、IJCNLP2004 等国际顶级会议发表多篇学术论文。另外,他在此期间领导设计的搜索系统曾在美国国防部 DARPA 主持的 TREC 高精度检索系统评测中取得综合排名第一名的优异成绩。近年来,陆续在 Recsys2019 以及 ICDM2019 等国际会议发表多篇深度学习推荐系统相关论文。

地点:宴会厅1

专题:人工智能应用与实践

人工智能正在各行各业产生着日益重要的作用,尤其是图像视频,自然语言处理,搜索推荐等领域,AI 已经不仅仅限于概念,而是切实地在各种实际应用中落地并促进了应用的极大发展。本专题集中介绍各个互联网公司在以上多个 AI 领域的具体应用实践,涉及到多个领域的应用场景,方案选型,实际效果等各种经验总结。

by 方非

阿里巴巴
高级算法专家

作为国内领先的电商交易平台,手机淘宝每天都会发生海量的用户行为和交易动作。我们希望能够充分利用这些数据和合适的算法,来更加智能的进行主动内容推送和营销。应用内的推荐会偏向于处理用户来访所引发的推荐需求,而我们要做的更多是一种主动推荐,目标是通过将用户状态、触发内容和触发时机进行统一的建模,来主动的进行消息和关键内容推送,让用户不要错过真正有用的事件和信息。

听众收益

1. 手淘消息 Push 平台介绍,以及对于用户增长的帮助和定位;
2. ​​强化学习和个性化情景计算如何有效解决消息推送时机、内容选择、打扰度控制、场景选择等难题;
3. ​如何结合业务目标设定有效和科学的长期收益目标,并且通过算法建模和优化长期收益。

by 刘挺

美图
数据智能部内容挖掘平台负责人

伴随着 UGC(用户原创内容)的蓬勃发展,以及美图社区规模快速扩展,美图智能化内容挖掘技术也随之迎来了巨大的挑战。目前美图秀秀月活过亿,如何处理用户每天产生的海量图文、视频等多形态内容?如何应对 UGC 主题五花八门,质量良莠不齐问题?这些问题给内容理解带来了极大的挑战,同时也给我们原有的技术体系带来了巨大的变革。

在实践的过程中,我们探索出了一条能有效解决这些问题的道路,并构建了美图智能化内容挖掘平台 K2 。K2 平台集成了基于 mobilenet+ssd 的图片和视频中水印检测识别技术、图像语义相关检索技术、基于 inceptionv3 的图像场景分类技术、在内容打散中的图像聚类技术等美图在多个领域的技术积累。K2 平台通过更好更全面地理解内容,从而知道用户想要表达什么,并且通过对用户进行全方位的刻画,极大的提升推荐、搜索的效果。同时 K2 平台也能辅助人工审核,提升公司内部运营效率。

在本次分享中,我们将会大家介绍下美图搭建一个完整的内容挖掘平台的具体实践以及 K2 的一些核心设计思路。

听众受益 

    1. 美图内容挖掘平台介绍,了解如何搭建一个完整的内容挖掘平台;

    2. 了解图像处理技术在内容理解中的应用;

    3. 了解如何利用内容理解来提升推荐和搜索的效果,如何利用 AI 技术来辅助人工运营。

by 刘一鸣

第四范式
基础架构负责人

相比于 MapReduce 等传统数据处理做法,大规模分布式 AI 场景下的网络通信面临着不一样的挑战。对于处理大规模离散特征的算法,如逻辑回归(LR),消息吞吐量将直接影响到整个训练任务的性能。对于处理稠密特征的深度学习算法或者是树模型(GBDT),网络延迟很容易成为性能瓶颈。 不同的 AI 算法面临不一样的性能瓶颈,我们设计了自己的 RPC 框架——PRPC,以求能在多变的 AI 场景下,都能实现优秀的性能。 通过 Zerocopy 和自研事件调度系统降低通信延迟;通过 RDMA 技术优化机器学习离线训练和线上预估。PRPC 的定位是尽可能的适应不同的机器学习的场景,提升分布式计算的性能,所以我们让他与应用层进行了适当的耦合,从而使的整个过程都是 Zerocopy 的,同时上层算法也尽可能进行原地计算,使的整个机器学习任务的性能达到极致。 对于 LR 算法和 GBDT 算法,RDMA 模式下的 PRPC 有数倍性能提升。与 ZMQ,BPRC 和 GRPC 对比 PRPC 在大部分机器学习场景下有较大性能优势。 

听众受益

  1. 了解大规模分布式机器学习场景下不同算法的性能瓶颈和解决思路;
  2. 高性能组件 RDMA 在大规模分布式机器学习场景下的应用和网络性能优化经验;
  3. RPC 的接口设计以及 Linux 事件调度的优化。  

by 王硕寰

百度
资深研发工程师
百度 ERNIE 语义理解框架
所属领域: 人工智能

近两年来,语义表示技术在多个自然语言处理任务上取得了突破,大规模预训练在自然语言处理领域变得至关重要,被业界称为开启了 NLP 的新时代。百度也发布了持续学习的语义理解框架 ERNIE,在多个中英文任务上超越了 BERT 和 XLNet,取得领先效果。此次演讲,主要围绕语义表示技术以及百度的持续学习语义理解框架 ERNIE 展开。

内容大纲

1.语义表示技术简介;

2.百度 ERNIE 语义理解框架;

3.ERNIE 应用实践;

4.语义表示技术未来展望。

听众收益

1.了解语义表示的基础技术与前沿进展;

2.深度了解百度 ERNIE 语义理解框架;

3.了解 ERNIE 的应用实践经验,提升业务效果。

by 张俊林

新浪微博
机器学习团队 AI Lab 负责人

工业界的实用化推荐系统一般分为召回和排序环节,而排序环节是其中技术较为复杂的部分。随着技术的发展,除了常见的LR/FM等传统模型,深度学习排序模型比如 Wide&Deep 模型、DeepFM 模型等各种新型模型也逐步落地到各个公司的实际业务中,并产生了较好的应用效果。

但是,目前的深度学习排序模型还是主要基于算法工程师手工设计模型的模式,这本身仍然具有很大的局限性。AutoML 作为自动进行模型探寻的技术方案,目前在图像以及自然语言处理领域已经取得较大的成效,但是在推荐系统以及 CTR 预估领域里,AutoML 如何应用并自动找到比手工设计更好的模型?这个问题还是一个具备挑战的新兴探索方向。本次分享,我们会介绍新浪微博利用 AutoML 技术方案来自动搜寻排序模型的探索和相关的经验性的结论。

内容大纲

  1. 推荐系统简介;
  2. 推荐系统常用排序模型介绍;
  3. AutoML 技术介绍;
  4. AutoML 如何应用在推荐系统的排序模型搜索中;
  5. 一些经验性的结论。

听众收益

  1. 可以掌握推荐系统技术前沿进展;
  2. 可以了解 AutoML 技术的主流方法;
  3. 可以掌握 AutoML 在排序模型的应用及其效果。

by 张俊林

新浪微博
机器学习团队 AI Lab 负责人

工业界的实用化推荐系统一般分为召回和排序环节,而排序环节是其中技术较为复杂的部分。随着技术的发展,除了常见的LR/FM等传统模型,深度学习排序模型比如 Wide&Deep 模型、DeepFM 模型等各种新型模型也逐步落地到各个公司的实际业务中,并产生了较好的应用效果。

但是,目前的深度学习排序模型还是主要基于算法工程师手工设计模型的模式,这本身仍然具有很大的局限性。AutoML 作为自动进行模型探寻的技术方案,目前在图像以及自然语言处理领域已经取得较大的成效,但是在推荐系统以及 CTR 预估领域里,AutoML 如何应用并自动找到比手工设计更好的模型?这个问题还是一个具备挑战的新兴探索方向。本次分享,我们会介绍新浪微博利用 AutoML 技术方案来自动搜寻排序模型的探索和相关的经验性的结论。

内容大纲

  1. 推荐系统简介;
  2. 推荐系统常用排序模型介绍;
  3. AutoML 技术介绍;
  4. AutoML 如何应用在推荐系统的排序模型搜索中;
  5. 一些经验性的结论。

听众收益

  1. 可以掌握推荐系统技术前沿进展;
  2. 可以了解 AutoML 技术的主流方法;
  3. 可以掌握 AutoML 在排序模型的应用及其效果。

by 张亚中

网易传媒
资深算法工程师

移动互联网时代数据呈现严重的信息过载,用户很难快速地找到自己想要的信息。网易新闻客户端作为新闻资讯平台,帮助用户从海量信息中找到感兴趣的内容,通过连接用户和内容实现个性化推荐。为了实现上述目标,需要同时对用户兴趣和资讯内容进行建模,其中通过算法进行内容理解是建模的基础,也是推荐系统的基石。

网易新闻包含图文、视频、公开课等多种形式的数据,各类型数据需要采用不同的内容分析方法。针对文本内容,我们通过 xgboost 等经典机器学习方法和 textcnn、bert 等深度学习方法进行文本分类和标签生成。针对视频内容,我们基于视频、音频和文本等多模态信息融合进行视频理解。本次分享中,我们将介绍在新闻推荐场景下利用 NLP、CV 及多模态技术对资讯数据进行语义分析的经验和实践。

内容大纲

1.网易新闻的标签体系概览;

2.基于 NLP 的文本内容分析;

3.基于 CV 的视觉内容分析;

4.多模态融合技术的落地实践。

听众收益

1.了解网易新闻的标签体系;

2.了解基于机器学习和深度学习的标签提取方法;

3.了解多模态技术在视频理解中的应用。

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86 17310043226