人工智能与机器学习

会议室:待定
出品人:王兴星

本专题将关注人工智能领域中正在兴起的技术和关键进展,探讨应用于机器学习问题的工程... 展开 >

专题出品人:王兴星

美团点评技术总监

美团点评技术总监,外卖商业技术负责人。2016 年初加入公司,从 0 到 1 搭建外卖商业变现技术体系,支撑效果广告、展示广告、增值服务及站外增长等多条核心产品线,带领团队多次获得事业群大奖。

他曾在搜狗商业、百度凤巢等部门任职,是前搜狗 PC 和无线联盟的算法整体负责人,所研发的大规模训练系统应用于搜狗联盟、DSP 等多个商业产品线。多次获得公司最佳个人、技术部犀牛、MVP 等奖项。

他也是数据挖掘爱好者,曾带领团队获得百度电影推荐大赛全国第一名、RTB 算法竞赛 Online/Offline 第一名等奖项。

专题:人工智能与机器学习

本专题将关注人工智能领域中正在兴起的技术和关键进展,探讨应用于机器学习问题的工程挑战及解决方案。

by 郭流芳

贝壳找房
交易智能技术负责人

图像处理技术是目前人工智能发展最为迅猛的领域,而贝壳找房又是以技术驱动的品质居住服务平台,积累和沉淀了大量的交易数据,场景+数据+算法,贝壳交易智能围绕以房产证识别为核心 OCR 技术架构也在落地实践中逐步建立起来。

本次分享我将重点介绍 OCR 技术的一般流程、各个环节遇到的实际问题以及整个技术架构的变迁,贝壳交易智能是如何通过一个一个技术点的突破,使识别率从无到有,从 95% 到 99% 的。还将介绍下基于业务演进打造的 Uni-iMatch 和 ASLS 系统。

内容大纲

1. 了解贝壳 OCR 能力的三⼤⽅向

  • 房产备件票据卡证类现状
  • 房产合同 IM 类通⽤用文本识别现状
  • 房产征信报告表单类通⽤表格识别现状

2. ⻉壳 OCR 识别的⼀般流程

  • 分类+摆正+检测+识别+结构化+NLP

3. 分类遇到的问题

  • 样本量小,正负类别分布不均

4. 摆正遇到的问题

  • 通⽤摆正的正确率的问题及相应的兜底策略

5. 检测遇到的问题

  • 倾斜和弯曲

6. 识别遇到的问题

  • 分类&序列
  • 形近字和⽣僻字如何处理 

7. 结构化

  • 从位置匹配到⾃定义模版技术
  • 再到深度学习位置关系 

8. 工程化进展

  • 模型裁剪
  • model version 控制

听众收益

1. 了解 OCR 技术的整体架构

  • 分类+摆正+检测+识别+结构化

2. 基本图像技术如何和具体的业务结合

  • VGG16+ 传统特征提⾼摆正准确性
  • DenseNet 的卷积处理,提高识别鲁棒性
  • AdaVancedEAST,更改起始点和终结点,提⾼ IoU
  • Attention 在解码中的应⽤用

3. 形近字和⽣僻字从技术和工程两个角度如何改进

  • 如何增加更加有效的特征
  • GAN 合成数据的冷启动,配合⼯程数据回流,打造自学习闭环

适合人群

图像分类、图像检测等图像处理相关从业技术人员。

 

by 袁晓洁

爱奇艺
高级技术经理

短视频信息流是目前最炙手可热的互联网产品,随之而来的挑战是每天海量 UGC 内容的自动审核、理解和分发问题。内容理解技术是推荐与搜索等业务的基石,本次分享主要介绍爱奇艺的内容理解框架,文本、图像、视频的理解与多模态融合技术,以及框架上支持的视频大规模层次分类、内容标签、视频质量、深度语义表示(embedding)等项目的技术解析与实践心得,包括如何实现自动质量审核和高准确率标签,以及多模态 embedding 在推荐和搜索场景中是怎样大放异彩的。

内容大纲

1.内容理解的应用

2.爱奇艺内容理解框架

3.内容理解特征表示技术

  • 整体架构
  • 文本建模
  • 图像建模
  • 视频建模
  • 多模态融合

4.内容理解任务层技术

  • 大规模层次分类
  • 内容标签
  • 内容质量
  • embedding

5.未来工作

by 赵中州

阿里巴巴
算法专家、小蜜机器阅读与 VQA 团队 Team Leader

以阿里小蜜为代表的对话式 AI 已应用在购物、办事、助理等多个场景,但目前的问答系统主要依赖于人工知识库的构建,配置成本高且覆盖有效,同时以文字为主的答案表现也不直观。在电商问答场景中,详情图片和 PDF 说明书里有大量信息,如何打通内容和服务,减轻配置成本同时保证体验?这驱动小蜜对多模态问答能力进行了探索。在落地过程中,除了文本和图片跨模态匹配,还需要考虑图片裁切、图文召回、内容呈现等环节,以及海量商品和大促高峰带来的服务延时与吞吐量优化问题。围绕着对话式多模态交互场景,我们沉淀了一套接入快速、效果精准和迭代自动化的图文问答解决方案,横向支撑了店小蜜、盒马小蜜等多个业务场景。本次分享将结合业务落地与学术探索,梳理多模态交互中的挑战、方案及实施路径。

内容大纲

1. 业务背景与典型场景

  • 阿里小蜜问答平台介绍
  • 智能服务之痛
  • 多模态交互       

2. 小蜜中多模态问答挑战与应用

  • 技术挑战             
  • 学术研究中的 VQA
  • 应用场景 & 技术方案
  • 多模态能力大图 & 处理流程

3. 总结与展望

  • 多模态统一路径
  • 面向多模态的技术准备(Take-away message)
  • 多模态交互的未来方向

by 王永康

美团
高级技术专家

美团外卖是全球规模最大的外卖平台,2019 年国内市场份超过 60%,外卖广告变现在外卖的收入中越来越发挥出重要的作用。本次分享主要从外卖的产品形态出发,介绍不同的产品形态对应的技术抓手和技术体系,针对在广告和推荐里的典型场景,介绍业界的主要做法和美团外卖广告的优化方案。

内容大纲

1. 互联网广告发展及外卖广告产品形态;

2. 不同广告类型的业务特点及技术体系;

3. 广告中几个典型场景及实践;

  • 多任务学习中的经典算法、不同应用场景的模型选择和优化实践;
  • 组合预估问题优化实践;
  • graph-Embedding 及序列模型的算法实践;
  • 信息流广告下广告位的智能决策问题优化实践。

听众收益

1. 了解互联网广告发展和外卖广告的主要产品形态;

2. 了解不同广告产品对应的产品和技术体系;

3. 了解在广告场景下,几个典型的问题和对应的解决方案。

by 宋丛礼

快手科技
AI算法专家

人工智能在很多领域有着广泛的应用,近年来在短视频领域出现了利用 AI,尤其是深度学习技术生成图像或视频的应用,吸引了业内广泛关注。基于 AI 的生成式技术区别于传统生成式技术最大的亮点之一就是真实,如变老、变小孩、AI 换脸等,可以达到人眼几乎分辨不出真假的效果。深度学习的一个显著特点是计算量大,尤其在生成式技术方面,需要大量的算力完成从一个数据分布到另一个数据分布的映射,且受到移动设备算力的限制,要在端上做到实时是非常困难的。另外,如何提高卷积神经网络生成结果的质量以及提升时序可控性也是一个挑战。本次分享将会为大家介绍 AI 生成式技术的基本原理,以及如何通过技术创新完成算法从研发到落地的过程。 

内容大纲

1. AI 生成式技术介绍

  • AI 生成式技术研发到落地的流程
  • GAN 简介
  • AI 生成式技术难点

2. AI 生成式技术在快手平台的应用

  • AI 助力快手魔法特效
  • AI 生成式技术在快手春晚活动中的应用

3. 快手自研 AI 生成式技术亮点

  • 计算量压缩
  • 生成质量提升

4. 未来展望

听众受益

  • 了解 AI 生成式技术如何从研发到落地,当中有哪些难点和亮点。
  • 了解 AI 生成式技术在快手平台的应用,及其潜在价值。 

适合人群

想了解人工智能尤其深度学习方面的知识的人群。

 

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86-17310043226