视频 AI 的工业级应⽤

会议室:311
出品人:胡尧

随着智能设备拍摄硬件的快速升级及 5G 网络时代的到来,视频生产和传输的成本⼤幅... 展开 >

专题出品人:胡尧

阿里巴巴资深算法专家

胡尧,阿里巴巴资深算法专家。2015 年博士毕业于浙江大学计算机学院 CAD & CG 国家重点实验室,博士期间发表国际顶级会议/期刊论文 30 余篇,担任 NIPS、ICML、AAAI、IJCAI、CVPR 等国际顶级学术会议程序委员会委员,及 TPAMI、TIP、TNNLS、TKDE 和 TMM 等国际顶级期刊审稿人;先后在百度研究院和滴滴研究院从事大规模机器学习算法工作的研发,2017 年加入阿里巴巴,当前主要负责阿里文娱智能视频推荐、视频内容理解及自动化生产等相关业务。

地点:311

专题:视频 AI 的工业级应⽤

随着智能设备拍摄硬件的快速升级及 5G 网络时代的到来,视频生产和传输的成本⼤幅降低。然⽽由于技术能⼒的不⾜,当前在整个视频消费领域尚存在诸多问题,如:

  • 如何降低视频制作⻔槛,让普通用户能够简单快捷制作出专业水准的短视频;
  • 如何针对影视剧内容自动化生产精彩片段和素材进行⼆次加工;
  • 如何在视频消费的场景为用户创造更多的互动消费;
  • 如何深度地理解视频概念及语义信息,并替代传统人⼯重复性低效劳动等。

针对这些问题,本专题特别邀请了多家行业内知名公司的视频 AI 专家来分享他们在各自领域的技术实践。

 

by 张德兵

格灵深瞳
首席科学家

人脸识别作为一个经典的计算机视觉任务,已成为非常重要的一个落地方向。本次分享将介绍人脸识别的基本概念,当前最新的学术界研究进展以及工业界如何进行大规模训练和测试的一些尝试,FRVT 人脸识别竞赛夺冠的一些经验和感受,以及人脸识别和聚类方向的一些技术和应用探索。  

1. 人脸识别的几种常见类型

  • 1:1 人脸比对
  • 1:N 人脸检索
  • N:N 实时监控
  • 人脸虚拟 ID 聚类

2. 人脸识别前沿进展

  • 基于传统特征的方法
  • 基于 Metric Learning 的方法
  • 基于 Margin 的方法
  • 基于 Mimic 的方法
  • 基于无监督的方法

3. 人脸识别的大规模分布式训练

  • 数据并行
  • 模型并行
  • 联合训练

4. 人脸识别的大规模评测和指标

  • GPU 加速
  • TPR/FPR
  • LFW/MegaFace/TrillionPairs/FRVT 竞赛

听众受益

  1. 了解最新的人脸识别技术前沿进展
  2. 了解大规模分布式模型训练的思路
  3. 了解人脸识别的多个不同的任务类型和评测标准
  4. 了解人脸识别效果的多种影响因素
  5. 了解人脸识别和聚类的基本应用

适合人群

了解基本的机器学习和深度学习原理、了解以图搜图基本概念、了解模型训练和优化基础的学生和计算机视觉从业者。 

by 丁飞

阿里巴巴
高级算法专家

随着 5G 时代的到来,视频逐渐成为互联网中最主要的内容消费形态。我们通过多模态视频理解和生产技术,使视频创作从全人工变成算法半自动化或全自动化,极大地提升视频生产效率。

本次分享将介绍阿里摩酷实验室在视频内容自动化生产的最新工作,包括视频封面图的生产和加工,电影/电视剧预告片生产,BGM 混剪视频生产等,介绍如何从业务和技术视角重新定义 Video Highlight、Video Summary、Video Thumbnail 等问题,介绍动作/场景检测、视频质量、人脸、音/视频切分等技术在视频内容自动化生产中的应用。

内容大纲

1. 视频内容自动化生产的背景和应用

2. 短、小视频封面图生产

  • 重新定义 Video Thumbnail——静态封面图生产方案
  • 让封面更有吸引力——封面图加工和美化
  • 让封面动起来——GIF 图生产

3. 电影/电视剧预告片生产

  • 如何检测高光时刻——重新定义 Video Highlight
  • 如何做视频摘要——重新定义 Video Summary
  • 剧情向、人物向、观影高潮向的影视预告片生产

4. 混剪视频生产

  • 如何做混剪——剧本、素材和 BGM
  • 你需要的子弹——素材库的建设
  • “燃、炸、裂”——BGM 卡点视频生产方案

5. 视频内容生产的下一站——Future work

听众受益

  1. 了解视频内容自动化生产的最新进展
  2. 了解工业界 Video Summary、Video Highlight 和 Video Thumbnail 的问题定义和解法
  3. 了解动作检测、图像/视频质量、场景分类、人脸、音/视频分镜等技术在视频内容自动化生产中的最新应用

适合人群

对图像、视频技术感兴趣的工业界和学术界人士。

 

交通指南

© 2020 Baidu - GS(2019)5218号 - 甲测资字1100930 - 京ICP证030173号 - Data © 长地万方
想要批量报名或更多优惠?
立即联系票务小姐姐 Ring
或致电:+86 17310043226