视频 AI 的工业级应⽤

会议室：311

出品人：胡尧

随着智能设备拍摄硬件的快速升级及 5G 网络时代的到来，视频生产和传输的成本⼤幅... 展开 >

旗下议题

出品人介绍

Topic 1
工业级大规模人脸识别和聚类
张德兵
格灵深瞳首席科学家
Topic 2
让算法做 BGM 卡点视频？——视频内容自动化生产实战
丁飞
阿里巴巴高级算法专家

专题出品人：胡尧

阿里巴巴资深算法专家

胡尧，阿里巴巴资深算法专家。2015 年博士毕业于浙江大学计算机学院 CAD & CG 国家重点实验室，博士期间发表国际顶级会议/期刊论文 30 余篇，担任 NIPS、ICML、AAAI、IJCAI、CVPR 等国际顶级学术会议程序委员会委员，及 TPAMI、TIP、TNNLS、TKDE 和 TMM 等国际顶级期刊审稿人；先后在百度研究院和滴滴研究院从事大规模机器学习算法工作的研发，2017 年加入阿里巴巴，当前主要负责阿里文娱智能视频推荐、视频内容理解及自动化生产等相关业务。

地点：311

专题：视频 AI 的工业级应⽤

随着智能设备拍摄硬件的快速升级及 5G 网络时代的到来，视频生产和传输的成本⼤幅降低。然⽽由于技术能⼒的不⾜，当前在整个视频消费领域尚存在诸多问题，如：

如何降低视频制作⻔槛，让普通用户能够简单快捷制作出专业水准的短视频；
如何针对影视剧内容自动化生产精彩片段和素材进行⼆次加工；
如何在视频消费的场景为用户创造更多的互动消费；
如何深度地理解视频概念及语义信息，并替代传统人⼯重复性低效劳动等。

针对这些问题，本专题特别邀请了多家行业内知名公司的视频 AI 专家来分享他们在各自领域的技术实践。

by 张德兵

格灵深瞳

首席科学家

工业级大规模人脸识别和聚类

人脸识别作为一个经典的计算机视觉任务，已成为非常重要的一个落地方向。本次分享将介绍人脸识别的基本概念，当前最新的学术界研究进展以及工业界如何进行大规模训练和测试的一些尝试，FRVT 人脸识别竞赛夺冠的一些经验和感受，以及人脸识别和聚类方向的一些技术和应用探索。

1. 人脸识别的几种常见类型

1:1 人脸比对
1:N 人脸检索
N:N 实时监控
人脸虚拟 ID 聚类

2. 人脸识别前沿进展

基于传统特征的方法
基于 Metric Learning 的方法
基于 Margin 的方法
基于 Mimic 的方法
基于无监督的方法

3. 人脸识别的大规模分布式训练

数据并行
模型并行
联合训练

4. 人脸识别的大规模评测和指标

GPU 加速
TPR/FPR
LFW/MegaFace/TrillionPairs/FRVT 竞赛

听众受益

了解最新的人脸识别技术前沿进展
了解大规模分布式模型训练的思路
了解人脸识别的多个不同的任务类型和评测标准
了解人脸识别效果的多种影响因素
了解人脸识别和聚类的基本应用

适合人群

了解基本的机器学习和深度学习原理、了解以图搜图基本概念、了解模型训练和优化基础的学生和计算机视觉从业者。

by 丁飞

阿里巴巴

高级算法专家

让算法做 BGM 卡点视频？——视频内容自动化生产实战

随着 5G 时代的到来，视频逐渐成为互联网中最主要的内容消费形态。我们通过多模态视频理解和生产技术，使视频创作从全人工变成算法半自动化或全自动化，极大地提升视频生产效率。

本次分享将介绍阿里摩酷实验室在视频内容自动化生产的最新工作，包括视频封面图的生产和加工，电影/电视剧预告片生产，BGM 混剪视频生产等，介绍如何从业务和技术视角重新定义 Video Highlight、Video Summary、Video Thumbnail 等问题，介绍动作/场景检测、视频质量、人脸、音/视频切分等技术在视频内容自动化生产中的应用。