随着智能设备拍摄硬件的快速升级及 5G 网络时代的到来,视频生产和传输的成本⼤幅... 展开 >
胡尧,阿里巴巴资深算法专家。2015 年博士毕业于浙江大学计算机学院 CAD & CG 国家重点实验室,博士期间发表国际顶级会议/期刊论文 30 余篇,担任 NIPS、ICML、AAAI、IJCAI、CVPR 等国际顶级学术会议程序委员会委员,及 TPAMI、TIP、TNNLS、TKDE 和 TMM 等国际顶级期刊审稿人;先后在百度研究院和滴滴研究院从事大规模机器学习算法工作的研发,2017 年加入阿里巴巴,当前主要负责阿里文娱智能视频推荐、视频内容理解及自动化生产等相关业务。
随着智能设备拍摄硬件的快速升级及 5G 网络时代的到来,视频生产和传输的成本⼤幅降低。然⽽由于技术能⼒的不⾜,当前在整个视频消费领域尚存在诸多问题,如:
针对这些问题,本专题特别邀请了多家行业内知名公司的视频 AI 专家来分享他们在各自领域的技术实践。
人脸识别作为一个经典的计算机视觉任务,已成为非常重要的一个落地方向。本次分享将介绍人脸识别的基本概念,当前最新的学术界研究进展以及工业界如何进行大规模训练和测试的一些尝试,FRVT 人脸识别竞赛夺冠的一些经验和感受,以及人脸识别和聚类方向的一些技术和应用探索。
1. 人脸识别的几种常见类型
2. 人脸识别前沿进展
3. 人脸识别的大规模分布式训练
4. 人脸识别的大规模评测和指标
了解基本的机器学习和深度学习原理、了解以图搜图基本概念、了解模型训练和优化基础的学生和计算机视觉从业者。
随着 5G 时代的到来,视频逐渐成为互联网中最主要的内容消费形态。我们通过多模态视频理解和生产技术,使视频创作从全人工变成算法半自动化或全自动化,极大地提升视频生产效率。
本次分享将介绍阿里摩酷实验室在视频内容自动化生产的最新工作,包括视频封面图的生产和加工,电影/电视剧预告片生产,BGM 混剪视频生产等,介绍如何从业务和技术视角重新定义 Video Highlight、Video Summary、Video Thumbnail 等问题,介绍动作/场景检测、视频质量、人脸、音/视频切分等技术在视频内容自动化生产中的应用。
1. 视频内容自动化生产的背景和应用
2. 短、小视频封面图生产
3. 电影/电视剧预告片生产
4. 混剪视频生产
5. 视频内容生产的下一站——Future work
对图像、视频技术感兴趣的工业界和学术界人士。