自 Alexnet 在 2012 年提出,引爆了深度神经网络的研究热潮,已有7年... 展开 >
腾讯PCG 社交应用产品部技术总监,腾讯T4技术专家,天天P图项目技术负责人。主导研发孵化多款千万级日活跃移动端产品,产品多次冲击 AppStore 榜首,AI 应用图像领域资深专家。提供公司级图像算法 AI 组件及图像算法云,支持微信,QQ 等核心业务。设计超大规模图像算法类运营云服务,提供1亿/日级别图片运营能力。
自 Alexnet 在 2012 年提出,引爆了深度神经网络的研究热潮,已有7年时间,这七年之中,深度学习势如破竹,遍地开花,突破性论文层出不穷,从人脸识别,五官定位,体态识别,到语义分割,自然语言处理,TTS,很多传统方法难以很好解决的问题,在深度学习的帮助下,都有了巨大的飞跃。也引爆了AI投资的热潮,各大公司纷纷投入巨大资源进行 AI 研究。DeepMind 更是以 Alphago,点燃了大众对 AI 技术的持续关注。
在 AI 高速发展的第七个年头,以深度学习为基础的新一代 AI 技术,已经从跑分刷榜的研究竞赛,转换为跑场景为产品赋能的切实业务尝试。AI 技术也更贴近生活,贴近应用,在不同场景中均能看到AI落地的影子,包括安防,医疗,自动驾驶,短视频推荐,工业检测,机器翻译以及直播等各类互动娱乐产品。
本次专题,我们特地邀请行业内人工智能场景落地的专家,从科技感爆棚的无人驾驶,到日常亲切的物流行业,从到语音识别的革新,到日常视频播放技术的智能升级,多维度为大家呈现 AI 对行业改造,AI 升级带来的产业硕果。
在基本解决了由带宽不足而造成的观看卡顿问题后,如何进一步为用户提供更清晰流畅更有趣的视听体验是当下视频网站所面临的挑战之一。本议题将分享 AI 算法在爱奇艺智能播放场景中的新应用探索,重点介绍在蒙版弹幕、智能倍帧、画质增强等场景中落地实现方面所面临的挑战和解决方案,如在蒙版弹幕场景中如何提升图像分割的精度和速度、解决分割误差带来的弹幕抖动问题,解决倍帧效果不理想时引入的残影等一系列问题。
1. 智能播放技术探索综述;
2. 画质增强;
3. 智能倍帧;
4. 蒙版弹幕。
1. 了解到 AI 技术在爱奇艺播放场景中的最新落地进展;
2. 了解图像分割等基于深度学习的技术在工程方面的挑战和解决方案。
深度学习不光在图像视频识别中取得了成功,在传统的图像视频处理中也取得了巨大进展。本演讲将根据团队超过 10 篇顶级会议研究成果以及在腾讯的落地实践,介绍深度学习如何攻克传统视觉在图像视频处理中的难题。演讲的第一部分将重点介绍图像视频恢复问题,如图像视频的去模糊,超分辨率,补全,上色等。第二部分将介绍图像视频的增强与编辑问题,如如何让千元手机拍出高端手机的夜景效果,如何自动改变人脸属性等。在介绍技术的同时,还将重点讨论图像视频处理AI技术如何服务用户和产业。
针对物流行业的痛点,通过对物流流程中的仓储、运输节点、车辆和末端的摄像头内容进行实时理解,提供车牌、到港离港、装载率、违规分拣、人员能效、场地安全等指标,从而将摄像头从简单的监控回溯设施升级为智能感知设备,进而对物流全流程的智能管理。
1. 物流行业应用 AI 技术的背景;
2. 大型边缘异构计算的设计思路;
3. 物流行业如何应用大型边缘异构计算。
Embedding 模型作为一类简单、高效、通用的模型,在机器学习中有着广泛的应用。Embedding 模型可以用来解决如下问题:
每一个视频,不论长短,在拍摄时都是有故事线和逻辑结构的,以往的视频分析主要集中于视频分类打标,而对于视频的细粒度结构分析涉及较少。如果我们在视频搜索中查询“某某角色战胜另外一位角色的打斗片段”,仅有基于关键词的匹配是远远不够的。电视剧或者电影在拍摄时都是从小片段拍出来的,如何像导演一样来解构视频是视频理解中一个非常挑战性的问题,它不仅涉及到基于计算视觉、ASR、OCR、NLP 等一系列多模态分析技术,还涉及到视频内容制作的原理和方法,如何能够对视频做完整的逆向工程不仅对于多模态搜索推荐,而且对于视频智能创作、后期都有很大的助力。这里我将给大家介绍优酷在结构化视频理解方面做的一些尝试工作,从应用到系统、算法设计给出我们的经验尝试。
目前,如何大规模、低成本生产无人驾驶高精地图是业界的一个难点。DeepMap 作为高精地图生产服务和定位服务提供商,可以帮助企业处理大规模 ADAS 地图以及用于 L3、L4 自动驾驶的点云地图。其中,自动化生成 ADAS 地图是大规模制图的关键一环。本演讲包含了高精地图与传统地图的区别,常用传感器的应用,以及如何使用深度学习提高矢量地图生产的自动化率。
随着 Amazon 的 Echo 走红、Google 的 Home 智能音箱的迎头追赶到国内的百度、小米、阿里等巨头在智能音箱市场的竞争,其技术的核心均围绕语音和对话式 AI 技术,本分享结合 DuerOS 系统下的对话式应用场景介绍对话式 AI 中主要问题,结合实际问题分析其中的挑战,以及 DuerOS 在综合 NLU、搜索、推荐等方向的技术打造智能对话式 AI 的实践,同时也介绍其中深度学习和增强学习等的应用。
一. 从人机交互的演进看对话式 AI 的崛起
1. 人机交互的演进历史
2. 对话式交互是什么
3. 为什么需要对话式交互
4. 什么场景下对话式交互更有效
二. 对话系统是一个集大成的问题域
1. 对话系统的主要类型
2. 对话系统的主要框架
3. 对话理解
4. 对话状态跟踪
5. 对话管理
6. 对话生成
7. 对话场景下的检索和推荐技术
1. 了解对话系统技术火热背后的产品背景和逻辑;
2. 了解对话系统的经典技术框架;
3. 学习对话理解中的经典 NLP 技术;
4. 了解对话场景下检索和推荐技术的一些独特应用。