本专题将结合业务场景,重点介绍一些大型使用者的实际落地案例和场景化的细节分析,希... 展开 >
2018年加入科大讯飞华南人工智能研究院担任工程院院长一职,负责科大讯飞人工智能核心技术与产业结合应用落地,同时参与客服NLP、政法NLP、医疗图像识别等AI引擎研发工作。加入科大讯飞之前,周国华先生曾在AI+工业、互联网+医疗、电信移动计费领域公司分别担任联合创始人、项目总监、技术总监职位,拥有近20年的技术研发管理经验,期间主导研发的多个核心产品应用落地,服务超过6000万的家庭用户。
浙江大学硕士,曾就职于微软、腾讯、阿里巴巴全球知名互联网企业,负责产品开发运营工作。2016年加入科大讯飞,现任职讯飞易听说公司总经理,精准教学业务线总经理,华南AI研究院执行院长,参与英语语音识别、语音评测、作文手写识别、语义检测等AI引擎研发工作,并主导全国中高考英语评分引擎的研发。
本专题将结合业务场景,重点介绍一些大型使用者的实际落地案例和场景化的细节分析,希望可以启发大家思考如何将AI整合进业务中,了解AI能为业务具体带来什么收益。
深度学习技术的进步推动了语音识别、机器翻译和语音合成性能取得大幅提升。在大规模训练数据支撑下,语音翻译在日常口语交流、旅游等简单场景跨过了实用门槛,对于帮助解决跨语言沟通交流具有重要意义。不过由于实际应用场景的复杂性,从技术到产品应用还存在许多问题需要持续研究。本次分享从当前语音翻译现状出发,介绍了语音翻译当前主流路线及进展,并结合科大讯飞在语音翻译产品上的探索,针对语音翻译在交替传译和会议同传两种典型应用场景,介绍了实际应用面临的问题和一些解决方案,最后探讨当前语音翻译面临的挑战和未来发展趋势。
内容大纲:
基于深度学习的计算机视觉是AI技术在现实场景的重要应用方向之一,被广泛用于交通管理、无人驾驶、安全监控等领域。然而由于其技术门槛较高,图像识别仍然属于少数研究人员的专属,体现在以下几点:各种新概念层出不穷,掩盖了真实业务的痛点;越来越复杂的神经网络需要强大的 GPU 集群支持,而现实中并非每家公司都有 Google 的强大算力;真正落地的视觉产品需要整合图像标注、模型定义、训练、部署及服务接口等多个步骤,是一个复杂的系统设计问题而非纯算法问题;部分基于 C/C++ 的代码实现,如 Yolo 的 Darknet,难以拓展到真实生产环境下,充分利用现代开发框架如 Tensorflow 等在分布式处理和资源调度上的优势。在这里我们基于腾讯互娱 Turing Lab 近两年将前沿算法和实际项目需求结合的实践经验, 以 YoloV3 的部署和应用为例,探讨一个真正落地的图像识别系统从单机原型开发到基于分布式集群部署和应用的完整演化过程。
听众受益: