施杨斌,高级技术专家,2011年复旦大学毕业后加入阿里巴巴,前期在阿里妈妈负责实时广告竞价系统和Dsp系统的研发,涉及的技术领域主要在大规模实时计算、高性能架构设计、领域建模和平台化建设方面。2015年加入达摩院机器智能技术实验室翻译平台团队,负责机器翻译语料平台和解决方案两个方向,专注于文本类大数据平台搭建、多语言知识图谱、数据挖掘、多语言NLP、深度学习应用、商业化解决方案等领域。
施杨斌,高级技术专家,2011年复旦大学毕业后加入阿里巴巴,前期在阿里妈妈负责实时广告竞价系统和Dsp系统的研发,涉及的技术领域主要在大规模实时计算、高性能架构设计、领域建模和平台化建设方面。2015年加入达摩院机器智能技术实验室翻译平台团队,负责机器翻译语料平台和解决方案两个方向,专注于文本类大数据平台搭建、多语言知识图谱、数据挖掘、多语言NLP、深度学习应用、商业化解决方案等领域。
“语言”是跨境交易主要的障碍之一,在阿里集团国际化背景下,阿里机器翻译重点在电商场景翻译上进行优化,目前已支持21个语种的48个语言方向的翻译,日均使用量达到7.5亿次。除了基础的文本翻译,还支持实时语音、图片以及视频翻译,在集团内应用于阿里巴巴国际站、速卖通、LAZADA、菜鸟、阿里云、钉钉和飞猪等40多个业务部门。
本次分享结合阿里跨境电商业务特点和挑战,重点介绍深度学习技术在机器翻译、语种识别、语料筛选和挖掘、电商标题改写,智能纠错等方面的技术创新和应用。