近两年,神经机器翻译(NMT: Neural Machine Translation)技术异军突起,翻译质量取得大幅提升。但不幸的是,NMT 系统的训练成本非常高,限制了这一技术的大范围使用。

7月12日,阿里巴巴披露的一份技术资料中显示,阿里翻译团队通过使用阿里云机器学习平台PAI实现了模型训练效率5倍的飞跃,并已应用在英俄电商翻译质量优化项目中。

神经机器翻译是一种用于自动翻译的端到端的学习方法,该方法能够克服传统的基于短语的翻译系统的缺点,可以将整个输入句子视作翻译的基本单元。从2016年以来的学术界顶级会议上,几乎全是围绕NMT相关的创新工作,之后谷歌、微软等巨头公司相继发布NMT系统。

在阿里巴巴内部,阿里翻译负责为1688国际站、全球速卖通等提供多语言服务,中国卖家填写的一些中文信息会被机器自动翻译成多国语言。该团队同时还为钉钉、东南亚电商Lazada等提供服务。

去年,他们首次将NMT技术应用在通讯场景下。虽然翻译质量取得很大的提升,但模型训练耗时太长。3000万的训练数据在单块GPU卡上一般需要训练20天以上,才能得到一个初步可用的模型。

之后,他们尝试在阿里云机器学习平台PAI上开发支持分布式训练的NMT系统,并于3月底完成了第一个版本。在英俄电商翻译质量优化项目中,分布式NMT系统大大提高了训练速度,使模型训练时间从20天缩短到了4天。

图:使用不同卡数时,在中英100万训练语料上获得的收敛加速比

PAI是阿里“NASA”计划发布的首个重磅工具,可完全兼容全球主流的深度学习开源框架。同时,底层提供强大的云端异构计算资源,包含CPU、GPU、FPGA。在GPU方面,可灵活实现多卡调度。

在阿里巴巴内部,PAI已经被广泛使用。淘宝搜索使用PAI的参数服务器,可以把百亿个特征的模型,分散到数十个乃至于上百个参数服务器上,打破规模瓶颈。最终实现搜索结果基于商品和用户的特征进行排序。

现在,阿里翻译团队还在破解线上服务处理延时的难题,为神经网络机器翻译模型的大规模应用扫除最后障碍。

关注中国IDC圈官方微信:idc-quan或微信号:821496803 我们将定期推送IDC产业最新资讯

扫描二维码,将会有专人将您拉进“大数据交流群”“云计算交流群”“区块链交流群”“物联网交流群”

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2017-08-23 19:49:00
Iaas IaaS软件厂商ZStack发布混合云 阿里云看重它的产品化
8月23日,开源云计算IaaS软件厂商ZStack与阿里云在京联合发布“无缝混合云”战略及产品。据 ZStack创始人&CEO张鑫介绍,用户在官网直接下载ZStack混合云产品,即可实现5分 <详情>
2017-08-23 19:47:00
市场情报 全系Skylake+25G网络 阿里云宣布华北5地域十月开服
8月23日,阿里云宣布即将在10月开放全新地域(Region)——华北5,该地域将部署领先的人工智能、机器学习计算资源及国内首个全系Skylake+25G网络的环境,提供高性能、高可 <详情>
2017-08-21 17:06:49
市场情报 安全能力第一,IaaS市场占有41%,阿里云成为云竞争“双料冠军”
近日,全球知名资讯机构IDC发布《IDC MarketScape:中国云服务提供商,2017厂商安全评估》(以下简称IDC云安全评估报告)。阿里云以其在安全上的综合实力和战略前瞻性,位 <详情>
2017-08-18 18:54:14
云资讯 3A云计算竞赛,微软阿里云追赶亚马逊
8月17日,阿里巴巴公布了截止2017年6月底业绩,全球云计算3A追逐战的第二季度赛季成绩全部揭晓,阿里云付费用户数量突破百万级别,当季营收同比增长96%达24.31亿元,以此推 <详情>
2017-08-18 17:44:00
市场情报 KDD Cup被中国选手包圆  阿里云天池向全球展现中国AI力量
2017年8月17日,第23届数据挖掘领域最高学术会议KDD在加拿大哈利法克斯落下帷幕。由阿里云承办的KDD?Cup宣布了最终排名,令人意外的是奖项竟被中国团队全部包圆。 <详情>