<--这段代码是专属于这个站点的:swantranslation.com--> <--此段代码添加在前。为保证统计准确,请勿将同一段代码添加到多个站点中。-->
 

创立于2010年

|  ​亚太区专业语言翻译服务商

service@swantranslation.com
86-159-8978-9886
.
思文翻译
思文资讯
这里是您获取翻译行业信息、探讨翻译学习的园地
营销翻译
神经元机器翻译系统
来源: | 作者:swantranslation | 发布时间: 2013-05-15 | 44 次浏览 | 分享到:
十年前,谷歌推出翻译服务,此服务使用了词组型机器翻译技术作为其关键算法。随着机器智能技术的快速发展,我们的语音识别和图像识别能力得到了大幅度提升,但是机器翻译一直是我们极具挑战性的奋斗目标。

最近,谷歌公布了Google神经元机器翻译系统(Google Neural Machine Translation ,GNMT),这个新的翻译系统利用最先进的培训技术最大限度地提升了机器翻译的质量。谷歌发布了关于此翻译系统的完整研究报告《Google神经元机器翻译系统:缩小人类翻译与机器翻译之间的差距(Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation)》。


神经元翻译-思文翻译
十年前,谷歌推出翻译服务,此服务使用了词组型机器翻译技术作为其关键算法。随着机器智能技术的快速发展,我们的语音识别和图像识别能力得到了大幅度提升,但是机器翻译一直是我们极具挑战性的奋斗目标。


最近,谷歌公布了Google神经元机器翻译系统Google Neural Machine Translation ,GNMT),这个新的翻译系统利用最先进的培训技术最大限度地提升了机器翻译的质量。谷歌发布了关于翻译系统的完整研究报告《Google神经元机器翻译系统:缩小人类翻译与机器翻译之间的差距(Google’s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation)》。

几年前,我们就开始把递归神经网络(Recurrent Neural Networks, RNN)用于学习输入序列(某种语言的句子)与输出序列(另一种语言的同一句子)之间的映射关系。词组型机器翻译系统(Phrase-Based Machine Translation, PBMT)的主要工作机制是将输入的句子分解为单词和短语然后单独翻译,但是神经元机器翻译(Neural Machine Translation, NMT)将整个输入序列(句子)视为一个翻译单位。这个系统的优点是比以前词汇型翻译系统需求更少的工程设计选择。在最初的性能测试中,NMT就表现出与词汇型翻译系统具有同等准确性。www.swantranslation.com

随后,研究人员对NMT进行了很多技术改进,包括通过模仿外部匹配模型处理生僻词翻译,引入“注意力技术”对齐输入和输出词等等。但是, NMT还是不够快速或准确,还是不能应用于我们的正式产品,如谷歌翻译。我们还公布了一片新论文,其中描述了我们如何克服诸多挑战使NMT处理超大规模数据集以及我们如何建立快速和准确的翻译系统为谷歌用户提供更好的服务。

《图片》

Fig. 1 翻译专家评价翻译质量图示。分值从060表示翻译结果“完全无用”,6表示翻译结果“完美”

下面的图形显示了GNMT进行中译英的过程。首先,神经元网络将中文字编码为一组向量,其中每个向量代表到目前为止读取的所有字的含义(“编码 Encoder”)。整个句子被读取之后,解码器开始工作,每次产生一个英语单词直到最终生成一个完整的句子(“解码 Decoder”)。 为了每步都翻译出正确的单词,解码器“注意”了与生成英语单词最相关的编码的中文向量的权重分布(“注意”:蓝色链接的强度表示解码器对被编码的单词的注意程度)。

《图片》

Fig. 2

人工翻译校审认为GNMT系统的翻译质量比以前词组型翻译系统有了很大改进。使用维基百科和新闻网站的例句测试发现,神经元网络机器翻译系统讲翻译误差降低了55%-85%甚至以上。

《图片》

Fig.3 GNMT系统翻译从新闻网站抽取的例句

翻译知识
公司团队
服务项目
服务流程
思文新闻
译海拾贝
联系我们
人才招聘