您当前的位置:主页 > 汽车资讯 >

支持 108 种语言的谷歌翻译如何用 AI 让翻译质量越来

作者:admin     发布时间:2020-06-05 02:12 点击数:

谷歌表示,在提高语言翻译的质量方面,已经取得了进展。在即将发表的博客文章中,该公司详细介绍了新的创新技术,这些创新技术增强了Google翻译(GoogleTranslate)支持的108种语言(特别是数据贫乏的约鲁巴语和马拉雅拉姆语)的用户体验,该服务平均每天翻译1500亿个单词。

自谷歌翻译首次公开亮后的13年间,诸如神经机器翻译、基于重写的范例和本地处理之类的技术使该平台的翻译准确性有了可量化的飞跃。但是直到最近,翻译的最新算法表现也落后于人类。Google之外的努力也说明了问题的难度,Masakhane项目旨在使非洲大陆上的数千种语言能够自动翻译,但它还没有超出数据收集和转录阶段。共同的声音(雷锋网注,CommonVoice是Mozilla发起的一个众包项目,旨在为语音识别软件创建免费的数据库)自2017年6月推出以来,Mozilla为建立转录语音数据的开源集合所做的努力仅审查了40种声音。

谷歌表示,其翻译质量的突破并不是由单一技术推动,而是针对资源较少的语言、高质量源语言、总体质量、延迟和整体推理速度的技术组合。在2019年5月至2020年5月之间,通过人工评估和BLEU(一种基于系统翻译与人工参考翻译之间相似性的指标)进行衡量,谷歌翻译在所有语言中平均提高了5分或更多,在50种最低水平的翻译中平均提高了7分或更多。此外,谷歌表示,"翻译"对机器翻译联想的功能变得更加强大,一种现象是,当给泰卢固语字符""输入,"ShenzhenShenzhenShawInternationalAirport(SSH)")时,AI模型会产生奇怪的翻译"Shshshshshshshshshshshshshshshshsh"。

混合模型和数据挖掘器

这些技术中的第一个是翻译模型体系结构??一种混合体系结构,包含在Lingvo(用于序列建模的TensorFlow框架)中实现的Transformer编码器和递归神经网络(RNN)解码器。

关闭窗口