国外怎么看百度人工智能同声传译?


2018-11-03 16:18:56

同声传译

在2018年10月中旬,百度的研究团队发表了一篇题为“STACL:具有集成预期和可控延迟的同时翻译” 研究论文。该出版物出现在2018年版自然语言处理经验方法会议之前,数千名世界领先的机器翻译和自然语言处理研究人员纷纷前往布鲁塞尔分享他们的最新发现。

当时,百度论文似乎只是神经机器翻译(NMT)研究的又一个渐进发展但随后百度的公关机械开始翻腾。

百度的公关机构发送了新闻稿,研究报告本身,以及GitHub演示页面,向众多媒体机构报道了Slator。该机构写道,STACL“只需几秒钟即可完成演讲者的演讲,并在演讲者完成后几秒钟完成,非常类似于同声传译员。”几小时后,广泛的媒体报道随之而来:

  • “语言学家,更新你的简历,因为百度认为它已经破解了快速的AI翻译,” The Register

  • “百度的AI可以在任何两种语言之间进行同时翻译”,作者:IEEE Spectrum

  • 麻省理工学院技术评论 ”,“百度的汉英翻译为你完成了句子”

  • 来自Fortune.com的 “实时人工智能翻译让百度惊艳”

  • “百度创造了世界上第一个同步翻译系统”,来自SiliconAngle

  • CNBC表示,“中国的百度向人工智能挑战谷歌,实时翻译语言”

  • 来自SCMP的 “百度将在谷歌的最新挑战中同步机器翻译”

其他头条新闻更直截了当,但仍然采用了良好的公关PR消息:

  • 来自VentureBeat的 “百度同时推出语言翻译AI”

  • “百度开发了自己的实时翻译(谷歌有一些新鲜的竞争),”来自Engadget

  • “百度发布了一个新的人工智能翻译系统,STACL,可以进行同声传译”,作者是Packt Hub

在百度研究集团的Github演示页面上显示了该论文获得的媒体报道的链接,包括出口的标识。

同声传译

由于这些文章和标题没有得到修正,随着时间的推移,它们现在开始被其他媒体采用。例如,Axios链接IEEE Spectrum文章中的一篇关于英语在科学话语中占主导地位的文章

作为公关推广的一部分,百度在11月1日的百度世界大会上进行了STACL公开演示在活动期间,主显示屏两侧的两个屏幕分别显示自动语音识别输出和STACL的同时翻译

同声传译

百度STACL演示:两个屏幕在一个屏幕上显示自动语音识别输出,在另一个屏幕上显示STACL同时翻译

但是,现场直播中的同声传译仍然由人类口译员提供。

打开STACL包装

那么什么是STACL,研究是否值得这样的报道?与处理整个句子然后翻译它的常规NMT引擎相比,STACL逐字“馈送”源句,并且一旦达到指定数量的单词就开始翻译输入。百度的研究小组将其称为wait-k模型,用户可以指定STACL在开始翻译之前应该等待多少单词。

STACL转换部分输入,并尝试预测可能仅出现在源句末尾的单词。例如,在像德语这样的语言中,动词和否定等重要词性通常出现在句子的末尾,STACL需要猜测动词或否定,因为它将德语源句翻译成英语。STACL的预测方法还使用来自其训练的语言数据的上下文。

研究人员进行了英语 - 德语和汉语 - 英语 翻译任务的实验。

赶上?在wait-5模型(系统在开始翻译之前等待五个单词),STACL的输出质量略低于当前的最新技术水平。更低,例如wait-3模型(系统等待三个单词),预测的单词可能完全错误。

实际上,研究报告指出,系统必须等待的单词越多,输出就越好,因此它本质上是一种平衡行为,即翻译的同步性和翻译的流畅程度。

是时候更新口译员简历?

百度的新闻稿称这项研究“受到人类同声传译人员的启发,他们经常预测或预测说话者即将在未来几秒钟内完成的材料。”

在研究论文的介绍中,最终结果显而易见:“同声翻译有可能实现同声传译的自动化。”

那么口译员应该注意The Register的话并更新他们的简历吗?不。Slator联系了NMT专家,以了解他们对STACL的看法:

“首先,我认为我们仍需要注意不要将每项新研究分类为突破,”标志性翻译机器联合创始人兼首席执行官约翰·汀斯利博士说。他说,同声传译“已经存在了一段时间,并且已经在NMT的背景下进行了一些实施。”

“我们仍然需要注意不要将每一项新研究分类为突破性” - 标志性翻译机器联合创始人兼首席执行官约翰·汀斯利

廷斯利指出,探索这项技术特别是对于解释来说是“诱人的”,并补充说“让这个领域的优秀研究团队工作并向前迈进是积极的。话虽这么说,我认为这就是我们在这里看到的 - 向前迈进的一步。“他还告诉Slator他和他的团队将来会在STACL论文的”引擎盖下深入挖掘“。

寻找问题的解决方案

都柏林城市大学正教授兼ADAPT数字内容技术中心副主任Andy Way教授说:“在我看来,这是一个寻找问题的解决方案。”

“如果这不是支持口译人员的工具,而是打算取代他们,那么我认为你根据我的记录了解我对此会说些什么,”他补充道。

Way教授表示,同声传译是业务中最难的任务之一,人工口译人员“对他们所做的工作非常了解。”考虑到这一点,他指出STACL较低的BLEU分数会引发部署问题。

“部署口译员的情况通常是需要作出重大决定的地方。在这种情况下你会相信机器吗?“ - 都柏林城市大学正教授Andy Way教授

“不是科学的突破”

至于Jean Senellart博士,Systran全球首席技术官为Slator提供了一个即兴的简短版本的评论,他说如果该论文提交给会议,他会给出。他指出,在与中国同事商量后,他被告知这一消息引起了很多噪音,而且似乎“它与”微软的论文[实现人类平等]相当重要。“

Senellart博士的第一点是该演示文稿具有误导性,因为在实际的连续口译场景中,虽然口译员可能在每完整一句话后进行翻译,但他或她也是沟通流程的一部分,以至于演讲者可能暂停允许口译员在翻译前提出问题或澄清。

“在这个工作流程中,我们确实将通信时间增加了一倍,”他说。

国外怎么看百度人工智能同声传译?

在MT的情况下,Senellart澄清说,在翻译之前等待一定数量的单词,正如STACL所做的那样,没有必要。“机器可以同时监听和计算,不需要暂停通信,因此两者都可以作为附加延迟,”他说。

塞内拉特说,在30分钟的演讲中,一个NMT引擎在每个完整的句子之后翻译,STACL“只会相差几秒钟。”他补充说,那几秒钟“不能证明几个BLEU点质量的损失。”

点食物

Slator还联系了百度STACL论文的两位作者:马明博和梁黄。Huang解决了上述问题,承认它“仅适用于会议环境中的语音到文本翻译。”然而,他提出了他所谓的“更常见的场景:1对1对话”(例如,订购食物) )“。

“这里的全句翻译策略会造成2倍的延迟,”他说。

“虽然我们目前的技术仍然是语音到文本,但我们也在努力将其扩展到同步语音到语音翻译。” - 黄亮,百度硅谷人工智能实验室首席科学家

在他的即兴评论中,Senellart继续说道:“用例被错误地呈现,并希望让读者理解该机器已达到一种新的'超人能力'。”

至此,黄刚简单地说:“我们从未声称”超人的能力“。”

Senellart还在论文中提出了一个主张,其中作者说STACL的开销“更加可取”,因为它是一个加法而不是乘法,就像NMT引擎在每个完整句子之后翻译的开销一样。

“这是错的,”他说。“因为即使这个陈述是真的(人类世界中的连续与同时),他们试图替换的方法(等到句子的结尾)与他们提出的方法属于同一类别(两者都是相加的) “。

至于背后的科学,Senellart说“STACL背后没有任何新想法”:“他们提出的解决方案将是默认解决方案,任何没有阅读论文的人都会设置。”他澄清说这不一定是坏事, “但这不是科学上的突破。”事实上,在NMT之前,人们已经开始考虑同声翻译,并且早在2016年就有人建议将其纳入NMT引擎

小BLEU惩罚; 巨大的翻译错误

最后,Senellart注意到“几乎没有定性或定量评估[执行],这种缺失很可能涵盖了大错误。”他在研究论文和GitHub演示页面中给出的一个例子中指出,STACL正确预测和翻译“见面”。

“但是,如果最终动词不符合,但”呼叫“,或者完全不同的东西会怎么样?”Senellart说。“动词的变化只会是一个小的BLEU惩罚,但是一个巨大的翻译错误 - 当模型最终对动词进行编码并”意识到“完整句子错误时,该模型如何尝试恢复(如果确实)?”

黄证实他们只使用BLEU,但也说“我们预测(或”预测“)各种单词,而不仅仅是动词,如果预测中存在重大问题,它也应该反映在BLEU评分中“他补充说,他们打算将人类评估纳入预测准确性。

“我们也承认:(a)我们目前的工作无法解决以前的预测错误,以及(b)它甚至无法”发现“这样的错误,”他说。“但我们正在努力解决这些问题。”

或许期待机器翻译社区的一些反击- 微软有争议的“人类平价”声称一个警示故事 - 百度确实更接近他们的新闻稿,声称“STACL并不打算取代人类口译员,谁将继续在未来的许多年里,他们的专业服务取决于他们。“

据他们说,这只是为了使同声翻译“更容易接近”。