机器翻译进化史


发布者:上海翻译公司 发布时间:2018-6-19


  机器翻译(MT)并不是什么新鲜事,第一次现场演示是在20世纪50年代完成的。但是,正如谷歌翻译和类似的产品所证明的那样,MT输出已经变得可用并可供任何人使用可靠的互联网连接。这种技术(通常是企业级机器翻译引擎)在翻译行业广泛用于某些类型的内容 - 通常创意性较低的文本 - 以应对成本和期限方面的压力。互联网的可访问性以及内容驱动的市场营销已经导致内容出版物的大幅度增长,与越来越全球化的经济相结合,这导致企业需要更大量的翻译。然而,预算压力导致MT的发展,后期编辑对许多公司来说是一个真正的选择:以这种方式生成的翻译与人类后编辑一起可以(在正确的情况下)以比人类更低的速率产生人类质量。现在,最新一代 - 神经机器翻译的发布正在使MT成为翻译界最热门的流行语之一。

  MT如何开始?
  第一个MT引擎是基于规则的(称为'RBMT')。他们研究语言的单个词和语法规则 - 文本的每个部分代表什么,外语中的等同物是什么?RBMT将语言A中的每个单词或语法功能替换为语言B中的等同单词或语法功能。但这并不完全正常。任何知道一种以上语言的人都会告诉你,找到一个简单的逐字翻译并不总是容易的。想象一下,你想把“跑道”这个词翻译成法文,西班牙文和荷兰文。这听起来很简单:法语滑雪道,西班牙语滑行道。对于荷兰人?不简单。飞机是起飞还是着陆?如果它起飞了,说startbaan ; 当它降落时,它是一个降落伞。这只是一种语言的一个例子; 每种语言都有自己的偏心,这使得MT很难。

  接下来是什么?
  RBMT之后,统计机器翻译(SMT)出现了,并且看到了稍大的单位。不仅仅是话语,而是少于句子。在找到最可能的翻译之前,它会对现有翻译的大量数据库运行的短语。听起来更好?嗯,是。但仍然不是很棒。译员不会翻译句子的部分并将它们粘合在一起。SMT提供比RBMT更好的结果,但错误仍然很多,并且仅适用于某些内容。对于一般文档(通信,评论等)来说,输出效果更好,但对于营销等更具创意的内容的输出通常是不可用的。

翻译公司
  现在…?
  翻译技术领域当前的热门话题是神经机器翻译(NMT),它可以查看更大的语言单位 - 整个句子。而不只是看句子,而是从中学习。而不是MT开发者决定MT引擎在训练数据时应该关注哪些语言特征,NMT研究现有翻译(如SMT)的数据库并自行学习和决定。它着眼于单词以及它们的重要性,以及它们在更大范围内如何相互关联(并且所有翻译人员都会告诉你语境的重要性),并将这些发现应用到新的翻译文本中。

  那么,NMT之后呢?
  在过去的十年间,SMT主导了围绕水冷却器的MT极客之间的聊天,NMT无疑是翻译行业2017年的口号。但是,MT开发人员已经在讨论下一步:Deep NMT。全新的编码层结合客户认可的词汇表和其他资源,Deep NMT将产生更好的翻译。创建Deep NMT引擎所涉及的工作比“浅”NMT涉及更多,但收获的奖励预计会更大。

  有了这些发展,SMT现在已经过时了吗?
  NMT和Deep NMT的发展令人兴奋,但它不是所有MT问题的解决方案。NMT可以产生一些很棒的翻译,并且更流利地表达SMT。对于更具创意的文本(比如说,对于市场营销),如果引擎是使用非常具体的内容的现有数据库构建的,比如对于用户手册或其他技术文档,它可以比SMT更好。但是如果你想翻译一般内容,那么至少目前来说,SMT是表现不佳的NMT。

  那么,有了这些进步,我们现在可以摒弃人类翻译吗?
  最简洁的答案是不。NMT和Deep NMT是非常有希望的开始,NMT输出比SMT翻译更流利,但是我们距离Post-Human译者时代的预告还有很长的路要走,因为一些MT输出仍然很难,甚至不可能,理解并仍然存在包含许多错误。翻译人员的作用仍然至关重要:MT的输出效果很好,并在一年之后逐渐好转,但MT仍然需要由翻译人员,具有源语言和目标语言知识的人员,当然还有主题领域进行后期编辑。最终,MT不是要消除人工翻译,而是帮助他们。这是翻译人员提高生产力的另一个箭头,它提供了即时编辑翻译,以不断提高的质量提供质量。

上一篇:为什么创译对国际企业至关重要

下一篇:欧盟的DG CONNECT宣布向英语翻译服务投标350万欧元