浅析机器翻译
2018-03-07杨雅婷徐楚妤鲁建波贺婧雨陈雅芬徐若凡
◎杨雅婷 徐楚妤 鲁建波 贺婧雨 陈雅芬 徐若凡
(中国民航大学外国语学院 天津 300300)
一、机器翻译的发展现状
翻译是一门艺术,也是一门语言学科。机器翻译,利用计算机科学与技术完成语言翻译,结合了翻译的艺术性和语言学科性这两个特点。在过去的一二十年,机器翻译受到语言学和AI界的广泛关注,在大量的理论研究和实践中,该技术取得了巨大进展和突破。就目前而言,机器翻译所运用的主流技术为统计型机器翻译系统(Statistical Machine Translation:SMT)。该系统的基本原理是:通过对大量的双语对照语料进行统计分析,构建统计翻译模型,进而使用此模型完成翻译[1]。但是近些年,神经网络机器翻译(Neural Machine Translation:NMT)也正在兴起。相对统计型,神经网络机器翻译具有深度学习的功能,然而统计型机器翻译系统则需要人为设计和定义在隐结构上的特征,才能描述翻译规律;同时神经网络机器翻译可以捕获长距离依赖,同时通过向量表示缓解数据稀疏问题,能明显提高译文的流畅性和可读性[2]。因此,神经网络机器翻译受到谷歌、百度等互联网企业的青睐,这些企业在该技术的研发和突破中投入了大量人力和资金。
当今世界,中国正积极呼吁构建人类命运共同体,发展新型经济全球化。在地球村中,各国借助互联网,交流也更加频繁。大量的外语信息需要高素质的译者高效且高质处理。但是人工翻译速度较慢且成本过高,传统的人工翻译满足不了当今的市场需求,这就凸显了机器翻译的重要性。特别是一些对翻译精度要求不高的工作,如快速获取普通新闻资讯、非正式文件等信息,完全可以借助谷歌翻译、百度翻译、有道翻译等免费翻译软件平台。
在中国民航大学“翻译平台的建设与应用”项目中,我们通过大量的人工翻译实践,进一步去发现人工翻译和机器翻译的异同,从而指导译者在未来的学习和工作中,如何更好地借助机器翻译,高效高质地完成翻译工作。
二、机器翻译的优势
(一)高效性
机器翻译又叫作自动翻译,顾名思义,其翻译速度快,效率高。计算机获取指定文本后,在双语语料库中进行匹配,从而找到合适的翻译。机器翻译从另一方面体现了计算机的优势,不仅速度快,储存容量也很大。它可以在很短的时间内完成大量的翻译工作,节省时间,提高了翻译效率。随着网络的发展以及世界经济一体化、全球化的加快,机器翻译能够走向世界,成为国家与国家之间沟通的文化桥梁。
在1954年的美国,由于学者的倡导和支持,机器翻译在当时十分兴盛。当年的1月7日,美国乔治敦大学在国际商用机器公司(IBM公司)的协助下,用IBM-701大型电子计算机,进行了世界上第一次机器翻译的实验,将几个简单的俄语句子翻译成英语。在演示时,一个女性操作员在键盘上输入转为英文字母的俄语“Mi pyeryedayem mislyi posryedstvom ryechi” 与“Vyelyichyina ugla opryedyelyayatsya onoshyenyiyem dlyini dugi k radyiusu”,计算机几乎同时就给出了相应的英语译文:“Magnitude of angle is determined by the relation of length of arc to radius.”(《纽约时报》1954.1.8)
第一次机器翻译的实验如此成功,带给了人们巨大的信心,接连许多国家也都掀起了机器翻译的热潮。与之相比的是,人工翻译在一定程度上来说并不能两者兼顾,在保证准确率的同时也保证高效。因此,机器翻译大大减少了翻译的成本,也在一定程度上减轻了负担。
(二)准确性
由机器翻译的高效性可以看出,计算机是一个具有存储功能的机器。不仅如此,计算机还可以借助逻辑运算来进行逻辑判断,并且可以自发地确定下一个步骤。因此,机器可以将存储在其中的资料分类,在适当的情况下使用适当的词语。在英语中,有很多单词都是一词多义,在这种情况下人工翻译不可能记住所有词意,只能借助于词典或专业资料。若是使用机器翻译,便可以快速地判断此句的意思,从而找到合适的意思翻译。
例如Round这个词语,在不同的语境中也有不同的意思。
例1: The planets move round the sun in the same direction.
许多行星以同一方向绕着太阳运行。
分析:此处Round为介词,表示在……周围。
例2:Shall i show you round?
我可以带你四处逛逛吗?
分析:此处Round为副词。
例3:It is as round as a ball.
它像球一样圆。
分析:此处Round为形容词,表示圆的。
例4:The night watchman makes his rounds.
守夜者四处巡逻查看。
分析:此处Round为名词,表示……的周围。
例5:The bear rounded and faced the hunters.
熊转过身来面对着那些猎人。
分析:此处Round为动词,表示转身。
另一方面,不仅中文有“形近字”,英语也有很多“形近字”。例如Complement与Compliment。仅仅只差一个单词,意思却千差万别。在人工翻译的过程中,我们需要花时间去辨认、判断,才能翻译正确,这会耗费很多精力。对于机器翻译来说,这个问题就不会存在,可以在第一时间检索并翻译。
(三)成本低
俗话说:“十年树木,百年树人。”培养人才,需要花费大量的时间、精力与金钱,而且成功率也不高。一个译者,更是要有扎实的翻译基本功以及大量的翻译实践,没有时间的打磨不可能达到预期效果。然而,翻译任务繁重,仅靠几个人的力量是无法完成种类繁多且来自不同国家的翻译工作,此时机器翻译就派上了大用场。它不仅速度快,耗费时间与精力也只是人工的几百分之一而已。计算机构建语料库所花费的时间,对于培养一个翻译人才来说是不值一提的;此外,语料库的内容十分丰富,检索功能也足够强大,使机器翻译更受人们的青睐。
三、机器翻译的局限性
随着科技的高速发展和互联网的广泛应用,机器翻译有了飞跃性的提升。尽管目前机器翻译已经达到了很高的水平,但是机器翻译的质量相较于人工翻译来讲还是存在诸多问题。
(一)语义不精确
同一词汇在不同的语境环境下具有不同的含义,人工翻译的过程是人工译者集理解、分析、选择及再创造为一体的综合过程,是大脑思维活动的过程。而机器的工作原理是建立在串行二值逻辑的基础上,即“非此即彼”,二者必居其一,它没有思维、判断、推理能力,只能是在限定的范围内进行一对一的选择,因此就会出现准确度不高的译文[3]。
以民航翻译为例:The strength of runway turn pad shoulders should be capable of withstanding the occasional passage of the aeroplane it is designed to serve without inducing structural damage to the aeroplane and to the supporting ground vehicles that may operate on the shoulder.
谷歌翻译:跑道转弯肩部的强度应该能够承受飞机的偶然通过,其设计用于不会对飞机和可能在肩部上操作的支撑地面车辆造成结构损坏。
百度翻译:跑道转弯垫肩的强度应能承受飞机偶尔通过的情况,其设计目的是在不会对飞机和可能在肩上运行的支撑地面车辆造成结构损坏的情况下使用。
人工翻译:跑道掉头坪的道肩的强度应能经受住其拟服务的飞机的偶然通过,而不会对飞机造成结构方面的损坏,也不会对可能在该道肩上运行的地面车辆造成结构方面的损坏。
以上示例是有关民航领域的翻译,可以看出机器翻译对于一些专业术语的收录并不十分完善。但是,诸如此类的科技翻译会涉及大量专业术语的运用,目前机器翻译还不能准确地翻译出相关专业术语,导致译文并不十分准确,影响读者理解。
(二)机器翻译存在文化缺陷
语言和文化有着密不可分的关系,想要翻译好一门语言,先要对其文化进行充分了解,机器翻译则缺乏对于文字背后文化背景的深入研究,以致于其译文缺失了文本所体现的文化背景。
以小说《骆驼祥子》中的一段文本为例:拉出车来,在固定的“车口”或宅门一放,专等坐快车的主儿。
谷歌翻译:Pull out the car, put it in the fixed "car mouth" or the house door, and wait for the main driver of the express train.
百度翻译:Pull out the car and put it at a fixed"car entrance" or house door, waiting for the owner of the express train.
人工翻译:They pull their rickshaws to a rickshaw stand or the gate of some big house and wait for fares who want a fast runner.
对于以上选段的翻译,谷歌和百度直接将“快车”译为“Express train”,是对于该词汇的直接翻译,单看此句话似乎并无不妥。但是考虑到作者老舍的本意,则该翻译就大错特错了,甚至会误导读者。
《骆驼祥子》是具有中国时代特色的小说,想要翻译好该文本,首先要对文学背景有所了解,对复杂的人物特点进行分析,再根据上下文语境进行翻译,机器翻译则很难做到这一点。
再以谚语翻译为例:When the cat's away, the mice will play.
谷歌翻译:当猫离开时,老鼠会玩。
百度翻译:猫不在时,老鼠会玩。
人工翻译:山中无老虎,猴子称大王。
以上示例是我们生活中经常会用到的一个谚语,但是谷歌和百度却将“Cat”和“Mice”直译为“猫”和“老鼠”,而不是大家所熟悉的“老虎”和“猴子”。其中“猫”“老鼠”以及“老虎”和“猴子”都涉及比喻,比喻会用到和文化相关联的具体的文化意象,在这方面机器翻译现阶段还不能处理好。
四、机器翻译的发展前景
综上所述,现在的机器翻译仍有许多缺陷,特别是翻译结果不够准确,也无法正确表达作者的真情实感和文化背景。不过,在未来随着AI技术的进一步成熟,AI技术越来越能“通情达理”,所以机器翻译也将更轻松地应对更加复杂的语言环境。特别是在同声传译方面,它将会发挥更重要的作用,解放大量人力。当然,翻译工作者无需担心机器翻译“开除”译者。恰恰相反,有了机器翻译,译者能从大量的简单机械性翻译工作中解放出来,发挥人的创造性,进行更加充满挑战和有趣的翻译研究和机器翻译指导方面的工作。不过这就要求未来的语言学者需要不断更新自己的知识水平,能多方面进行跨学科学习和研究,成为AI时代的复合型人才。