人工智能背景下对机器翻译的思考
2019-07-05张一宁徐林熇
张一宁,徐林熇
(1.长春理工大学外国语学院,吉林长春,130022;2.吉林省科技外语人才培养创新研究中心,吉林长春,130022)
作为“宇宙进化以来最为复杂的人类活动”,翻译一直被冠以“人工”、“很难被机器所取代”等标签。数字化时代的互联网、大数据、人工智能等信息技术给人类社会的发展带来了深刻的变革,当然翻译也毫无例外地被影响着。人工智能悄然地改变着翻译的过程和译者的身份。2016年谷歌基于神经网络翻译引擎的论文发表后,机器翻译又一次宣布走出低潮,朝气蓬勃地发展起来。随后,谷歌、微软、百度、阿里、腾讯等公司相继推出号称可以模仿人脑“理解语言,生成译文”的人工智能翻译软件产品。人工智能的不断发展不禁引发了这样的思考:机器翻译是否会对专业译员造成冲击并完全取代人工翻译呢?本文以机器翻译为例,探讨人工智能背景下机器翻译的发展、现存的问题以及译者的职业发展。
一、机器翻译的发展
机器翻译最早出现于上世纪三四十年代。从早期的词汇型、语法型和语义型的规则翻译到基于语料库的统计机器翻译,再到神经机器翻译,计算机技术、信息论、语言学等学科的发展助推了机器翻译技术的发展。随着互联网的发展与应用,以及全球一体化进程的推进,人工作业的跨语言翻译活动早已无法满足时代的需要。据中国翻译协会统计数据显示,2011-2016年间中国语言服务行业产值年均增长率接近19.7%,翻译市场巨大的红利给机器翻译带来了新的发展机遇。
2016年初,腾讯基于短语的机器翻译产品的翻译效果并不理想。同年年底谷歌在机器翻译领域取得重大突破,其神经网络机器翻译系统(Google Neural Machine Translation,简称 GNMT)实现了迄今为止机器翻译质量的最大提升。GNMT可以通过现有的、大规模的语料库来实现深度学习,从而做到从语料库中自动地获取语言特征和规则(冯志伟,2018)。“神经网络机器翻译”技术能够克服原有的基于短语的翻译,可以实现基于语料库对于上下文信息进行充分比较。人工智能翻译以大量语料为基础,经过分析后能谙熟这些公式、套路、模板,从而翻译出译文。源语句子通过多层复杂的传导运算,转化为计算机可以“看懂”、“理解”的表达形式;系统对语言进行语码处理,完成句子的整体编码和解码,最终产出基本符合目的语语法的译文。在翻译全过程中整体建模,利用深度神经网络机器翻译技术自动学习语料库中的翻译知识,从而在一定程度上提升了翻译结果的准确性。
虽说语言结构的复杂性和语义理解的多样性影响了人工智能的迭代升级速度,但是机器翻译的成长,尤其是其深度学习能力远远超出了常人的想象。近年来,人工智能技术在机器翻译领域确实表现出了不俗的水准。从出国旅游到留学办公,一些语音翻译软件基本能够满足简单的日常短语交流;另外一些具有实用功能的智能手机软件可以实时地通过摄像头的取景框来翻译外文景点指示牌、菜单、说明书和实物等,极大地满足了普通用户对于基本翻译的需求,大大提升了其跨语言沟通效率。2017年国际机器翻译会议(WMT)对于新闻文本的机器翻译进行了评测,汉英和英汉互译翻译质量已经达到70%以上。但是,就人工智能机器翻译的质量而言,我们认为其所谓的译文“较为流畅”,只能说是与之前的机器翻译系统产出的译文相比流畅度有所提高。整体而言,相比高质量的人工翻译,机器翻译依然存在很大的差距。
二、机器翻译实例分析
(一)口译实例分析
各大公司对于自身技术充满信心,腾讯翻译君出现在了2018年博鳌亚洲论坛会议现场,微软神经机器翻译实时口译系统于2018年在北京语言大学举行的“翻译自动化用户协会(TAUS)亚洲峰会”上与人工同声传译全程同步进行较量。下面以网络上热传的博鳌亚洲论坛中的翻译为例:
例1.
原文:We know that in China there is the rrooaadd and bbeelltt and a visit there is some corporation,just like the structure from him to have in the area of infrastructure.
腾讯译文:我们知道中国有一条公路和一条腰带。访问那里有一些公司,就像他在基础设施方面的结构一样。
例2.
原文:But as a technology from a what can you do in the road and belltt and so maybe I think we have something to do for your company,thank you.
腾讯译文:但是作为一项技术,你在道路和传送带上能做些什么,所以我想我们可以为你的公司做点什么,谢谢。
博鳌亚洲论坛分论坛“新一轮技术革命”会场上发言者在即席讲话中把“One Belt One Road”说成了“the road and belt”。如果是人工翻译,译员会根据上下文语境知识加以判断并译为“一带一路”,但是机器翻译更多的是基于算法的传导运算,还无法灵活处理此类表达,因此将其误译为“一条公路和一条腰带”、“道路和传送带”。人工同传译员会自己判断并主动纠正发言者明显的口误,而机器则很难做到这一点。
此会场英译中部分的“Yes,please.”被译成“是的,求你了”,大多是基于数据库的语符匹配的结果。机器在运算过程中根据交际场景判断词义乃至会话含义的能力还有待提高。人工智能更擅长于程序化高、重复率高、计算速度快的工作。而人工译员具有的在交际中熟练处理跨文化跨领域问题的能力,以及根据主题、交际场合、讲话双方、口音和口吻、手势与面部表情等处理信息的能力,是人工智能需要为之努力的更高要求。
在博鳌论坛“未来的生产”会场同传中出现了“when when when”、“but but but”、“And and and have and max and”等令听众难以接受的译文版本。分析其原因不难发现,无论是传统的机器翻译还是基于语料库的神经网络翻译技术,更多的是严格遵循各种语言的语法规则的传导运算,更擅长书面语翻译,对未加处理的碎片式口语束手无策。
两次尝试,无论是语音识别,还是机器翻译的结果,整体上都差强人意。业内人士的结论是:基于语音识别和机器翻译的实时口译系统要替代专业的人工同传翻译,还有很长的路要走。
(二)笔译实例分析
机器翻译的迅猛发展在促进国际交流合作的同时也凸显了翻译市场的巨大需求。但是,令人哭笑不得的“sign everywhere”(签到处)、“Slip carefully”(小心地滑)和“Chinese dream,fly nine days”(中国梦,飞九天),都或多或少体现着人工智能机器翻译不够“智能”的一面。又如,机器翻译处理“Jane Zhang became the first Chinese singer to perform for Victoria's Secret,joining the ranks of Taylor Swift and Katy Perry.”一句时,由于语境知识的欠缺,把“Jane Zhang”(张靓颖的英文名)翻译成了“简·张”,这种译文很难符合中国读者的理解需求。下面以2017年浙江大学建校120周年开幕式幕布翻译为例,对比分析机器翻译软件的不同译本。
例3.
原文:向为人类未知领域探索,为国家和民族作出重大贡献的前辈先贤致以最崇高的敬意。
校庆译文:Let’s express our highest respect to those predecessors explored the unknown field of mankind,and to those predecessors made significant contributions to the country and people!
浙大校庆译本的语法错误一石激起千层浪,网友发起了此译本与机器翻译版本的对比,认为机器翻译虽说存在各种问题,但是和这种各种语法错误的版本比起来还是略胜一筹。时隔一年有余,笔者将原文分别输入百度翻译、有道翻译和谷歌翻译,进行翻译测试。下表为2017年百度翻译、有道翻译和谷歌翻译译本的对比以及2019年三大翻译软件的译本对比。通过对比不难发现,2017年的机译质量很难令人满意,不同的机器翻译版本存在着句法、词法和语义的问题。仅就2017版译文而言,机器翻译的前景并不像大多数人所想象的那么乐观。可喜的是,随着神经网络机器翻译技术的快速发展,机器翻译译文质量不断提升,综合统计机器翻译、神经机器翻译等技术,现行的辅助翻译软件全面综合互联网海量数据,从中挖掘数千万的专业术语翻译和亿级双语例句提供给用户作为翻译参考信息。因为计算能力增强、机器翻译模型创新、语料规模大幅提升,2019版译本质量较之前已有明显改善,初步实现了“理解语言,生成译文”,因此译文更加符合语法规范,贴近自然语言,容易理解。有别于2017版译文中词汇的识别性错误、漏翻以及译文的中式表达,2019版的3个译本基本符合了严复翻译三字标准的第一个标准——“信”。
表1 三大机器翻译软件译本对比
作为检验机器翻译译文质量的一个标准,业界人士坚持译本必须保障在语义上与目标语言意义保持一致,也就是说,无论是人工翻译还是机器翻译一定要坚持把源语所要表达的意义准确无误地表达出来,达到“信”的标准。因此,许多神经网络机器翻译技术突出对于语序的处理,追求与自然语序的接近度以及译文的整体流畅度。随着机器翻译的深度学习,上述3个机器翻译软件在尽量向“信”这一标准靠拢,或已经基本达到这一标准。
但是问题在于,机器翻译的译本是否达到了严复翻译三字标准的第二个标准——“达”,即语言的通顺畅达。如果就严复的“达”的字面意义而言,3个机器翻译软件均达到了“达”的标准。但是,我们认为翻译中的“达”不仅是通顺,更强调功能的畅达和实现。浙大校庆典礼展板标语的作用是致敬浙大校友和先贤,而百度翻译和有道翻译的第一人称代词“I”的使用淡化了浙大的群体意识,谷歌翻译的第三人称代词“they”的使用使得原文中强烈的融入感荡然无存,拉开了交际的心理距离。此类机器翻译虽将原文译为目的语,但是其译文并未达到原文所表达的效果。“顾信矣不达,虽译犹不译也,则达尚焉。”相比机器翻译,网络上流行的几个人工翻译译本则更加清晰地传达了校庆典礼展示板的语用功能。笔者结合网络上的几个英译版,尝试做出如下翻译:
例4.
Salute to the predecessors of Zhejiang University who have explored the unknown and have made great contributions to our country and people.
通过深度学习、基于算法的传导运算,机器翻译的各个版本中补充了人称指示语“I”和“they”作为句子的主语,译本看上去更符合汉语的语法,但是这种译法只考虑到了语法的完整性,却忽略了语句的交际功能。考虑到原文宣传标语的特点,我们省略了句子的主语,将其译为“salute to”引导的动词短语,并且根据相关语境信息将“前辈先贤”译为“the predecessors of Zhejiang University”,以突出校庆标语的信息功能和表情功能。上述对于语境和体裁的考量均为人工智能翻译系统短时间内难以达到的。
机器翻译的优势在于其速度和数量,但是优秀的译文更体现在其传达功能。翻译不仅是字符的转换,其精妙之处在于意境的畅达与功能的奏效。纽马克(1981)认为:“语境在所有翻译中都是最重要的因素,其重要性都大于任何法规、任何理论和任何基本词义。”源语语义的深层理解以及目标语语境知识的掌握决定了译文的可接受性,语境知识的认知以及如何参照其文化语境确定包含在字面意义中的语用意义将成为机器翻译技术的重要突破点。现有机器翻译能够短时间内迅速深度学习翻译所需要的词法、语法和语义信息,甚至是固定搭配、语义特征、单词间的约束条件等知识,但是语境的分析则是机器翻译最关键的难题所在。随着人工智能的迅猛发展,值得深思的不是机器翻译是否可为人工译者所用,而是如何利用人工智能助力我们的翻译实践,如何在人工智能很难达到的语境顺应的领域避免误译,提高译文质量。
三、人工智能时代机器翻译与译者
人工智能时代,翻译技术的迅猛发展是一种必然,机器翻译成为了语言翻译必不可少的一种模式。海德格尔(1996)曾指出,现代技术使人和物失去了自我意志……沦为了功能性的存在。人类如何处理自身与技术之间的关系成为了我们必须回答的问题。面对现代技术,摆在译者面前的问题是如何处理翻译与技术之间的关系,如何做一名人工智能时代的译者。做一名沉湎于技术带给我们的舒适,渐渐丧失个性和批判性思维的“单向度”译者?亦或将机器翻译技术拒之门外?
答案当然都是否定的。如果只做被技术限定的“单向度”译者,莎士比亚口中那一千个人的眼里不会再出现一千个哈姆雷特。流水线上缺乏批判性思维的“单向度”低端译者将很快被机器所取代。也许有人会为了避免被取代,而拒绝机器翻译技术,事实上这也是不可取的。无论我们接受与不接受,技术都存在并迅猛发展着。机器翻译可以每天提供亿级翻译次数,有快速深度学习的能力,这是人工翻译难以企及的。机器翻译可帮助译者完成相对机械的打字、查词等低效劳动,以便有精力从事译后编辑和更高层次翻译创作,进而提升翻译效率和质量。蓝红军(2017)透过傅雷的个案研究指出机器能取代的只不过是译者作为翻译实践重复性的、缺乏精神内涵的翻译工作,并不能取代译者作为翻译精神主体的作用。译者强大的语境知识联想、认知能力以及应变能力是机器翻译在很长一段时间内都很难深度学习得到的。机器翻译不能替代人工翻译,但却给人工翻译带来了变革,重构了人工翻译的过程。机器翻译与人工翻译相结合的翻译方法,在提高翻译效率的同时,也在一定程度上促进了翻译质量的提高。大数据时代人工译者更应该具有踏踏实实和精益求精的工匠精神,广泛开展人机合作模式。不但要身怀译技,还要善用译器。在积极拥抱技术、享受技术成果的同时,更应该积极发挥主观能动性和创造性,译出一千个人眼中的那一千个哈姆雷特。
作为三大底层基础设施之一的人工智能是未来智能时代的“水电煤”,是后互联网时代的重要技术推动力。虽然目前人工智能技术已经发展到一定程度,但是距离机器翻译完全取代人工翻译的那一天还很遥远,即便是神经网络机器翻译技术也只能在较为日常和机械的翻译活动中大显身手,机器翻译是否真正能够取代人工翻译依然是一个暂无答案的问题。作为传统的复杂人工活动,翻译需要在人工智能技术的推动下进行变革和创新。期待技术能代替繁重、重复单调的工作,帮助译者们进行更富有创造性和更高效率的工作,通过机器翻译与人工翻译更好地人机协同,发挥各自所长,创造出更多更好的翻译作品。