机器翻译与译者译后编辑能力研究
2022-11-10洁杨
廉 洁杨 帆
(1.太原理工大学,山西 太原 030024;2.赛鼎工程有限公司,山西 太原 030032)
0 引言
自第一次工业革命起,机器取代人力似乎成为各行各业的必然趋势。人类迈入信息时代后,所谓“取代”不仅限于机械性劳动,而是慢慢延伸至思维领域,人们的劳动模式也开始随之改变。以往译者作为桥梁和纽带的角色从未受到过挑战,而今,各类翻译软件、语音翻译器的出现让一部分译者陷入自我怀疑的怪圈,就目前机器翻译的发展情况而言,译者的作用虽然略有削弱,但仍无可替代。然而,译者也应紧跟时代步伐,借助前沿工具十分有必要。本文通过回溯机器翻译的发展历程、工作原理、研究现状,探究机器翻译目前所适用的文本类型以及当前应用最广的机器翻译软件“谷歌翻译”的英汉互译水平,从而加深译者对当前技术框架下机器翻译的缺陷与不足的认识,以便在译后编辑环节提出有针对性的解决方案,同时提升译者自身的译后编辑能力。另外,笔者认为,当前译员的培养要着眼于未来市场的翻译需求。本文的最后部分对译者的译后编辑能力构成进行了综述概括,对译后编辑与传统翻译模式进行了系统区分,以期为译者能力培养提供方向性参考。
1 机器翻译研究综述
1.1 机器翻译发展历程
机器翻译的发展是一个波折前进的过程,很多学者对于机器翻译的发展历程都进行了不同的阶段划分,但总体来说可以将其分为提出、低谷、回暖三个阶段,而在这三个阶段中又包括不同的发展时期。
20世纪40年代至50年代(提出与初步试验时期):1946年,电子计算机问世,英国工程师Booth和美国工程师Weaver首次提出利用计算机进行翻译,开始了机器翻译的可能性研究。1954年,美国Georgetown University使用IBM-701电子计算机进行了第一次机器翻译实验,而且在这一时期,美国多所大学已经开始了机器翻译研究。
20世纪50年代至80年代(限于语法分析的翻译时期与重新修订语言理论时期):1957年,Chomsky的著作Syntactic Structure为当时的机器翻译研究提供了语言学理论基础。但自1966年美国政府资助的语言自动处理咨询委员会发布报告指出人工翻译速度更快、准确性更高且成本更低,机器翻译在未来若干年内发展前景无法预测。此后,政府开始大量削减研究经费,机器翻译研究跌入低谷阶段,但始终没有终止,出现了如SYSTRAN的第一代机器翻译系统。1971年Terry Winograd证实了机器对于原文的理解处理不仅与语法结构有关,更与语境有较大关联,需要联系更多语言以外的外部知识才能达到较好的翻译效果,提出了语义语法、词典功能语法等理论,为下一个阶段的研究做了铺垫。
20世纪80年代至今(对语言环境的挑战时期及互联网翻译技术时期):高质量的机器翻译一定是基于对源语言语义的充分理解,而做到所谓充分理解,不仅要求机器能够具备相应的语法结构知识,而且要具备一定的语境分析与联想能力,内容涉及语言学、计算机科学、人工智能等多个领域。21世纪互联网的快速发展也推动了新时代的机器翻译研究,基于统计、基于实例等新的机器翻译方法也都是在这一时期出现的。2016年,谷歌公司发布谷歌神经网络机器翻译系统,首次将整个输入句子视作翻译的基本单元,准确度较以往机器翻译系统有了大幅度提升。如今,神经网络机器翻译系统已经克服了超大型数据集上的许多挑战,在翻译速度和准确度上都有着显著飞跃。
1.2 机器翻译研究现状
谷歌神经网络机器翻译系统目前已被全球用户与研究者们广泛接受,与传统的基于统计的机器翻译系统相比,谷歌神经翻译系统在生成译文的每个部分时都会在整个原文的基础上进行以句子为单位的对照参考,因此译文更加自然。但在日常应用中,就英汉互译而言,谷歌翻译的英译汉准确率要相对高于其汉译英准确率,而从文本类型来看,谷歌翻译对于非文学类文本的翻译效果要远优于其对于文学文本的处理效果。
由德国翻译家Katharine Reiss提出的文本类型理论划分了三种文本类型:信息型、表情型、操作型,不同的文本类型有着不同的翻译要求,因此机器翻译在处理不同文本类型时应采取相应机制才能达到较为理想的翻译效果。表1对不同文本类型及其特点进行了简要概括。
综合表1,笔者根据国内几位学者,如孙瑾、叶子南、包凯等对机器翻译的研究,对谷歌翻译在三种文本类型中的翻译效果进行了总结,结论显示:
表1 文本类型及其特点
对于信息型本,谷歌翻译的句子虽然生硬,但已基本明晰其大意,与信息型文本忠于原文、简洁明了的翻译标准已基本接近。但谷歌翻译中,英译汉的效果明显优于汉译英,这主要是由于汉语与英文的语法结构相差甚远,语料输入不足,机器无法进行充分学习,然而随着语料库的扩大及语法识别技术的进步,信息型文本的英汉互译结果将会越来越完善,有着较高的实用性。同时,利用谷歌翻译处理信息类文本还具有一定优势,就时效性而言,机器翻译能够帮助译者节省重复句型句式的翻译时间,缩短部分术语的查找时间,在保证准确的前提下很大程度上可以提升翻译效率。
对于表情型文本,即文学作品来说,首先机器翻译只具备字面理解并处理的功能,甚至对于某些不符合日常表达习惯的文学性特殊表达不具备识别和理解能力,更无法准确地将原文的情感和深层含义通过译文展现出来;其次文学翻译的主观色彩是机器翻译系统所极度缺乏的一项重要模块,一旦无法在语料库中找到与原文相匹配的语料,机器就只能进行字面翻译,导致情感表达的缺失。因此,无论是英译还是汉译,机器翻译目前对于文学类文本的适用性较低,甚至无法达到参考效果。
最后,对于操作型文本,该文本的特点介于信息型和表情型之间,既强调内容也注重感染力,在传递信息的同时,追求译文的独创性。而目前的机器翻译只是基于语法规则和语料库所建立的语言转换程序,在情感表达方面无法实现源语与目的语的动态对等。因此,对于操作型文本的英汉互译,机器翻译目前还未能达到适用标准。
由上述结论可见,当前技术框架下的机器翻译虽然一直在进步,但始终无法涉足带有主观性元素或表情性元素的文本类型。而对于信息型文本,机器翻译结果只能达到参考级别,译文仍需要通过人工译员来进行修改完善才能最终成稿。因此,在机器翻译完全成熟之前,“机器翻译+译后编辑”这种新兴翻译模式将成为提高翻译时效性的一个必要环节和促进机器翻译走向成熟的必然选择。
2 译后编辑研究综述
根据ISO/DIS 17100:2013标准所给出的定义,译后编辑(Post-editing)是“检查和修正机器翻译的输出”的一个环节。由于机器翻译技术尚未完善,机器翻译质量暂时无法达到职业译者的翻译水准,而为实现翻译效率与翻译质量的平衡把控,将机器翻译技术与人工翻译结合并发挥二者的一体化优势成为翻译服务行业的一种新兴翻译模式。
2.1 译后编辑应用与研究
卡门森斯咨询公司于2010年发布的语言服务行业报告指出,42%的语言服务提供商已经向客户提供机器翻译的译后编辑服务。无论机器翻译技术多么先进,也很难实现“全自动高质量”的翻译,必须有人工的译后参与。显而易见,译后编辑在平衡机器翻译质量方面已经成为市场需求的一部分,并且需求比重正在上升。
译后编辑的研究紧随机器翻译的发展,国外学者对于译后编辑的研究始于20世纪80年代,主要研究方向集中在译后编辑概述与评估、机器翻译错误识别、译后编辑工具研发、译后编辑能力与译后编辑者的培养等方面。ISO 18587草案标准将译后编辑分为三个阶段:准备阶段、译后编辑阶段、后处理阶段,并对从事译后编辑人员的技能和能力进行了描述。草案还将译后编辑分为两个级别:light post-editing以及full post-editing。其中,light post-editing指的是尽量保证机器译文的风格,仅对错误句子进行修改,也就是所谓的“轻处理”;而full post-editing则是加入了更多人为干预的因素,保证译文在语言、语法、风格各方面都与原文达到动态对等。国内学者崔启亮提出了“狭义译后编辑”和“广义译后编辑的概念”,前者指的是对机器翻译结果直接进行的译后编辑,而后者指的是对来自模糊匹配、记忆库等各种翻译语料库管理系统的翻译结果进行的译后编辑。随着机器翻译的进步,单纯基于语法层面的机器翻译已经逐步淘汰,因此,译后编辑的研究重点已经转向广义译后编辑。
2.2 译后编辑常见错误类型及特征
当前机器翻译可能出现的错误主要是来自语料库中语料模糊匹配度不高或计算机本身对语言信息加工不当。谷歌神经翻译上线之前,传统机器翻译主要以短语为基本单位进行翻译,然后根据语法理论对整个句子进行重新排序。传统机器翻译可能出现的错误类型包括:术语误译、形式错误(大小写)、格式错误(字体字号)、顺序错误、欠译、过译、多译、漏译、冗余、词性错误、从句逻辑关系错误、受到源语句型结构束缚,共12种错误类型。
谷歌神经翻译的推出在一定程度上降低了机器翻译的错误率,但大多数错误类型仍然存在,随着语料库的扩展和匹配检索系统的完善,以上错误类型中,术语误译、格式及形式错误、词性错误的发生率明显下降。除从句逻辑关系错误、受到源语句型束缚两种错误类型以外,其他错误类型均可根据具体情况采用light post-editing的译后编辑模式。以英汉互译为例,两种语言语法和构成差异较大,在转换过程中难免出现逻辑混乱、束缚表达等不当甚至错误情况,因此,译者需要对这两种译后编辑错误类型进行full post-editing,必要情况下进行适当改译,保证原文意图的有效传达。
翻译服务市场上对于译后编辑所产出的译文要求大多情况下只需达到参考级别,因此,读者可以理解即可,表达上允许适当的生硬表达以提高效率。在编辑时,译者需要掌握机器翻译的特点及工作原理,根据客户需求,对机器译文进行不同程度的编辑。对于一词多义、语序不当、表达不畅等情况,译者需要具备一定的编辑技巧,在考虑语篇联系的情况下适度编辑,而不是完全按照第一译者的想法进行翻译。译后编辑不同于一手翻译,译者在进行编辑时不仅要考虑全文的语篇联系,还要考虑机器翻译的语言风格,这就需要译者接受相应的定制训练以强化译后编辑能力。
3 译者译后编辑能力研究
译后编辑作为翻译领域人机交互的一种呈现形式,对于译者能力的要求不同于传统翻译模式。国内的机器译后编辑研究还处于新兴阶段,而对于译者译后能力培养与提升的研究也是凤毛麟角,只引起了少数学者的重视。而基于传统翻译能力之上的译后编辑能力很有可能成为未来译者的必备技能之一,也是职业译者竞争力的体现。
3.1 译后编辑能力构成
译者在执行译后编辑任务前不仅要具备进行传统模式翻译的能力,还要具有针对性地去了解机器翻译,相关机制及工具。根据冯全功对于译后编辑培养的研究,译后编辑能力主要是编辑能力与翻译能力的综合,具体又包括除译者基本能力(双语运用能力、专业知识认知能力、查阅搜索及工具运用能力等)以外的机器翻译机制认知能力、术语管理能力、译前编辑能力、基本编程能力、语言学知识能力、宏命令使用能力、词典编制能力等。Rico & Torrejón认为译者译后编辑能力可划分为三大范畴:语言能力、工具能力、核心能力,其中核心能力指译者的“生理/心理能力”和“策略能力”,涉及译者对于主体性问题的处理,如对于机器质量译文的容忍、满足客户需求、克服译后编辑中出现的不确定性、对机器翻译风格的遵循与舍弃等。另外,不同程度的译后编辑对于译者能力的侧重也各不相同,light post-editing侧重于译者的工具能力,而full post-editing要求更为全面,译者在进行full postediting时不仅要发挥过硬的语言能力,还要合理安排时间,注重排版和符号运用等细节,积累术语并且对译后编辑的所谓“伦理”有一定的认同。
3.2 译后编辑能力培养与提升
如何培养译者的译后编辑能力目前受到了国内学界与翻译行业的初步重视,无论对于译者的自我学习还是全国高校翻译教育来说,都需要将译后编辑能力培养提上日程。国内外学者,如O'Brien、刘群、冯全功等已经在这一方面进行了相关研究,且国内高校,如香港中文大学等也有过相关实践经验。其中,冯全功参考国内外译后编辑能力培养研究,对国内高校翻译教育,尤其是MTI专业课程设置,就加入译后编辑元素提出了若干意见。
译后编辑代表着未来翻译服务行业的趋势走向,进行译后编辑能力的培养与自我塑造对于译者也是顺应未来行业要求的重要环节。而译后编辑构成复杂,与传统翻译模式大相径庭,需要译者更新翻译意识,主动学习使用相应工具,学习相应技术才能紧跟行业发展的潮流,提升自身综合职业竞争力。
4 结语
信息化时代给人们带来了海量信息和数据,传统翻译模式对于源语言的处理效率已经显得越发力不从心,而机器翻译与人工译后编辑这种新型人机交互模式的出现必然引起翻译行业的一轮革新。无论作为译者还是翻译研究人员,把握当前趋势,合理转变思维,接纳新生事物都十分必要。但是,目前国内对于机器翻译和译后编辑的研究刚刚兴起,相关技术发展也尚未成熟,还需要进行长时间的理论和实践研究。笔者从机器翻译、译后编辑及译后编辑能力培养与提升三个方面,就几位具有代表性的国内外学者所做研究进行了综述,希望能够为该方面研究提供相应参考,促进“机器翻译+译后编辑”翻译模式的进一步发展。