机器翻译在人文社科文本翻译中的应用及启示
2021-05-20梁本彬李天云
梁本彬 李天云
(1.重庆第二师范学院外语学院,重庆;2.重庆工商职业学院旅游文化学院,重庆)
1.引言
谷歌于2016年推出神经机器翻译(NMT,Neural Machine Translation)之后,有关机器翻译会取代人工翻译的报道不断涌现,这些真假难辨的报道宣传致使公众对翻译的认识发生了颠覆性的改变,似乎存在了数千年的翻译职业即将被机器翻译取代。面对机器翻译对人工翻译带来的冲击,不少学者纷纷撰文,从语言学、翻译学、文化学、计算机科学等理论高度展开论述,认为机器翻译永远不会取代人工翻译(胡开宝 李翼,2016;叶子南,2017;祝朝伟,2018;许钧,2019)。持机器翻译取代人工译者观点的一方多数为机器翻译的开发运营商,其言论带有自我美化的色彩,可信度存疑;认为机器翻译无法取代人工译者的一方,其论述通常缺少基于真实翻译项目的详实例证,即便有例句,也主要集中在诗歌等带有极强修辞色彩的文体,无法客观反映机器翻译在人文社科文本翻译中的真实表现。在本文中,笔者根据自己近些年运用机器翻译辅助翻译人文社科图书的实践经验,选取笔者与多位译者协作完成的Glimpses of World History(简称World History)为案例,展示机器翻译在人文社科图书翻译方面的表现,并尝试对机器翻译在人文社科图书翻译中的使用策略给出自己的见解。
2.World History翻译项目简介
World History由印度开国总理尼赫鲁在上世纪30年代受监禁期间用英语写成,全书共有196封书信,收信人是监狱之外尼赫鲁年仅13岁的女儿英迪拉。该书讲述了从公元前6000年到1933年期间的历史,集史书、家书、时事评论等体裁于一体,是一部有别于西方叙事结构的世界史,在国际上有较为突出的影响力。原文可读性信息如下:正文单词数48万词,平均词长4.6,平均句长18.3个单词,Flesch Reading Ease为58.0,Flesch-Kincaid 级别为9.4,文章难度较大①Flesch Reading Ease和Flesch-Kincaid Grade Level为阅读难度测试(又称易读性测试),在美国教育界广泛使用。这一难度级别数值对应美国的中小学基础教育级别。Flesch-Kincaid级别9.4意味着普通高中生的阅读难度。。
World History问世70余年来一直没有完整的中译本。2015年初,中信出版社邀请笔者承担该书的翻译工作。笔者召集四位经验丰富的翻译教师,在谷歌机器翻译的辅助下,用时6个月完成整个项目,译文总字数约100万字。2016年7月,四个中文版本同步面世,分别为《尼赫鲁世界史》(单行本)、《尼赫鲁世界史》(限量发行的大字本)、《爸爸尼赫鲁写给我的世界史》(平装三卷本)、《爸爸尼赫鲁写给我的世界史》(精装四卷本)。该系列入选深圳读书月2016“年度十大好书”100书单。截至2021年3月,该系列译著在豆瓣网上的评价良好,评分均为8.4分。
3.机器翻译在World History翻译项目的应用分析
翻译技术的应用已经广泛渗透到各种翻译场景之中,信息化与技术化已成为当前翻译职业的显著特征(王少爽 覃江华,2018:90)。笔者在为本书组建翻译团队时,也自然借助了机器翻译等翻译技术,采用融入了机器翻译的“MT+CAT+PE”翻译协作模式,充分整合机器翻译的速度优势和人工译者的质量优势,以较高的翻译效率和翻译质量完成本书的翻译工作。在此过程中,机器翻译较好地展现了快速生成高质量基础译文方面的优势,其劣势同样暴露无遗。
3.1 机器翻译在World History翻译过程中的优势分析
熟练的译者以谷歌机器翻译译文为基础进行译后编辑(Post-Editing,PE),能大幅度提高翻译效率(徐彬,2010;梁本彬,2018),在World History翻译过程中,机器翻译确实辅助提高了翻译效率,其积极作用主要表现在数字翻译、术语翻译、语块翻译三方面。
(1)数字翻译
人工译者在翻译大量的数字时容易出现失误,而机器翻译在数字翻译方面一直有着良好的表现,神经机器翻译在数字翻译转换方面的表现更是惊人。World History涉及众多国家的历史事件、人口、教育、经济等方面的数千处日期和统计数据,机器翻译在翻译转换这些数字时,准确性极高,例1中的10个数字(包括以单词拼写的数字)均被准确地转换到译文之中②SL为原文【Source Text】, NMT为谷歌神经机器翻译结果,PT为最终出版的中文译文【Published Text】。由于NMT已成为MT的主流形式,为了更好地反映当前MT的表现,本文采用的MT译文均为2019年以来采集的谷歌NMT结果。。
例1.SL: In1800the population was180 millionsfor the whole of Europe…and in1914it was460 millions.During this period also millions of Europeans emigrated to other continents, particularly to America, and we may put their number at about40 millions.Thus Europe’s population went up to about500 millionsfrom180 millions, in the course of a little over100 years.This increase was especially marked in the industrial countries of Europe.England,at the beginning ofthe eighteenth century, had a population of5 millionsonly, and was the poorest country in western Europe.
MT:1800年,整个欧洲的人口为1.8亿……并在1914年它是4.6亿。在此期间,还有数百万欧洲人移民到其他大陆,尤其是美国,我们的数量可能会达到大约4千万。因此,在100多年的时间里,欧洲的人口从1.8亿增加到大约5亿。这种增长在欧洲工业国家尤其明显。英国在十八世纪初只有500万人口,是西欧最贫穷的国家。
(2)术语翻译
谷歌机器翻译提供的各类术语翻译准确度非常高,可为人工翻译提供许多有益的借鉴。根据项目完成后的统计,整套书的术语达到4000多条,术语密度远高于一般人文社科图书。准确翻译这些术语需要进行大量的查证核实工作,耗费巨大的精力,成为影响翻译效率和质量的主要障碍之一。机器翻译在本书的术语翻译方面表现突出,例2中的美国早期历史的常见人名、地名等术语,均被准确地翻译成了可以直接采用的汉语,只有个别术语需要在格式上略作调整,如“本杰明富兰克林”改为“本杰明·富兰克林”。
例2 ST:George Washingtonbecame the first president of the United States.He was a great landowner from theState of Virginia.Other great men of this period who are considered the founders of the republic areThomas Paine,Benjamin Franklin,Patrick Henry,Thomas Jefferson,Adams and JamesMadison.Benjamin Franklinwas an especially distinguished man, and was a great scientist.By flying boys’kites he showed that the lightning in the clouds was the same thing as electricity.
MT:乔治华盛顿成为美国的第一任总统。他是弗吉尼亚州的伟大土地所有者。 这一时期被认为是共和国创始人的其他伟人包括托马斯潘恩,本杰明富兰克林,帕特里克亨利,托马斯杰斐逊,亚当斯和詹姆斯麦迪逊。本杰明富兰克林是一位特别杰出的人,是一位伟大的科学家。通过飞行男孩的风筝,他表明云中的闪电与电力是一样的。
(3)语块翻译
谷歌机器翻译生成的译文包含大量准确度较高、能够直接利用的语块,有利于提升翻译效率。徐彬和郭红梅(2015)在基于文学及半文学的图书翻译实践发现,机器翻译结果的综合利用率最高能达到40%左右。World History中有大量结构清晰、信息明确、表述直白的内容,机器翻译能将这些语句快速生成包括大量可用语块的基础译文。如例3所示,谷歌机器翻译结果中,可利用的字数为126字(带下划线部分),经过译后编辑的译文字数为184字,即该句的最终译文里有68.4%的字数为机器翻译译文,机器翻译对翻译效率的贡献由此可见一斑。
例3 ST: This was a great city of a million inhabitants, a garden city ten miles in length, with twenty-four miles of suburbs.There are said to have been 60,000 palaces and mansions, 200,000 smaller houses, 80,000 shops, 3800 mosques and 700 public baths.These figures may be exaggerations, but they give some idea of the city.There were many libraries,the chief of these, the Imperial Library of the Emir,containing 400,000 books.The University of Cordoba was famous all over Europe and even in western Asia.Free elementary schools for the poor abounded.
MT:这是一个拥有百万居民的大城市,一个十英里长的花园城市,有二十四英里的郊区。据说有6万个宫殿和宅邸,20万个小房子,8万个商店,3800个清真寺和700个公共浴池。 这些数字可能有些夸张,但他们对这座城市有所了解。有许多图书馆,其中包括埃米尔的帝国图书馆,其中包含40万册图书。科尔多瓦大学在欧洲甚至西亚都很有名。 为穷人提供免费小学。
PT: 这是一座有着100万居民的大城市,也是一座长达10英里的花园城市,有24英里长的郊区。据说,城市里有6万座宫殿和大宅第、20万栋小型住房、8万间商铺、3800座清镇寺和700间公共浴室。这些数字可能有点夸张,但是它勾勒出了这座城市的大致情况。城里还有很多图书馆,其中最主要的是埃米尔帝国图书馆,藏书量为40万册。科尔多瓦大学享誉整个欧洲,甚至名声还远播到了西亚。还为穷人提供大量免费的小学。
3.2 机器翻译在World History翻译中的错误分析
有关机器翻译的错误,国内外学者已经做过一定的分析论述,如许建平(1998)简要分析过机器翻译的准确度与可读性,李梅和朱锡明(2013)以“汽车技术文献翻译语料库”为基础,对机器翻译的译文错误、术语错译、句法错误等进行过统计分析。贺文照和李德凤(2019)发现机器翻译译文可接受性总体上仍然比人工译文低,译文可接受度起伏较大。上述文献分析的机器翻译在词汇和句子层面的翻译错误,也广泛存在于World History的翻译之中。此外,在本书的翻译过程中还出现了一些鲜见于应用文本翻译中语篇层面的翻译问题,如原文史实勘误与背景知识增补、重要引文回译、经典译文引用等。
(1)原文史实勘误与背景知识增补
尼赫鲁在写作时只能凭记忆和参考极为有限的笔记资料,致使书中不可避免地存在一定数量的史实错误,一些历史背景交代也很模糊。鉴于此,翻译过程中需要核查史实,更正原文中的史实性错误,补充必要的背景知识。笔者为全书添加了数百条注释,目前机器翻译在这方面还不能发挥作用,如下列例句所示。
例4 SL: So Ashoka sent his messengers and ambassadors to the kingdoms of the West in Asia,Europe and Africa.To Ceylon, you will remember,he sent his own brother Mahendra and sister Sanghamitra.
MT: 因此,阿育王(Ashoka)派遣了使者和大使前往亚洲在亚洲,欧洲和非洲的王国。您会记得,他给锡兰送了自己的兄弟马亨德拉和姐姐桑加米特拉。
PT: 阿育王派遣信使和使节前往亚洲西部、欧洲和非洲诸国。你还记得吧,他还派遣了他的兄弟摩哂陀(Mahendra)和妹妹僧伽蜜多(Sanghamitra)前往锡兰[此二人应是阿育王的子女,而不是他的兄妹。——译者注]。
例5 SL: I told you once that India was known of old as the Land of the Moon—Indu-land! Hiuen Tsang also tells us about this, and describes how suitable the name is.Apparently even in Chinese InTu is the name for the moon.
MT: 我曾经告诉过您,印度曾被称为月球之地-印度土地! 曾浩(Houen Tsang)还会告诉我们这件事,并描述这个名字的适用性。显然,即使在中文中,InTu还是月亮的名字。
PT: 我曾告诉过你,印度历史悠久、闻名于世,也被称为“月亮之国”!玄奘也在游记中提到了这个名字,还向我们描述了这个名字是多么适合印度。显然,中文拼音“In-Tu”(印度)就是指月亮。[现代中国人可能并不能看出“印度”与月亮的联系。其实,中文中的“印度”一名为玄奘首创……玄奘在《大唐西域记》中解释说:“……印度者,唐云月,月有多名,斯其一称。言诸群生轮回不息,无明长夜,莫有司晨。……良以其土圣贤继轨,导凡御物,如月照临,由是义故,谓之印度。”——译者注。]
(2)重要引文回译
该书引用了一定量详实确凿的文史资料,对于此类有明确出处的重要中文史料,在翻译中笔者采取“有本回译、精准复原”的方法,利用网络检索、图书馆查阅等手段,确定原文的回译内容。下述例句是乾隆皇帝写给英王乔治三世的信,这封信在中英交流史上具有重要意义,为许多中国读者所熟知,因而在翻译时必须还原引文的历史原貌。笔者最终在《清实录》乾隆朝实录卷之1435卷找到了信件原文。机器翻译在回译此类资料时还无法发挥作用。
例6 ST: “...You, O King, live beyond the confines of many seas, nevertheless, impelled by your humble desire to partake of the benefits of our civilization, you have despatched a mission respectfully bearing your memorial...”
MT: “……国王,噢,您生活在许多海洋的界限之外,然而,由于您渴望分享我们的文明利益的谦卑愿望而受到驱使,您已派遣了一个谨记您的纪念馆的任务。……”
PT: “……奉天承运皇帝敕谕英咭利国王悉知,咨尔国王远在重洋,倾心向化,特遣使恭赉……”
(3)经典译文引用
书中引用了大量世界各国诗歌、散文、宗教典籍、人物传记等经典文献,涉及几十位作家的作品,其中不少作品都有公认的权威中文译本。为了保证此类引文翻译的准确性和权威性,尤其是译者并不熟悉的俄语、德语、法语、西班牙语等引文,根据出版社的要求,笔者查阅了权威译文并加以引用。本书翻译过程中所引用的部分中文权威译文情况见表1。目前机器翻译还无法做到这一点。
表1 World History所引用的部分中文权威译本
4.机器翻译助力人文社科图书翻译的建议
机器翻译能快速为译后编辑提供高质量的基础译文,已演进为翻译活动中的必备工具,成为翻译行为的重要构成部分(崔启亮,2014),翻译也因此被视为一种人与机器协作完成的活动(Alonso & Calvo, 2015)。为了让机器翻译在人文社科图书翻译中得到更加广泛的应用,充分发挥其辅助优势,如下三个方面需要引起足够重视。
4.1 深化对机器翻译的理性认识
译者已经进入了一个“无技术不翻译”的时代(任文,2019),从事人文图书翻译的译者需要理性看待机器翻译的优势与不足,只有充分认识了机器翻译的基本原理及其译文生成规律,面对商家“妄下断言、以偏概全、夸大事实”的宣传(韩林涛,2019: 54),才不至于对自己的翻译前景感到悲观失望;面对机器翻译永远无法取代译者从事文学翻译的论断时,又不会盲目乐观而彻底抛弃机器翻译。机器翻译利用的是翻译记忆和现有的语料库,遵循数字世界的规则和代码指令,本身缺少自反性,无法为生成的译文负责,也无法拒绝自身能力之外的翻译(郝俊杰 莫爱屏,2019)。该特性从一开始便注定机器翻译将永远处于从属、辅助的地位;在人文社科图书翻译中,翻译的责任主体只能是人。
文学类翻译被视为人工翻译的最后一块领地(Toral & Way, 2018),文学文本独特的文学、文化特性被视为机器翻译的“拦路虎”。翻译的本质是“译者将一种语言文字所蕴含的意思用另一种语言文字表达出来的文化活动”,文学与非文学翻译在本质上依旧是“将一种语言文字所蕴含的意思用另一种语言文字表述出来”,二者不存在本质上的差别,只是语言文化在程度上存在差异罢了(王克非,1997),因此机器翻译在人文社科图书翻译中也能发挥应有的价值,前文的例证分析也较好地说明了这一点。无论是翻译研究者还是翻译实践者,均应看到机器翻译在人文社科文本翻译中的巨大潜力,淡化技术文本与人文社科文本之间的概念性区别;在AI技术盛行的时代,译者应该转变对翻译技术的固有而片面的认知,“熟悉运用多种翻译技术和工具,快速更新知识结构并提升技术能力”(王华树 王鑫,2021:14),结合人工译者的翻译决策优势和质量优势,更好地提升人文社科图书翻译质量和效率。
4.2 强化译者在翻译过程中的主体责任意识
人文社科图书具有存续时间长、影响广泛、知识产权归属明确、翻译质量要求严格等显著特征,译者在借助机器翻译进行人文社科图书翻译时,所承担的责任要求也更高。一方面,传统的译者伦理要求译者忠实于原作,准确传达原文的思想内容,再现原作的风格特征;另一方面,译文又必须符合图书市场的需求,贴合当代读者的阅读习惯;有出版社明确禁止使用机器翻译或计算机辅助翻译,译者应意识到这是出版社在图书翻译项目管理方面存在的重大缺陷(徐彬 梁本彬王臻,2021),不应亦步亦趋地放弃使用翻译技术,而应本着对翻译质量和效率负责任的态度,合理地让翻译技术为翻译助力。机器翻译自身的运行机制决定了其译文达不到人文社科图书的质量要求。译者对所译人文社科图书具有的署名权既是对译者智力劳动成果的归属认定,也是约束译者对译文质量负责的有效方式,因此译者在使用机器翻译时,必须有高度的主体责任意识,充分认识机器翻译译文的质量缺陷,凭借自身出色的翻译能力,过硬的信息素养,从语篇统筹的高度,在译后编辑过程中认真修改润色每一句译文,才能保证译文质量。
近年来,师生借助机器翻译协作翻译人文社科图书的现象日益普遍,翻译教师在此过程中的责任意识尤其值得重视。笔者接触过不少此类师生协作翻译图书的事故案例,失败原因归结起来,主要是教师和学生不懂得如何有效利用机器翻译,不熟悉译文质量控制手段,导致的后果往往是教师和学生都陷入机器翻译的思维模式,放弃人工译者的语言思维优势,最后提交的相当于全部是机器翻译的译文。如果翻译教师要在此过程中借助机器翻译,他们有义务首先保证,参与图书翻译项目的教师和学生均具备识别、修改机器翻译译文差错的能力,熟悉基于现代翻译技术的翻译协作流程,同时必须具备以“良好的信息检索、辨析、整合和重构能力”为核心内容的“搜商”(王华树,2015),否则翻译协作会导致灾难性的后果。
4.3 译者要树立高远的职业目标
信息化时代的译者被要求在机器翻译等翻译技术的辅助下,以更快的速度和低廉的成本完成翻译任务,不少翻译客户对翻译质量的要求也降到了“能看就行”的标准(李晗信 陈海庆,2020:116)。这种变化客观上引起了技术化语言的泛滥,在一定范围内造成语言的机械化与同质化,语言也开始朝着有利于翻译技术识别的方向发展,变得愈发“远离个性化、情景化、具体化”,语言意义层次和语言诗性也随之流失(郝俊杰 莫爱屏,2019:62)。译者受此消极影响,逐渐放弃了对译文遣词造句的深思熟虑和精雕细琢,对语言的敏感度下降,语言转换技能也趋于退化(郝俊杰 莫爱屏,2019),创造性减弱,满意度下降,自主性也有所丧失(Kenny,2017),逐渐沦为机器翻译的附庸。语言在交流中的意义包括概念意义、语境意义、形式意义、风格意义、形象意义和文化意义(刘宓庆,2019);系统功能语言学认为,语言具有概念、人际、语篇三大功能;语言是一个自成体系的生态系统,需要不断创新自己,方能在千变万化的情景中发挥适恰的功能。翻译过程中的意义转换是多层次、全方位的,译者要在众多可能的意义中做出合理选择,翻译因而被视为“一种判断和选择的艺术”(杨武能,1993: 6)。作为人类语言最重要存在形式的人文社科图书,较为完整、系统地展现了异常丰富的语言特征和功能。机器翻译由于具有自动化、机械性、以句子为翻译单位、二度模仿和语境制约有限等特征(胡开宝 李翼,2016),所能转换的意义基本上停留在概念意义这一层,对人际、语篇意义识别度有限,无法根据原作意图、原文语境、目标语文化、赞助人、读者等要求做出灵活的意义选择和表达;机器翻译遭遇的巨大挑战为译者发挥优势、施展个性化的语言能力提供了广阔空间。
从事人文社科图书翻译的译者应在翻译质量、翻译效率和语言修养等方面确立高远的职业追求,积极拥抱翻译技术,让技术为自己赋能。当前的人文社科图书翻译要求是质量和效率并重。采用机器翻译,并依靠自身过硬的信息素养,快速而准确地获取翻译所需的各类信息,这是提高交付效率的必由之路;为了保证翻译质量,译者必须充分熟悉机器翻译等现代翻译技术的属性,制定合理的机助人译流程,充分发挥人工译者在意义选择、信息获取与筛选、翻译策略、语境识别方面的优势,译写出表达准确而专业,或严肃,或轻快,或雄壮,或温婉,或幽默,或沉闷的语句。译者同时还须有意识地提高自身的信息素养,“通过主动学习,弥补自身知识与能力体系的欠缺,促进知识升质和智能增量,应对翻译行业的各种挑战,实现翻译职业的可持续发展”(王少爽,2017: 62)。译者应从维护语言文化多样性的高度,怀着对自然语言的尊重,在跨文化交际的崇高使命感召下,自觉承担人文社科图书的翻译工作,积极应对翻译过程中的挑战,让富有人文性、创造性、灵活性、多样性、趣味性的译文增添翻译工作的乐趣,增强职业荣誉感和认同感。
5.结语
本文采用笔者机器翻译译后编辑模式翻译出版的人文社科图书的案例,从优势和错误两方面分析了机器翻译在人文社科文本翻译过程中的表现情况。一方面机器翻译能提高翻译效率,在一定程度上保证翻译质量;另一方面,机器翻译译文无法达到人文社科图书翻译的质量要求,需要译者人工把关。因此要让机器翻译在人文社科图书翻译中得到更加广泛的应用,充分发挥翻译技术的辅助优势,需要在三个方面给予足够的重视,即深化对机器翻译的理性认识、强化译者的主体责任意识、译者应树立更高的职业追求目标。这样才能满足翻译人才、翻译行业、国家社会发展的根本需要。