APP下载

语言学的译后编辑规则研究
——以谷歌翻译中译英为例

2023-10-19袁湾

文化创新比较研究 2023年22期
关键词:词序校正词语

袁湾

(广州华商学院,广东广州 511300)

在全球化背景下,随着众多信息瞬时流动,信息在不同的语言社区的传播紧迫性也随之提高。高速捕捉信息的压力,以及并非所有说话者都是双语甚至多语者的事实,使人们开始接触机器翻译。机器翻译以其在几秒钟内产生译文和在任何时间、任何地点都能轻松获得的优势,吸引了越来越多的用户。从机器翻译系统获得高质量的翻译是一种理想;但在现实生活中,在翻译达到一定质量之前,需要对机器翻译系统的输入或机器翻译系统的输出进行人工修改。修改机器翻译系统的输出,或称为译后编辑,“可能是最古老的人机合作翻译形式”。它也被认为是机器翻译系统实践使用中的一个重要场景。近年来,人们倾向于对机器翻译输出进行译后编辑工作,而不是从头开始翻译。根据O'Brien等学者的说法,对译后编辑的兴趣激增背后的原因,其一是机器翻译输出的质量不断提高;其二是机器翻译和译后编辑的免费、高质量软件的存在[1]。有完全由人类完成的人工译后编辑,以及由人类完成但有计算机协助的交互式译后编辑。

另一个需要进一步研究的领域是译后编辑的实践,更具体地说,在可以合理地称为“译后编辑”的编辑过程中,应该遵循什么标准。Allen提出与译后编辑准则相关的一个问题是,首先要确定机器翻译输出的文本在多大程度上可以接受译后编辑,以及有多少译后编辑工作是必要的,以改善这些不完美的机器翻译文本[2]。在回答这个问题时,翻译自动化用户协会(TAUS)与下一代本地化中心(CNGL)合作,制作了他们的基线译后编辑指南,为他们自己的目的服务。TAUS(2010年)指出了决定译后编辑工作量的两个主要因素:一是原始机器翻译输出的质量;二是最终文本的预期质量。TAUS/CNGL在2010年根据内容的预期质量水平,提出了具体的译后编辑规则。它被认为是第一套“公开的以行业为重点的译后编辑指南”[3]。 Depraetere(2010 年)试图建立一套供课堂使用的译后编辑规则[4-5],并在开始译后编辑任务之前,向学生讲授了Allen(2003年)的译后编辑的基本原则(快速、最小和全面的译后编辑)。由于Allen的编辑准则的措辞不精确,在实际的编辑任务中很难遵循。因此,他们选择了Allen的快速和最低限度的编辑,并得出了一套“做”和“不做”的编辑规则。杨文地和范梓锐(2021年)从语义、语用和句法角度,指出了科技类文本译后编辑需注意的语言现象[6]。此外,夏玲、李宜蔓和李弘武阐述了译后编辑任务分解流程,归纳了机器翻译科技论文摘要常见错误,提出了科技论文摘要的译后编辑策略[7]。为了深度探究译后编辑,杨艳霞和魏向清从认知范畴角度出发,分析了作为译后编辑必要要素的翻译能力和翻译修改能力之间的相互关系,提出了供教学使用的译后编辑建议[8]。

在前述研究的基础上,本文将进一步研究,将源文本(中文)与由无法接触源文本的单语目标语言使用者编辑的谷歌翻译输出 (英文)进行比较,根据Mona Baker的翻译对等理论进行分析,探究是否可以从分析谷歌翻译输出的语言错误中得出任何具体的语言学译后编辑规则。

1 Mona Baker的翻译对等理论

根据Baker(2011年)的观点,翻译中的对等是在不同的层面上,即单词层面的对等、单词层面以上的对等、语法对等、文本对等(主题和信息结构以及内聚力)、语用对等和超越对等(伦理和道德)。在翻译的对等性方面,每个层次都有自己的特点[9]。Baker将它们区分为:(1)词语层面的对等性,词层面的对等概念指出了命题和表达方面的词汇意义;(2)词层面以上的对等是指在搭配、习语和固定表达方面的对等;(3)语法对等是指在不同的语法范畴,即数量、性别、人称、时态和语态、语气和词序方面的对等;(4)文本对等主要是在主题和信息结构、凝聚力方面;(5)语用对等是指翻译中的一致性和暗示。本研究以Mona Baker的不同层次的对等性为理论指导,分析了源文本和谷歌翻译后输出的非对等性。

2 实验数据和方法

本研究从《东北亚论坛》的双语期刊中随机收集了4篇长度在221—298字之间中文原文的摘要作为实验样本,3个以英语为母语的人为实验对象,对这4个中文摘要样本(以下简称ST)的谷歌翻译输出(以下简称MT)进行译后编辑。本文中的译后编辑水平属于“快速译后编辑”的选择。基于这样的目标,确立了译后编辑要求,即:

(1)每份文件最多10分钟;

(2)对文本进行最低限度的译后编辑,以修正明显的重大错误;

(3)不应考虑文体问题。

基于定量和定性研究方法,测试数据主体为一组3个测试对象(以下简称P1-P3),将分别编辑4个机器翻译的文本(以下简称T1-T4)(见表1)。译后编辑任务完成后,相关人员将向受访者发放调查问卷,以评估编辑后文本(以下简称TT)的整体质量。

3 案例研究

3.1 样本数据1

例1:

ST:新时期俄罗斯外交转型始于2012年开启的普京第3个总统任期,对国内形势、地区局势和国际格局的再评估促使莫斯科开始注重通过软实力建设与多极世界中的不同行为体进行合作,转变类型首先从软实力政策调整开始。

P1:The new period of Russian diplomatic transition began in 2012,Putin's third presidential term.Thedomestic situation,regional situation and the international pattern of re-evaluation prompted Moscowto beginto focus on soft power construction andthemulti-polar world of different actors.Cooperation,andtransformation from the soft power policy adjustment began.

P2/P3:The new period of Russian diplomatic transition began in 2012,Putin's third presidential term.Thedomestic situation,regional situation and the international pattern of re-evaluation prompted Moscowto beginto focus on soft power construction and multi-polar world of different actors.Cooperation,andtransformation began first from the soft power policy adjustment.

通常的情况是,当ST由多层片段组成时,ST的主题图案在TT中被扭曲。根据Mona Baker(2011年)的理论成果,主题结构决定了在文本层面上相当于ST的更清晰的信息流。ST中的一连串元素在TT中被分层,Mona Baker所称的主题和韵律在TT中没有被区分开。这导致了ST和TT之间的非等价信息流。3位译后编辑都意识到了这样的错误,并进行了一些译后编辑:第一,将长句分为3个句子,并在上面的摘录中显示了具体的主题和流变;第二,通过英文词汇不同但含义相同的“开始”来保持自然和准确的搭配。

如上述摘录所示,有一个错误的翻译。“与多极世界中的不同行为体进行合作”被误译为“不同行为体的多极世界合作”。值得注意的是,当发生误译时,在无法访问ST的情况下进行译后编辑变得很困难。

例2:

ST:新时期俄罗斯的软实力政策调整主要在对外宣传、教育交流和国际发展援助三个领域展开,在对传统公共外交领域进行政策调整的基础上,俄罗斯更加注重公共外交与国际发展援助的机构功能整合,以更有效地兼顾国内发展和国际影响,提升国家软实力,为整体外交战略目标服务。

P1:Russia's soft power policy adjustment in the new periodhas beenmainly in the field of foreign propaganda,education,international exchange and international development assistance.Inthe field of traditional public diplomacy policy adjustment,Russia ispayingmore attention to public diplomacy and international development assistance,institutional functionsandIntegration,in order to more effectively take into account domestic development and international influencetoenhance national soft power for the overall diplomatic strategic objectives.

P2:Russia's soft power policy adjustment in the new period mainly in the field of foreign propaganda,education,international exchange and international development assistance in the field of traditional public diplomacy policy adjustment,wasbased on Russiapayingmore attention to public diplomacy and international development assistance institutional functions Integration,in order to more effectively take into accountthedomestic development and international influence,enhance the national soft power,for the overall diplomatic strategic objectives.

P3:Russia's soft power policy adjustment in the new periodwasmainly in the field of foreign propaganda,education,international exchange.Internationaldevelopment assistance in the field of traditional public diplomacy policy adjustment,isbased on Russiapayingmore attention to public diplomacy and international development assistance and institutional functions Integration in order to more effectively take into account the domestic development and international influence,enhance the national soft power,and achieveoverall diplomatic strategic objectives.

这也是MT中主题结构问题的另一个例子。为了解决这样的问题并保持翻译的对等性,P1、P2和P3采取的策略是将长句分成若干句子。如编辑后的文本所示,主题和韵律已被明确。然而,基于个人理解,句子的划分工作可以是很直观的事实证明,P3所采取的长句划分、连词插入和介词添加等策略,使信息的传递更加顺畅,与ST相当。

3.2 样本数据2

例1:

ST:离岸市场的发展与人民币国际化的推进

P1/P3:The Development of OffshoreMarketsand the Promotion of RMB Internationalization

与中文相比,英语是一种有数量语法范畴的语言。根据Mona Baker(2011年)的说法,在英语中,一个和一个以上(单数和复数)的区别必须用形态学来表达。与英语不同,中文不一定有数量上的区分。然而,谷歌翻译并不能识别这样的语言区别,而是将“离岸市场”的字面翻译为英语中的复数。

例2:

ST:人民币国际化自2009年正式启动以来

P1/P2:Since the internationalization of RMB was officially launched in 2009

时态是翻译中再次出现的其他语法错误。正如Mona Baker所指出的,“动词的形式表示事件的时间和时间分布信息 (时态和方面)”。在上面的例子中,动词的形式应该是过去式,因为时间信息是“2009 年”。

例3:

ST:人民币离岸市场的建设也取得了一定成绩,但目前来看并没有充分发挥预期中的功能,这也引发了各界对人民币国际化模式的进一步讨论。

P1/P3:The construction of the RMB offshore market has also made certain achievements,but at present,it has not fully fulfilled the expected functions,whichalso led tofurther discussion of/onthe RMB internationalization of the model.

P2:The construction of RMB offshore market has also made certain achievements,but at present,it has not fully fulfilled the expected functions.This also led to the RMB internationalization of the model for further discussion.

词序在翻译中的重要性在于,“它在保持连贯的观点和在文本层面的信息定向方面发挥着重要作用”。词序一直是谷歌翻译的薄弱环节。如例3所示,“引发了各界对人民币国际化模式的进一步讨论”这一条款在翻译中的结构听起来很别扭。为了保持ST信息的顺畅流动,P1和P3都对该子句中的单词进行了重新排序。此外,译后编辑还发现了机器翻译中的一个套管问题。

3.3 样本数据3

例1:

ST:中国作为横跨“心脏地带”和“边缘地带”并使二者相连的地缘经济政治大国,与处于 “边缘地带”的东南亚地区和兼具“心脏地带”和“边缘地带”的南亚地区在地缘经济政治上已呈互为依托之势。东南亚和南亚对于中国来说,既有资源价值,又有地缘价值;而中国对于东南亚和南亚而言,可借助中国所处的“心脏地带”地缘优势和发展潜力获取自身特有的地缘经济政治权益。

P1:China,as a geopolitical and economic country that spans both the "heartland" and the "fringes",connects China with Southeast Asia and the "heartland" and "fringe" of South Asia.The region has been in the geopolitical and economic development has been relying on each other's development trends.Southeast Asia and South Asia for Chinahasboth the value of resources,but also the geopolitical value;and China for Southeast Asia and South Asia,with China's "heartland"hasthe geographical advantages and development potential to obtain Southeast Asia and South Asia's unique geopolitical and political rights and interests.

P2:China,as a geopolitical and economic country that spans both the "heartland" and the "fringes",connects China with Southeast Asia and the "heartland" and "fringe" of South Asia.The region in the geopolitical and economic development has been relying on each other's development trend.Southeast Asia and South Asia for China,both the value of resources,but also the geopolitical value;and China for Southeast Asia and South Asia,with China's "heartland" in which the geographical advantages and development potential to obtain their own unique geopolitical and political rights and interests.

P3:China,as a geopolitical and economic country that spans both the "heartland" and the "fringes",connects China with Southeast Asia and the "heartland" and "fringe" of South Asia.The region has been in the geopolitical and economic development and has been relying on each other's development trend.Southeast Asia and South Asia for China,both the value of resources,but also the geopolitical value;and China for Southeast Asia and South Asia,with China's "heartland" in which the geographical advantages and development potentialallow themto obtain their own unique geopolitical and political rights and interests.

由此看来,与文本等同性密切相关的内聚力在翻译中很难得到保持。上述文本的复杂性给谷歌翻译带来了一些困难,使其无法将长文本划分为相应的句子。3位译后编辑通过添加标点符号指出了一个长句的错误。

翻译中也出现了多余的词的问题。在一个句子中出现两次“have been”使句子的意思变得混乱。这方面的例证是译后编辑所采取的不同策略。P1和P2删除了多余的词,而P3则保留了这些词,但通过增加一个连词and来纠正句子。然而,译后编辑不仅是为了使句子具有凝聚力,也是为了使译文与原句保持等同。就ST而言,P1和P2删除冗余词的策略保持了ST和TT之间的对等信息。

在这个不完整的句子中,一般的代词“他们自己的”使参照物变得扑朔迷离。根据Mona Baker的观点,在文本层面上,当读者遇到一个一般的代词,如例子中的“他们自己的”时,希望检索到直接身份。当上下文中存在多个参照物时,尤其需要一个明确的参照物。然而,虽然译后编辑清除了参照物,但该句子仍未以明确的方式传递ST的同等含义。

3.4 样本数据4

例1:

ST:2015年对中日韩三国具有重要意义。

P1/P2/P3:The year 2015in Japan and South Korea is of great significance.

“当一个翻译被描述为‘不准确’时,被质疑的往往是命题意义。”命题意义提供了“我们可以判断话语真假的基础”。TT中“2015年”这个词不准确的命题意义使得TT与ST有区别。译后编辑注意到了这样的误译,将“2015 年”纠正为“The year 2015”。

例2:

ST:这一年既是不平等的中日《马关条约》签署120周年,也是世界反法西斯战争及中国人民抗日战争胜利、朝鲜半岛光复、日本战败投降70周年。

P1:This year is not only equal to the 120 anniversary of the signing of the Sino-Japanese Treaty of Shimonoseki,but also theanniversary of theworld anti-fascist war and the victory of the Chinese People's Anti-Japanese War,and the 70th anniversary of Japan's defeat and surrender.

P2/P3:This year is not only equal to the 120 anniversary of the signing of the Sino-Japanese Treaty of Shimonoseki,but also the70th anniversaryof world anti-fascist war and the victory of the Chinese People's Anti-Japanese War,the Korean Peninsula,Japan defeat surrender.

词序一直是机器翻译中的一个问题。根据Mona Baker的说法,翻译中的词序非常重要,它可以保持连贯的观点,并引导信息。在MT中排列不整齐的单词会误导源文本的含义。文末的名词“70周年”使文本听起来很混乱。因此,P1、P2和P3采取了重新排列词语的译后编辑策略。

例3:

ST:这一年既是不平等的《日韩合并条约》签署105周年,也是二战后韩日建交50周年。

P1/P2/P3:this year is unequal "Treaty of Merger" signed 105 anniversary,andalso the 50th anniversary of the establishment of diplomatic relations between South Korea and Japan after World War II.

“可能有一个目标语言的词与源语言的词具有相同的命题意义,但它可能具有不同的表达意义。”这样的差异,如果不弄清楚,可能 “足以造成翻译问题”。在例3的例子中,MT中的“也是”是ST中“也是”的确切命题含义。然而,传统的对应词“也是”在给定的语境中似乎并不连贯。取而代之的是,被编辑后取代的连接词“和”已经完全表达了ST的意思。

例4:

ST:如何从政治与经济的相关性、历史与现实的结合点,认识日本政治右倾化特别是“安倍政治学”对中日、韩日关系的影响,值得深入研究。

P1/P2/P3:Understanding/How we understandthe influence of Japanese political right deviation,especially "Abe Politics",on the relationship between China and Japan and between Korea and Japan is worth studying deeply from the combination of politics and economy,history and reality.

从连贯性的角度来看,实用性的等同性对MT系统来说是很困难的。暗示作为一致性的一个方面,对机器翻译来说尤其困难。与传统意义不同,暗示是指 “说话人的意思或暗示,而不是他或她的字面意思”,正如Mona Baker所报告的。ST中“如何”一词的常规翻译使TT表示一种询问的语气,这与原文的语气相反。因此,询问词“如何”被替换为肯定词“理解”或短语“我们如何理解”。

4 质量评估

本实验采用5分制的忠实性评分,作为评估编辑后机器翻译输出质量的方式,如表2所示。正如Chan所指出的,这种5分制的忠实性评分已经“广泛用于许多公开的机器翻译评估”[10]。传统上,可懂性始终是要评估的一个方面。然而,译后编辑本身就是纠正错误和提高文本可懂度的途径。似乎没有必要在译后编辑工作流程之后立即再次检查可懂性。为了评估忠实性,笔者邀请了E-C翻译研究项目的4名研究生对4条实验数据进行了评估,详细的评估结果见表3。

表2 忠实性的5分制

表3 对译后编辑译文忠实性的评价

5 结果

总的来说,3个测试对象共做了58处修改。其中,3位译后编辑在4个样本文本中分别进行了19次修改、16次更正和23次译后编辑。表4给出了译后编辑的概况、译后编辑所应用的译后编辑规则及4个样本文本中译后编辑的使用率。总共有13条译后编辑规则被用于纠正错误。这13条编辑规则在58条编辑中的出现率如下:动词形式校正(13.79%),词语翻译更正 (12.07%),词序更正(13.79%),句子结构调整(15.52%),删去多余的词语 (8.62%),句子片段修正 (10.34%),添加冠词(5.17%),大小写校正(5.17%),词语搭配校正(5.17%),单复数校正(3.45%),规范一般术语(3.45%),插入连接词(1.72%),词汇选择(1.72%)。在所有这些译后编辑规则中,添加冠词、大小写校正和词汇选择并不是译后编辑的必要规则,因为它们不一定有助于原文的意义传递。然而,它们的频繁出现表明,当我们对机器翻译输出进行译后编辑时,它们值得我们关注。除了数量上的百分比,质量上的评价是总体平均3.59分。根据5分制测量(如表2和3所示),3.59分意味着单语译后编辑后,忠实性 “超过”很多,但“低于”大部分。基于此定量和定性研究,政治和经济文件领域的语言学译后编辑规则是:

表4 译后编辑规则使用率分类表

(1)动词形式校正

(2)词语翻译的更正;词序更正

(3)句子结构调整

(4)删去多余的词语

(5)句子片段修正

(6)词语搭配校正

(7)单复数校正;规范一般术语

(8)插入连接词

其中,动词形式校正、词语翻译更正、词序更正、句子结构调整、句子片段修正的使用率为65.51%,超过一半的比例,是最常用的5条语言学译后编辑规则(见表4)。

6 结束语

基于数据分析和质量评估,结果显示:(1)单语译后编辑有助于产生可读的译文,传递源文本中大部分相同的信息;(2)适用于经济和政治文件中常用的语言学译后编辑规则,主要包括动词形式校正、词语翻译更正、词序更正、句子结构调整、句子片段修正。其他值得关注的规则有:删去多余的词语、词语搭配校正、单复数校正、一般术语的规范、插入连接词。

猜你喜欢

词序校正词语
容易混淆的词语
找词语
劉光第《南旋記》校正
修改病句的妙招
一类具有校正隔离率随机SIQS模型的绝灭性与分布
机内校正
汉语搭配信息对词汇识别的影响
俄汉语定语对比
影响词序的“普通重音”规则
一枚词语一门静