阿里翻译Alynx平台机器翻译及译后编辑:问题、成因与对策
——以“Country Reports on Terrorism 2014”等文本的机译为例①
2023-02-06余静良
余静良
1. 引言
自20世纪40年代W. 韦弗(W. Weaver)提出机器翻译构想以来,机器翻译历经挫折与挑战,取得了显著的成绩与进步。尤其是21世纪以来,计算机技术与互联网发展进入快车道,同样促使机器翻译技术不断更迭。
近年来,随着人工智能(AI)、大数据与5G技术的发展,机器翻译又迎来了新的机遇与挑战。2014年,神经网络机器翻译(Neural Machine Translation,简称NMT)模型成功问世,标志着机器翻译的译文质量又得到了进一步提升。机器翻译及译后编辑模式的运用极大地提高了翻译速度与质量,翻译生产力得以迅猛增长。现如今,机器翻译及译后编辑在语言服务行业所占比重越来越大,发挥着至关重要的作用。例如,阿里翻译及译后编辑在商品名称与简介翻译方面表现卓越、成绩斐然,为中外贸易往来提供了技术支持。
Alynx是阿里翻译旗下智能协同翻译平台,致力于为有自主人工翻译需求的用户提供高效管理翻译项目的平台,赋能用户快速完成翻译需求。随着神经网络翻译技术、大数据、人工智能以及5G技术的不断更新迭代,现如今,阿里翻译已拥有先进的技术、稳定的系统、源源不断的客户以及良好的口碑。
本研究依托南京策马集团译后编辑在线实习项目,借助Alynx翻译平台,通过选取“Country Reports on Terrorism 2014”(《2014年全球恐怖主义形势报告》)等文本中近20万字语料进行机器翻译,再利用Alynx平台进行译后编辑。通过对机器翻译与人工译后编辑文本进行对比分析发现,机器翻译译文正确率虽已大幅提升,但仍存在类似词汇、句法和符号等层面的翻译错误。此外,通过反思此次机器翻译及译后编辑,发现机器翻译与译后编辑等人机交互模式中仍存在机器翻译语料来源不明、机器翻译及译后编辑译文版权归属问题、“忠实原文与否”以及责权不清等伦理问题。
基于此,本文将对机器翻译平台译文翻译的错误类型与翻译伦理问题进行深入剖析,以期廓清Alynx平台机器翻译的错误类型,并对相关错误进行修改,总结译后编辑原则。此外,本研究还将针对机器翻译及译后编辑出现的翻译伦理问题进行归纳,探索机器翻译错误和翻译伦理问题的成因,并提出相应对策,从而为今后机器翻译及译后编辑提供学理参考,为机器翻译平台技术研发提供镜鉴,以期提高机器翻译译文的质量与效率,实现人机协作的合理、健康发展。
2. 机器翻译及译后编辑
2.1 机器翻译
计算机翻译通常被称为机器翻译,即全自动高质量机器翻译(Fully Automatic High Quality Machine Translation,简称 FAHQMT或MT)(张政,2004)。机器翻译即为:利用计算机系统将一种自然语言(源语言)转化成另一种自然语言(目标语)。
机器翻译是计算语言学的一个分支,具有重要的科学研究价值。1946年,人类制造出世界上第一台电子计算机。1949年,美国科学家韦弗在《翻译备忘录》中首次正式提出“机器翻译”的概念与构想,标志着机器翻译的诞生。通过梳理机器翻译与计算机发展史可知,机译系统可划分为基于规则(rule-based)与基于语料库(corpus-based)2个种类。机器翻译目前是语料库翻译学应用较为成功的领域之一,翻译平行语料库使得机器翻译如虎添翼(张继光,2016)。而基于语料库的机译方法又可分为基于统计(statistics-based)的方法和基于实例(example-based)的方法。
2013年以来,随着深度学习的研究取得显著进步,基于人工神经网络的机器翻译逐渐兴起和繁荣。2016年谷歌宣布人工水平英汉翻译后,神经机器翻译以井喷式的发展将翻译行业从人力驱动带入数据驱动(杨玉婉,2020)。
然而,虽然各在线翻译平台技术日趋成熟,但机器翻译始终无法达到专业译员的翻译水准,仍存在翻译译文质量层次不齐、翻译质量与效率之间的不平衡以及相关术语库、记忆库仍待加强与更新等问题。由是观之,需要采用人机交互模式,通过人工对机器翻译的译文进行译后编辑,从而达到相应的翻译标准,进而实现翻译效率与翻译质量的动态平衡。
2.2 译后编辑
业界不同学者对译后编辑曾有不同的定义。魏长宏和张春柏(2007)认为,译后编辑(post-editing,简称PE)是对机器翻译系统把源语言转化为目标语后生成的译文进行的编辑操作。崔启亮(2014)表示,译后编辑是“检查和修正机器翻译的输出”。而笔者认为,冯全功和张慧玉(2015)对译后编辑所作的定义更为全面、详细与精准,即“所谓译后编辑是指根据一定的目的对机器翻译的原始产出进行加工与修改的过程,包括更改翻译(语言)错误、提高机译产出的准确性与可读性等。其中,编辑加工的程度由多种因素而定,如翻译目的、客户需求、客户报价、文档类型、机译产出质量、文档使用寿命等”。一般情况下,可将译后编辑分为轻度译后编辑和完全译后编辑。由是观之,译后编辑即为根据(客户)特定需求对机器翻译原始译文进行加工处理,以期提高译文的准确性和可读性,从而大幅提升翻译速度与质量的过程。
美国卡门森斯咨询公司(Common Sense Advisory)的《2016全球语言服务市场报告》显示,2016年译后编辑业务占整个语言服务行业市场的3.94%,有25.39%的语言服务供应商提供译后编辑服务,并认为该项服务前景光明(冯全功 等,2018)。可见,基于机器翻译的译后编辑仍大有可为。
3. 翻译伦理
《现代汉语词典》(第七版)对“伦理”一词的定义为“人与人相处的各种道德准则”。汉语中“伦理”一词在英语中对应的词为ethics。而《牛津高阶英汉双解词典》(第九版)对ethics一词的解释为motivation based on ideas of right and wrong以及the philosophical study of moral values and rules。由此可见,伦理学重点聚焦人与人之间的道德准则与是非观。
翻译伦理(ethics of translation)一词始于1895年美国学者约翰·S. 诺伦(John S. Nollen)于《当代语言论丛》发表的署名文章“The ethics of translation”。中外学者都曾对“翻译伦理”或“翻译伦理学”给予过定义。例如,王大智(2009)认为:“翻译伦理就是翻译行为事实该如何规律以及翻译行为该如何规范,它既面向翻译行为也面向翻译行为的主体。”该定义并未将中间人,即除译者以外的翻译需求方、出版商和赞助商等因素考虑在内。因此,彭萍(2013)将“翻译伦理学”定义为:“翻译伦理学就是关于翻译活动、翻译理论研究、翻译批评、翻译教学等的道德或伦理规范研究,即从伦理的视角来审视翻译的方方面面。”
于是,翻译伦理学不仅是有关译者本身的伦理规约,还涉及语言服务供应商、出版商和赞助人,甚至还关乎翻译项目管理、机器翻译及译后编辑与本地化和国际化等多方面。翻译活动不再仅囿于切斯特曼(Chesterman)总结的再现伦理、服务伦理、交际伦理、基于规范的伦理与承诺伦理5种伦理模式,还延伸至约纳斯(Jonas)所提出的“责任伦理”。翻译活动不仅聚焦“怎么译”的问题,还要关注“译不译”“为谁译”“谁来译”“译后结果如何”及“译文责任主体”等问题。
随着翻译技术时代的来临,在译后编辑等人机耦合的过程中,势必会碰撞出翻译伦理问题的“火花”。2019年,中国翻译协会正式发布国内首部《译员职业道德准则与行为规范》。该文件的发布表明,中国翻译职业化得到进一步推进,职业译员道德伦理规范、伦理选择、信任危机及责权不清等伦理问题日益凸显,翻译伦理已成为机器翻译及译后编辑等人类与翻译技术深度交融过程中不可回避的问题,亟待扩充翻译伦理模式,拓展翻译伦理应用场景,从而更好地促进人机交互的健康与可持续发展。
4. 机器翻译及译后编辑的研究现状
通过在中国知网按主题搜索“机器翻译”发现,机器翻译研究成果达13696项(1)本文所有源自中国知网的数据检索时间均为2022年7月7日。。搜索“译后编辑”可知,译后编辑研究成果达641项。同时搜索“机器翻译、译后编辑”发现,该词条下研究成果达389项。可见,国内学界对机器翻译研究较为深入,研究成果不胜枚举,对译后编辑的研究成果也相对较多。如刘群(2003)对统计机器翻译方法进行了总结,并对自然语言处理原则进行了归纳整理。然而,对机器翻译及译后编辑进行研究的相关成果却相对较少。例如,崔启亮(2014)对机器翻译及译后编辑的应用与研究、发展动力、应用领域与实践准则进行了深度剖析,为机器翻译发展前景提供了有价值的参考。
此外,在中国知网按主题搜索“机器翻译、伦理”,显示国内对机器翻译中伦理问题进行研究的相关成果只有51项,尚显匮乏,与机器翻译及译后编辑相关研究成果数量形成鲜明对比。其中,任文(2019)对翻译伦理、机器翻译伦理与翻译技术伦理等概念加以廓清,提出将责任伦理原则与其他翻译伦理五原则相结合,从而应对机器翻译中所产生的新的翻译伦理问题与挑战。
5. 机器翻译及译后编辑:问题、成因与对策
本文依托南京策马集团译后编辑实习项目,借助阿里翻译Alynx翻译平台对“Country Reports on Terrorism 2014”等文本进行机器翻译,再利用该平台对机器翻译译文进行人工译后编辑。通过比对机器翻译与译后编辑译文发现,虽然神经网络机器翻译正确率已显著提升,效率与便捷性大大提高,但仍不可避免存在诸多不同类型的翻译错误。同时,译员在进行译后编辑过程中,由于不同客户需求、原文与机器翻译译文对译员的影响以及翻译技术的更新优化,难免会触发翻译伦理问题。译者不仅面临“怎么译”的问题,且还需面对“译不译”“为谁译”“谁来译”“忠实与否”以及“译后结果如何”等问题。鉴于此,本研究将利用上述平台,借助翻译文本总结相关机器翻译错误类型与翻译伦理问题,分析其背后成因,并提出相应对策,以期为机器翻译技术研发人员、机器翻译研究学者提供相应参考。
5.1 机器翻译错误类型
5.1.1 词汇层面
例①:词义误译。
原文:Location/Area of Operation。
机器译文:操作位置/区域。
译后编辑:行动位置或区域。
分析:operation在英语中既意为“操作;经营;手术”,又意为“行动”。而在上述文本中,重点是为了强调各恐怖组织行动或活动的位置或区域。因此,这里机器显然是对英语中operation一词的词义进行了错误匹配,误将该语境下的词义理解为了“操作”。因此,该译文将使得读者对此疑惑不解。而事实上,原文是为了引出下文,从而对恐怖组织的活动区域与范围进行更为详细的介绍。所以,这里应当译为“行动”。同样,这也反映出机器翻译,特别是在线翻译平台在词义辨析、术语库以及语料库的更新完善与发展方面还亟待提高。
例②:增词减词(主语指代不明)。
原文:Ansar al-Dine (AAD) was designated as a Foreign Terrorist Organization on March 22, 2013.
机器翻译:安萨尔·丁 (AAD) 于2013年3月22日被指定为外国恐怖组织。
译后编辑:2013年3月22日,美国将安萨尔·丁组织确认为境外恐怖组织。
分析:本文所有案例均选自“Country Reports on Terrorism 2014”,该报告是由美国国务院发布的。因此,该报告中各组织的名称均由美国国务院等组织机构认定,原文中的主语应为美国或美国国务院。而机器翻译译文将原文中的被动语态直接原封不动地译为汉语中的被动语态。翻译中由于受到源语的影响和省力原则的操纵,英语被动句多被翻译为“被”字句(朱一凡 等,2014)。而在未受英语语法与句法所影响的汉语中,被动语态的使用频率远远小于英语中被动语态的使用频次。由是观之,若欲将原文译为地道的汉语表达法,则需增加主语,将原文译为主动语态。因此,译后编辑译文增加了主语“美国”,从而让句意更加直观清晰,也不会引起句意的模糊与歧义。
5.1.2 句法层面
例①:句子语序问题。
原文:AAD has fractured and its members have been largely scattered by the French intervention in Mali.
机器翻译:AAD已经破裂,其成员在很大程度上被法国对马里的干预所分散。
译后编辑:安萨尔·丁组织已支离破碎,法国对马里实施干预,该组织成员很大程度上因此而“军心涣散”。
分析:对比分析机器译文与译后编辑译文发现,机器翻译译文语内逻辑结构混乱,组织名称即术语翻译前后不一致,被动语态翻译僵化。更为重要的是,机器译文也并未将原因前置,结果后置,很可能导致译入语读者对原文所要传达的信息和内涵一头雾水,感到不知所云。因此,在译后编辑译文中,将“军心涣散”的原因前置,把被动语态翻译为主动语态,从而增强译文的可读性,使得译文语序合理清晰。
例②:从句翻译错误。
原文:The first attack took place when a bomber blew himself up outside a hotel in Sousse, Tunisia, resulting in no other fatalities.
机器翻译:第一次袭击发生在一名炸弹袭击者在突尼斯苏塞的一家旅馆外炸死自己,没有造成其他死亡。
译后编辑:第一次袭击中,一名炸弹袭击者在突尼斯苏塞的一家旅馆外引燃炸弹,自己被炸死,所幸没有造成其他人员死亡。
分析:通过对比分析原文、机器译文与译后编辑译文不难发现,机器译文逻辑混乱,含义模糊,让人不知所云。与此同时,机器译文也并未正确地将when引导的时间状语从句译出。而译后编辑译文则就较为准确地传递出原文中“自己被炸死”的含义,且与原文语序保持了一致,通过增词的增译手段,使得原文信息实现了较好的传递。
5.1.3 符号层面
例①:术语符号错误。
机器翻译:2006年12月,ETC爆炸了一枚巨大的汽车炸弹,炸毁了马德里巴拉哈斯国际机场的大部分有盖停车场。
译后编辑:2006年12月,巴斯克祖国与自由组织引爆了一枚巨型汽车炸弹,导致马德里巴拉哈斯国际机场有蓬停车场的大部分区域被毁。
分析:通过深入分析机器译文与译后编辑译文可以发现,机器翻译译文将ETA组织误译为了我们日常生活中常见的ETC(电子不停车收费系统)。因此,笔者认为,译员在进行译后编辑时,需格外注意术语翻译的准确性与一致性。不能因为一个字母之差而造成翻译上的重大失误。
例②:标点符号格式错误。
原文:It was a moment ago, and I didn’t get a chance to—when he was describing Chinese investments and so forth...
机器译文:就在刚才,当他描述中国投资等等的时候,我没机会……
译后编辑:刚刚,他谈及中国投资等话题时,我并没机会……
分析:英汉语标点符号既有相似性,又有差异性。例如,汉语中的逗号、分号、问号、感叹号及破折号都与英语中的该类符号类似,但也并不完全一致。尤其是汉语中拥有某些英语中并未有的标点符号,例如书名号(《》)与顿号(、)。对比分析原文、机器译文与译后编辑译文可知,原文中的“-”在机器译文中被误译为了“-”,原因就在于汉语中的破折号应为“——”,而非“-”。而译后编辑译文中则对其进行了删除,并在括号内对原文缺失语义进行补充说明,从而使得译文更加符合译入语的语法规范,进而体现出该报告的严谨与正式。
不要惹水瓶座,敏感的水瓶座最害怕受伤;水瓶很敏感,几句话就能感觉出他人对自己是讨厌还是喜欢。水瓶很浪漫,但有时也不善于表达,很多事闷在心里,自己研究透彻然后做出行动。作为别人眼中的“开心果”,水瓶似乎很坚强,然而内心只有自己知道……
5.2 机器翻译错误成因
5.2.1 机器一词多义辨析能力尚待提升
无论英语还是汉语,都存在众多一词多义的现象。例如,上述例子中operation一词,既可指“操作”,同样还有“行动”的含义;再如英语中的brother,既有“哥哥”的含义,同样又可指“弟弟”。又如interest一词既含有“兴趣”之意,又包含“利益、利息”的含义。因此,机器翻译研发人员应当着重训练与提升机器翻译系统根据特定语境,辨析可能出现的一词多义现象的能力。
5.2.2 机器自动分词技术有待完善
汉语语句是以字为单位,且字与字之间没有空格。因此,在进行汉译英(或汉语译为其他语言)时,必须根据词汇或意群对汉语语句进行切分。然而,近年来,虽机器自动分词技术取得了较为显著的进步,但各类主流机器翻译软件或在线翻译平台仍会时常出现相应自动分词错误导致的机器误译。如此前谷歌、必应、有道翻译等机器翻译引擎无法进行精准自动分词,错误地将“请在一米线外等候”译为“Please wait outside rice-flour noodle.”,将“救生衣柜”误译为Life-saving Wardrobe,以及将“上车票”误译为Get on the Ticket。
5.2.3 机器学习算法技术亟待提高
相较于统计机器翻译,神经网络机器翻译的语言模型较为简单,即“端到端”式。其主要包含2个部分,编码器和解码器。同时,神经网络机器翻译主要依赖于机器学习和机器算法,基于特定的神经语言模型,利用庞大的数据库以获取较为精确的词向量,从而进行编码与解码。因此,神经网络机器翻译对机器学习与算法技术的要求较高。如今,机器学习,尤其是深度学习技术仍需不断革新,以满足机器翻译引擎开发和语言服务行业发展的需要。
5.2.4 语料库、数据库内容尚待更新与拓展
作为神经网络机器翻译不可或缺的组成部分之一,神经语言模型和词向量的训练与获取在某种程度上都依赖于最新的海量数据库。此外,翻译语料的新旧与否,同样可能决定着机器翻译与译后编辑产出结果的准确度和流畅度,如近年来出现的“内卷”“躺平”“元宇宙”等新词的翻译。因此,倘若使用尚未更新的语料库和数据库进行机器翻译及译后编辑,很可能造成某些领域的重大且不可逆转的损失。
5.3 机器翻译错误的应对策略与原则
针对机器翻译出现的不同类型错误,作为机器翻译引擎研发人员与专业译后编辑人员,应当采取相应的对策,加快翻译技术的研发,以期降低机器翻译译文错误率,切实提升机器翻译与译后编辑译文水平。
首先,研发人员应基于特定的应用场景,从4个方面加强翻译技术的研发与应用:第一,加强产学研融合发展;第二,加强多流程与多渠道整合;第三,提高兼容性、拓宽适用性;第四,提高协作化,提升翻译效率(余静良,2022)。同时,应着力提升机器一词多义甄别能力,优化机器自动分词技术、机器学习与算法技术,从而真正实现包括机器翻译在内的翻译技术的跨越式发展。此外,各大高校、科研院所及语言服务提供商应不断更新、拓展和完善自身语料库、数据库内容,做到与时俱进,从而确保机器翻译及译后编辑产出结果的准确性和先进性。
其次,译后编辑人员可利用刘重德倡导的“信、达、切”原则(刘重德,1979),对机器翻译译文进行适当修改与调整,以期满足不同客户群体的需求。第一,遵循“信”的原则,对原文中术语内涵精准传递。例如,在对“In December 2006, ETA...”例句中的ETA进行翻译时,不能在对该术语毫无查证的情况下将该术语错误译为ETC。第二,可利用“达”的翻译原则,如对机器翻译译文中的“其成员在很大程度上被法国对马里的干预所分散”进行处理,将其修改为“法国对马里实施干预,该组织成员很大程度上因此而‘支离破碎’”,从而让译文做到“语序连贯、逻辑严谨”,较好地传递出原文语义内容。第三,还可在做到“信、达”的基础上,利用“切”的原则对机器翻译译文进行恰当处理,使得译文风格简约、格式无误。如在对“...I didn’t get a chance to—when he was describing Chinese investments and so forth...”该例句进行翻译时,译文无需对原文英文格式进行完全保留,可根据汉语标点符号使用规则对机器翻译译文进行处理。因此,该例句可译为“刚刚,他谈及中国投资等话题时,我并无机会……”。
5.4 机器翻译及译后编辑伦理问题
翻译是一种跨语言、跨文化的交际活动,是一项在人类意识支配下为了达到某种目的或意图的主观能动性的活动。许钧(1998)曾指出:“任何翻译标准的确立,任何翻译方法的采用,无不受到道德层面的约束。”可见,翻译实际上就是一种伦理活动,必然会受到道德层面的限制和约束。
进入21世纪以来,计算机与互联网技术飞速发展,造就了机器翻译的兴旺繁荣。尤其是近年来,随着人工智能、深度学习、大数据及5G技术不断取得新的突破,机器翻译也出现了神经网络机器翻译新模式。然而,伴随翻译技术的迭代更新,翻译伦理问题也在人机交互过程中层出不穷。鉴于此,笔者总结出以下机器翻译及译后编辑伦理问题:
机器使用记忆库、术语库等版权不明的语料翻译出的译文,经由人工译后编辑,最终产出的译文版权到底归谁?
如若经由机器翻译及译后编辑得出的译文出现错误,该错误应由机器承担还是译后编辑人员承担?
译后编辑人员在修改译文时,是选择忠实于原文还是忠实于机器翻译译文?需不需要参考原文?
某些机器翻译公司为提高公司效益,刻意夸大宣传机器翻译效能,甚至将人工译文当作机器译文进行宣传,严重损害译员权利,造成信任危机,这种情况该如何应对?
可能还会出现客户要求与译员本身职业道德相违背,亦或与国家、民族利益或宗教习俗相背的问题。在这种情况下,译员应如何选择?
此外,某些语言服务企业可能会出现泄露客户或译员隐私数据甚至贩卖其隐私数据的行为和现象。
上述问题应当引起所有机器翻译及译后编辑研究人员的反思。
5.5 机器翻译及译后编辑伦理问题成因
5.5.1 意识不强
近年来,机器翻译与译后编辑伦理问题层出不穷,如某些翻译公司公开宣称其公司产出译文可以与人工译文相媲美;又如某些译员错将机器翻译译文当作人工译文交付用户;再如某些语言服务提供商存在翻译数据和用户数据泄露的现象与问题等。以上所述案例多数由翻译伦理意识薄弱所致。
5.5.2 责任不清
大部分语言服务企业的译员均接受过专业培训。因此,其对相关翻译业务、译员职业道德及应承担的责任较为熟知。然而,某些语言服务提供商的译员并未经过专业培训和教育,因而缺乏相应的责任意识,对相关翻译紧急情况的处理能力较弱,无法理清责任主体和履行专业译员应尽义务,可能会出现“责权不清”“互相推诿”的问题,最终可能导致某些语言服务企业与译员个体“声名狼藉”。
5.5.3 版权不明
机器翻译与译后编辑伦理问题的另一大成因即为版权不明。由于记忆库、术语库等语料的开放使用和二度传播,倘若机器使用版权来源不明的语料内容进行翻译,将很可能产生译文(或译著)署名权纠纷等版权问题。
5.5.4 规则不从
首先,国际标准化组织(ISO)已于2017年4月发布ISO 18587—2017“Translation services—Post-editing of machine translation output—Requirements”;其次,2019年,中国翻译协会发布了《译员职业道德准则与行为规范》;最后,国家标准GB/T 40036—2021《翻译服务 机器翻译结果的译后编辑要求》于2021年4月30日由国家标准化管理委员会正式批准发布(刘智洋 等,2021),已于2021年11月1日实施。在第一份标准发布之前,很长一段时间内,国内外机器翻译译后编辑的发展速度与其缺乏标准规范的发展状态极不相匹配。因此,该段时间内,各类问题层出不穷,诸如译文质量层次不齐、版权纠纷、数据泄露、定价不合理等等。虽然在一系列标准与规范出台后,译员素质和责权意识得以显著提升,但仍有部分译员规则意识淡薄,不遵守相应行业规范,导致在译文交付过程中,各类问题仍有出现。
5.5.5 诚信不足
诚信是立身之本。然而,某些翻译公司为了凸显机器翻译引擎的效果,有意夸大宣传,甚至将专业译员的人工译文当作机器翻译产出的译文进行宣传。不仅违反相关法律法规,更是对语言服务提供商、译员与客户间信任关系的严重损害。此外,某些非专业译员还可能出现延期交付译文、错误交付译文亦或交付译文质量无法满足客户的期待等问题,从而产生“信任危机”等翻译伦理问题。
5.6 机器翻译及译后编辑伦理问题的应对策略
首先,在宏观层面上,国家相关部门和行业协会应当制定与出台相应法律法规和行业规范。例如,中国翻译协会已于2019年正式发布国内首部《译员职业道德准则与行为规范》(中国翻译协会,2019)。该规范理应引起每位译员的高度重视。译员应当恪守相关道德准则与行为规范,提升自身职业道德水平,确保翻译行业的积极、健康、有序、和谐发展。
其次,在理论创新层面上,应当探索翻译伦理新模式。约纳斯于1979年出版的《责任原理》一书被认为是技术时代一种新伦理学的发端。因此,有必要将约纳斯提出的“责任伦理”引入翻译伦理学领域。切斯特曼提出的再现伦理、服务伦理、交际伦理、基于规范的伦理与承诺伦理5种伦理模式属于微观层面,关注的是译中行为,对译前与译后行为则关注较少。鉴于此,我们应当提出新的翻译伦理模式,做到“将客户的眼前利益与人类的高远目标结合,将职业操守的近距离责任与技术伦理的远距离责任结合,让约纳斯的责任伦理成为新时代语境下一个新的翻译伦理模式”(任文,2020)。
再者,相关语言类高校与应用型大学应当开设翻译伦理相关课程,将翻译伦理知识贯穿于教学实践中。2021年,北京语言大学国际语言服务博士点开始招生。该博士点的设立与招生可谓高校语言服务发展和研究的重大进步。其他高校,尤其是语言类和综合应用型大学应趁势而上,完善翻译伦理教育体系,设立翻译伦理教育和研究专项基金,组织专业人员编写翻译伦理理论与实践相关教材,开展对翻译伦理课程教师的专业培训,逐步开设翻译伦理相关课程。同时,也应强化校企合作,建立语言服务和翻译伦理实习基地,培养熟练掌握和运用翻译伦理知识的高素质、复合型语言服务人才。
另外,语言服务企业应当积极开展内部人员培训和教育。语言服务提供商应强化责任意识,树立翻译伦理底线思维,定期开展翻译伦理培训和召开相关会议,制定机器翻译译后编辑操作规范,建立翻译伦理奖惩制度,规范企业服务与产品的宣传手段、内容,进而促进语言服务行业的健康和可持续发展。
最后,个体译员应当树立清晰的翻译伦理责任意识。译者应恪守行业规范,遵守道德准则,将翻译伦理要求贯穿整个翻译流程。充分利用最新翻译技术,在不违背国家与民族利益等前提下,尽量满足客户的合理需求。不断更新完善翻译伦理内涵,在翻译伦理约束下,将翻译技术应用到翻译研究、翻译教学、口笔译实践与语言服务行业等更广阔的领域。
6. 结语
本文摘选“Country Reports on Terrorism 2014”等文本内容,利用阿里翻译Alynx平台对文本进行机器翻译,再由人工对机器翻译译文进行译后编辑。通过对比分析机器翻译与译后编辑译文发现,机器翻译译文的确存在各类错误,这仍然是机器翻译平台与软件的“通病”。再对上述文本中具体案例进行归纳发现,机器翻译时常出现类似词汇层面、句法层面及符号层面的错误。因此,上述各类机器翻译错误应当引起机器翻译及译后编辑研究人员的高度重视。
此外,针对不同的机器翻译错误类型,笔者总结出错误产生的原因,如机器一词多义辨析能力尚待提升、机器自动分词技术有待完善、机器学习算法技术亟待提高、语料库、数据库内容尚待更新与拓展。同时,基于机器翻译及译后编辑伦理问题,本文还理清了伦理问题的成因,即意识不强、责任不清、版权不明、规则不从和诚信不足。
依据机器翻译错误成因,笔者提出:首先,研发人员应加大翻译技术研发与应用的力度,不断顺应人工智能时代语言服务行业的发展需求;其次,译后编辑人员可利用刘重德提出的“信、达、切”翻译原则,对机器翻译译文错误进行修改,确保译文通顺流畅、逻辑连贯,以期满足不同客户群体的需求。
同时,为解决机器翻译及译后编辑伦理问题,笔者认为:第一,相关部门与行业协会应当出台相应法律法规及行业规范,切实约束译员主体及规范译者行为,努力营造和谐共生的行业环境;第二,应当将约纳斯的“责任伦理”引入翻译伦理学领域,从而不断丰富翻译伦理理论和模式;第三,相关高校应当创新性地开设翻译伦理相关课程,培养具备扎实翻译伦理知识的新型翻译人才;第四,语言服务提供商应适时开展企业内部翻译伦理培训,强化译员翻译伦理意识和思维,制定译后编辑操作准则,规范宣传手段;第五,个体译员应树立基本翻译伦理责任意识,恪守道德准则,遵守行业规范,化解客户利益关切与自身道德底线之间的矛盾,妥善处理好个人、客户、语言服务提供商、出版商及赞助人等各方之间的关系,以实现语言服务产业的健康和可持续发展。
希望本文能为机器翻译及译后编辑的研发与翻译伦理学在机器翻译领域的应用提供学理参考,为人机交互的良性、健康发展贡献微薄之力。