APP下载

21世纪国外机器翻译译后编辑实证研究

2018-10-24王湘玲贾艳芳

湖南大学学报(社会科学版) 2018年2期
关键词:机器翻译实证研究

王湘玲 贾艳芳

[摘要]机器翻译已广泛应用于语言服务行业,国外机器翻译译后编辑实证研究近年来取得了较丰富的研究成果。基于“翻译研究文献目录”和“机器翻译档案馆”两大数据库,通过全面剖析译后编辑过程及产品评估、译后编辑效率影响因素、译后编辑工具与译后编辑者及人才培养四大研究热点,分析其研究进展与研究方法,阐述其未来发展趋势以及对我国机器翻译译后编辑研究的启示,为国内相关研究以及翻译人才培养和翻译学科建设提供新视角新方法。

[关键词]机器翻译;译后编辑;实证研究

一引言

随着全球化和信息化进程不断推进,海量的翻译需求给全球语言服务行业带来了前所未有的机遇和挑战。在此背景下,机器翻译译后编辑(machinetranslation post-editing)(简称译后编辑)成为应对这一挑战的有效途径。技术的发展已经彻底改变了职业译者的工作方式,不同于传统人工翻译,译后编辑是一种人机交互的翻译过程,是对机器翻译结果进行编辑及更正的过程,其中涉及的因素包括机器翻译系统、译后编辑工具、译者、语言对特征等,它们相互作用共同决定译后编辑的过程和结果,使经过译后编辑的译文达到“终端用户预期的质量需求水平”。翻译自动化用户协会(TAUS)预测,译后编辑“有可能在未来五年内取代翻译记忆技术成为翻译行业的首要生产环境”。译后编辑在国外翻译行业的广泛应用吸引了众多翻译学者对这一新技术和新职业的研究兴趣。国际上对该领域的探究主要运用实证手段,近年已有较丰富的研究成果,而国内还鲜有此领域的研究成果出现。本文聚焦于国际上关于译后编辑的实证研究,重点分析其研究进展与研究方法,进而阐述其未来发展趋势以及对我国机器翻译译后编辑研究的启示。

二数据来源

根据Holmes对翻译学整体研究框架的界定,译后编辑实证研究同时具备纯翻译研究和应用翻译研究属性。此外,译后编辑实证研究具有明显的跨学科特质,是翻译研究以及机器翻译领域共同的研究话题,所以本文将数据来源定位于两个领域的权威数据库,分别为翻译研究文献目录(TranslationStudies Bibliography)和机器翻译档案馆(Ma-chine Translation Archive),以保证数据全面反映译后编辑实证研究的现状。翻译研究文献目录是由欧洲翻译协会、鲁汶大学翻译中心和本杰明出版公司联合开发的翻译研究数据库,其中涵盖五十多种翻译领域期刊,以及翻译学相关的论文集、学位论文等,是翻译领域库容最大、专业性最强的数据库,能够充分体现译后编辑在翻译领域的研究现状。机器翻译档案馆是国际机器翻译协会(International As-sociation for Machine Translation)委托欧洲翻译协会(European Association for Machine Translation)编撰,收录了全球最有影响力的机器翻译期刊和会议论文集,可以代表译后编辑在机器翻译领域的最新研究动向。机器翻译历经曲折的发展之后,在20世纪90年代日臻成熟。译后编辑研究于本世纪初开始,近年来受到了译学界的广泛关注。因此,本文将这项研究的时间范围确定为2000年至2016年。笔者搜索了两个数据库内标题、关键词或摘要中包含post-editing的文章,并通过阅读摘要和全文的方式剔除重复及不相关数据,共获得译后编辑实证研究文章87篇,其中35篇来自翻译研究文献目录,52篇来自机器翻译档案馆。总体上,国际译后编辑实证研究自2000年以来呈现上升的趋势,2009年开始每年都有稳定的研究成果,其研究内容与方法也愈加丰富。

三研究进展

从研究目的来看,以上研究主要分为四类:1)译后编辑过程及产品评估;2)译后编辑效率影响因素;3)译后编辑工具的研发;4)译后编辑者及人才培养。以下对其主要研究内容及方法进行剖析。

(一)译后编辑过程及产品评估

译后编辑过程及产品评估指对译后编辑的速度、质量、认知负荷与技术负荷等方面进行评测,通常采用与传统人工翻译或翻译记忆进行实证对比的模式。其生产率评估多集中在速度和质量两方面。Fiederer&O;'Brien发现英译德译的译后编辑译文虽文体风格不如人工翻译,但准确度和流畅度更具優势。Garcia对英汉双向译后编辑进行了探究,发现译后编辑在逆向翻译(汉译英)且文本难度适中的条件下,速度提升效果更为显著,双向翻译时译后编辑的质量评分都高于人工翻译。Guerberof对比了译后编辑、80%~90%匹配区问的翻译记忆以及人工翻译三种模式在速度和质量上的差异,指出译后编辑明显比翻译记忆及人工翻译更快,译后编辑的错误数量远低于翻译记忆,且在准确性、误译以及语言方面有明显优势。虽然此类研究所采用的机器翻译系统、受试、质量评估方式及语言对均有差异,但研究结果基本证实,相对于传统人工翻译和一定门槛值的翻译记忆,译后编辑在不同程度上提升了翻译速度和质量。

在探究译者的认知心理过程中,认知负荷评测成为了译后编辑实证研究的焦点。认知心理研究表明人的工作记忆有限,长时间在高强度认知负荷环境中工作容易疲劳,这会影响译者的情绪和对任务的态度,从而降低工作效率。Sekino以关联理论为研究视角,发现译后编辑需要同时进行概念编码和过程编码,所耗认知负荷较人工翻译反而更高。Koglin基于停顿与眼动指标,证实处理隐喻这一特殊语言现象时,译后编辑所需认知负荷远低于人工翻译。其他眼动研究也表明,译后编辑与传统人工翻译的认知加工模式差异较大。人工翻译时,原文和译文所获注视次数基本相同,而译后编辑时,译文所获注视次数往往远高于原文,同时前者原文部分的平均注视时长远高于后者。差异造成的原因显而易见,译后编辑过程是对已有机器翻译译文的修改过程,所以更多注视译文区域,而人工翻译要以阅读理解原文为起点,所以关注原文更多。由于认知负荷的大小难以直接度量,其评测方法一直处于不断发展中,目前常用的评测指标主要分为三类,即眼动指标、停顿指标和时间指标。尽管三类指标具有各自的解释力,但目前仍无法基于现有研究得出译后编辑减轻认知负荷的定论。

(二)译后编辑效率影响因素

译后编辑效率的影响因素主要包括原文特征与机译质量等。探究这些因素与译者精力投人及产出质量之间的关系,制定受控语言写作规范以实施译前编辑,合理设立译后编辑的机译质量容忍门槛,将有利于提高译后编辑效率和减轻译者精力投入。源语文本特征和机器翻译错误与译后编辑效率紧密相关,某些原文特征引发的机器翻译错误更为复杂,从而造成更多译后编辑精力投入。OBrien针对英译德译后编辑的一系列研究发现,包含消极翻译指征的句子会在整体上降低译后编辑速度,而这些指征对译后编辑负荷的影响程度不同,如较长的名词短语及动名词对译后编辑负荷影响较大,而缩写、专有名词以及标点符号等影响较小。Aikawa et al研究表明受控语言写作规范与语言对特征直接相关,译后编辑效率提升程度对英语译人荷兰语、汉语、阿拉伯语及法语各不相同。Tatsumi&Roturier;证实过长或过短的句子都不利于译后编辑,因为过长的句子分析起来更有难度,过短的句子所提供的语境有限,不完整的句子以及复合句译后编辑需要更长的时问来处理。由此,制定合理的受控语言写作规范,实施译前编辑,即在机器翻译之前减少源语文本中的消极翻译指征,是提高机器翻译质量从而提高译后编辑效率的有效途径。

机器翻译质量直接影响译后编辑效率,对低质量机译结果进行译后编辑,会造成比人工翻译更多的精力损耗。根据机译质量对译后编辑所耗精力进行预先估测,可以避免过低质量的机译结果进入译后编辑流程。机器翻译质量评估通常通过对比机译结果和标准参考译文之问的编辑量差异来完成,其常用方法包括BLEU,NIST,GTM,METEOR以及TER等。O'Brien根据GTM得分,将源语及其对应的机器翻译句子质量分为低分组、中间组和高分组,三组得分与其译后编辑所需负荷大小正好相反,低分组需要高负荷而高分组需要低负荷,GTM和TER高分段的句子均比中等及低分段句子明显耗时短且认知负荷低。Escartin&Arcedillo;研究表明,与人工翻译和翻译记忆相比,机器翻译得分BLEU高于45,TER低于30或FMS高于75则能保证译后编辑效率更高。机器翻译错误的具体性质和数量也与译后编辑的程度存在相关性。Daems et al从可接受性和准确性两方面评估机器翻译错误,依据其严重性,错误被划分为不同等级并赋予0到4分不等的权重,发现机器翻译错误权重均值与译后编辑时问、平均注视时长、注视次数、停顿率、平均停顿率等都存在不同程度的相关性,其中误译、句子结构及词序错误与各认知负荷指征相关性最强。

(三)译后编辑工具研发

现阶段译后编辑通常依附机辅翻译工具完成,然而此类工具专为翻译记忆开发,许多功能对于译后编辑工作来说并不理想,因此研发适用于译后编辑过程的专业工具是此类研究的主要目的。Penk-ale&Way;介绍了一个自助式在线机器翻译平台SmartMATE,用户可以根据已有数据个性化设置平台功能进行译后编辑,作者通过一个大型游戏公司使用该平台的案例,分析展示了其应用优势。Roturier描述了一款专为社区用户开发的在线译后编辑平台ACCEPT,此软件不但可以灵活定制满足译后编辑的不同需求,还可以实时记录用户的译后编辑过程并生成活动报告,便于随时查看与分析译后编辑过程。Moorkens&O;'Biren调查发现职业译后编辑者普遍对当前的译后编辑环境不满意,译者希望译后编辑界面简洁明快且具备可外挂词典以及网络搜索引擎等功能,大部分译者偏爱交互式机器翻译系统在译后编辑过程中提供动态更正建议。这些研究为译后编辑工具开发提供了来自终端用户最直接的反馈及建议,对人性化译后编辑工具的研发大有裨益。

此外,自动译后编辑工具(Automatic Post-ed-itor,APE)和交互式机器翻译系统也越来越受关注。Mundt et al.使用自动译后编辑软件对机器翻译结果中漏译词语进行补译,发现阿拉伯语译英比汉译英的补译部分更准确。Parton et al.介绍了一种可修正准确性方面错误的自动译后编辑器,并证实30~56%的句子经自动编辑后其准确性较机器翻译结果有所提高。Germdn et al.采用CasMaCat工作平台测试了传统译后编辑和交互式译后编辑的差异,发现两种模式下翻译耗时差别不大,作者认为后者速度没有显著提升的原因可能是未经训练的译者不能充分利用其优势。机器翻译领域在不断探索更加快捷有效且可满足不同客户需求的译后编辑工具,此类工具多具有灵活易用且能提供可定制化服务的特征,用户不需要太多的技术背景就可方便操作。因此,自动译后编辑器及交互式机器翻译等技术的不断完善将进一步提升译后编辑效率。

(四)译后编辑人才培养

人机交互是译后编辑最主要的表征。作为译后编辑任务的完成人,译后编辑者的作用至关重要,此类研究主要关注译后编辑者的相关情况,包括译后编辑者的态度、能力及培养方式等。Aranberri etal.研究发现职业译者对机器翻译的态度比较消极,而无翻译经验的外行用户对译后编辑持更加积极的态度。相比人工翻译,译后编辑时职业译者和外行用户的翻译效率均有提高,而外行用户提升幅度更大。Guerberof通过问卷调查了职业译者对机器翻译及译后编辑的态度及经验,发现他们对机器翻译结果及译后编辑的看法极为复杂,许多消极态度与以往参与机器翻译译后编辑项目的不悦经历有关。Yamada分析了大学语言专业学生英译日译后编辑的时间、质量及态度,并通过与职业译者相比较,发现同时具备三种特征(对译后编辑持有正面态度、在传统翻译课堂测评中成绩优异、采取分析而非整合的方式进行翻译)的学生有潜力成为合格的译后编辑者。虽然译后编辑在翻译市场得到广泛应用,但是当前行业内部严重缺少职业译后编辑者,原因是译后编辑能力需要长期的实践和经验积累,且译后编辑人才培养相对滞后,与行业需求严重脱节。

现阶段译后编辑培训主要通过公司内部及在职培训实现,高校作为译者培养重地还鲜有把译后编辑纳入常规翻译课程设置。近年部分学者通过自身译后编辑课堂实践,积极探索最佳译后编辑教学方案。Depraetere基于其译后编辑课堂教学案例分析发现,对于学生譯者来说,不可过分弱化译后编辑文体风格及措辞的重要性,因为学生本身翻译水平有限且比较依赖机器翻译结果,过分强调可能导致译后编辑质量过差。Koponen介绍了其在赫尔辛基大学一学期的译后编辑教学实践及评估过程,该课程包括机器翻译系统对比、译前编辑、单语译后编辑、译后编辑质量水平和机器翻译质量评估等几大模块。实践表明一学期的课程时间较为有限,很难对每个模块展开深入讲解与剖析。目前,译后编辑教学及人才培养研究还停留在对译后编辑能力界定、课程设置规范等理论探讨层面,其实证研究数量相对较少,且多采用案例分析、访谈、问卷调查等方法,侧重从不同角度呈现译后编辑教学中出现的问题以及译者对于这一新技术新职业的态度及期许。

四趋势与启示

本文力图全面涵盖翻译学和机器翻译领域中译后编辑实证研究的最新成果,虽然其研究内容丰富,角度新颖,研究方法也值得借鉴,但作为一个跨学科新兴研究领域,译后编辑实证研究涉及到翻译学、语言学、认知心理学、计算机语言学、统计学等多方面知识,研究难度大,许多研究仍处于探索性阶段,本文认为未来研究主要存在以下发展趋势:

(一)进一步验证已有研究结果

现有译后编辑实证研究虽然主题丰富,但许多研究结果仍不具备普遍性,如对于译后编辑过程和质量评估时,所选机译系统、原文文本类型及难度、译后编辑程度(轻度译后编辑或充分译后编辑)、译者数量及经验、数据收集工具选择如眼动仪类型,以及实验过程是否可以查阅词典等,都会在不同程度上影响实验结果,因此已有的小范围研究只能基于实验本身的变量控制得出有限的结论。此外,已有研究所涉及的语言面较窄,原语以英语居多,目的语多见于法语、德语、西班牙语等同族语言。由于不同语言,尤其是不同语系的语言特征迥异,如英译法与英译汉的机器翻译水平差别很大,相应机译错误类型、受控语言写作规范也不同,所以某一语言对的译后编辑研究结果对于不同语言对并不一定具备可适应性,因此后续各研究主题需要在更多实验、更大样本、更丰富的语言对上進行多方验证。

(二)理论与实践层面创新译后编辑人才培养研究

国外多聚焦于对译后编辑的评估和工具开发,而关注译后编辑者培养的研究却寥寥无几,少有的几项研究仍停留在对译后编辑实践模式尝试性的探讨,高校也鲜有把译后编辑能力培养作为一门自成体系的独立课程,造成译后编辑人才培养与其市场需求严重脱节,国内人才培养现状与国外大致相似。我国翻译专业硕士(MTI)于2007年设立,为顺应全球化、信息化背景下市场对翻译人才的需要,各大高校都在积极创新培养模式以产出熟练掌握行业技术的翻译人才,其中包括普遍将机辅翻译课纳入MTI课程设置,而基于译后编辑人才培养的理论与实践研究在国内仍属空白。究其原因,一是由于译后编辑仍属新生事物,对其人才的培养尚未引起翻译研究领域的足够重视;另一方面,由于学界对于译后编辑所涉及的专业能力还处于摸索阶段,亟待成熟的学术专著和科研队伍保证此类研究的开展。相比之下,企业对译后编辑技能培养模式则更为成熟,如TAUS、SDL International、Welocalize等国际著名机构或公司都建立了相应的人才培训机制,积累了丰富的译后编辑人才培养经验。因此,未来翻译研究者将立足高校翻译人才培养模式创新,充分利用企业机构在译后编辑人才培养的优势,共享师资、技术与成果,建立“产学研”相结合的译后编辑人才培养机制,为未来译后编辑人才培养开辟一条校企双赢的可行之路。

(三)实现机器翻译与翻译学研究领域的进一步合作

目前,国外机器翻译领域多关注译后编辑工具的研发及评测,对工具的使用者——译后编辑人才的培养没有引起足够重视。而翻译学研究者对日新月异的译后编辑工具了解甚少。具体而言,虽然译后编辑工具的研发成果颇丰,但其中得到广泛推广的新工具却非常有限,可以应用于译后编辑教学的则更为稀缺。现今多数主流机辅翻译软件如Tra-dos及MemoQ等兼有译后编辑功能,国内诸多高校所采用的传神公司研发的Tcloud翻译软件内嵌于Office中,也兼备查询机器翻译功能,可用于译后编辑。此外,在线机译系统中,Google TranslatorToolkit支持对Google机译结果进行在线译后编辑,应用较为成熟。此类工具虽可用于译后编辑教学,但由于其主要功能服务于机辅翻译,并非独立的专业译后编辑工具,所以无法灵活定制充分满足译后编辑及其教学的不同需求。而机器翻译领域最新研发的译后编辑工具,如交互式机器翻译系统、自动译后编辑器等,却鲜少得到翻译学及翻译教育领域的关注。因此,机器翻译领域未来将在技术上对译后编辑教学及人才培养等给予更多关注和支持,翻译研究领域也将更充分地学习和利用机器翻译领域的新成果,掌握新工具新技术,提高翻译人才培养效率。

最后,加强译后编辑基础理论建设。现有研究多为描述性研究,长于方法而短于理论。译后编辑实证研究对于机器翻译系统优化、机器翻译译文筛选、科学制定受控语言写作规范、合理设置译后编辑定价模式及研究译后编辑人才培养模式等方面都有积极意义,强化对该领域基础理论研究,对于指导其走向成熟必不可少。

五结语

机器翻译是语言服务行业的核心技术,机器翻译译后编辑模式已广泛应用于语言服务行业,有望超越翻译记忆成为翻译行业的首要生产环境。本文基于翻译研究文献目录和机器翻译档案馆两大数据库,较全面地剖析了译后编辑实证研究在翻译研究领域和机器翻译领域的研究热点,主要包括对译后编辑过程及产品的评估、对译后编辑效率影响因素的挖掘、对译后编辑工具的研发以及对译后编辑者及人才培养的探究。相比其他翻译研究,译后编辑仍属于新兴跨学科研究领域,许多研究内容仍需进一步深入探究,本文通过对译后编辑研究现状的总结和其发展趋势的预测,希望给国内译后编辑实证研究提供新视角新方法,对翻译人才培养和翻译学科建设具有一定价值。

猜你喜欢

机器翻译实证研究
互联网+新时代下人机翻译模式研究
“语联网+行业” 助力中国伟大复兴
大数据背景下石油科技翻译
大数据背景下石油科技翻译
中国在新农村建设中金融支持的实证研究
简述翻译研究中实证研究法的应用
玉雕专业学生专业认同的实证研究
机器翻译不可盲取
温州小微企业融资环境及能力分析
认知语言视角下英语词汇多义习得的实证研究