人机交互理念下CAT+MT+PE师生协同翻译模式探索
2021-05-20肖志清魏光凤
肖志清 魏光凤
(1.武汉科技大学外国语学院,湖北武汉;2.武汉科技大学外国语学院,湖北武汉/北京外国语大学英语学院,北京)
1.引言
人工智能时代神经网络机器翻译(Neural Machine Translation,NMT)技术迅猛发展,以谷歌为代表的神经机器翻译质量较之前已有很大提升。如今神经机器翻译已在语言服务行业得到广泛应用,以机翻为基础的人工译后编辑(MT Postediting,即MT+PE)也被越来越多的语言服务供应商所采用。2018年中国翻译协会发布的《2018中国语言服务行业发展报告》显示,75.8%的语言服务需求公司使用译后编辑方式进行翻译。另外,随着人工智能、大数据、移动互联网、云计算等应用技术愈发成熟以及译后编辑业务需求日益扩大,将成熟的计算机辅助翻译(Computeraided Translation,CAT)软件作为译后编辑的工具或平台成为必然,计算机辅助翻译软件可以弥补单一Word环境下的MT+PE模式没有记忆库和术语库匹配、无法进行质量检查和项目管理的缺陷,因此将三者结合起来(CAT+MT+PE)的人机交互翻译模式越来越成为语言服务行业的主流翻译生产模式。
2.国内外研究现状
翻译学界对机器翻译的研究不像其开发者那样涉及自然语言处理和核心算法,而是聚焦于机器翻译的行业和教学应用问题。由于早期基于规则或统计的机器翻译译文质量难以达到直接可用的实用化要求,因此早在20世纪80年代,人们就已经开始对机器翻译结果进行译后编辑(叶娜等,2012)。与此同时,国外首先兴起了对机器翻译的译后编辑研究,但直到近十年译后编辑的应用应用研究才进入繁荣时期。国外的译后编辑研究重点主要集中在译后编辑自身的可行性研究(Garcia,2011;Screen,2019)、译后编辑教学和培训(Depraetere,2010;O’Brien,2002;Koponen,2015;Yamada,2015;Arenas &Moorkens,2019)等方面,对机器翻译的译后编辑在图书翻译这一特殊语言服务领域中的应用几乎没有涉及。
与国外不同的是,译后编辑在图书翻译中的可行性研究逐渐成为国内翻译研究的一个新的增长点。国内翻译研究者对机器翻译的译后编辑是否可以应用于图书等创造性文本翻译持不同观点。冯全功、张慧玉(2015)认为译后编辑不适用于文学翻译。崔启亮从文本类型理论出发,认为不同层级的文本应使用不同的翻译策略,“在翻译出版级文本时,主要应以人工翻译为主,可以辅助使用计算机辅助翻译软件某些功能以提高翻译效率和准确率”(2016:52)。可见崔启亮对图书文本适合人工翻译的早期观点(2014)作了一些修正,承认CAT工具在图书翻译中的辅助性作用。徐彬、郭红梅(2015)以人文社科类图书翻译出版的个人实践为例,说明不仅CAT工具完全可以而且也应该用于包括文学翻译在内的非技术文本的翻译,而且MT+CAT+PE的翻译模式对于一些非技术文本的翻译也有应用价值。梁本彬(2018)也以自己运用CAT翻译人文类图书的成功案例为例,进一步论证了MT+CAT+PE的多人协作翻译模式在人文类图书翻译的可行性和巨大优势。
第二个研究热点是基于计算机辅助翻译软件的翻译协作模式探讨。翻译协作(collaborative translation)不是一种新现象(O’Brien, 2011),在中国最早可以追溯至东汉时期的佛经翻译(马祖毅等,2006)。到21世纪初,随着互联网和人工智能等新技术而兴起的参与式文化让众包翻译等翻译协作模式逐渐流行,且“不再限于人与人的范畴,更将延伸至人与机器,甚至机器与机器的维度”(邵璐,2019:126),乃至一些图书翻译都通过这一模式来提高效率(张慧玉 杨晰雯,2020)。王正(2005)最早向国内翻译界介绍了基于互联网的合作翻译模式,对基于互联网BBS和WIKI技术进行合作翻译的实例作了有益探讨,指出机助翻译软件在合作翻译尤其是商业合作翻译方面具有很高的实用价值。徐彬、谭 (2008)以及张政、张少哲(2012)介绍了基于单机版CAT软件的图书翻译协作实践,论述了翻译协作的必要性和优势。叶娜等(2012)探讨了计算机辅助翻译与协同翻译之间的关联和区别,分析了协同翻译技术所面临的协作策略确定、协同任务分配、协同质检等问题和现有的技术解决方案。周兴华(2015)从CAT工具使用角度对不同类型CAT软件的翻译协作功能进行了比较,具体探讨了协作方法、适用条件与局限,并指出基于云翻译软件的翻译协作模式是最灵活高效的翻译解决方案。
第三个研究热点是将计算机辅助翻译应用到以图书翻译出版为导向的翻译教学研究。在这一方面,山东师范大学MTI教学团队做了有益探索,走在了全国前列,他们“很好地建立了以CAT技术应用为抓手,以真实出版翻译项目驱动的翻译能力立体化培养模式,使MTI学生能够有效地提升翻译能力、翻译技术应用能力,以及项目管理能力”(徐彬 曹军,2017:130)。
但是上述研究没有对图书翻译的最佳实践及其外部评估、CAT+MT+PE师生协同翻译模式的内涵、优势和不足等方面展开充分讨论,因此这一领域还有很大的研究空间。
3.CAT+M T+PE师生协同翻译模式构建
“近年来,人文类图书的翻译时间越来越紧迫……在资金压力、出版风险、图书市场热点、利润最大化等诸多因素的综合作用下,压缩图书翻译时间似乎成了出版社的必然选择,甚至已经成了通行做法”(梁本彬,2018:74)。在当前图书翻译出版追求效率和效益的行业背景下,以前那种“十年磨一剑”“单兵作战”的个人译者往往会感到难以适应,甚至“败下阵来”。图书翻译市场已经发生了巨变,我们不能再用“刀耕火种”的原始生产方式去应对当前翻译出版生态环境的新变化,译者要积极运用翻译技术“武装”自己,提高语言服务业的“第三产能”。鉴于图书翻译领域出现了项目化、技术化、流程化、协作化等新趋势,本文从人机交互角度提出基于CAT+MT+PE的师生协同翻译模式,如图1所示:
图1 CAT +MT +PE师生协同翻译(TSCT)模式
3.1 模式内涵
与“自上而下”的众包翻译模式不同,本模式中的“师生协同翻译”(Teacher-Student Collaborative Translation, TSCT)是一种“自下而上”的翻译行为模式(Jim nez -Crespo, 2017:19-25)。具体而言,它是由多名翻译专业师生利用现代计算机辅助翻译工具(或平台)完成某一翻译项目的网络协作翻译过程。它既有可能是自发的志愿者行为,也有可能是出于经济利益而专门组织的目的性行为。该定义中的计算机辅助翻译工具指的是可以实时共享翻译记忆库和术语库、可以一站式管理翻译项目且嵌入交互式机器翻译引擎的云翻译平台;翻译项目主要是指真实市场环境下客户(出版社或翻译公司)交付的真实图书翻译项目。“师生协同翻译”强调以翻译教师为主导、以学生译者为主体的双主式师生翻译共同体。教师为主导,即翻译教师在协作中不仅要承担翻译、审校的任务,还要作为项目的启动者、管理者、监控者、协调者以及译后编辑的培训者、译文风格的制定者、译文的最终定稿者等诸多角色,全程负责整个翻译项目的组织实施。翻译教师在师生协同翻译项目管理过程中不能前紧后松,更不能放任不管。学生为主体,即学生译者是图书翻译译后编辑的实践主体。他们要对机器翻译抱有积极的态度,能够容忍低质的机译产出,并能较好地驾驭机器翻译为人类译者所用。不管是翻译教师还是学生译者,他们都“不再是传统的源文本/文化和目标文本/文化二元结构之间的固定中介,而是一个不断演变的动态网络中的活跃节点”(Cordingley & Manning, 2017:4)。简言之,师生在协同翻译共同体的角色不是静态和截然划分的,而是动态可调整的。
本模式借鉴了CSA 2017年发布的以译员为中心的增强型翻译生产模型(The Augmented Translation Model),整合了计算机辅助翻译、机器翻译、译后编辑与翻译项目管理等技术,在每一环节又分别融入翻译管理系统(TMS)、翻译记忆(TM)、术语管理(TB)、质量保证(QA)和桌面排版(DTP)等知识。这一模式除了可以实现翻译内容电子化、机译译文自动填充和项目管理流程化之外,最重要的是将“人”(翻译教师和学生译者)置于中心的位置,凸显了人类译者在机器和技术生态圈中的中心地位以及人机对话交互(talk to each other)的“工具理性和价值理性的融合”(李彦肖维青,2018:3-4)。师生协同翻译过程中不仅师生、生生要对翻译中出现的问题进行对话和协商,在机器翻译能自适应学习的今天,还有必要发挥译者的主体性,逐步实现“人赋慧于机器,机器赋能于人”(传神语联网)的人机交互新理念。总之,这种模式旨在打破人与人、人与机器的孤立和对立,突显协同翻译的人机共译新模式。
3.2 项目流程
关于图书翻译项目的工作流程,从事图书翻译实践的职业译者很少在学界公开发表他们的最佳实践经验。笔者借鉴了山东师大徐彬教授的图书翻译经验以及最近几年带领翻译专业学生运用CAT+MT+PE模式从事图书翻译的实践经验,形成了自己的一套图书翻译流程,如图2所示。
图2 图书翻译项目流程
(1)文本获取与处理:签订翻译合同拿到出版社的图书样稿后,不是直接扫描或转换格式,因为那样既费时、又易出错。建议通过商业渠道购买该书的epub格式,然后用Calibre软件将其转换为CAT支持度更好的文本格式(如.docx或.rtf),经过降噪后再利用Word结构文档按章节拆分,这样既不会出错,也方便译后文档合并。
(2)选拔培训与制定计划:图书翻译难度大,对译者各方面素质的要求较高,因而需要对学生译者进行试译选拔。师生协同翻译总参与人数控制在4-5人较为合适。学生译者的英语水平至少通过专八或CATTI三级笔译,并完成CAT课程学习,具备一定的翻译技术应用能力。译前培训重点是云翻译平台操作、机器翻译常见错误识别、译后编辑技巧、语言风格指南要求等。项目启动前,还要根据项目情况制定项目进度和风险控制等计划。
(3)创建项目与分配任务:在云翻译平台YiCAT上创建项目,翻译流程选择“译后编辑”模式,启用腾讯TranSmart交互式机器翻译引擎,将待译文稿按章节导入,点击预翻译按扭后机译译文将填充到译文区。
(4)机器翻译的译后编辑:鉴于图书文本重复率极低以及出版级别的质量要求,我们采用的是深度译后编辑(full post-editing)方式,即直接在机译译文基础上进行充分的译后编辑。重点是检查机翻语句是否忠实于原文、有无错译漏译,尤其是要运用逻辑思维能力对机译查错纠错,积极利用可以使用的“语块”。图3所示为YiCAT译后编辑模式下利用腾讯TranSmart交互式机器翻译引擎对图书章节进行机器翻译的人工译后编辑:
图3 YiCAT翻译平台人机交互模式
(5)师生互审与教师二审:除了设置质量保证和语言质量保证外,翻译教师和学生译者对章节译文还要进行人工交叉审校,从各自角度提出不同的见解、质疑或修改建议。教师在审校中要确保没有错译、漏译,保证语言风格的统一。不同翻译主体之间的对话除了使用即时交流工具外,还可以采用YiCAT中的备注形式。
(6)译后通读与排版交稿:再次对全书各章节进行批量质检后导出章节译文加以合并,师生再分别通读全文,批注问题进行汇总,由教师最后定夺修改。桌面排版重点放在检查错别字、标点符号、格式体例等方面。定稿后提交书稿译文给出版社,做好语言资产(记忆库、术语库等)回收整理。
4.模式评价
4.1 项目评估
项目完成交稿后,笔者邀请出版社责编就图书翻译质量提供反馈意见,以对整个图书翻译项目质量进行评估。他们的评价和反馈如下:
你们提交的译稿质量整体很好,看不出机器翻译的痕迹。……从发来的译稿来看,你们能做到正确理解原文,译文无错译、漏译等问题,文字简练、无生涩硬造词汇,表达方式符合中文阅读习惯,标点、格式统一,并能按进度准时齐全发稿。
我们随后又对参与的学生译者进行了半结构式访谈,请他们对人机交互理念下图书协同翻译的优势和不足作出评价,学生译者的代表性反馈如下:
学生A:我觉得能够参与这次翻译项目是一件非常幸运的事情,整个翻译过程不仅非常愉快,而且让我收获颇多。CAT+MT+PE的师生协同翻译模式提高的不仅是我的翻译能力,还使我更熟悉CAT工具的操作,辨别机器翻译质量的能力和译后编辑的能力也提高了。另外,这种翻译模式强调团队合作,所以整本书翻译下来,我的合作意识也更强了。
学生B:这种翻译模式的一大优势就是术语干预功能,因为机器翻译在处理一些术语时并不准确,这一功能可以将术语库中的术语翻译自动应用到机译译文,确保了术语的统一;其次,相比于传统的Word文档翻译,省去了复制粘贴的时间,大大提高了工作效率。我也参与过另一位老师的翻译项目,总共有十几个同学参与,用的就是传统的办法,老师通常会提前整理出一份术语表发给我们,然后大家分头翻译。由于翻译时没有术语标注和提示,我们只能打开术语表人工查找,不但效率低,而且人多手杂,术语统一是个难题。
学生C:这种协作模式是交互式机器翻译在人工智能翻译方面的进步。机器似乎能从我的输入中自适应学习,进而预测我下一步要输入的内容,这在一定程度上提高了我的输入效率。
从责编的上述反馈来看,CAT+MT+PE的师生协同翻译模式只要翻译流程和质量控制得当,图书翻译质量可以达到出版级别的要求;三位学生译者的积极反馈也说明该协同翻译模式相较于传统的图书翻译模式具有一定的优势。
4.2 模式优势
人机交互理念下的CAT+MT+PE协同翻译模式主要具有以下三大优势。
(1)符合人体工学,有助于提高翻译效率和舒适性:人体工学,即人机工程学,是“研究人和机器、环境的相互作用及其合理结合,使设计的机器和环境系统适合人的生理及心理等特点,达到在生产中提高效率、安全、健康和舒适目的的一门科学”①请参见https://zh.wikipedia.org/wiki/%E4%BA%BA%E5%9B%A0%E5%B7%A5%E7%A8%8B%E5%AD%A6。CAT软件符合人机工程学的设计主要体现在以下四点:①默认将原文以句段为翻译单位进行切分,并设置为左右对照(或上下对照)、逐句翻译的编辑模式,这样既不容易漏译某些句段,也便于译后编辑者减少视线移动和定位等重复劳动;②将翻译任务化整为零,以句段数量来呈现可以降低译者翻译时的心理压力;③YiCAT编辑器界面有普通、护眼、夜间三种个性化视图模式,尤其是后两种模式可有效缓解视觉疲劳;④YiCAT融合了腾讯TranSmart交互式辅助翻译输入法,减少了译者敲击键盘的次数,从而节省了输入时间,提高了翻译效率。
(2)凸显人机交互,有助于重建交往旨趣和价值理性:“计算机辅助翻译的实质是一种人机交互的文字转换技术”(张政,2020:148)。人机交互的关键在于了解机器延伸了我们的哪些能力,它是如何帮助我们处理信息的,这样我们就可以将大部分时间放到翻译技术中的“人”身上,而不是让人成为工具或技术的附庸。这一模式将译者从技术的“奴役”中解放出来,赋予其主动干预译文生成的主体地位,给“冰冷僵硬的”机器翻译增加人类译者的“温度”。具体而言,译者一方面可以在YiCAT中对腾讯TranSmart的机译译文不断进行修正,TranSmart也会根据译者的修改,动态预测译者下一步要输入的内容。另一方面,译者之间基于网络互动的翻译对话也打破了人与人之间的孤立,有助于重建“交往旨趣”和“价值理性”(李彦 肖维青,2018),最终实现人与人、人与机器之间的和谐共生。
(3)突出师生协同,有助于培养协作能力和批判思维:随着语言服务行业的快速发展,“辅助翻译的工作方式已经从单用户、小规模发展为多用户、大规模。多名在空间上分散的用户被组织起来共同完成一项翻译任务已经成为普遍现象”(叶娜等,2012:2)。项目组成员之间可以将翻译中的疑难点在CAT软件中加注释,或在即时通讯工具中在线讨论,这样审校者在审校过程中可以更有针对性地解决此类问题。师生之间集思广益,也许可以给问题解决带来新思路,无形之中提升了师生的协同翻译能力。面对机器翻译输出的译文,师生在译后编辑和互审互校过程中主体性得到了发挥,批判思维得到了训练,译后编辑能力也得到了提高。
4.3 优化建议
CAT+MT+PE协同翻译模式虽然给传统的图书翻译提供了全新的翻译流程,提高了图书翻译质量和效率,但也存在如下一些仍需改进和优化的不足之处:
(1)译后编辑环境需要改善:在线CAT工具给协同译后编辑提供了最佳的操作环境,但姚运磊、赵小兵(2017)认为现阶段译后编辑依附CAT工具效果并不理想。Moorkens 和 O’Brien调查发现职业译后编辑者普遍对当前的译后编辑环境不满意,译者希望译后编辑界面简洁明快且具备可外挂词典以及网络搜索引擎等功能,大部分译者偏爱交互式机器翻译系统在译后编辑过程中提供动态更正建议(王湘玲 贾艳芳,2018)。以YiCAT为代表的云翻译平台率先在国内将腾讯交互式机器翻译引擎进行了商业化部署,相较其他CAT工具取得了一些技术性的突破,但其译后编辑的操作界面仍然较为简陋,译者不能对网络搜索进行个性化设置,悬浮式的交互式翻译对话框容易遮挡译文编辑区和工具栏按钮(见图3)。因而CAT编辑界面还需要与机器翻译引擎无缝对接,做到界面和功能更加友好;
(2)机器翻译参考需要优化:当前机器翻译在医学、法律、电商等垂直领域的文本翻译质量取得了较大突破,但就人文社科类图书翻译而言,文本的多样性和复杂性导致机译产出不甚理想,决定了我们不能采用机译主导的策略,而应该是人机交互的翻译策略(崔启亮 雷学发,2016;赵惠,2019)。虽然大多数TMS / CAT都集成了若干机器翻译引擎,但机器翻译引擎的选择设置具有排他性,即每个项目只能选择启用一种机器翻译,无法同时呈现多个机译译文供译者参考;目前也很少有CAT软件能对多个机译译文质量进行自动筛选,给译者推荐最优化的参考机译译文①。因而,基于人机交互的TMS / CAT需要对机器翻译引擎的兼容性和译文筛选功能进行优化;
(3)翻译记忆功能需要增强:YiCAT虽然嵌入了腾讯TranSmart研发的融合翻译记忆的机器翻译引擎(TM Augmented MT,即翻译记忆增强型的机器翻译),但图书文本重复率极低的特点导致翻译记忆增强效果并不明显,这就势必要进一步整合人与机器各自的优势,在更深层次上利用人机共译产出的优质语料不断充实机器翻译引擎训练数据,优化机器翻译引擎训练模型,从而有效提升融合翻译记忆的集成翻译环境。
5.结语
“翻译技术领域正逐渐实现从全人工化模式到人机交互模式的转变,使用者需注重翻译技术的交互性,有意识地发挥应有的修正、评判、反
①YiCAT于2020年12月在国内率先推出了优选机器翻译功能,旨在通过人工智能算法,为用户自动筛选出准确率更高的机译译文,从而大幅减少人工译后编辑工作量。参见https://mp.weixin.qq.com/s/y-GLMRgqbdUnqe8VHbFyXg,引用日期:2020年12月4日。馈功能,以免沦为技术的附庸”(张政,2020:150)。人机交互理念下的CAT+MT+PE协同翻译模式旨在打破人与机器的二元对立,最终实现工具理性和价值理性的融合。现代语言服务技术化、项目化、协作化的新趋势决定了基于CAT+MT+PE的师生协同翻译模式在图书翻译领域具有可行性和必要性。图书翻译应用机器翻译的译后编辑不一定会节省时间和精力,却符合Web 2.0时代人与机器的双向互动以及“互联网+”时代的翻译生产模式和译后编辑能力培养新模式。