中医药说明书功效主治部分的机辅翻译
2019-04-28王楠鑫
王楠鑫,云 红
(重庆医科大学外国语学院,重庆 400016)
一、背景、理论支撑与研究基础
(一)背景
中医药是中国传统文化的重要组成部分。中国“一带一路”建设,优秀中国文化,特别是中医的传播不可或缺。然而中医药的发展之路,特别是传播之路并不尽如人意。中医药的功效主治部分,是指按照中医理论描述某项活动所具有的功效的语言,如提神醒脑、恶心呕吐、解表散寒等[1]。这类功效主治部分中包含有大量文学色彩较强的内容,其中以医古文、四字格部分最为明显,属于偏文学类的非技术文本。
因而在中医药产品海外推广传播过程中,中医药产品相关说明书,特别是说明书内偏文学类文本的本地化十分重要。但是,根据目前市面流通的双语/多语说明书现状,本地化的结果并不乐观。按照汉语字面意思硬译,不探究表层文本背后的中医文化内涵,盲目追求“归化”与“异化”等不合理的翻译现象频频出现。此外,目前较多的中医药类文本翻译流程仍旧以“一只笔+一本字典”或是“电子文档+电子词典”为主,单纯引入CAT模式都可称之为大创新。这样陈旧的翻译流程直接导致很多偏记忆性质的重复内容仍旧需要大脑进行记忆、搜索,对译者的态度、记忆力以及经验等要求极高。然而很明显,这一系列极高的要求无法让中医药产品快速进驻海外市场。所以从客观角度而言,中医药产品的说明书文本本地化需要进行主动变革。
在国外,虽然机器翻译与计算机辅助翻译技术应用研究正在蓬勃发展,但与中医药类文本结合的相关研究,受制于种种因素,比如“一带一路”提倡出台之前,认同中医药的国家和地区较少,所以此类研究几乎为空白。
在国内,中医药翻译研究主要集中在上海、南京等知名中医药院校的个别研究人员,如李照国、李永安等。机器翻译与计算机辅助翻译技术的应用研究主要集中在北京、上海、广州等知名外语类院校的个别研究人员,如崔启亮、王华树、徐彬以及俞敬松等,且较少涉及包含中医药类文本在内的非技术类文本。国内目前尚无中医药类文本翻译与机器翻译、计算机辅助翻译技术结合的相关研究。
(二)理论支撑
崔启亮[2]在2014年提出了以“翻译记忆”技术为核心的计算机辅助翻译(CAT)、机器翻译(MT)和翻译管理系统(TMS)集成在一起,构成译者的集成翻译环境(Integrated Translation Environment,ITE)。但在其文中未涉及具体文体,也没有具体谈及在该集成翻译环境下的“双PE”(Pre-editing与Post-editing)操作模式,缺乏可重复性和专业应用性,难以直接应用。
徐彬等[3]72在2015年提出,非技术类文本同样可成功应用“MT+CAT+PE”(机器翻译+计算机辅助翻译+译后编辑)翻译模式,综合帮助译者进行翻译。在其提供的非技术类文本例证中,以儿童文学、报告文学等白话文章为例,对该翻译模式进行了细致分析。但遗憾的是,并未涉及中医药类的非技术类文本。
中医药类文本的翻译应用机器翻译与计算机辅助翻译目前尚无深入研究,这或许是因为中医药类翻译在整体处理流程上与上述文本有较大不一致。译者首先需要完成古汉语到现代汉语、古代文化到现代文化的阐释,之后再实现现代汉语、东方文化向外语、外语文化的翻译[4]97。中医药文本这样的翻译流程,也客观导致了其他非技术类文本的翻译模式难以直接套用。
综上所述,机器翻译和计算机辅助翻译虽然在其他文本领域已解决类似问题,但是,针对中医药英译已知问题,却难以直接将两者应用。本文希望以中医药说明书中的功效主治部分为研究对象,寻找出一个中医药翻译可用、可重复且高效的翻译模式,借助机器翻译与计算机辅助翻译的优势,解决该类型文本已知难题。
(三)研究基础
1.“MT+CAT+PE”模式
“MT+CAT+PE”模式,是指直接将原文放入机器翻译引擎,获取初始译文;而后将原文与初始译文导入至计算机辅助翻译软件,利用该软件的翻译记忆库(TM)与术语库(TB)优势,配合一定量的译后编辑技巧,完成翻译实践的模式。
目前这一翻译模式主要用于技术类文本,但已由徐彬等(2015)率先应用至非技术类文本。他们认为,该模式虽然看似激进,但在实际翻译中可有效提高非技术类文本的翻译效率。经过儿童文学、报告文学等白话文章验证,这一模式的确能够有效改善翻译整体流程。
2.“PE+MT+CAT+PE”模式
基于徐彬的“CAT+MT+PE”翻译模式和崔启亮提出的“ITE”概念,本文针对中医药功效主治部分内涵丰富、偏文言等特点,提出了“PE+MT+CAT+PE”(译前编辑+机器翻译+计算机辅助翻译+译后编辑)模式。
在充分发挥“CAT+MT+PE”翻译模式和“ITE”概念既有优势的前提下,新模式在获取机器翻译之前,力图解构医古文,减少文本文学特性,保留文本内含精髓,以规范化的受控语言重新阐述原有文本。同时,合理复用术语,高效利用平行语料,保证翻译的语言风格一致,以期优化翻译流程,改善翻译质量,提升翻译效率。
3.测试文本来源、“MT”与“CAT”
本文拟用于测试的双语中医药功效主治部分均来自于国有控股医药类上市公司——漳州片仔癀药业股份有限公司以及2009年以来同类硕士论文附录部分的中英文对照说明书,共计40份。
机器翻译技术(MT)选用谷歌神经机器翻译系统(Google' s Neural Machine Translation System)。该技术采用了目前最先进的智能训练技术,可最大程度地提升机器翻译质量。
计算机辅助翻译(CAT)软件中,市场占有率最高的软件为塔多思(Trados),由语言服务供应商SDL国际发布。本文拟使用的计算机辅助翻译软件即为该公司的SDL Trados Studio 2015-12.0.4809.0。
二、“PE+MT+CAT+PE”模式应用
(一)概述
该翻译模式在中医药功效主治部分英译的操作步骤大致如下:译前,尽可能多地搜索、查证以及整理相关权威翻译术语与语料,并提前存储至计算机辅助翻译软件中;在需要翻译的中医药文本中,选出文学性较强的内容,并对这些内容进行译前编辑,然后将编辑后的文本导入机器翻译引擎获取译文。译中,创建翻译项目,导入原文以及机器翻译文本并分配,对译者、审校以及项目负责人设定不同的翻译、查阅、存储权限,保证已有的和待存储的术语与语料的正确性以及一致性。译者在上述技术覆盖的集成翻译环境下,对机器翻译的中医药文本进行译后编辑。译后,针对翻译过程中存储的术语与语料再行查证,整理保存,以便下次翻译活动使用。
(二)具体应用
徐彬等[3]72表示,虽然传统研究认为,MT与CAT的重点研究方向应为技术类文本,文学性较强的文本不适宜借助这项技术进行翻译。但本文认为,译者如果在非技术类文本中采用适当的技巧与策略,借助恰当的翻译模式引入MT与CAT,依旧能够在多方面超越传统翻译模式。
本文认为,在中医药功效主治部分的翻译中,通过适当调整优化,MT与CAT同样可以引入至中医药文本的翻译,且可以在多方面超越传统翻译模式。
中医药功效主治部分多医古文、四字格,经常以较少文字涵盖较多内容,属于偏文言性质的文学类文本。直接翻译此类文本无法保证翻译效率最优化。第一,已确定译法的双语纸质资料收集后需要人工检索、查询;第二,翻译后的双语文本,即便以电子文档、表格形式存储,也难以进行快速反向检索、查询;第三,四字词语等相对固定含义的语料,难以单独存储,难以保证全文一致性;第四,类似中医药产品进行产品线扩展时,难以再次直接使用或搜索相关译文。
直接引入“MT+CAT+PE”翻译模式,虽然大致解决了上述四个问题,但是在应用机器翻译时,没有进行针对性译前编辑,产出的机器翻译文本效率值偏低,无法实现机器翻译效率最大化。如果译员采用“PE+MT+CAT+PE”模式,则可有效解决上述问题。下文将以中医药功效主治部分的英译中为例,详细介绍“PE+MT+CAT+PE”模式的应用流程。
1.2 其他寄生虫材料 并殖吸虫囊蚴DNA、日本血吸虫DNA、牛带绦虫DNA、猪带绦虫DNA、刚地弓形虫DNA、隐孢子虫DNA、蓝氏贾第鞭毛虫DNA、溶组织内阿米巴DNA和蛔虫DNA为本室保存。
1.权威术语、语料搜集整理
本文将世界中医药学会联合会(以下简称“世中联”)所提供的中医基本名词术语中英对照国际标准 SCM0002-2007认定为权威术语,进行收集与整理。在需要译前编译的功效主治部分中,筛选出了共计80字(21个语块)已有译文(见表1)。进行译前编辑前,该部分内容已提前录入CAT软件中的术语库。
表1 部分“世中联”权威术语
2.译前编辑与机器翻译
在徐彬的“MT+CAT+PE”模式中,原文直接导入机器翻译获取初始译文。但是,中医药功效主治部分的翻译却无法直接引用。这是因为,中医功效主治语中四字结构较多,关系复杂,没有或少有语法关系词。如果直接导入机器翻译,所获的译文无法达到最优效率。
为克服用于机器翻译的语料库相对复杂的缺点,一些语言学家和工程师沿袭“基本英语”提议和“直白英语”运动的思想,创造了受控语言。这是一套自然语言,其词汇和语法受到限制,以期减少歧义性,降低复杂性[5]。所以,为充分实现机器翻译的自动化翻译优势,中医药类文本同样需要进行解构重组,减少文本文学色彩,保留文本内含精髓,以规范化的受控语言重新阐述原有文本。
在导入机器翻译之前,通过调整原文语法结构,依靠中医类词典释义解析,让原文更为清楚与直接。
本版块以中医相关期刊、教材以及辞典等为指南,重点解构非权威语料的314字(78个语块)。由于语块内部结构分类方式不一致,本文将所有78个语块分为功效语(40个语块)和主治语(38个语块)两个部分。
在功效语部分中,编辑语块为受控语言的方式主要基于两个原则:(1)尽量使用短句,合乎汉语习惯[5]25;(2)通过强调汉语的形合,来规避汉语偏重意合,以期降低机器翻译引擎理解难度。基于上述原则,在功效语的具体处理过程中共采用三种方式,分别为:(1)编辑为两个并列的短句;(2)编辑为带目的状语的短句;(3)编辑为带方式状语的短句。在第一种方式中,原有语块用逗号拆分为两个短句,同时增加“并”字,强调短句间的并列逻辑。在第二种方式中,主动增加“以”字,强调语块间的目的逻辑。在第三种方式中,主动增加“通过”一词,强调语块间的方式逻辑。整体上,三种方式的处理过程中,都对原有语块进行了去文学化处理,减少词汇句法方面的歧义,以便既表达出含义与逻辑,又简洁易懂,尽可能保证译文在获取机器翻译文本时,达到最优效率。中医药功效语文本从译前编辑(解构)经机器翻译至产出最终译文的整体流程示例可参考表2。
完成译前编辑后,将经过译前编辑的待翻译文本导入机器翻译引擎,获取初始译文。随后将获得的译文与原文(即未经译前编辑处理的文本)匹配对齐,存为供计算机辅助翻译软件使用的语料。
表2 中医药功效语文本“译前编辑(解构)——机器翻译-最终译文”流程(部分)
3.MT效率对比
在传统的“MT+CAT+PE”翻译模式下,即便是最为优秀的机器翻译引擎也难以为中医药功效语得出较为可用的初始译文。而在“PE+MT+CAT+PE”机辅翻译新模式下,由于增加了基于机器翻译的译前编辑“PE”,获取的机器译文质量会明显提升。
以不同翻译模式下机器译文为例,即可发现机器译文质量的提升(见表3)。简单对比即可发现,在“MT+CAT+PE”翻译模式下,机器翻译所获得的译文佶屈聱牙,甚至还有拼音等非英文内容,很难直接为译者所用。相比之下,虽然“PE+MT+CAT+PE”翻译模式下的机器译文质量仍算不上高,但却有不少内容可以利用。因此,基于“MT+CAT+PE”翻译模式增加译前编辑“PE”,在中医药功效主治语的翻译上可发挥作用的观点得到了印证。
表3 机器翻译内容抽样对比
为了进一步从数据角度分析机器翻译的效率,本文决定采用徐彬提出的MT效率的计算方式,即MTe= RC / HTc(见图1),对不同模式下的MT效率值进行对比。
图1 MT效率计算公式
经过人工计算,“MT+CAT+PE”模式下该批次文本的MT效率约为22.5%,“PE+MT+CAT+PE”新模式下的效率值约为31%。这一数据已经大幅超过了单纯使用高质量术语库所得到的效率提升(约20%)[3]74。因此可以判定,相较于原有的翻译模式,“PE+MT+CAT+PE”新模式下的机器翻译效率提升明显。
4.机辅翻译应用与译后编辑
在计算机辅助翻译软件中,翻译记忆(TM)和术语库(TB)是核心技术。其中,翻译记忆的定义为“一种用于存储原文与对应译文的语言数据库”[6]93。而术语库,是一种计算机化的术语集合。面向翻译的术语库一般是双语或多语对照词表,并附带其他相关信息[7]24。
在正式翻译前,本文在Trados中,为待翻译文本新建翻译项目。在项目内新建相应主翻译记忆库与主术语库,以便已有术语、语料导入。同时,在翻译过程中,不断积累相关语料与术语,以期提高翻译效率。
此处以漳州片仔癀药业股份有限公司板蓝根颗粒中的功能主治部分进行详细说明。
原文以及机器翻译译文导入Trados,机译译文为初始翻译,为译者提供了大致版本。而图2右上角的术语库,则是CAT软件的另一大优势。如上文所述,本文在正式翻译之前,已经“提取—收集”了由“世中联”提供的官方术语相应译文。因此,在实际翻译过程中,一旦原文中出现了已收集的相应术语,术语库界面便会立即显示出相应译文。译者借此即可在集成翻译环境下进行译后编辑工作,无需另行查证。
图2 “清热解毒”初始翻译界面
该句译后编辑完成后,即可跳转翻译行,进行下一句编辑处理。但在译后编辑时,本文若发现该药品的功效主治部分,可合并处理。为提高最终翻译质量,本文决定将该药品的翻译句段予以合并,并最终完成该部分的整体编辑工作(见图3)。
图3 “板蓝根颗粒”的功效主治部分最终译文
此外,在整个40份的功效主治语翻译过程中,由于“清热解毒”等词语多次重复出现。译者翻译时,可利用语料检索功能进行搜索,对比类似翻译内容,进而获取所需内容。这不仅能够加快翻译速度,也能提高译者自身对于翻译材料的理解(见图4)。
图4 记忆库内搜索“清热解毒”
在此需要特别指出,在利用“PE+MT+CAT+PE”模式进行译后编辑的过程中,CAT软件与译后编辑手段的应用,应处于动态平衡的状态。从单次翻译微观角度而言,每一句最终译文的产出,都涉及翻译句段的搜寻、译后编辑的进行与翻译句段的再储存。与此同时,每一句译文中的术语,也会涉及相应的含义理解、术语库匹配、译后编辑和再储存的过程。宏观来看,从整个翻译项目甚至多个翻译项目衔接角度来观察,“PE+MT+CAT+PE”模式的动态应用,同样会涉及项目翻译记忆库与术语库的编辑与应用,以及译员和审校针对不同项目、不同产品译文在集成翻译环境下进行的译后编辑工作。
三、新模式应用优势
此前,徐彬已经证明了在非技术类文本中可采用新的翻译模式,应用MT以及CAT带来翻译效率、质量以及流程上的提升。但研究发现,中医药功效主治部分内含较多文言特色以及文化内容,如果直接套用徐彬的翻译模式,无法充分利用机器翻译的优势。
因此本文以“MT+CAT+PE”翻译模式为基础,充分考虑译者集成翻译环境的最优化,进一步提出并借助“PE+MT+CAT+PE”模式,完成了40份中医药说明书功效主治部分的翻译,并对比了“MT+CAT+PE”模式与“PE+MT+CAT+PE”模式之间的翻译效率。从最终结果来看,新模式不仅可用于中医药功效主治部分的翻译,而且相较于传统翻译模式和“MT+CAT+PE”模式,新模式应用于中医药功效主治类文本时,在翻译效率、翻译质量和翻译流程方面优势明显。
(一)翻译效率提升
相较于传统模式和“MT+CAT+PE”模式,在译前编辑与机器翻译结合方面,“PE+MT+CAT+PE”模式的翻译效率优势体现最为明显。
新模式充分应用机器翻译,经过译前编辑的原文文本,经解构重组,原有文学性减弱,从而保证了原文基本信息的完整。因此,将已译前编辑的文本导入至机器翻译引擎,可获得更高质量的机译译文,最终实现了翻译效率的极大提升。
此外,在术语合理复用以及平行语料高效利用方面,同样可以在多次翻译项目累及的情况下,不断提升翻译效率。由于同类研究较少,可供此次研究提前收集处理的权威语料较少,翻译效率提升还存在进一步优化的潜力。
(二)翻译质量改善
判断和认定高质量的翻译文本具有较强的主观性。但是在实际翻译需求中,一份翻译达意的说明书,即可符合基本需求。虽然已搜集到的双语说明书大多来自上市企业、中医药知名厂商,但译文却连基本语法都无法保证正确。因此,将基于新模式的译文与原有译文直接对比,并无必要。
基于此,本文在衡量“PE+MT+CAT+PE”新模式的翻译质量时,从权威术语使用、译前编辑、术语与语料积累以及句式完整性和连贯性角度进行了分析。
第一,权威术语的使用。在翻译开展前,预先收集由“世中联”发布的相关权威术语译文(见表1),规避了“自创”翻译,保证了相关译文的准确性。
第二,译前编辑。对原文进行针对机器翻译的受控化译前编辑,看似增加了翻译流程的复杂性,但是,这一流程同样是译者对原文深入理解的过程。在这一过程中,译者完成了对文学性较强文本理解的逐一突破,精炼原文供机器翻译的同时,更加深入地理解文本内含。
第三,术语与语料积累。在翻译过程中,译法相对固定的术语以及句段由专业软件存储记忆。这极大程度上减轻了译者的记忆负担,同时在实际应用时,保证了译文的一致性。
第四,句式完整性和连贯性。已面世的说明书功效主治部分,很多仅仅是词语的堆砌,不仅不够正式,而且还极易造成误译。而基于新模式下的翻译不仅保证了句子的完整性,同时还尽可能连接了主治语与功效语两个板块。
(三)翻译流程优化
任何翻译流程都包括译前、译中以及译后三个阶段,中医药功效主治部分的翻译也是如此。传统翻译模式下,译者大多将重点放在译中部分,而忽略了译前、译后两个流程部分的重要性。“MT+CAT+PE”模式的提出,初步改善了这一情况。“PE+MT+CAT+PE”新模式的提出,进一步优化了翻译流程,并成功将MT与CAT应用至中医药类翻译。
新模式下,中医药功效主治部分翻译在三个板块的使用方面都进行了充分利用。译前,收集权威术语资源,并针对原文进行基于机器翻译的译前编辑预处理,获取机器翻译译文。译中,充分利用机器翻译内容以及计算机辅助翻译软件所独有的术语库与语料库技术优势。译后,优化存储相关术语、语料资源,供将来循环使用或进行相关研究。