APP下载

基于机器翻译的人机交互译前编辑模式研究

2021-05-20梁玉静

英语知识 2021年2期
关键词:译文药品文本

李 洋 孙 宁 梁玉静

(东北大学外国语学院,辽宁沈阳)

1.引言

机器翻译(Machine Translation)即在计算机辅助下,进行不同自然语言文本的相互转换(Hutchins,1986)。2016年,Google发布神经网络机器翻译系统(Google Neural Machine Translation),之后机器翻译质量迅速提升,如术语翻译和程式度较高的语篇翻译。这在极大程度上提高了译者的翻译效率。当今世界处于一个全球化时代,国际公司、跨国公司和不同国家间的合资企业数量快速增长,同时这也带来了数百万的项目、合同以及其他类型的文件,其语言种类千差万别。无论是将翻译工作外包给翻译公司,还是众包给云端之下的不同译者,他们都认为利用机器翻译辅助人工翻译是更好、更快地完成翻译项目的最佳选择。如今,诸如人工智能等新技术的迅速发展助推了机器翻译编程方式的革新,大大提高了机器翻译的质量。因此,许多企业也选择通过使用机器翻译的方法来降低成本效益,同时也提高翻译效率。然而,在当前技术条件下,人机结合的翻译模式才是实现更高的机器翻译质量的最佳途径。“人机结合翻译模式”是在深度融合机器翻译与人工翻译各自优点的基础上,借助互联网、人工智能以及大数据的技术优势,生成“原稿—机译—人译”的产出链的人机合作智能翻译模式(肖凤华 殷白恩,2019:38)。译前编辑能使源语在不改变语义的基础上,使源语的语言结构更易于机器翻译识别、分析和转换,是译文质量提高的前提之一。同时,有效的译前编辑也可以更好的服务于译后编辑,使得译后编辑的复杂程度大大降低,在一定程度上提高翻译工作效率。广义上来说,译前编辑可以被视为译后编辑的重要组成部分(冯全功 高琳,2017)。

本研究通过选取《欧盟GMP/GDP法规汇编》(Compilation of EU GMP/GDP Regulations),下简称《法规汇编》为源语文本,以Google神经网络机器翻译为依托,对经过译前编辑与未经译前编辑两种不同的机器翻译文本之间的译文质量进行对比,通过实例分析来讨论译前编辑在机器翻译中的实现途径以及对译文质量提高的具体效果,从而更好地帮助译者完成翻译工作,实现人机互动的翻译方法,即“人工+机器”的翻译模式。

2.译前编辑

译前编辑,即在人工干预、编辑、修改源语文本的前提下,运用机器翻译软件对源语文本进行翻译处理,最终生成目的语译文文本的过程。译前编辑过程中,译员常对源语文本进行词级、短语、句级层面的译前编辑处理。在词级层面,已有研究发现在利用机器翻译系统进行英语翻译时,通过编辑源语能提高译文的准确性和可读性,包括增加或减少冠词等限定词,提前翻译术语及专有词,尽量限制代词、连词等功能词的使用(冯全功 高琳,2017;黄越悦,2017)。同时,译前编辑还应对语素词进行语义切分、离合词进行语义整合。在短语层面,根据译前编辑中短语的切分原则,可将短语划分为名词性短语、动词性短语、形容词性短语、主谓短语等短语类型切分(郭高攀 王宗英,2017)。具体而言,通过单个动词替换动词—介词短语能避免机器翻译的译文产生歧义(冯全功 高琳,2017)。在句级层面,将源语句长控制在25个单词以内,关系从句使用关系词引入,并列句子结构中使用平行结构等方法能提高机器识别准确性(冯全功 高琳,2017)。另外,句法结构调整如主被动语态的转化有助于机器翻译得出更为通顺的译文(黄越悦,2017)。

由于源语与目的语存在语言结构、思维逻辑、文化等差异,Google机器翻译产出的译文尚存在漏译赘译、语序错误、时态错误等问题。因此,译前编辑的必要性体现在通过人工干预,使源语文本在词、短语、句子等层面改变词序或结构,形成更适合机器读取的语言结构,有机地将源语文本和机器翻译的语言处理算法相结合,将源语文本改变为既符合目的语思维,又适应机器翻译方式的中介语篇,从而提高译文的准确性和可读性。虽然有研究表明,与译后编辑进行比较,译前编辑耗时长、工作量大、效率低(吴慧颖,2012),但缺乏大量试验数据的验证,研究结论的主观性较强。然而,本研究认为译前编辑和译后编辑应该相辅相成,二者均是人机互动的翻译活动链条上两个不可或缺的重要环节。另外,由于译者风格、技术素养、翻译文本的不同,译者对译前编辑和译后编辑的选择各有侧重,需要依据源语文本的类型和特点进行具体分析和选择。按照文本类型分类分为(Nord,1997;Reiss,1989)信息型(informative)、操作型(operative)和工具型(instrumental)的文本,由于这类语篇语言程式度较高,所以更适合译前编辑的翻译处理。比较而言,表情型(expressive)和文献型(documentary)的文本语篇具有明显的文学、诗学和美学的特点,所以不适合译前编辑的翻译处理。

3.不同机译系统的译文质量对比

传统的基于规则的机器翻译效率低,取而代之的是基于深度学习、基于人工智能的机器翻译平台或移动应用,如Google翻译、百度翻译、有道翻译等。然而,由于语言本身的复杂性和其文化附加元素等特点,机器翻译的产出结果往往差强人意,因此机器翻译仍然无法完全取代人工翻译。本研究主要选择了上述三种常用的机器翻译平台,测试语料为法规合同文本,源语为英文,对三种英译的产品进行对比。

为保证研究的客观性和准确性,本研究从某大学翻译专业硕士中选取了5名熟练使用英语的中文母语者,他们接受了半年翻译硕士课程训练且具有较丰富的翻译实践。此外,本研究还从翻译硕士专业教师中选取了2名翻译教师作为评分者。从上述法规合同文件中节选了三段内容作为测试三个自动翻译平台产出使用的语料。7名评分者为机器翻译对英译汉的译文质量进行评分(见表1),主要考察译文的可理解性。

表1 机器翻译译文的质量评分标准

为了更直观、有效地展现三个机器翻译平台的译文质量,本研究从《法规汇编》节选了部分最具代表性的文本,并以平均分为最终衡量标准来呈现评审意见,从而使评判结果更具普遍性和公平性(见表2)。

表2 机器翻译译文的质量评分

最终,评分员对Google翻译、百度翻译、有道翻译三个机器翻译平台测试后,译文质量评估的平均分分别为8.3、7.9和7.6,说明Google翻译对于法规合同文本类语篇的英译汉适用性较高,汉译文本的翻译质量较高。因此,本研究最终采用Google翻译探索人机互动的译前编辑模式。

4.语料来源

本研究选取典型的信息型和工具型文本《法规汇编》作为主要的研究对象,重点分析欧盟药品生产、流通质量管理规范法规中的典型语句翻译案例,包括术语(如Good Manufacturing Practice)、程式语(如in accordance with,relevant to)或词簇(如the requirement of)。在应用层面,《法规汇编》不仅对制药企业从事研究、设计、质量管理等的技术人员有着重要的实际运用意义,也能为高等院校制药工程、药物制剂等相关专业提供权威的参考。除此之外,《法规汇编》是研究药品生产质量管理规范的法规文本,对我国制药行业更好地了解国际制药质量体系,提高制药验证工作水平,具有很大的借鉴意义。

5.案例分析

人机交互的机器翻译模式能改进源语文本的语句结构、消除词语的歧义,尽可能地降低机器翻译对文本分析的复杂性。目前,常见的译前编辑方法包括提前翻译术语及文化意象词、置换同义词、调整源语结构、增删成分、修改标点符号等。

本研究从《法规汇编》中选取案例,通过使用Google机器翻译,研究对源语文本进行词级和句级的译前编辑方法,以期降低源语文本的语言复杂性,提升程式度(formulaicity),更易于机器翻译在语料库中进行识别、对比和转换,提升译文质量。

5.1 词级调整的译前编辑

5.1.1 特殊词语的提前翻译

纵使Google机器翻译拥有庞大且不断增加的数据库及模拟神经网络的学习能力,但是目前,某些固定表达、专有名词或具有独特文化意象的词语依然是机器无法理解并正确翻译的。语义转换的抽象性要求译者在翻译过程中必须对每个词语的对应含义进行把关,即使是在具有特定术语的限制性文本领域,译者也必须决定术语的翻译是否符合上下文语境(Jean,2019)。在这样的背景下,译前编辑可采取的唯一措施就是将机器不可译的词、词组或句子直接预翻译成相应的目的语,如:

例(1)ST1(source text):Quality Management therefore incorporatesGood Manufacturing Practice.

TT1(original Google Translation): 因此,质量管理包含良好生产规范。

在英语源语中,专有名词Good Manufacturing Practice具有固定的搭配语义,即“药品生产质量管理规范”,但机器翻译采取字面直译方法,输出译文为“良好生产规范”,造成语义缺失和改变。因此,译前编辑应进行术语提前翻译,可将全文的Good Manufacturing Practice提前通过WORD WORD中的“替换”功能,将该专有名词全部替换为“药品生产质量管理规范”。

ST2(after pre-editing): Quality Management therefore incorporates药品生产质量管理规范.

TT2(Google Translation after pre-editing):因此,质量管理包含药品生产质量管理规范。

Google机器翻译受上下文语境的影响,同一专有名词或术语的译文有时并不一致,导致译文的连贯性较低,甚至造成读者误解。提前翻译具有特殊含义的重要词语、术语或专有名词,可增强译文的术语一致性,提高翻译的准确率,如:

例(2)ST1: A state of control is established and maintained by developing and using effectivemonitoringand control systems for process performance and product quality.

TT1: 通过开发和使用有效的监视和控制系统来控制和控制过程状态和产品质量,从而建立并保持控制状态。

除了一些专业术语的替换外,多义词在特定领域的常用翻译也会成为机器翻译过程中的障碍,如“monitoring”在法律法规文本中一般翻译为“监测”而非“监视”或“监控”。此外,此处的“monitoring”应为名词而非动词,机器翻译为更具动词特性的“监视”而非带有名词特性的“监测”,致使本应翻译为“监测和控制系统”的整体名词分裂为一个动词和一个名词——“监视”和“控制系统”,这也就直接导致了上下语境的翻译错乱。同理,我们通过WORD的“替换”把“monitoring”直接替换为“监测”。

ST2: A state of control is established and maintained by developing and using effective监测and control systems for process performance and product quality.

TT2: 开发和使用有效的监测和控制系统来提高过程性能和产品质量,建立并维持控制状态。

经过调整后,机器翻译的译文不仅用语更加准确,而且语义的流畅程度也得到了提高,通过提前置换关键词、术语等译前干预手段,可在保证译文连贯性的同时,大幅提高翻译的准确性。

5.1.2 情态动词的增译

汉英两种语言之间存在明显不同的思维方式、表达方式与语言习惯,因此,在英译汉的过程中,为使汉语译文明确完整,译前编辑可对源语文本增添词、短语或句子,通过增加源语的明晰度(explicitness),达到准确表达语篇含义的目的。在下例中,源语使用被动语态表达规定和确定的语气。然而,被动语态在汉语中常表达陈述语气,这就导致译文与源语的感情色彩不一致,如:

例(3)ST1: Medicinal products are not sold or suppliedbefore a Qualified Person has certified that each production batch has been produced and controlled in accordance with the requirements of the Marketing Authorization and any other regulations relevant to the production, control and release of medicinal products.

TT1: 在合格人员证明每个生产批次已根据市场授权的要求以及与药品的生产,控制和释放相关的任何其他法规生产和控制之前,不销售或提供药品。

因此在翻译法律法规类文本时,应当适当增译,如增加符合语境的情态动词:

ST2: Medicinal productsmust not be sold or suppliedbefore a Qualified Person has certified that each production batch has been produced and controlled in accordance with the requirements of the Marketing Authorization and any other regulations relevant to the production, control and release of medicinal products.

TT2: 在合格人员证明每个生产批次已根据营销许可的要求以及与药品的生产,控制和释放相关的任何其他法规生产和控制之前,不得出售或提供药品;

在将源语进行译前编辑,加入情态动词“must”之后,机器输出的译文也从简单的陈述语气“不销售或提供药品”变为符合法律法规的命令语气“不得销售或提供药品”,表达严令禁止之意。最后,通过译后编辑的句序调整和符合汉语习惯的表达修正,提高译文的可读性:

TT3(after post-editing): 质量授权人需签发证明以确认每一批次药品的生产和控制均符合上市许可要求以及与药品生产、控制和放行相关的任何其他法规要求,未经质量授权人签发证明的药品不得销售或供货。

5.1.3 代词的替换

代词作为替代名词或形容词的一种词类,在增强句子简洁性方面起到了非常重要的作用。然而,在较为复杂的句子中,代词的使用也会在一定程度上导致句子意义不明确,甚至可能产生歧义。在译前编辑中,可以通过以名词或形容词替换相应代词的手段,增加源语的明晰度与译文的should be defined and there should be a science-based control strategy for the required attributes for incoming materials, critical quality attributes and critical process parameters to confirm product realization.Thisshould also include regular evaluation of the parameters.Process Analytical Technology and multivariate statistical process control may be used as tools.

TT1: 应规定工艺确证系统,并应针对进料所需的属性,关键质量属性和关键工艺参数制定基于科学的控制策略,以确认产品实现。这还应包括对参数的定期评估。可以使用技术和多元统计过程控制作为工具。

在译文中,机器翻译未将源语中代词的实际指示明确地翻译出来,使读者在阅读译文时,可能对代词所指代的究竟是“工艺确证系统”还是“科学的控制策略”存在疑问,导致理解偏差。对于这种代词指示不明确的情况,在译前编辑中,可以将其直接替换为实际所指代的名词。

ST2: The process verification system should be defined and there should be a science-based control strategy for the required attributes for incoming materials, critical quality attributes and critical process parameters to confirm product realization.The process verification systemshould also include regular evaluation of the parameters.Process Analytical Technology and multivariate statistical process control may be used as tools.

TT2: 应规定工艺确证系统,并且对于接收物料所要求的属性,关键质量属性和关键工艺参数应有一个基于科学的控制策略来确认产品实现。工艺确证系统还应包括对参数的定期评估。可以使用技术和多元统计过程控制作为工具。

5.1.4 冠词的省译

英语中常在单数可数名词前添加冠词a和an表示“一”的含义,但此时冠词仅表示名词为不特定者,而不强调数目概念。但在将其翻译成汉语时,机器翻译经常会将a翻译为“一个”,这在汉语的表达中是冗余的。

例(5)ST1: There isaprocess for self-inspection and/or quality audit, which regularly appraises the effectiveness and applicability of the Pharmaceutical Quality System.

TT1: 有一个自我检查和/或质量审核的过程,定期评估药品质量体系的有效性和适用性。

在表述过程等抽象名词时,汉语不与“一个”连用。因此,在这样的情况下,可省译a,即删除源语中的a。

ST2:There is processfor self-inspection and/or quality audit, which regularly appraises the effectiveness and applicability of the Pharmaceutical Quality System.

TT2:有自我检查和/或质量审核的过程,定期评估药品质量体系的有效性和适用性。

经过译后编辑删除抽象名词的冗余表达,消除欧化表达的定语从句结构,最终译文如下:

TT3:有自检和/或质量审计规程,能定期评价制药质量体系的有效性与适用性。

5.2 句级结构的译前编辑

5.2.1 断句分译

英语中多用后置的定语从句等复合从句结构进一步解释说明修饰的先行词。这一语言结构在Google机器翻译中会出现先行词重复的现象,使译文啰嗦赘述,如:

例(6)ST1: Quality Management is a wideranging concept,whichcovers all matters,whichindividually or collectively influence the quality of a product.

TT1: 翻译质量管理是一个广泛的概念,涵盖所有事项,这些事项单独或共同影响产品的质量。

因此在译前编辑中可以采取用指示代词替代关系代词的做法,将较长的复合句转化为多个较短的简单句,使译文更简洁。

ST2: Quality Management is a wide-ranging concept.Itcovers all matters which individually or collectively influence the quality of a product.

TT2: 质量管理是一个广泛的概念。它涵盖了单独或共同影响产品质量的所有事项。

同理,在机器翻译之前,我们对长句、难句进行分解成简单句处理,从而使译文达到语义通顺、语言风格与源语适配的目的。

例(7)ST1: A system of manufacturing authorizations ensures that all products authorized on the European market are manufactured/imported only by authorized manufacturers,whoseactivities are regularly inspected by the competent authorities, using Quality Risk Management principles.

TT1: 制造授权系统可确保仅授权制造商制造/进口在欧洲市场上授权的所有产品,这些制造商的活动均由主管当局使用质量风险管理原则进行定期检查。

无论是否需要机器翻译,如何翻译定语从句一直都是困扰译者翻译的热门话题,因而在译前进行编辑,无疑会大大减少译后编辑的工作量。这一点在长难句的翻译中,尤为重要。英语中的定语一般较长且放在名词之后,而在汉语中,定语更偏向碎片化且多置于名词之前。因此,本文建议将英语中的定语“打碎”,放在句中,或变换为并列的结构。此句中将“whose”置换成“and+代词(their)”就起到将定语并列且置后于名词的作用。

ST2: A system of manufacturing authorizations ensures that all products authorized on the European market are manufactured/imported only by authorized manufacturers,and theiractivities are regularly inspected by the competent authorities, using Quality Risk Management principles.

TT2: 制造授权系统可确保只有授权制造商才能制造/进口在欧洲市场上授权的所有产品,并且主管部门会根据质量风险管理原则定期检查其活动。

5.2.2 语序调整

英语思维习惯把结果前置,形成结果的原因、行为等后置,而汉语思维恰恰相反。如果仅运用机器翻译一种技术手段,产出的译文会出现生涩、不通顺的问题,如:

例(8)ST1:Product realizationis achievedbydesigning, planning, implementing, maintaining and continuously improving a system that allows the consistent delivery of products with appropriate quality attributes.

TT1:产品实现是通过设计、规划、实施、维护和持续改进一个系统来实现的,该系统允许具有适当质量属性的产品的一致交付。

利用译前翻译调整语序,使汉语译文行文逻辑更顺畅,也避免中心词的重复(如上例中的“该系统”)。

ST2:Bydesigning, planning, implementing,maintaining and continuously improving a system that allows the consistent delivery of products with appropriate quality attributes,product realization is achieved.

TT2:通过设计、规划、实施、维护和持续改进一个系统,允许具有适当质量属性的产品的一致交付,从而实现产品实现。

依据语境,allow不是“允许”,而是“使能够”,consistent delivery不是“一致交付”而是“持续交付”。此外,system后的that从句作定语修饰system,机器翻译出的意义并不准确。由此可知,机器翻译中多义词在具体语境下翻译不准确,需要译者通过结合译前编辑和译后编辑的手段来提高翻译准确率和效率。最终译文如下:

TT3: 通过设计、规划、实施、维护和持续改进一个能持续交付具有适当质量属性的产品系统,从而实现产品的实现。

5.2.3 意群切分与调整

英语长难句成分相对复杂,因此在进行此类句子翻译时,通常需要通过判断句子中各意群间的逻辑关系,厘清句子结构。但机器翻译往往“只看眼前,不顾全局”,译文不符合目的语的句子结构,从而使语篇意义和功能产生偏差,降低了译文质量。

例(9)ST1: Arrangements are made for the manufacture, supply and use of the correct starting and packaging materials, the selection and monitoring of suppliers and for verifying that each delivery is from the approved supply chain.

TT1: 安排制造,供应和使用正确的起始和包装材料,供应商的选择和监测,以及核实每次交付是否来自批准的供应链。

从句子结构和语法分析,第一个for和第二个for是并列结构,其后内容都是对arrangement范围的限定。然而,机器翻译无法分析相隔较远的并列介词结构,理解分析意群之间关系和行文的逻辑结构。因此,译前编辑时可采用分析意群关系后将句子结构作适当的调整、适当增补单词的方法。

ST2: Arrangements are made for the following activities: manufacture, supply and use of the correct starting and packaging materials, the selection and monitoring of suppliers and verifying that each delivery is from the approved supply chain.

TT2: 安排以下活动:制造,供应和使用正确的起始和包装材料,选择和监控供应商并核实每次交付是否来自经批准的供应链。

在此例语境中,arrangement虽有“安排”之意,但此处应是an agreement that you make with sb.that you can both accept,即对某一项目双方达成协定的意思,编辑后译文如下:

TT3: 对下述活动均有协议约束:生产、供应和使用正确的起始物料与包装材料、选择并监督供应商并每次交付都来源于经过批准的供应链。

5.2.4 语态改变向中句子主被动语态的转化,但在分析时态和情态时,往往将其处理为完成时,造成时态误译,如:

例(10)ST1: A Pharmaceutical Quality System appropriate for the manufacture of medicinal productsshouldensure that:

Production and control operationsare clearly specifiedand Good Manufacturing Practiceadopted.

TT1: 适用于制造药品的药品质量体系应确保:

……

明确规定了生产和控制操作,并采用了良好生产规范。

由上文“适用于制造药品的药品质量体系应确保”可知,ST1应是要求中的一项,表达“要求”的语气,且译文中的“了”在汉语中作为过去式的标记,表示已完成的状态,显然不符合例文(法规)的翻译要求。因此,译前编辑可处理被动语态,将其转变为主动语态,在一定程度上解决时态的翻译问题,使机器翻译产出符合文本语境的时态:

ST2: Clearly specify production and control operations and adopt Good Manufacturing Practice.

TT2: 明确规定生产和控制操作,并采取良好的生产实践。

5.2.5 标点符号的处理

标点符号在翻译中似乎并不重要,译者也不会给予额外的关注。中国人对标点符号的态度亦是如此。然而,在拥有丰富的中英语阅读经验的基础上,不难发现,英汉两种语言在标点符号的使用也存在一定的差异。例如,在英语中,通常以逗号来分割多个并列的成分,用斜体来表示书刊名称,然而,在中文中,则以顿号与书名号代之。因此,如果在机器翻译中不对两种语言中使用习惯不同的标点符号进行译前编辑的优化处理,机器翻译产出就会产出质量较低的目标语,甚至会产生歧义,如:

例(11)ST1: Viral safety concerns as described in ICH Guideline Q5AQuality of Biotechnological Products: Viral Safety Evaluation of Biotechnology Products Derived from Cell Lines of Human or Animal Origin.

TT1: 如ICH准则Q5A生物技术产品质量中所述的病毒安全问题:源自人类或动物源细胞系的生物技术产品的病毒安全性评估。

在英语中,对于书名、刊物名以及文章的名字多是以斜体表达。然而,在中文里,通常使用书名号来表述特定的书籍、刊物及文章等。例(11)中,我们可以看到,由于机器翻译未能识别书籍的名称,导致整段译文的质量非常差。因此,译前处理中将相应的书籍、刊物及文章名字以书名号表示,则可以在很大程度上解决机器翻译不能识别书刊名称的问题,增强译文的准确性:

ST2: Viral safety concerns as described in ICH Guideline Q5A《Quality of Biotechnological Products: Viral Safety Evaluation of Biotechnology Products Derived from Cell Lines of Human or Animal Origin》.

TT2: ICH准则Q5A《生物技术产品的质量:源自人类或动物源细胞系的生物技术产品的病毒安全性评估》中所述的病毒安全问题。

6.结语

本研究以《法规汇编》为例,基于Google翻译平台对比分析了信息型和工具型文本的未经与经过译前编辑的机译译文质量,提出了词级和句级的具体解决方案。译前编辑主要包括三点:第一,人工干预源语语篇的顺序和结构,如标点符号的正确使用、句法结构的完整性;第二,降低源语语言的结构复杂性,如将复杂定语从句和状语从句处理为独立的句子、减少语篇的修辞使用;第三,提升语篇的程式度,如避免使用一词多义的英语单词或英语缩写。鉴此,本研究旨在构建人机互动的译前编辑翻译模式。一方面,在技术层面上,本研究论证了Google机器翻译在英译汉的语言方向上译文质量较高,尤其是针对非文学文本的汉译。另一方面,在社会层面上,本研究强调了基于机器翻译构建人机互动翻译模式的价值,特别是在应对文字量较大、时间短、质量要求高的翻译工作中,人机互动翻译模式的广泛应用是当前语言服务业和翻译行业的发展趋势。因此,以机器翻译平台为基础,本研究提出的译前编辑方法有助于提高专门领域及特定文本类型的机器翻译质量和效率。

猜你喜欢

译文药品文本
在药店购买药品需要注意的几个问题
文本联读学概括 细致观察促写作
药品保存细解读
作为“文本链”的元电影
新修订药品管理法对何为假药劣药重新作出界定
搭文本之桥 铺生活之路 引习作之流
弟子规
过期药品回收“梗”在哪儿?
弟子规
弟子规