逻辑语义学视角下的连接词“and”的句法错译分析
——基于汽车手册机器翻译的译后编辑研究
2020-01-01李阳春
李阳春
(同济大学 外国语学院,上海 200092)
随着经济的快速发展和产品发布周期的日益缩短,对翻译交付的时间和速度提出了更高的要求。以此为动力,机器翻译越来越成为高效翻译的重要组成部分,但是机器翻译固有的局限性影响了翻译的质量,阻碍了其进一步发展。提高机器翻译的准确性主要有两种途径,一是进一步完善机器翻译软件来提高所生成的正文质量,二是对机器译文进行译后编辑处理[1]。完善翻译软件是最理想的解决途径,但是由于人类语言内部结构的复杂性,重新建构翻译规则不仅工程浩大,而且往往会触发新问题。因此,对机器译文进行译后编辑处理越来越引起人们的重视。译后编辑既可以由人工完成,一般称为 reviser,也可以利用软件来实现,一般称为 post-editor[2]。本研究不聚焦于机器翻译的系统本身,而是关注系统产生译文后,如何建立一个独立的子系统进行译后编辑,从而提高最终译文的质量[1]。
始于20世纪70年代初的逻辑语义学,又被称为形式语义学,是逻辑学与语言学的交叉研究学科。逻辑语义学以自然语言的意义为研究对象,利用现代逻辑为其研究工具,探索复合表达式的意义如何由其组成部分的意义组合而来[3]。它与哲学、逻辑学、语言学、数学、计算机科学、人工智能和模型论等诸多学科息息相关,是一个横跨多个研究领域的知识体系[4]。由于机器翻译规则的统一性,同一类型的翻译错误会反复出现,将逻辑语义学中的命题逻辑引入到机器翻译的译后编辑系统中,不仅能够有效理清句法之间复杂的逻辑关系,而且能够帮助改进译后编辑的算法,从而改进那些重复率高的翻译错误,提升机器翻译的质量。
一、研究设计
(一)研究内容
本文通过对同济大学汽车学院的“汽车技术文献翻译语料库”中某一知名品牌汽车操作手册中随机抽取的英语原语、机器译文和人工译文各2 500条语料进行对比分析,发现连接词“and”出现频率较高(占16.8%),但其翻译效果却不如人意。为此,本研究将在科技文本翻译的语境下,对连接词“and”的机器翻译错误进行描述和分析,归纳出机器在处理这类文本时所表现出的错误特征,并运用逻辑语义表达式为译后编辑系统的改进提供形式化的句法规则。
(二)研究方法
本研究主要采用定性分析法来对随机抽取的2 500条汽车手册中含有连接词“and”的语料进行系统分析,并将机器译本和人工译本加以比较,从而对不同句法结构中连接词“and”的错译现象进行归纳总结。
二、不同句法结构中连接词“and”错译现象分析
在英语中,“and”是一个十分普通的连词,用来连接词、短语或句子,其基本意义相当于汉语的“和”或“并且”。这个词看起来很简单,有时甚至可以忽略或不译,但是在特定专业范围内,如本文涉及的汽车技术文本中,“and”有多种含义和用法变化,其翻译往往牵涉到整个句子的句法结构,能否对其进行准确恰当的分析直接影响到翻译效果和受众的理解程度。本研究希望通过分析归纳不同句法结构中“and”的错译现象,还原句子本身的逻辑语义关系,进而为译后编辑系统的改进提供一定的启示。
(一)“动词短语+多个并列宾语”的错译
例1Source Language(以下简称SL):The automatic headlight beam level control system mainly consists of the AFS ECU,rear height control sensor,andtwo headlight leveling motors.
Machine Translation(以下简称MT):自动前灯梁水平控制系统主要由AFS ECU组成,后高度控制传感器并且两盏前灯使电动机成水平。
Human Translation(以下简称HT):前大灯光束高度自动控制系统主要包括AFS ECU、后高度控制传感器和两个前大灯光束高度调整电动机。
例2SL:Remove the 3 clipsandtrim.
MT:除去3个夹子并且整理。
HT:拆下 3 个卡子和装饰板。
在例1中,动词短语“consists of”后接三个并列的名词短语“the AFS ECU”“rear height control sensor”和“two headlight leveling motors”,但机器未能识别动词短语后的三个并列宾语,而将名词短语“two headlight leveling motors”识别为与动词短语“consists of”并列的谓语成分,因而将“and”误译为“并且”。同样,在例2中,机器将“trim”识别为动词,从而造成句意不通。虽然“和”与“并且”都表示并列,但连词“ 并且”在汉语中表示其连接的两个分句后者比前者在意义上更进一步[5]。因此,要解决这一类型的句法翻译错误,笔者建议在译后编辑系统中将一些汽车手册中复现率较高的术语从词性上加以限制,从而使机器能够界定并识别出并列对象。
(二)多个“动词短语+状语从句”的错译
例3SL:Turns on when door is openandoff when door is closed.
MT:打开门营业什么时候和远,途经关闭什么时候。
HT:车门打开时开关打开;车门关闭时开关关闭。
例4SL:This switch turns off when door is lockedandon when door is unlocked.
MT:这开关关闭,到那时门锁住和在上到那时门被开锁。
HT:车门锁止时此开关关闭;车门解锁时此开关打开。
例5SL:This switch turns off when system is setandon when system is unset.
MT:当系统被确定并且在系统是未装配的时导通时,这个开关关闭。
HT:系统设置时此开关关闭,系统未设置时此开关打开。
由以上三个例子可以看出,机器翻译在处理稍微复杂的句型结构时,其准确度大大下降,句法词序错乱。进一步分析便会发现,由于“and”之后省略了相同的动词“turn”,导致机器误以为“and”前后并列了两个形容词。在这种情况下,译后编辑系统需要使动词“turn”对副词“off”进行约束,从而使“on”和“off”搭建起联系,这样就很容易发现,“and”在这里表示对照,可译为“而”或直接用分号表示。
(三)多个“并列小句”的错译
例6SL:Engine switch off,all doors closedanddriver side door key cylinder neutral position.
MT:发动机关掉,全部门关上和司机门钥匙汽缸空挡的位置。
HT:发动机开关关闭,所有车门关闭且驾驶员侧车门锁芯处于中间位置。
例7SL:Engine switch on,luggage compart-ment door closedandluggage opener switch not pushed.
MT:发动机打开,行李舱架门关闭和行李打开开关接通不按。
HT:发动机开关置于ON位置,行李箱门关闭且未按下行李箱开启器开关。
经分析发现,机器将上述两个例子中的“and”翻译为“和”,主要是因为上述例子包含三个小句,这三个小句看似是并列的,其实不然。在例5中,“Engine switch off”实际上暗含一种条件,而例6中“all doors closed”和“driver side door key cylinder neutral position”是“Engine switch off”所引发的结果,因此,“and”实际上并列的只有后两个小句。可以进一步假设,如果这句话以完整的形式出现,即“(If) Engine switch(is) off,all doors(are) closedanddriver side door key cylinder(is in) neutral position”,那么这句话中的内在逻辑关系便可理清,机器翻译的准确度也将会大大提高。例6属于同一类型的问题,所以在进行这类句型的翻译时,找出内在的逻辑关系就显得尤为重要。
(四)“并列句”的错译
例8SL:If door is not completely closedandtransmitter LOCK switch is pressed,this function makes buzzer sound for 10 seconds.
MT:如果门没被完全关闭并且发送器锁开关被压,这个功能使蜂鸣器为声音10秒。
HT:如果车门没有完全关闭而按下发射器锁止开关,此功能使蜂鸣器鸣响 10 秒。
例9SL:When the rear door sunshade is operatingandthe engine switch is turned from on to off,check that the operation continues.
MT:当后门阳伞正操作和从到离开上发动机开关被改变时,操作继续的检查。
HT:后门遮阳帘工作且发动机开关从 ON 转至 OFF 位置时,检查并确认其继续工作。
在例8中,“and”的错译主要是由语义范畴造成的。在英语里,“and”常可将两种不同性质的陈述连接起来,表示对比或转折的意思[6],而在汉语里,“并且”只能表示递进,不能表示转折。在以上例句中,“door is not completely closed”与“transmitter LOCK switch is pressed”是转折关系,此时的“and”可以由“but”替代。由于在英语里“and”有转折的作用,在本句里就可以用它将存在转折关系的前后两部分连接起来,而在汉译时,译文里必须将“并且”改成“而”,这样句子前后两部分的关系才能被正确反映出来。这一例子给我们的启示是,要打破在机器翻译中原语词汇和目的语词汇的一一映射,将句法和语义相结合,才能提高翻译质量。而在例9中,“and”表示的却是递进关系,“the rear door sunshade is operating”和“the engine switch is turned from on to off”两个条件共同满足时,才需要“check that the operation continues”。由此可见,例8和例9虽然句型相似,但“and”表示的含义却大不相同,此时需要将“and”放在具体的语境下进行语义辨析。
(五)复杂句中“并列多个主句”的错译
例10SL:When the electrical key transmitter is brought near the electrical key antenna,the possibility of wave interference decreases,andit can be determined if wave interference is causing the problem symptom.
MT:当电关键发送器被在电关键天线附近带来时,波干扰的可能性减少,并且如果波干扰正引起问题症状,它可能被确定。
HT:将电子钥匙发射器带到电子钥匙天线附近时,波干扰的可能性减小,可以确定波干扰是否是导致故障症状的原因。
例11SL:If performed on a speed tester,the front wheels do not rotateandthe vehicle will determine that the vehicle is stopped.
MT:如果在一速度检测器上执行,前轮不旋转和车辆将确定车辆停止。
HT:如果用速度检测仪检测,前轮不转,则判定车辆停止。
例10和例11中,“and”看似连接了两个并列的主句,但是稍加分析就可以得出,这两个主句存在着因果关系。例10中,只有“波干扰的可能性减小”,才能“确定波干扰是否是导致故障症状的原因”;而在例11中,“前轮不转”才可以“判定车辆停止”。因此,“and”在这里的作用相当于“so”。在翻译时,应将“and”前后两部分之间的这种关系表达出来。在汉语里,“从而”这个词是表示上文是方法或原因,下文是目的或结果,用在此处来表达两个主句的关系十分恰当。
(六)“介词+多个并列宾语”的错译
例12SL:For reassembly purposes,mark the installation positions of the differential case bearing outer raceanddifferential side gear shaft snap ring.
MT:对重新聚集目的来说,标明承担外圈安装位置和不同边用具轴开口环的不同案件。
HT:出于重新装配的需要,标出差速器壳轴承外座圈和差速器半轴齿轮轴卡环的安装位置。
例13SL:Perform the tooth contact pattern inspection for the differential ring gearanddrive pinion.
MT:为不同戒指齿轮进行牙齿接触图案检查并且驱动翼。
HT:检查差速器齿圈和主动小齿轮的齿接触斑点。
例14SL:Support the rear suspension member with an engine liftandattachments.
MT:支持后发动机的悬挂成员振奋和附件。
HT:用发动机举升机和附加支撑块支撑后悬架横梁。
从以上三个例句分析可以得出,在“介词+ NP + and + NP”这种结构中,机器往往不能识别出介词所管辖的范围,所以导致输出的翻译结果有误。在上述三个例子中,无论是介词“of”,“for”还是“with”,其约束范围均是由“and”并列的两个名词短语,而机器却误将第一个名词短语作为介词的约束对象,而将第二个名词短语机械地并列在后面。因此在译后编辑过程中,可以通过用逻辑表达式,将主干成分提取出来,再将这些成分进行排序,通过规则的运用限定这些成分的翻译次序,这样翻译的准确性将大大提高。
(七)连接词“and”常见错译类型总结
通过以上的分析和归纳,笔者发现连接词“and”在汽车手册这一文本语境下的错译类型主要体现在三个方面:“and”连接多个名词性短语、“and”连接多个小句以及“and”连接多个句子,详见表1。
三、连接词“and”的命题逻辑表达式与译后编辑
逻辑语义学强调计算的思想、逻辑规则的采用和逻辑推演的套路,这使其成为分析自然语言句法语义构造组合的有力工具[7]。由于科技文本的翻译需要精确的语义解释,而且其语用功能较弱,因此,笔者大胆尝试将数学和逻辑语言引入到机器翻译的译后编辑中。蒙太格认为,每条句法规则都有一条与之对应的语义规则,句法成分与语义成分之间是同态映射关系,所有表达式的意义都是由其直接构成成分的意义组合而成,句法规则组合一次,对应的语义规则也组合一次[4]。基于以上“and”错译现象分析,可以发现句子结构一旦复杂,机器翻译的准确度就大打折扣,然而,在句法上要为每一句特例编制形式化的语法可能还不现实,语言的形式化本身也是一项艰深的难题[8]。因此,笔者通过归纳连接词“and”的典型错译类型,利用以下的逻辑表达式(见表2),将这些句子隐含的逻辑关系显性化,从而提高机器对汽车手册中含有连接词“and”语料的句法识别度,改进翻译质量。
表1 连接词“and”常见错译类型总结Tab.1 Summary of common mistranslation types of connective word “and”
表2 “and”常见错译类型的逻辑表达式Tab.2 Logical expressions of semantic relations toward connective word“and”
由表2可以看出,对连接词“and”常见的错译类型进行归纳后,笔者用形式化的语言分别将每种错译类型进行描述,并推导出其正确翻译的逻辑表达式。以表2中例10和例11来分析,“and”连接多个句子,S1和S2作为共同条件可以导致S3的结果,而S1又是S2的前提条件,便可推导出其正确翻译的逻辑表达式为[S1→S2]→& S3,而这里的“and”便可译为“那么,则”。
将这些逻辑表达式转换成机器翻译算法纳入到译后编辑系统中,将有助于提高机器翻译的准确性。
在此需要特别强调的是,这些汽车语料中的“and”常见错译句法结构可以用逻辑表达式呈现出来,根据这些表达式可以改进译后编辑的算法,这虽然可以从句法结构的整体上提高机器翻译的准确性,但在局部语境中,“and”究竟是翻译为“和”“并且”还是表示转折的“而”等,还需人工进一步核对校验。
四、结束语
and虽然是一个小词,却是一个使用频率很高的词,其背后包含着复杂的句法逻辑关系,其语义远非我们所认为的“和”“而且”那样简单。在不同的语篇中,它有多种多样的词义,其具体译法也要根据不同的语境而定。在汽车技术文件这一限定领域内,能否准确翻译“and”,直接关系到译文的语气是否顺畅,逻辑是否严密,句意是否连贯,结构是否清晰。本文的上述诸例并未展现出and的全部语义功能,只是对连接词“and”的典型错译进行了深度的句法分析,初步尝试从逻辑语义的角度改进机器翻译译后编辑系统。但通过对“and”在汽车手册中常见的翻译错误类型进行归纳和分析,据此推导出正确翻译的逻辑表达式,缩小了对语言进行形式化处理的范围,有助于提高机器翻译的可懂度和忠实度,并为机器翻译在这一领域的译后编辑软件的改良提供启示。