基于HNC理论机器翻译系统中语义块主辅变换研究
2022-05-14王婷婷
王婷婷
(淮北师范大学外国语学院,淮北 235000)
1 HNC 的机器翻译概述
HNC属于一种自然语言处理技术,它具有原始创新特点,此技术主要以研究员黄曾阳建立的概念层次网络理论作为指导,其概念层次网络的英文名简称为HNC[1]。HNC属于一种自然语言空间向另一种自然语言空间映射,此种映射由3部分构成,如图1所示。
从图1中可以看出自然语言空间映射主要由3部分构成,这3部分分别对应3个处理时期,即源语空间向语言概念空间映射所对应的是源语分析时期,语言概念空间内部调整对应的是过渡处理时期,语言概念空间向目标空间反映射对应的是目标语形成。
图1 自然语言空间映射构成
有关HNC研究指出,制约传统机器翻译系统健康发展最重要的在源语分析与过渡处理这两个时期处理是否充分:一源语分析是否充分,也就是对源语理解是否到位;二过渡处理是否充分、到位[2]。
与三个处理时期相匹配,HNC机器翻译系统引擎重在3大模块,如图2所示。
图2 HNC机器翻译系统引擎
在这3个模块中,最重要的模块为过渡处理模块。它属于一种转换器,主要功能就是将源语言向目标语言转换。在机器翻译过程中,对于两种不一样的语言,必将存在语句格式差异,势必会引发语言表达形式出现迥异[2]。所以,要对两种语言在表达形式上的不同进行揭示,然后在揭示不同原则上产生一些相互贯串的法则,这是无论哪种方式的机器翻译系统都要进行处理的核心问题。HNC机器翻译系统引擎中过渡处理模块产生的原因是为了对这个问题进行全面处理,其处理内容主要包含6大处理过程,分别是“2转换”“2变换”“2调整”,具体如图3所示[3]。
图3 过渡处理模块主要构成
图3中的6项处理对于建立HNC机器翻译系统引擎具有重要的价值与作用,相关研究均做了论证,比如语料实验、理论预期研究等。HNC机器翻译系统能否对雪线困境(指机器翻译系统很难超越的译准率极限——70%)进行突破,主要是由“6项过渡处理”研究的深度与广度决定的[4]。对于“2转换”全部内容与“2变换”之一的语义块构成变换,早有了相关论文与著作对其进行过具体研究;“2变换”的语义块主辅变换有相关专家对其进行研究,不过还是处于初级探索阶段,大部分还仅停留在宏观研究方面,对于主辅语义块变换也只是对其进行了大概总体规划研究,还未进入到对其进行具体微观方面的研究,以及没有制订比较详细的译文法则与制度等[5]。所以,对于语义块主辅变换应该进行更加具体的微观研究,并制订相关的法则与制度。
2 语义主辅换
2.1 语义块定义与分类
语义块是指在语句中相对而言比较完善的语义低级别单位,是对句子理解的最基础元素。前文分析过语义块分为主语义块与辅语义块。主语义块又分为4种类型,分别为特征语义块,即E块;作用者,即A块;对象,即B块;内容,即C块;其中,A、B、C块共同称作广义对象语义块,记作为GBK,而E块为特征语义块,即对句子类型特征语义块进行描绘,如表1所示。主语义块为句子中最重要的组成部分,其属于句子类型的函数,语句中主要由主语义块与辅语义块两部分组成。辅语义块主要通过次要要素作为中心而产生的语义块,为语境空间所提供相关背景知识;辅语义块大概与汉语传统的状语句法相类似,主语义块从形式上看与汉语传统的主语、谓语、宾语以及补语等句法比较类似[6]。
表1 语义块与汉语传统句法相对应对照表
不过在实际应用中,HNC理论中语义块概念和汉语句法成分还是有很大区别的。第一,汉语中句法成分的主语、谓语、宾语、定语以及状语的划分是完全立足于句法基础上,但是HNC对主、辅语义块进行区别是立足于语义基础之上,因此这两者立足点不同。第二,汉语句子语法成分在句子中的组成与句子格式联系较强。同一个短语在不同语句格式中承担不一样的成分,但语义块是属于句类函数。不同的句类对语义块数量、类型所起到的作用不同。语义块组成不会受语句格式的直接影响,只是会对语义块顺序产生影响。第三,汉语中的句子语法重点借助于综合形式对句子成分实现划分,再通过对不同句子组成进行分析,对这当中的相对稳定的搭配、排列规律进行总结,通常称为句子语法或叫做句子成分[7]。由于自然语言句子变化多端,很难对其实际规律进行总结。所以只凭综合方法所获取到的句法规律,无法包括所有语言情况。对于同一语句,略作变动,采用传统语法表现出束手无策,比如:“压死学生的汽车”,这对于HNC理论而言,属于一个非常常见的要素句蜕,而在传统的语法中就表现出非常不好处理,其原因在于在传统的语法里并未深入到语义里面。因为HNC理论运用了演绎和综合两种相互结合的分析形式,通过从内至外把自然语言所有句子类型进行列举,避免了传统语法理论对一些发生变异的句子表现出毫无办法的状况[8]。还是以“压死学生的汽车”为例,倘若从HNC理论而言,此短语本质上就属于一个要素句蜕(实质上就是某一个句子因为所表现的需要而蜕变为短语),所以能够还原成为“汽车压死学生”原型结构,此要素句蜕标注式为“压死学生的汽车”。
辅语义块类型有方式Ms(Means)、工具In(Instrument)、途径Wy(Way)、条件Cn(Condition)、参照Re(Refer)、因Pr(Premise)、果Rt(Result)。辅语义块采用“fK”表示,与汉语句子语法中的状语类似,其大多数配置了相应的符号,称作辅语义块标记符。例如“将”“使”“让”等字,用在某一语句中,对它主语义块进行确定之后,余下部分均为辅语义块。
2.2 语义主辅换、原因析
语义块主辅变换主要包括2个变换,即“主”变为“辅”、“辅”变为“主”。“主”变为“辅”与句类转换有着非常密切的关系,“辅”变为“主”是本文主要研究内容。对于语义块的主辅变换,要依据语义块主辅变换相关制度与规则,将待译语言转变为翻译语言,即将前者的主语义块转换为后者的辅语义块,或者前者的辅语义块转变为后者的主语义块[9]。比如:“我国中央人民政府||将自始至终一直坚持与贯彻‖独立自主的和平外交政策,与全球各国、各地区‖构建与发展友好关系,一直以来均坚持反对‖强权政治与霸权主义,与全球各国共同维护‖全球和平,构建‖人类命运共同体,促进‖社会快速向前发展,推动‖人类共同进步。”译成英文为:“My country's Central People's Government‖will persist and implement from beginning to end,‖an independent foreign policy of peace,+with countries and regions around the world‖building and developing friendly relations,+always oppose it‖community with a shared future for mankind,+promote‖society develops fast,+promote‖humanity makes progress together.”
上文的汉语句子是一个由数个不同的小句构成的迭句句子集群,译成英文时,把全句的关键选取出来看成英文的主干,其它辅句依照与主句存在的逻辑关系将变成从句或者是一种独立结构搭建于主句之中。中文主语义块也由此转变成了英文的辅语义块。
2.3 语义主辅换应分
例:“以陈独秀创办的《青年杂志》为标志,我国进入新文化运动的发展时期。”标准英译文为:“Youth magazine founded by Chen Duxiu marked the beginning of a new period of development for New Culture Movement in China.”
从所列举的中文句子的首个小句子:“以陈独秀创办的《青年杂志》为标志”在英文句子中属于辅语义块,在中文句子中属于状语,对于整个语句而言,只起着辅助注释作用。因为中文句子中“以……为……”的句式有一定的语法配置功能,但是在英文没有相应功能的词语作对应。所以在中译英时,要实现辅—主变换[9]。
将源文与目标文两者进行对比,选取以下的主辅变换法则[10]:
中文句子中的“以A作为标志……”翻译成英文相对应的词语为“A marks……”;中文辅语义块中的“A”转换为英文中主语义块的GBK1;中文辅语义块中的“标志”转换为英文中主语义块的EK。
关于选择出来的辅—主变换法则,对它的有效性并不是很清楚,一定要进行相关检验,下面以谷歌系统翻译译文中文句子结果为例来简要分析语义块主辅变换在机器翻译系统中的应用。
谷歌系统将上文中文原文句子翻译为:"Youth Magazine"founded by Chen Duxiu convention signs,my country has entered the development period of the New Culture Movement."从以上译文中可知,第二小句"my country has entered the development period of the New Culture Movement."翻译得比较准确,一看就明白中文的意思,可是因为没有辅—主语义块变换法则,所以对照第一句辅语义块“以陈独秀创办的《青年杂志》为标志”的译文就让人摸不着头脑,倘若将前文所描述的辅—主变换法则选取出来,即“以A作为标志……”翻译成英文相对应的词语为“A marks……”放到谷歌翻译系统中,则理论译文结果是:"Youth Magazine"founded by Chen Duxiu convention marked(that)my country has entered the development period of the New Culture Movement."
从上述译文可知,尽管理论译文结果还不是非常完美,比如存在部分关系代词欠缺,不过与原来译文结果相比较,还是有了很大改进,让一个不太懂中文的外国人来读,还是能够理解原文的意思。
综上所述,对当前的机器翻译系统,加入一些较简单的主辅变换法则,能够使得翻译的质量得到大幅度提升。
3 结语
当前传统机器翻译系统还存在较多缺点,特别其翻译精准率还有很大提升空间,其产生的原因较多[11]。第一,由于人类语言非常复杂,且变化多端,不可能仅凭一些并不复杂的法则把所有特点全部列举出来;第二,传统机器翻译系统通常仅重视句子语法规律与语言形式,而忽略了语言真正含意、语言用法特点以及概念形式等,无法真正做到像人类的大脑一样能够对语言进行精准翻译;第三,自然语言理解属于一个复杂且长期动态变化的系统工程,倘若无法将各个方面基础工作做好,则机器翻译质量就很难有实质性提升。而HNC理论与传统语言学相比较,具有很大差异性,HNC理论利用概念联想脉络把人类大脑思维与自然语言特点相结合起来,完全有可能将人类理解语言的奥妙揭开。