APP下载

HNC 理论关系句研究及其机器翻译改进

2019-11-30杨政

现代计算机 2019年27期
关键词:省略双向语义

杨政

(信息工程大学洛阳校区,洛阳 471003)

0 引言

自然界万事万物永远不是孤立存在的,千丝万缕的关系将事物联结起来。但是自然语言对于两个事物间关系的描述有多种类别。概念层次网络理论(Hierarchical Network of Concepts,HNC)是关于自然语言理解的理论体系,其目标是以概念联想脉络为主线,建立一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式,使计算机获得消解模糊的能力[1]。从人类大脑对语言的感知理解出发,HNC 总结了自然语言对万事万物进行总体表述的六个基本角度,也是一切事物发生、发展和消亡的六个基本环节,即作用、过程、转移、效应、关系和状态,称为作用效应链。

在HNC 的语义网络中,关系一级节点下有七个二级节点,是对关系七个侧面的描写,分别是结合与分离、依存于排斥、支持与反对、主宰与从属、使用与舍弃、拥有与失去以及适应与干扰。这些二级节点作为关系概念,完成对关系类别的划分和描述,其纯净性是越来越弱的,前两个是纯净的关系概念,而其后的关系概念都是与其他的基元概念有交叉关联性的,例如支持与反对是与反应关联的。

HNC 研究是通过以概念联想脉络为主线,建立一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式[1]。HNC 通过建立自然语言概念体系模式以及自然语言语义块和语句的表示模式等,使计算机可以模拟人类感知语言的过程。HNC 从语言表述的抽象概念出发设计行车了三大语义网络,分别是基本概念、基元概念以及逻辑概念[2]。

基本概念是对万事万物基本特性的描述,例如时间、空间、质、量、度等。基元概念是自然语言对自然中万事万物进行表述的角度,根据作用效应链的六个环节描述,这六个环节是作用、过程、转移、效应、关系、状态。其中关系处于第五个环节。逻辑概念则是各类语义块的标识和说明符。

本文从HNC 理论出发,分析自然语言对具有双向特征基元概念为关系形成的关系句进行分析,从双向关系句以及扩展双向关系句两个侧面。随后提出算法改进这两类关系句的机器翻译,并进行实验验证。

1 以具有双向特征基元概念为关系的关系句分析

HNC 关系句就是对关系的描述。在对关系进行描述时,除了关系本身,还需要表述关系的双方,在关系句表示式中用RB1 和RB2 表示。通过关系双方参与度和主动权的不同,关系句分为单向关系句、双向关系句、扩展单向关系句以及扩展双向关系句。其中,单向关系句和双向关系句可统称为基本关系句,两类则可以统称为扩展关系句。

虽然基本关系句可分为单向关系句和双向关系句,但是对于关系一级节点下的七个二级节点来说,有的基元概念基本上只存在单向关系句,例如45 使用与舍弃、46 拥有与失去。同样,有的基元概念基本只存在双向关系句,例如41 结合与分离、42 依存与排斥。而43 支持与反对、44 主宰与从属和47 适应与干扰则是兼有单向关系和双向关系特性。因此,在对以具有双向特征基元概念为关系形成的关系句中,本文只分析41、42、43、44 和47 形成的双向关系句和扩展双向关系句。

1.1 双向关系句

双向关系句的语句表达式为:RmJ=RB+R。其中,m 取值为关系一级节点下的二级节点编码,由于本文主要分析具有双向特征基元概念为关系形成的关系句,因此m 取值为不包括5、6。RB 是指关系双方,包括RB1 和RB2,R 指的是关系本身。在双向关系句中,关系双方RB 内的RB1 和RB2 间一般有语义块组合标识符,如“和、同、与”等。

例如:西藏和平解放以来,很多著名的宗教界人士同中国共产党政府合作。(R34J)

句中,RB1 是很多著名的宗教界人士,RB2 是中国共产党政府,RB1 和RB2 都属于pp 类概念,RB 内部的语义标识符为“同”。在这一句中,关系双方之间不仅有明确的标识符,还具有一定的对仗性。

例如:挪威奥斯陆大学人权研究所和越南胡志明政治学院人权研究中心合作。(R34J)

句中,RB1 挪威奥斯陆大学人权研究所和RB2 越南胡志明政治学院人权研究中心就具有比较好的对仗性,其RB 内部语义标志符为“和”字。但是,关系双方之间也可能不显含标识符,而是隐含的。

例如:甲乙双方共同协商。(R74J)

在该句中,RB1 和RB2 由一个词语来表达,这样的关系双方就被隐藏在一个词语“甲乙双方”中,不会显含标识符。

除此之外,双向关系句还有一个特征,即在出现语义标志符时,特征语义块R 的上装常常分离,放于语义标志符的前面。

例如:2010 年以来,中国即将与联合国儿童基金会驻华代表处开展合作。(R34J)

句中,RB 内部的语义标志符“与”前的“继续”,就是特征语义块“继续开展合作”的上装,被分离到语义标志符之前。

例如:中国市场的很多做法还不能与国际市场接轨。(R4J)

句中,特征语义块R 的上装“还不能”就被分离到RB 内部的语义标志符“与”之前。R 应当是“还不能接轨”。

1.2 扩展双向关系句

在以具有双向特征基元概念为关系形成的关系句中,除了双向关系句,还有扩展双向关系句。扩展双向关系句比基本关系句多了关系双方的共同表现RC,RC 一定块扩。扩展双向关系句的句类表示式为:Rm0J=RB+R+RC。以上一节的几个句子为例,其加上关系双方的共同表现RC 的扩展双向关系句如下,其中加下划线的部分是RC。

西藏和平解放以来,很多著名的宗教界人士同中国共产党政府合作共事,参政议政。(R304J)

挪威奥斯陆大学人权研究所和越南胡志明政治学院人权研究中心合作,翻译出版了人权著作。(R304J)

甲乙双方共同协商决定停车费的收取标准。(R704J)

2010 年以来,中国即将与联合国儿童基金会驻华代表处开展合作,举办《儿童权利公约》宣传、培训活动。(R304J)

由于RC 是关系双方的共同表现并且一定块扩,所以RC 的格式是!31J 省略格式,省略的JK1 就是扩展关系句中的RB1 和RB2。

例如:中国与外国企业合作生产了MD-82、MD-90等大型客机。(R304J)

句中,中国与外国企业是关系双方RB,关系双方的共同表现RC 是生产了MD-82、MD-90 等大型客机,RC 块扩且省略了JK1,就是RB。

除此之外,关系句的关系双方RB1 和RB2 基本都是pp 类的概念,并且大部分关系双方都不含C。

例如:1987 年,中国同联合国合作在北京召开了“世界裁军运动”区域讨论会。(R304J)

在扩展双向关系句中还有一个特殊现象,由于特征语义块R 之后的关系双方的共同表现RC,并且RC是!31J 的省略格式,省略了JK1,因此R 之后一般直接跟RC 的E,从而形成了动词连见的情况。

例如:中国和日本于1986 至1992 年合作调查黑潮出现的情况。(R304J)

在这句中,特征语义块R“合作”和RC 的E 即“调查”形成的动词连见。但是这样的两个动词不属于同一层次的动词,它们是广义上的因果关系,因此前面的动词是Ep,而后面的动词是Er。

2 机器翻译改进方法及实验

本文从双语语料库中选取了25 条双向关系句和40 条扩展双向关系句,对国内评估较高的在线机器翻译网站的汉译英进行了测评,根据测评的结果对两种句类的翻译进行改进,主要从改动翻译的原文输入入手,再将输出修改为符合语法规范的句子。改进算法如下:

算法 扩展双向关系句翻译

(1)定位该句语义标志符R 的位置,Rm0J=RB+R+RC;

(2)定位RB 内部的语义标志符,若有则将RB1和RB2 分开,若没有显含语义标志符则直接翻译;

(3)补充RC 省略的E,翻译RC;

(4)将(2)和(4)连接。

改进后的翻译结果统计显示,25 条双向关系句改进前的正确率为88%,改进后为92%,40 条扩展双向关系句改进前的正确率为70%,改进后为82.5%。几个典型例句举例如下:

①1987 年,中国作为东道主同联合国合作在北京召开了“世界裁军运动”区域讨论会。

原译:In 1987, China hosted a regional seminar on the "World Disarmament Movement" in Beijing as a host country in cooperation with the United Nations.

改进:In 1987, China in cooperation with the United Nations, hosted the Regional Symposium on World Disarmament Campaign in Beijing.

②几名教练还分头同队员们谈心。

原译:Several coaches also talked with the players.

改进:Several coaches also spoke to the players separately.

③中国政府还同有关国际组织密切合作,组织有关人员出国考察学习。

原译:The Chinese government has also worked closely with relevant international organizations to organize relevant personnel to study abroad.

改进:Chinese government has in close cooperation with related international organizations, sent people abroad to study.

从改进结果看,由于双向关系句多是简单句,因此原译文正确率就相对较高,改进效果不明显,而扩展双向关系句由于涉及到省略格式的RC,因此改进效果较好。

3 结语

本文以具有双向特征基元概念为关系的关系句为内容,分析了双向关系句和扩展双向关系句,并根据分析要点和机器翻译测评结果,对这两类句式的机器翻译进行改进。实验结果显示,在对这两类句式进行分析后在分部分进行翻译的效果,比直接进行翻译的效果要好,并且对更为复杂的扩展双向关系句翻译提升效果更为明显。

猜你喜欢

省略双向语义
真实场景水下语义分割方法及数据集
基于双向特征融合的交通标志识别
降低寄递成本需双向发力
“省略”讲解与训练
关于单、双向板梁板用钢量的对比分析
完善刑事证据双向开示制度的思考
“吃+NP”的语义生成机制研究
中间的省略
汉语依凭介词的语义范畴
省略