APP下载

基于组合范畴语法的现代汉语两种结构歧义的消解

2019-01-31张晓君林胜强

关键词:歧义词条东亚

张晓君,林胜强

(四川师范大学 逻辑与信息研究所, 四川 成都 610066)

一、引言

自然语言中的歧义问题是自然语言中常见的语言现象,其实质是自然语言的语义与句法的不对应问题。自然语言中的歧义有多种类型,但最常见、最难消解的是“结构歧义”。结构歧义是自然语言计算机处理的巨大障碍,对其进行深入研究具有重要的意义,因此受到语言学、逻辑学、心理学和计算机科学等诸多领域的学者的青睐,学者们从不同视角进行了探讨,并提出了诸多歧义消解方案。

对歧义问题的研究可以追溯到亚里士多德的《工具论·辨谬篇》。国外计算机学界为了解决英语中的结构歧义,提出了多种解决方法,比如:确定性剖析算法、消移剖析算法、线图剖析算法、超前分析策略、启发式分析策略,等等[1]。国外逻辑学界的学者也发展出了多种自然语言逻辑理论,用于英语结构歧义的消解,比如:兰贝克演算、范畴类型逻辑、组合范畴语法,等等。

我国学者从多个视角使用不同方法试图解决汉语中的不同歧义问题。例如:赵元任就对汉语中的歧义问题进行了探讨[2],朱德熙研究了汉语句法里的歧义现象[3],冯志伟研究了中文科技术语中的结构描述及潜在歧义[4]、探究了自然语言处理中的歧义消解方法[1],孙国俊把认知解释机制引入了语言各层面的歧义识别和消解过程[5],于泽等探讨了书面韵律信息与词汇偏向在歧义句消解中的作用[6],吴明军等探究了加工深度对二语代词消解的影响[7],等等。

虽然国外学者提出了诸多歧义消解策略,但是由于这些策略基本上是针对英语等外语的歧义问题的,而汉语与英语句式迥异,这些方法不能生搬硬套地用于解决汉语歧义。加之汉语歧义种类繁多,各具特色,国内学者的歧义消解策略还不够成熟,而且从逻辑推演和计算的角度解读汉语歧义的文献更是寥寥无几,因此有必要把汉语歧义问题的研究深入下去。本文从逻辑学的视角对现代汉语中常见的两种结构歧义进行消解。

二、现代汉语中常见的两种结构歧义句

自然语言中的歧义,可以分为词汇歧义和结构歧义[1]。常见的词汇歧义就是英语单词中的一词多义和兼类现象。比如:cell,作为名词理解时,有:“小牢房、细胞、孢子囊、支部、电池、单元、云泡、坟墓”等含义;作不及物动词理解时,有“住牢房”之义;作为及物动词理解时,有“(蜜蜂)贮……于巢室”之义。不论是英语,还是汉语,结构歧义都有多种。

本文将处理现代汉语中的如下两种常见的结构歧义句:

(1)形容词不同管辖范围产生的歧义。当一个形容词放在多个名词之前时,由于形容词管辖范围不同,就会产生结构歧义。实例一“这栋楼是新学生宿舍”,第一种解读是“这栋楼是新/学生宿舍”,第二种解读是“这栋楼是新学生/宿舍”。

(2)两个以上名词构成名词词组所产生的歧义。这种歧义是对名词之间的限制关系的不同而产生的。实例二“张欢加入了东亚语言研究会”,第一种解读是“张欢加入了东亚/语言研究会”,第二种解读是“张欢加入了东亚语言/研究会”。

三、相关知识准备

组合范畴语法(Compostional Category Grammar,简称CCG)认为,自然语言的毗连生成是一种函项运算,为了揭示这种运算的规律,就需要对自然语言的表达式进行分类编码[8]。其中有些类别作为函项,而另一些类别则是函项运算的主目[9]。区分这些类别的编码就是范畴,引入两个毗连算子“”与“/ ”,就可以通过范畴之间的运算来刻画自然语言的毗连生成[10]。“”叫作左毗连算子,表示其论元范畴在左边;“/ ”叫作右毗连算子,表示其论元范畴在右边。例如,“学生”的范畴为n/n,作为函子范畴。而“宿舍”的范畴为n,作为论元范畴。因此,二者毗连后的“学生宿舍”的范畴就是n。组合范畴语法满足“句法和语义的对应原则”[11],而且也符合意义组合原则这个逻辑语义学的基本思想,组合范畴语法因此受到了极大的关注[12]。

组合范畴语法中的范畴传达了两类信息:它们刻画了一个词条如何同时从句法和语义两个方面与另一个词条进行毗连。根据组合范畴语法的思想,分析上述三类结构歧义句所需要的词条范畴的指派可以确立如下的词库:

专有名词(比如:张三、东亚):np

普通名词(比如:楼、学生、宿舍、语言、研究会):n

作形容词的专有名词(比如:东亚):np/n (CCG一词多范畴的原则)

作形容词的名词(学生、语言):n/n (CCG一词多范畴的原则)

及物动词(比如:加入了):(nps)/np

判断动词(比如:是):(nps)/n

形容词(比如:新):n/n

毗连普通名词的形容词(比如:新):(n/n)/n (CCG一词多范畴的原则)

限定词(比如:这栋、那个):np/n

需要说明的是:同一词条在不同语境下,由于其句法作用和语义所指可能不同,则需要根据具体情况指派不同的范畴。按照组合范畴语法的词汇主义思路,允许为同一词条指派多个不同的范畴。本文从词条角度来挖掘结构歧义句的根源。

进一步说,在组合范畴语法中,可以按照词条的范畴对应逻辑类型,进而给词条匹配相关的逻辑表达式以表征其逻辑语义。在上文的词库中,给每个词条指派范畴和对应的逻辑表达式,如给“张三”指派“张三′:np”。本文采取汉字右上角加一撇来表示该词条的逻辑语义,即表征个体的逻辑常项,其他词条可以类似处理。

下面给出生成构造本文两类结构歧义句所需要的组合范畴语法规则:

其中,A、B、A/B和BA表示语言表达式的句法范畴;字母f和a表示语言表达式的逻辑语义,f(a)表示f和a的贴合运算。

四、现代汉语结构歧义句的消解

根据上文的相关知识,利用组合范畴语法的推演树,可以对现代汉语中的结构歧义句进行消解。下面对前面两个实例的结构歧义进行消解。下文图中的lex表示词条。

实例一 “这栋楼是新学生宿舍”的两种解读的完整的推演树分别如图1和图2所示。

图1 “这栋楼是新学生宿舍”的第一种解读“这栋楼是新/学生宿舍”的推演树

图2 “这栋楼是新学生宿舍”的第二种解读“这栋楼是新学生/宿舍”的推演树

对图1和图2进行对比就会发现:(1)由于第一种解读“这栋楼是新/学生宿舍”中“学生”与“宿舍”不是并列关系,而是修饰关系,因此“学生”被指派的是形容词范畴n/n,而不是普通名词的范畴n,二者毗连得到“学生宿舍”的范畴是n,“新”则可指派普通形容词的范畴n/n;(2)第二种解读“这栋楼是新学生/宿舍”中的“新学生”中“学生”是普通名词,其范畴是n,“新”向右毗连“学生”而得到的“新学生”是作为形容词来修饰“宿舍”的,因此“新学生”的范畴是n/n,故“新”的范畴是(n/n)/n。由此可见,在具体语境中,词条的范畴是由其句法功能来决定的,即:同一词条如果在不同语境下的语义和句法功能不同,则需要根据实际情况指派不同的范畴[注]图1和图2中的限定词“这栋”,其逻辑式是比较长的带逻辑量词的表述,这里暂时不展开,简化表述为:这栋′(楼′)。。

实例二 “张欢加入了东亚语言研究会”的两种解读的完整推演树分别如图3和图4所示。

图3 “张欢加入了东亚语言研究会”的第一种解读“张欢加入了东亚/语言研究会” 的推演树

图4 “张欢加入了东亚语言研究会”的第二种解读“张欢加入了东亚语言/研究会”的推演树

对比图3和图4可以看出:在图3中先利用A≻规则对“语言”与“研究会”进行毗连,然后再次利用A≻规则把得到的“语言研究会”与“东亚”进行毗连,从而得到第一种解读“张欢加入了东亚/语言研究会”;在第一种解读中,“语言”与“研究会”是修饰关系,而非并列关系,因此“语言”的范畴为n/n,二者毗连后得到的“语言研究会”的范畴是n,因此修饰“语言研究会”的“东亚”的范畴是np/n。在图4中先利用A≻规则对“东亚”与“语言”进行毗连,然后再次利用A≻规则把得到的“东亚语言”与“研究会”进行毗连,从而得到第二种解读“张欢加入了东亚语言/研究会”;在第二种解读中,“东亚语言”与“研究会”是修饰关系,而非并列关系,因此“东亚语言”的范畴为np/n,而“语言”的范畴是n,故“东亚”的范畴是(np/n)/n。由此可见,同一语句可以根据实际情况,对同一词条指派不同的范畴及对词条进行毗连采取不同的先后顺序,即可达到歧义消解的目的。

五、结束语

综上所述,利用组合范畴语法的推演树,可以对现代汉语中由形容词的不同管辖范围以及两个以上的名词组成的名词短语所产生的这两种结构歧义句进行消解。结构歧义语句可以通过对同一词条指派不同范畴以及对推演树中词条毗连采取不同的先后顺序,来达到歧义消解的目的。从本文结构歧义句的消解实例可以看出:(1)如果一个语句有两个不同的推演树,那么此语句就有两种不同的语义解读;(2)如果同一词条在不同语境下的语义和句法功能不同,则需要根据实际情况指派不同的范畴;(3)同一语句的不同推演树中指派给同一词条的范畴不一样,对词条毗连的先后顺序不一样,正是这些“不一样”,使得我们可以对现代汉语中的结构歧义句进行消解。

事实上,现代汉语中的结构歧义句还有很多种,例如,由于连词“和”的不同管辖范围也会产生结构歧义[1]。实例如:“我家里有爸爸和妈妈的同学”,第一种解读是“我家里有爸爸,还有妈妈的同学”,连词“和”管辖“爸爸”及“妈妈的同学”两个并列的普通名词,在这种解读下,可以得出:我家里至少有两人;第二种解读是“我家里有既是爸爸的又是妈妈的同学”,连词“和”管辖“爸爸的”及“妈妈的”两个并列的形容词,在这种解读下,可以得出:我家里可能只有一人。利用本文的方法,也可以消解此类结构歧义。

由于汉语语序灵活、语义复杂、各类歧义句繁多等原因,对汉语进行计算机处理任重而道远,因此除了需要不同领域的学者从不同的视角加以潜心深入的研究外,还需要各领域的学者加强合作与交流。例如:“张三伤心地看着李四亲吻自己的妻子”,请问:李四亲吻的是李四的妻子呢?还是亲吻的是张三的妻子?事实上,这一语句是由反身代词“自己”指代不明而造成的歧义,对其进行指代消解,也就完成了歧义消解。如何从逻辑推演和计算的角度来消解这类歧义,限于篇幅原因,笔者将另外撰文论述。

致谢:本文得到了邹崇理研究员悉心指导和耐心多次修改,作者在此致以最真诚的谢意和祝福!

猜你喜欢

歧义词条东亚
以泉会友,共享东亚文化盛世
欧洲第一份研究东亚视觉艺术的西方语言杂志——《东亚艺术》
现代汉语歧义类型的再讨论
利用简单的公式快速分隔中英文词条
eUCP条款歧义剖析
语文教学及生活情境中的歧义现象
学霸“三小只”
基于关联理论的歧义消除研究
未定的东亚多边体制与能动的中国东亚政策