广义量词理论:自然语言推理的简便工具*
2015-02-25黄朝阳张晓君
黄朝阳 张晓君
广义量词理论:自然语言推理的简便工具*
黄朝阳 张晓君
广义量词理论的基础是集合论。该理论注重广义量词的语义性质和推理特征的研究,比一阶逻辑具有更为强大的表达力。利用广义量词理论既能证明亚里士多德三段论的有效性,也能证明广义三段论的有效性,还能证明广义三段论的不同推理模式之间有可化归关系。由于广义量词普遍存在于自然语言中,广义量词理论的成果将有利于计算机科学中的知识表示和知识推理。
广义量词理论 广义量词 集合 广义三段论
在一阶逻辑中,量词只有两个:全称量词 “所有的”和存在量词 “有的”,分别用∀和∃表示。然而,在自然语言中还存在着大量无法刻画为一阶逻辑的标准量词∀和∃,又相当有趣的数学性质的量词,如 “大多数的” “许多” “无穷多个的” “至少三分之二的” “少数的”等。因而,一阶逻辑仅仅能够处理自然语言中小部分量化语句的推理,却无法处理其中大部分量化语句的推理。对一阶逻辑加以扩展势在必行,广义量词理论应运而生。广义量词理论既适用于一阶逻辑中的标准量词,又使得非标准量词的定义和表达成为可能。
20世纪五六十年代,在莫斯托韦斯基 (Mostowski,1957)[1]和林兹卓姆 (Lindström,1966)[2]工作的基础上,广义量词理论得以萌芽。20世纪80年代以来,在巴怀斯和库伯尔 (Barwise and Cooper,1981)、[3]肯南 (Keenan,1997)、[4]彼特斯和魏斯特斯塔尔 (Peters and Westerst hl,2006)、[5]塞曼尼克 (Szymanik,2009)[6]等人工作的基础上,广义量词理论获得了很大的发展,成果丰硕。广义量词理论主要研究的是广义量词的语义普遍性和逻辑推理性质,及其逻辑推演的可计算性 (computability)、复杂性 (complexity)。广义量词理论以集合论为基础。
较之一阶逻辑,广义量词理论的优越性主要体现在:(1)它可以合理地解释自然语言中许多直观上成立的推理,帮助计算机更好地进行知识推理。这是仅凭公理和推理规则去判断推理有效性的一阶逻辑难以比拟的;(2)利用它可以将逻辑句法与自然语言的句法密切对应起来,帮助计算机进行有效的知识表示;(3)它给出了广义量词一些重要的语义普遍特征,大大提高了我们进行自然语言信息处理的能力;(4)它处理现实问题的方式直观简洁,其成果有很大的普适性。[7]正因为如此,广义量词理论逐渐走进国内外一些著名逻辑学家的视野,得到重视并有深入研究。
一、广义量词理论的相关基础知识
广义量词既包括限定词a,an,the,还包括以限定词或其他量化关系指称而形成的一切名词短语NP。我们把表示
广义量词的名词短语称为量化表达式,把包含量化表达式的语句称为量化语句。不难看出,广义量词是一阶逻辑中的标准量词∀和∃的推广,而后者仅仅是前者的两个特例。[8]正如广义量词是四个亚氏量词的自然推广一样,广义三段论(generalized syllogisms)是亚氏三段论的自然推广。本文中,由广义量词所涉论元组成的集合用A,B,C表示,所涉论域用E表示,集合的基数用|X|表示,广义量词之间的关系用标准的集合论符号表示,广义量词则用其所对应的英语表示。
根据广义量词在集合论运算中有多少论元并且论元是什么的标准,可以把广义量词划分为 〈1〉类型量词、〈1,1〉类型量词、〈1,1,1〉类型量词等等。自然语言中存在最普遍的是 〈1〉类型量词和 〈1,1〉类型量词,它们分别表示集合的性质和集合之间的二元关系。常见的名词短语属于前一量词,大多数限定词属于后一量词。 “……比……更多”是〈1,1,1〉类型量词,该类量词具有三个论元,表示的是三个集合之间的三元关系。[9]
由于 〈1〉类型量词常常可以由其所对应的亲缘量词来表示,〈1,1〉类型量词因此成为我们研究的重点对象。以〈1,1〉类型量词开头的语句存在有如Q(A,B)一般的三分结构,这种结构在自然语言中常常可见。比如:在 “至少一半以上的青年人常常入不敷出”中,“至少一半以上的青年人”是 〈1〉类型量词,它在此表示 “至少一半以上的青年人”的对应集合具有 “常常入不敷出”的性质;而 “至少一半以上的”则是 〈1,1〉类型量词,此量词就是 “至少一半以上的青年人”是 〈1〉类型量词的亲缘量词。 “至少一半以上的青年人常常入不敷出”这一语句可以表示为 (atleast-half-of-the)E(A,B)这样的三分结构,其中的E表示所涉及的论域,A表示论域E中所有青年人所组成的集合,B表示论域中 “常常入不敷出”的个体所组成的集合。
下面我们给出本文中将用到的定义和定理。
定义1:令Q是任意的 〈1,1〉类型量词,E是任意的论域,且A⊆E,则Q的外否定量词┐Q可以定义为:(┐Q)E(A,B)⇔非QE(A,B)。
定义2:对一个 〈1,1〉类型的广义量词Q及任意论域E而言:
(1)Q是右单调递增的,当且仅当:如果A⊆B⊆E,那么QE(C,A)⇒QE(C,B);
(2)Q是右单调递减的,当且仅当:如果A⊆B⊆E,那么QE(C,B)⇒QE(C,A)。
在广义量词的单调性和其三种否定量词的单调性之间,存在如下可转换关系:
定理1[10]:对于一个 〈1,1〉类型的广义量词Q来说,Q是右单调递增的,当且仅当:Q的外否定量词┐Q是右单调递减的。
证明:假设对于一个 〈1,1〉类型的广义量词Q而言,Q是右单调递增的,根据定义2(1),如果A⊆B⊆E,那么QE(C,A)⇒QE(C,B)。由此可得:如果A⊆B⊆E,那么 (┐Q)E(C,B)⇒ (┐Q)E(C,B),再根据定义2(2)可知:┐Q是右单调递减的。反方向的证明与此类似。结论由此得证。
二、广义量词的基本思想
广义量词理论研究广义量词的语义普遍性,是以广义量词的论元所涉及的集合的性质或集合之间的关系为主要根据的。比如:根据广义量词理论,“所有的 (all)” “并非所有的 (not all)” “没有 (no)” “有些 (some)”这四个亚里士多德量词的真值定义分别为定义3:[11]
(1)allE(A,B)⇔A⊆B (2)not allE(A,B)⇔A□B
(3)noE(A,B)⇔A∩B=Ø (4)someE(A,B)⇔A∩B≠Ø
例如:语句 “有些学生上课爱打瞌睡”可以形式化为some(A,B)。其意思是学生组成的集合A与爱打瞌睡的个体组成的集合B之间的交集是非空,因此量词 “some”表示的是集合A与集合B之间存在重叠关系。
我们认为,广义量词理论的基本思想就在于利用其真值定义去揭示其论元集合之间的关系,以达到对广义量词的普遍语义性质加以描述的目的。比如,〈1,1〉类型的广义量词的真值定义,正是通过揭示两个集合,即其限制论元的集合与其辖域论元的集合之间存在的关系,达到描述其普遍语义性质的目的。一些 〈1,1〉类型量词的真值定义如定义4:
(1)(all but three)E(A,B)⇔|A-B|=3;
(2)(at most six)E(A,B)⇔|A∩B|≤7;
(3)mostE(A,B)⇔|A∩B|>|A-B|;
(4)(the seven)E(A,B)⇔|A|=7且A⊆B;
(5)(between two and five)E(A,B)⇔2≤|A∩B|≤5;
(6)MOE(A,B)⇔|A|>|B|;
(7)(at least half of the)E(A,B)⇔|A∩B|≥1/2·|A|;
(8)(exactly five)E(A,B)⇔A∩B=5;
(9)(just finitely many)E(A,B)⇔存在一个自然数n,使得|A∩B|=n;
(10)(at least n)E(A,B)⇔|A∩B|≥n(其中n是自然数);
(11)(infinite many)E(A,B)⇔A∩B是无穷的;
(12)IE(A,B)⇔|A|=|B|(Härtig量词或等基数量词)。
例如,定义4(7)表示的是 “至少一半以上的” 这一 〈1,1〉类型的广义量词的真值定义。具体地说,在 “至少一半以上的青年人常常入不敷出”这一语句中,其真值定义 (at least half of the)E(A,B)⇔|A∩B|≥1/2·|A|表示 “青年人”所对应的集合A与 “常常入不敷出”所对应的集合B之间具有|A∩B|≥1/2·|A|的性质,即论域中所有青年人所组成的集合与常常入不敷出的个体所组成的集合的交集的基数,大于或等于论域中所有青年人所组成的集合的二分之一。
在广义量词理论中,“……比……更多”这一 〈1,1,1〉类型量词的真值定义是:(more than)E(A,B,C)⇔|A∩C|>| B∩C|。例如:语句 “买房子的人比买期货的人更多”可以形式化为 (more than)E(A,B,C)。其中A表示论域E中所有买房子的人所组成的集合,B表示论域E中所有买期货的人所组成的集合,C表示具有 “……比……更多”的性质的个体所组成的集合。此真值定义表示A与C交集的基数大于B与C交集的基数。
“至少一半以上的”“……比……更多”“绝大多数的”“许多”“无数个的”等广义量词是无法用一阶逻辑的标准量词∀和∃来加以表示的。可见,就对自然语言的表达能力而言,广义量词理论比经典一阶逻辑更加强大。
三、广义量词理论对自然语言推理的处理
目前,国内外关于自然语言信息处理的理论有很多,比如蒙太格语法、动态蒙太格语法、动态谓词逻辑、组合范畴语法、类型论、广义量词理论等等。我们认为,在这些理论中,就自然语言推理而言,广义量词理论应当是最为简便的工具了。这从以下广义量词理论对自然语言推理的一些处理中可以窥见一斑。
(1)利用广义量词理论对四个亚里士多德量词的真值定义,可以证明亚氏三段论的有效性。[12]例如,第一格EIO式的一个传统三段论:
大前提:没有A是B。
小前提:有些C是A。
结论:并非所有的C是B。
利用广义量词理论,可形式化为:noE(A,B)且someE(C,A)⇒ not allE(C,B)。证明:假设两前提noE(A,B)和someE(C,A)成立。对任意论域E而言,根据本文定义3(3)中 “no”的真值定义noE(A,B)⇔A∩B=Ø,且noE(A, B)成立,可得:A∩B=Ø。再根据定义3(4)中 “some”的真值定义someE(A,B)⇔A∩B=Ø,且someE(C,A)成立,可得:C∩A=Ø。假设C⊆B,由A∩B=Ø推知:A∩C=Ø,据∩的交换律得:C∩A=Ø,这与C∩A=Ø矛盾,所以C□B。再根据定义3(2)中 “not all”的真值定义not allE(A,B)⇔A□B,可得:not allE(C,B)成立。故结论得证。
(2)利用广义量词理论对于相应广义量词的真值定义,能够证明含有广义量词的广义三段论的有效性。例如,对于如下广义三段论而言:
前提1:所有数学不及格的学生都是留守儿童。
前提2:至少三个学生数学不及格。
结论:至少三个学生是留守儿童。
利用广义量词理论,此广义三段论可形式化为:allE(A,B)& (at least n)E(C,A)⇒ (at least n)E(C,B)(其中的n是自然数,这里的n=3)。这里的A表示所涉及的论域E中所有数学不及格的学生所组成的集合,B表示论域E中所有的留守儿童组成的集合,C表示论域E中所有学生所组成的集合。笔者在此给出此广义三段论的有效性证明:假设两前提allE(A,B)和(at least n)E(C,A)都成立。对任意论域E而言,根据本文定义3(1)中的 “all”的真值定义allE(A,B)⇔A⊆B,且allE(A,B)成立,可得:A⊆B。再根据定义4(10)中 “at least n”的真值定义 (at least n)E(C,A)⇔|C∩A|≥n,且 (at least n)E(C,A)成立,可得:|C∩A|≥n。由A⊆B且|C∩A|≥n可得:|C∩B|≥n。再根据定义4(10)中 “at least n”的真值定义,可得 (at least n)E(C,B)成立。故结论得证。这就证明了allE(A,B)& (at least n)E(C, A)⇒ (at least n)E(C,B)这一广义三段论是有效的,其中的A、B、C可以是任何论元组成的集合,n可以是任何的自然
数。对于其他广义三段论的有效性也可以做类似处理。由此可见,利用广义量词理论,可以成批量地进行自然语言信息的处理。这是一阶逻辑和其他语义理论和逻辑理论很难做到的。
(3)利用广义量词理论,可以证明广义三段论的不同推理模式之间的可化归关系。[13]例如,前面所列举的广义三段论的有效性等价于如下的广义三段论的有效性:
前提1:所有数学不及格的学生都是留守儿童。
前提2:不到三个学生是留守儿童。
结论:不到三个学生数学不及格。
利用广义量词理论,此广义三段论可形式化为:allE(A,B)& (least than n)E(C,B)⇒ (least than n)E(C,A)(其中的n是自然数,这里的n=3)。这也是说,这两个广义三段论的相异推理模式之间实际上存在可化归关系。形式化地说:
allE(A,B)& (at least n)E(C,A)⇒ (at least n)E(C,B),当且仅当,allE(A,B)& (least than n)E(C,B)⇒ (least than n)E(C,A)。
在此给出其证明:此前已经证明allE(A,B)& (at least n)E(C,A)⇒ (at least n)E(C,B)的有效性。再结合定义3(1)中 “all”的真值定义allE(A,B)⇔A⊆B可知,A⊆B且 (at least n)E(C,A)⇒ (at least n)E(C,B)。根据定义2(1)右单调递增的定义可知,at least n这一广义量词是右单调递增的,根据定理1可知at least n的外否定量词least than n则是右单调递减的。根据定义2(2)右单调递减的定义可知,A⊆B且 (least than n)E(C,B)⇒ (least than n)E(C,A)。再结合定义3(1)中 “all”的真值定义allE(A,B)⇔A⊆B可知,allE(A,B)&(least than n)E(C,B)⇒ (least than n)E(C,A)的有效性成立。反方向的证明与此类似,故结论得证。
综上所述,与其他相关理论相比,广义量词理论具有更强大的表达能力,并且对自然语言信息的处理显得非常直观简洁,因而是处理自然语言推理的简便工具。但令人遗憾的是,广义量词理论的诸多成果目前还没有引起专门研究知识表示和知识推理的计算机专家的足够重视。当然,广义量词理论的潜能也还有待于进一步挖掘。
[1]A.Mostowski,“On a Generalization of Quantifiers”,Fund.Math.,1957,(44),pp.12-36.
[2]P.Linström,“First-order Predicate Logic with Generalized Quantifiers”,Theoria,1966,(32),pp.186-195.
[3]J.Barwise and R.Cooper,“Generalized Quantifiers and Natural Language”,Linguistics and Philosophy,1981,4(2),pp.159-219.
[4]E.L.Keenan,“The Semantics of Determiners”,The Handbook of Contemporary Semantic Theory,Blackwell Publishing,1997.
[5][9][10][11]S.Peters and D.Westerst hl,Quantifiers in Language and Logic,Oxford:Claredon Press,2006,pp.11-52;pp. 11-15;p.170,p.62.
[6]J.Szymanik,Quantifiers in Time and Space,Polen:Geboren te Warschau,2009.
[7]张晓君:《广义量词的各种单调性之间的关系》,《安徽大学学报 (哲学社会科学版)》2012年第5期。
[8]张晓君:《广义量词的相关性质研究》,《逻辑学研究》2010年第3期。
[12]张晓君、黄朝阳:《基于广义量词理论的亚氏三段论的研究》,《重庆理工大学学报 (社会科学版)》2012年第10期。
[13]张晓君:《扩展三段论的可化归性与广义量词的语义性质之间的关系》,《逻辑学研究》2012年第2期。
责任编辑:罗 苹
B81
A
1000-7326(2015)07-0022-04
*本文系教育部人文社会科学研究规划基金项目 “面向自然语言信息处理的广义量词理论研究”(12YJA72040001)的阶段性成果。