广义量词理论对一阶逻辑的扩展
2015-02-17张晓君
张晓君
(四川师范大学政治教育学院,成都 610066)
广义量词理论对一阶逻辑的扩展
张晓君
(四川师范大学政治教育学院,成都 610066)
广义量词理论是一阶逻辑的扩展。该理论已经成为逻辑学和语言学中重要的推理工具之一。广义量词是对来自于一阶逻辑中两个标准量词(全称量词和存在量词)的推广。对一阶逻辑进行扩展的主要原因有二:其一是为了解释亚氏三段论形式以外的大量的有效推理;其二是为了提升一阶逻辑的表达力,使得计算机能够更好地处理自然语言。文章阐述了广义量词理论来自于哪里,是如何得来的。现代谓词逻辑首先通过固定一阶逻辑中的全称量词和存在量词的真值定义,然后把它们的真值定义推广到〈1〉类型的广义量词,之后把〈1〉类型的广义量词的真值定义推广到任意的广义量词。这样就可以把任意的广义量词添加到一阶逻辑中,从而得到表达力更强的逻辑——广义量词理论。
广义量词;一阶逻辑;全称量词;存在量词;真值定义
主持人语:中国逻辑学会会长 邹崇理研究员
广义量词理论已经成为逻辑学和语言学中重要的推理工具之一,广义量词理论的研究也取得了相关成果。那么,广义量词理论来自于哪里,是如何得来的;广义量词理论为什么要对一阶逻辑进行扩展,其扩展的基本思路是什么;相关研究成果有哪些?论文《广义量词理论对一阶逻辑的扩展》将对上述问题作出回答。
人的理性选择产生了法律,法律制约着人的理性选择。法律对合理性与正当性的需求决定法律活动中逻辑理性的必要性,对法律事实的认定形成一个命题或判断,法律规则正是对法律命题或判断进行哲学意义上的推理。在法律推理中,实现形式正义的首要条件是法律必须具有一致性、可预见性和可计算性。而法律的要义在于法律规范与法律事实之间的对应与配置,这里必须考量客观事实作为法律事实的基石性要件。在法律推理过程中,最为关切的是作为推理的大前提和小前提的建构,《论法哲学视野下的法律推理重构方案》一文将对上述观点进行阐述。
广义量词理论是一阶逻辑的扩展。该理论已经成为逻辑学和语言学中重要的推理工具之一。广义量词是对来自于一阶逻辑中两个标准量词(全称量词和存在量词)的推广。
在汉语和英语等自然语言中,基本语句都是由名词短语与动词短语组成的。最简单的名词短语就是名称(比如:张三、李四、王五),它们与一阶逻辑中的常元相对应。复杂的名词短语是由普通名词短语与限定词(比如:所有的、有些、没有、并非所有的、大多数的、至少三分之一的)组成的,例如:三班的所有男生、有些三角梅、没有苹果、并非所有的三叶虫、大多数股票、至少三分之一的车。这类名词短语在逻辑学中叫作量化表达式,包含量化表达式的语句叫作量化语句。量化语句的逻辑性质很大程度上依赖于它们所包含的限定词[1]227。例如:
三段论1:
大前提:每个漂亮女人都很有钱。
小前提:李兰是个漂亮女人。
结 论:李兰很有钱。
三段论2:
大前提:很多漂亮女人都很有钱。
小前提:李兰是个漂亮女人。
结 论:李兰很有钱。
虽然这两个三段论都具有相同的逻辑形式: (p∧q)→r,但是很显然,三段论1是逻辑有效的,而三段论2则是无效的。这主要是由“每个”和“很多”这两个限定词的逻辑性质不同决定的。可见,量化语句的真假不能够仅仅由其组成语句的真值来决定,其真假与它对应的量化表达式有关。
一、对一阶逻辑进行扩展的必要性
虽然自然语言中有很多形式的量化,但是一阶逻辑仅仅建立在全称量词(“所有的”,用∀表示)和存在量词(“有些”,用∃表示)这两个标准量词之上[2]49。一些形式的量化表达式可以利用谓词和真值联结词,通过∀和∃来加以定义,比如:三班的所有男生、有些三角梅、没有苹果、并非所有的三叶虫、这部手机、某个人、5辆车、每当。而另外一些形式的量化表达式则不能够利用一阶逻辑中的∀和∃来加以定义,比如:大多数股票、很多漂亮女人、无穷多个偶数、至少三分之二的计算器[3]18。为了研究这些量化表达式的逻辑语义性质,逻辑学家把限定词以及可以做主语的所有名词短语、一阶逻辑中的标准量词都统称为广义量词[4]。自然语言中存在最广泛的量词是〈1〉类型和〈1,1〉类型的广义量词[5]11-18。广义量词理论产生和发展的主要原因有二:其一是为了解释亚氏三段论形式以外的大量的有效推理,其二是为了提升一阶逻辑的表达力,使得计算机能够更好地处理自然语言[6]7。
利用谓词和真值联结词以及一阶逻辑中的全称量词∀和存在量词∃,可以把一些自然语言语句翻译成逻辑表达式。例如:“无商不奸”的本意是“每个商人都是奸诈的”,可以翻译为“∀x(商人(x)→奸诈的(x))”,其意思是“如果x是一个商人,那么x就是奸诈的”。“某个商人是奸诈的”,可以翻译为“∃x(商人(x)∧奸诈的(x))”,其意思是“存在某个x是一个商人,并且x是奸诈的”。而“大多数商人都是奸诈的”应该翻译成怎样的逻辑表达式呢?
事实上,“大多数的”是不能够利用一阶逻辑中的全称量词∀和存在量词∃来加以定义的,即“大多数”这一广义量词在一阶逻辑中是不可表达的。为什么呢?我们来考察“大多数商人都是奸诈的”这一语句,令S表示“奸诈的那部分商人组成的集合”,T表示“不是奸诈的那部分商人组成的集合”,语句“大多数商人都是奸诈的”是对S与T的相对大小进行比较,只说明了集合S比集合T大,但并没有说明这两个集合或者话语的论域中究竟有多少个商人。在此,用“S(x)”来表示“商人(x)∧奸诈的(x)”,用T(x)来表示“商人(x)∧﹁奸诈的(x)”。我们试图用下面的方式来表达“大多数商人都是奸诈的”这样的语句:
由于论域中没有给出全部商人的数目的一个有穷的固定的上界,因此这样的析取需要无穷地进行下去,因而得到的该语句的翻译就是一个无穷长的语句,这在一阶逻辑中是不允许的[1]383-387。如果在某个具体世界中,正如在Tarski世界中一样,商人的总数是有限的,比如是30个,那么通过有穷步就可以对此语句进行翻译;如果没有这个限制,那么对此语句的翻译将需要无穷步。因此,“大多数的”在一阶逻辑中是不可表达的。我们把这类在一阶逻辑中不能够得到表达的广义量词叫作不可化归的量词。
要对这些不可化归量词进行分析和处理,就需要把它们作为新的量词符号添加到一阶逻辑中,对一阶逻辑进行扩张,以增强一阶逻辑的表达力。把不同的不可化归量词引入一阶逻辑,可以得到一阶逻辑的不同扩张逻辑。比如:把“大多数的”引入一阶逻辑对其进行扩张;用Lindström量词对一阶逻辑进行扩张[7]。
随着逻辑学和计算机科学的发展,逻辑学学者发现:现实中存在诸多一阶逻辑不能够解决的问题,为此发展更强大的逻辑就显得尤为必要[8]18。比如:在一阶逻辑FO中不能够表达“只有有穷多个前驱的序关系<”,但是用表示“存在无穷多个的”广义量词Q0对一阶逻辑FO加以扩张而得到的逻辑FO(Q0)中,这一关系则可以表示为:∀x﹁Q0y(y<x)。
二、广义量词理论对一阶逻辑进行扩展的基本思路
许多英语语句和汉语语句都有“Q A B”这样的三分结构的语句形式[2],其中Q是比如“所有的、有些、没有、并非所有的、大多数的、至少三分之一的、张三的”这样的一个限定词表达式;A是比如“股票、三角梅、手机、漂亮女人、商人”这样的一个普通名词短语;B是比如“下跌了、在盛开、丢了、有钱、打人”这样的动词短语。
如果“Q A B”这样的语句的论域是E,那么就可以把这样的语句写作“QE(A,B)”。QE(A,B)为真,当且仅当,在论域E中,满足A的那些Q也满足B。例如:
(1)10%x(股票(x),下跌了(x))在一个世界中为真,当且仅当,在那个世界中10%的股票下跌了。
(2)至少5x(股票 (x),下跌了(x))在一个世界中为真,当且仅当,在那个世界中至少5支股票下跌了。
(3)有穷多x(股票(x),下跌了(x))在一个世界中为真,当且仅当,在那个世界中有穷多支股票下跌了。
(4)大多数x(股票(x),下跌了(x))在一个世界中为真,当且仅当,在那个世界中大多数股票下跌了。
如何把一个不可化归的广义量词,添加到一阶逻辑中而得到表达力更强的逻辑呢?在此,我们以把“大多数的”添加到一阶逻辑中而得到表达力更强的逻辑为例加以说明。我们的形成规则是:两个合式公式和一个变元能够构造一个新的合式公式,即,如果S与T是合式公式,v是一个变元,那么“大多数的v(S,T)”就是一个合式公式,而且出现在“大多数的v(S,T)”中的v是约束出现的。
合式公式“大多数的x(S,T)”的意思是“满足S的大多数的 x也满足 T”。可见,“大多数的x(S,T)”表示了满足S的集合与满足T的集合之间的二元关系。也可以用“大多数的x(R)”来表示“大多数的x(x=x,R)”,其意思是“大多数的人或物满足R”,这就是“大多数的”特殊形式,它只有一个合式公式,即R;而一般形式则有两个合式公式。“大多数的x(S,T)”为真,当且仅当,在一个世界中,满足 S(x)的大多数的人或物也满足T(x)。
从某种意义上说,使用广义量词Q1,Q2,…对一阶逻辑进行扩张后得到的逻辑FO(Q1,Q2,…)是由一个语句的集合、一类模型以及语句和模型之间的真值关系(或满足关系)组成,这种逻辑被称为模型论逻辑。这是因为这些逻辑是根据模型和真值,从语义方面加以定义的,而不是根据推导定理的演绎系统从证明论的角度加以定义的[1]385-387。比如,用一个〈1〉类型的广义量词Q对一阶逻辑FO进行扩张得到逻辑FO(Q)时,需要添加一个形成规则和真值定义。要想对一阶逻辑FO进行扩张得到逻辑FO(Q),首先就需要对一阶逻辑中的全称量词∀和存在量词∃的真值定义的意义加以固定,然后把它们的真值定义推广到〈1〉类型的广义量词Q的真值定义,最后把〈1〉类型的广义量词Q添加到一阶逻辑中即可。下面我们对这一扩张过程加以详细说明。
三、全称量词和存在量词的真值定义及其推广
一阶逻辑通过真值定义中的相应条款对∀和∃的意义加以固定[9]。该定义给出了相应的归纳条件:一个模型M=(E,I)中相应元素b1,…,bn满足一个公式φ(y1,…,yn)(其中最多 y1,…,yn自由),记作:M⊨φ(b1,…,bn),其中E是论域,I是为非逻辑符号指派外延的解释函数。∀和∃的真值定义分别为:
定义1:M⊨∀xψ(x,b1,…,bn),当且仅当,对于每一个a∈E,M⊨ψ(a,b1,…,bn);
定义2:M⊨∃xψ(x,b1,…,bn),当且仅当,存在某个a∈E,使得M⊨ψ(a,b1,…,bn)。
为了引进其他量词,需要弄清表达式∀和∃究竟是什么东西。从语法的角度看,∀和∃都是在一个公式中约束了一个变元的算子。为了展示其语义特征,需要对定义1和定义2加以改写。首先,要明确的是:具有一个自由变元的每个公式ψ(x)在一个模型M中表示的是E的一个子集;E中个体的集合满足ψ(x)。更一般地说,如果ψ(x,y1,…,yn)=ψ(x,[y])中最多 y1,…,yn自由,而且[b]=b1,…,bn,令ψ(x,[b])M,x={a∈E:M⊨ψ (x,[b])}是ψ(x,[y])在M中相对于b1,…,bn的外延,那么∀和∃的真值定义则可分别改写为:
定义3:M⊨∀xψ(x,[b]),当且仅当,ψ(x,[b])M,x=E;
定义4:M⊨∃xψ(x,[b]),当且仅当,ψ(x,[b])M,x≠Ø。
定义3和定义4的右边部分是作为集合ψ(x,[b])的性质出现的。也就是说,一个集合等同于论域的性质可以用∀表示,一个集合的非空的性质可以用∃表示。类似地,集合的其他性质可以用其他量词来表示。
需要注意的是,这些性质仅仅依赖于论域E,而不依赖于模型M的其余部分。更明确地说,这些性质仅仅是论域E的子集的集合。这就引出了下面的定义5[9]。
定义5:
(1)从语法上讲,一个〈1〉类型的广义量词Q是一个变元约束算子,该算子使得:如果φ是一个公式,那么Qxφ也是一个公式,而且Qx约束φ中x的所有自由出现;
(2)从语义上讲,一个〈1〉类型的广义量词Q是一个映射,即是从任意论域(非空集合)E到E的子集的集合QE的映射,该映射根据下面的(3)来解释形如Qxφ的公式;
(3)M⊨Qxψ(x,[b]),当且仅当,ψ(x,[b])M,x∈QE。
这里,对于量词表达式及其所表示的映射我们采用相同的符号。这样,∀即可以表示全称量词,也可以表示全称量词所对应的映射,即:对于所有的论域E,∀E={E}。存在量词(所表示的映射是:∃E={A⊆E:A≠Ø}。类似地,其他一些〈1〉类型的广义量词所对应的映射分别为: (∃≤7)E={A⊆E:|A|≤7},(∃=4)E={A⊆E: |A|=4},(Q0)E={A⊆E:A是无穷的},(Qeven)E={A⊆E:|A|是偶数};(QR)={A⊆E:|A|>|E-A|}(Rescher量词)。〈1〉类型的广义量词Q的真值定义可以推广到任意广义量词的真值定义[9]。限于篇幅,本文略去不谈。
我们发现:把定义5的条款(1)添加到一阶逻辑的形成规则中,并把定义5的条款(3)添加到一阶逻辑的真值定义中,就可以把一阶逻辑FO扩展成逻辑FO(Q)。类似地,若在一阶逻辑中添加一个以上的量词Q1,…,Qn,则得到逻辑FO(Q1,…,Qn)。在这种逻辑中,可以讨论在一阶逻辑FO中不可以表达的性质。例如,虽然在一阶逻辑FO中,不可以表达一个(有穷)集合A包含了论域E中正好一半的元素;但是在逻辑FO(QR)中,却可表达成:﹁QRxA(x)∧﹁QRx﹁A(x),其中第一个合取支表示|A|≤|E-A|,第二个合取支表示|E -A|≤|A|[4]。由此可见,一阶逻辑的表达力小于逻辑FO(Q0)与逻辑FO(QR)的表达力,即后两个逻辑都是 FO的真扩张,可分别记作 FO<FO(Q0)、FO<FO(QR),其他记法类似。
在研究仅仅使用一个变元的广义量词Q时,令Q约束每个公式中同一个变元,问题就变得简单些,例如,“most As are not B”在相应的逻辑语言中就可写成“mostx(A(x),﹁B(x))”而不是写成“mostx,y(A(x),﹁B(y))”。广义量词通过其真值定义所给出的映射来揭示其论元集合之间的关系,从而达到描述量词的语义性质的目的。例如:自然语言中存在最为广泛的〈1,1〉类型的广义量词,就是通过其真值定义所对应的映射,来揭示其左论元的集合与其右论元的集合之间的关系,来达到描述量词的普遍语义性质的目的。比如,下列表达式中的斜体表示广义量词,A、B、C是量词的论元所组成的集合,E表示论域,|X|表示集合的基数,一些〈1,1〉类型的广义量词在其真值定义中所对应的映射如下[5]93-120:
(between-three-and-seven)E(A,B)⇔3≤|A∩B|≤7;
(more)E(A,B)⇔ |A|>|B|;
IE(A,B)⇔ |A|=|B|(Härtig量词或等基数量词);
(at-least-half-of-the)E(A,B)⇔ |A∩B|≥1/2·|A|;
(just-finitely-many)E(A,B)⇔ 存在一个自然数n,使得|A∩B|=n;
(infinite many)E(A,B)⇔ A∩B是无穷的; (Q0)E={A⊆E:A是无穷的}。
四、相关研究成果
对于通过引入广义量词对一阶逻辑进行扩张而得到的两个模型论逻辑L1、L2,如果每一个L1-语句φ逻辑等值于某个L2-语句ψ,即φ与ψ在同样的模型中为真,那么就说L2至少与L1具有同样的表达力,即L2是L1的扩张,记作L1≤L2。如果L1与L2具有同样的表达力,即是同样的逻辑,就记作L1≡L2;如果L2是L1的真扩张,就记作L1<L2。广义量词理论对一阶逻辑的扩张的相关成果主要有:
事实1[9]11对于任意广义量词Q,Q在用其亲缘量词Qrel对一阶逻辑FO进行扩张后得到的逻辑FO(Qrel)中是可定义的。
事实2[9]11FO(Q1,Q2,…,Qn)≤L,当且仅当,每一个Qi(1≤i≤n)在L中是可定义的。
另一方面,为了证明一个逻辑不是另一个逻辑的扩张,可以直接说明第一个逻辑中的某个语句不逻辑等值于第二个逻辑中的任何语句,也可以用下面这两个逻辑的性质对它们加以区分。例如,利用一阶逻辑的下面这4个著名的性质,可以判断两个逻辑不等值[5]239-242:
(1)紧致性:如果一些语句的集合的每一个子集都有一个模型,那么由这些语句的全体所形成的集合就有一个模型。
考察FO(Q0)-语句的如下集合:{﹁Q0x(x= x)}∪{∃≥nx(x=x):n=1,2,3,…},该集合没有模型,但是其有穷子集都有模型,因此,FO(Q0) (以及它的所有扩张)都不是紧致的。特别地,FO (Q0)FO。
(2)塔斯基(Tarski)性质:如果一个语句有一个可数的模型,那么该语句就有一个不可数模型。
令φ是一个FO-语句,<是带有第一个元素的离散线性序,那么FO(Q0)-语句(a)φ∧∀x﹁Q0y (y<x)表示了自然数序〈N,<〉(即〈E,R〉是语句(a)的模型,当且仅当,〈E,R〉与〈N,<〉同构)。语句(a)的所有模型都是可数的,因此FO(Q0)不具有塔斯基性质。
(3)完全性:有效语句的集合是递归可枚举的。
把(2)中的例句(a)引入FO的语句中定义加法和乘法,比如,0是最小的元,x+1是x的直接后继,就可以得到能够表示算术的标准模型N=〈N,<,+,×,0,1〉的一个语句θ,那么对于在该词库中的每一个FO(Q0)-语句ψ而言,N⊨ψ⇔θ→ψ是有效的。因为这种真的算术语句的集合不是递归可枚举的,所有FO(Q0)不是完全的。
(4)骆文海姆(Löwenheim)性质:如果一个语句有一个无穷的模型,那么该语句就有一个可数的模型。
考察用等词,即 IE={〈X,Y〉∈E2:|X|= |Y|}对一阶逻辑进行扩张后得到的逻辑FO(I),我们可以写下FO(I)的一个语句,<是没有终点的一个稠密的线性序,那么就存在一个元素,该元素的前驱的个数与其后继的个数不一样多。在一个模型中,该元素的前驱的集合与其后继的集合都是无穷的,并且具有不同的基数,那么该模型必定是不可数的。而FO(Q0)具有骆文海姆性质,因此FO(I)FO(Q0)。
对此,介绍一个有名的定理,其证明可参见Flum的论文[9]:
定理1:(Lindström定理)
如果L是紧致的并且具有骆文海姆性质,那么L≡FO。假定L是可以亲缘化的,如果L是完全的并且具有骆文海姆性质;或者说L同时具有骆文海姆性质和塔斯基性质,那么L≡FO。
此外,对于通过一些广义量词对一阶逻辑进行扩张后得到的逻辑之间的表达力的强弱问题,D.Westerståhl提出了下面两个定理[10]240-249:
定理2:FO<FO(Q0)<FO(I)<FO(more)<FO(H)
定理3:FO(most)<FO(more);在有穷结构上,FO(most)≡FO(more);FO(more)≡FO(most,Q0)。
综上所述,广义量词理论首先通过固定一阶逻辑中的全称量词∀和存在量词∃的真值定义,然后把它们的真值定义推广到〈1〉类型的广义量词,之后把〈1〉类型的广义量词的真值定义推广到任意的广义量词。这样就可以把任意的广义量词添加一阶逻辑中,实现了对一阶逻辑的扩展,从而得到表达力更强的逻辑。为了更好地进行自然语言信息处理,对这些扩张后的逻辑进行更加深入的研究是必要的。
[1]BARWISE J,ETCHEMENDY J.Language,Proof and Logic[M].[S.l.]:CSLI Publications,2003.
[2]张晓君,吴宝祥.广义量词的单调性与其他语义性质之间的关系[J].重庆理工大学学报:社会科学,2015 (1):49-53.
[3]张晓君,郝一江.广义量词的单调性与数字三角形[J].重庆理工大学学报:社会科学,2010(3):18-24.
[4]张晓君.广义量词的相关性质研究[J].逻辑学研究,2010(3):67-79.
[5]PETERS S,WESTERSTÅHL D,PETERS S,et al.Quantifiers in Language and Logic[M].[S.l.]:Claredon Press,2006.
[6]张晓君,黄朝阳.基于广义量词理论的亚氏三段论[J].重庆理工大学学报:社会科学,2012(10):7-11.
[7]DAWAR A,GRÄDEL E.Generalized Quantifiers and 0 -1 Laws[EB/OL].[2010-05-18].http://www.eprints.kfupm.edu.sa/42572/,1995.
[8]WESTERSTÅHL D.Quantifiers in Formal and Natural Languages[M]//GABBAY D M,GUENTHNER F.Handbook of Philosophical Logic,2ndEdition,Vol.14,Springer,2007.
[9]FLUM J.Characterising logics[C]//Barwise J,Feferman S.Model-Theoretic Logics,1985:77-120.
[10]WESTERSTÅHL D.Generalized Quantifiers[EB/OL].[2010-05-16].Standford Encyclopedia of Philosophy,http://www.plato.standford.edu/entries/generalizedquantifiers,2005.
(责任编辑张佑法)
Extension of First-Order Logic by Generalized Quantifier Theory
ZHANG Xiao-jun
(College of Political Education,Sichuan Normal University,Chengdu 610066,China)
Generalized quantifier theory is the extension of first-order logic.The theory is now one of important tools of reasoning equipment in logic and linguistics.The term“generalized quantifier”reflects that these entities were introduced in logic as generalizations of the standard quantifiers from first-order logic,universal and existential quantifier.The main reasons for the extension of first-order logic are two:the one is to explain many of valid syllogistic forms beyond Aristotlian syllogisms;theother is to enhance the expressive power of first-order logic,so that the computer can better deal with natural language.The main purpose of this paper is to describe where and how generalized quantifier theory comes from.Modern predicate logic firstly fixed the meaning of universal and existential quantifier with the respective clauses in the truth definition,then generalized the definition of them to the one of generalized quantifiers of type〈1〉,and then generalized the latter to the one of generalized quantifiers of arbitrary types.Hence one can add any generalized quantifier first-order logic in order to gain more expressive logic:generalized quantifier theory.
generalized quantifier theory;first-order logic;generalized quantifiers;existential quantifiertruth definition
B81
A
1674-8425(2015)11-0009-06
10.3969/j.issn.1674-8425(s).2015.11.002
2015-06-13
国家社会科学基金西部项目“面向中文信息处理的汉语主谓句的逻辑语义及其推理模式研究”(15XYY012)
张晓君(1970—),女,四川南充人,副研究员,博士后,研究方向:现代逻辑和Agent理论。
张晓君.广义量词理论对一阶逻辑的扩展[J].重庆理工大学学报:社会科学,2015(11):9-14.
format:ZHANG Xiao-jun.Extension of First-Order Logic by Generalized Quantifier Theory[J].Journal of Chongqing University of Technology:Social Science,2015(11):9-14.