非精确谓词逻辑推理
2019-09-27潘文全
潘文全
1 导言
非精确概率逻辑是经典命题逻辑的扩张,是一种非经典归纳逻辑。国外对它的研究比较充分。但没有引起国内学界的充分关注,研究也比较薄弱。本文试图通过刻画其元性质分析其逻辑机制,初步探讨其哲学基础,展示其特异性和理论优势。
假设X是一个可能空间,在X上可以定义一个有界实值泛函f,即赌局,X上的所有赌局构成赌局集L(X)。主体对f的下界预期被定义为它对f的上确界可接受购买价格:是最大价格s,满足对于任意t0。同样的,主体对f的上界预期P(f)直接被定义为它对f的下确界可接受出售价格:是最小价格s,满足对于任意t>s,主体在观察到赌局f的结果之前接受以t卖出f(当观察到赌局f的结果是x之后,主体保证失去f(x)的收益)。当,且就是自我共轭的,此时就用P代替和P,P被简称为一个预期。P表达就是主体对有界赌局f的公平价格:它接受以任何价格s
P(f)出售f。
如果把一个事件看成是X的某个子集A,事件的指标赌局
就是一个有界赌局,所以把指标赌局等同于对应的事件。特别的,把IA的下界预期表示为它被叫作事件A的下界概率,如果的定义域只包含指标赌局,它就被叫作下界概率。类似的,把IA的上界预期表示为,它被叫作事件A的上界概率,如果的定义域只包含指标赌局,就被叫作上界概率。如果P是一个自我共轭的预期,那么P(A)被叫作A的概率,如果P的定义域只包含指标赌局IA和它的否定−IA,它就被叫作一个概率。
非精确概率推理(简写为IP推理)如何进行呢?推理都是从前提开始的,假设存在一个主体接受的前提集Γ,首先需要把这些前提转换为下界预期它就是IP推理的前提。在经典逻辑中,推理之前需要判断前提是否具有一致性,对应的IP推理也需要首先判定是否避免确定损失(它推广了一致性)。如果对于任意n∈N,中的任意赌局满足,则避免确定损失(一致的)。如果是一致的,那么就能进行推理了,经典逻辑通过反复使用MP规则来进行推理,而IP推理则是通过自然扩张来实现的。假设是一致的且,f∈L(X),下界预期被叫作的自然扩张,通过自然扩张就能得出所有赌局的上界预期和下界预期。很明显,如果是下界概率,通过就能推出所有事件的下界概率,如果是概率,通过就能推出所有事件的概率。在通过自然扩张进行推理之后,如果这就意味着主体在确定前提时,没有充分考虑到其它前提的行为后果,所以自然扩张修正了前提。如果前提没有这种缺陷,它就是融贯的(coherence),即避免确定损失且它是的限制,很明显是融贯的。
一个下界预期是自我共轭且融贯的,它就被定义为一个线性预期,X上的所有线性预期构成集合P。特别的,线性预期的自然扩张被叫作线性扩张,它是一个定义在上的线性预期。假设存在两个下界预期和,如果那么Q控制(dominate)
很多时候,下界预期没有预期方便处理,所以在下界预期和预期之间构建一个过渡桥梁将是有益的。
定义1.对于任意下界预期它等价于所有控制的线性预期的集合
相反的,对于任意的线性预期集M,它等价于一个下界预期
这个桥梁相当重要,以至于可以采用经典概率的理论来处理非精确概率,同时也可以用经典概率来表达非精确概率推理。
命题1.令是任意下界预期,那么
(1)避免确定损失当且仅当
(2)是融贯的当且仅当
(3)如果避免确定损失,那么它的自然扩张L(X)。([9],第1-76页)
2 非精确命题逻辑推理
假设X是一个可能空间,℘(X)是X的幂集。某个F⊆℘(X)被叫作一个滤,如果
1.F是递增的:如(A∈F)∧(A⊆B),那么B∈F;
2.F在有穷交下是封闭的:如果(A∈F)∧(B∈F),那么A∩B∈F。
当F⊂℘(X)时,F被叫作真滤,所有的真滤构成集合。如果某个真滤U不是任何其它真滤的子集,那么它就是超滤,所有的超滤构成集合。
运用滤和超滤可以把经典命题逻辑和{0,1}-值下界概率联系起来,即把命题逻辑嵌入到融贯下界预期理论中。
为了描述的方便,假设关于“变量f取值”的命题都位于X中,那么这些命题与X的子集就具有了一一对应的关系:一个关于“f取值”的命题就是一个下述形式的陈述“对于X的某个子集A而言,f∈A”。对于任意命题系统L,通过L的Lindenbaum代数上的Stone表示定理可以把L嵌入到下界预期理论中([2])。此外一组信念就是一个被主体认为是真的命题集,也是主体认为将会发生的事件集,在这里就是X的子集C。那么C与命题集具有下述四种对应关系:
1.一个命题集是演绎封闭的(如果它在有穷合取和MP下是封闭的),即对应的事件集C是滤(在有穷交和递增下封闭);
2.给定一个命题集,它的演绎闭包是包含它的最小演绎闭集,如果用事件集来表示的话,就是包含C的最小事件滤,即
3.一个命题集是一致的(如果它的演绎闭包是所有命题构成的集合的严格子集),等价地,一个事件集C是一致的当且仅当它的演绎闭包是真滤,即因此所有真滤构成的集合对应于所有演绎封闭且一致的事件集所构成的集合。
4.一个命题集是演绎完全的(如果往此集合中再加入任何其它命题就会导致不一致),这就意味着事件集是演绎封闭且完全的当且仅当它是超滤。
所以使用滤可以表达命题逻辑。但是滤如何同下界预期联系起来呢?
首先需要考虑的是下界预期能否表达命题逻辑的语言。如果p是关于随机变量f取值的某个命题,那么p就对应于X的子集Ap,这样就在命题和X的子集之间就建立了一一对应的关系,即主体接受命题p当且仅当它接受有界赌局IAp−1+ε,ε>0,
如果主体愿意接受以任意严格小于1的赔率在事件“Ap即将发生”上下注,这就说明主体确定Ap即将发生,即确定f的取值属于Ap。在融贯的条件下就可以表达出命题逻辑的五种真值运算。
主体接受了命题p当且仅当它接受有界赌局IAp−1+ε(ε>0)。如果主体是融贯的,它就不会接受有界赌局−IAp+1−ε(ε>0),即不会接受命题¬p。这就表达出了逻辑否定。
主体同时接受了p和q,即同时接受IAp−1+ε和IAq−1+ε(ε>0),由融贯性得出它也会接受这两个赌局的和,即接受IAp+IAq−2+2ε(ε>0)。因为IAp+IAq−2≤IAp+IAq−1≤IAp∩Aq,由融贯性得出主体接受IAp∩Aq,即接受p∧q(从p∧q得出Ap∧q=Ap∩Aq)。这就表达出了经典命题逻辑的合取规则。
主体接受了p和p→q。由于p→q对应于Ap⊆Aq,那么IAp−1+ε≤IAq−1+ε,由融贯性得出主体接受IAq−1+ε(ε>0),即主体接受q。这就表达出了经典命题逻辑的MP规则。
逻辑推理要避免矛盾,如果主体同时接受p,¬p,就意味着同时接受IAp−1+ε和IA¬p−1+ε(ε>0),那么它也会接受这两个赌局的和,即IAp−1+ε+IA¬p−1+ε=−1+2ε(ε>0),这就违背了避免确定损失,从这里也可以看出经典逻辑的一致性对应于避免确定损失。所以这就表达出了逻辑矛盾。
这样就能表达出命题逻辑的所有合式公式。那么如何用IP推理来表达命题逻辑的推理呢?
考虑任意非空事件A⊆X,假设主体只知道A一定会发生,即f∈A。这时如何刻画主体的信念?因为主体确定A一定会发生,所以它就愿意以任何赔率对此事件下注,即它将接受有界赌局IA−1+ε(ε>0)。这就得到了定义域为{IA}的下界概率
进一步推广上述思想。考虑事件集C⊆℘(X),假设主体确定C中的任意事件都会发生——它愿意以任意赔率对这些事件下注,但是它对于其它事件一无所知——它只愿意以0赔率对这些事件下注。这就得到了定义在{IA:A⊆X}上的下界概率
同样地,如果用(X)来定义概率而不是下界概率时,就得到了一个自我共轭的评估,这使得在负不变的定义域C=∪A⊆X{IA,−IA}上定义概率QC成为可能:
此时主体不仅愿意以任意赔率对C中的事件下注,而且不愿意以任意赔率对C外的事件下注。
如果想要对应的(下界)概率避免确定损失和融贯性,必须满足什么条件呢?对于任意有界赌局考虑定义在F上的实网这里是关于A的空下界预期。因为有上界supf,而且是非递降的——如果A⊇B则,所以它收敛到某个实数:
这就得到了定义在L(X)上的下界预期。因为它是融贯下界预期的逐点极限,所以也是融贯的。
如何解释融贯下界预期?它刻画了什么信念?对于∀A∈F,都可以得到关于A的空下界预期,它表示主体相信f∈A。当A在有向集F中“变小”时,就变得更加精确,如果取极限,就得到了融贯下界预期,它表示主体相信(∀A∈F)(f∈A)。
命题2.令F是一个真滤,那么
(1)是L(X)上的融贯下界预期;
(2)是线性预期当且仅当F是超滤。([9])
命题(2-1)把融贯性同真滤联系起来了,命题(2-2)把线性预期同超滤联系起来了。进一步推广命题2就可以得到下述命题。
命题3.令C⊆℘(X)且考虑下界概率和概率:
(3)QC是融贯概率当且仅当C是超滤。([9])
在命题逻辑的推理中,首先要做的是判定前提是否具有一致性,当把命题转换成非精确概率的语言后,首先要判断的是前提是否避免确定损失(即一致性)。命题(3-1)把避免确定损失同集合的有穷交联系起来了,相当于给出了判定避免确定损失的另一种办法。命题(3-2)和(3-3)分别是命题2两个小命题的推广。当前提一致了,如何推理呢?
命题4.令F是一个真滤,那么对于∀f∈L(X)而言([9]),
命题5.如果F是X上的真滤,U是X上的超滤,那么
(2)PU是把融贯概率QU扩张到所有有界赌局上的唯一线性预期,即PU就是QU的自然扩张。([9])
有了这个定理以后,就能轻松地进行推理了,即把推理中的前提转换成,通过自然扩张轻易地计算出结论的真假值。
命题集(事件集)和下界预期之间具有什么样的形式联系呢?如果主体相信一个命题是真的,即它相信对应的事件将会发生,那么它将愿意以任何赔率在此事件下注,所以它确定此事件的下界概率是1。也就是说,在主体认为事件都会发生的评估C中和下界概率之间存在一一对应:
在这种特殊的意义上,经典命题逻辑的推理等同于使用{0,1}-值下界概率的推理。因为后者是下界预期的一种特殊推理,所以经典命题逻辑可以被嵌入到融贯下界预期理论中,即融贯下界预期理论是经典命题逻辑的推广。
为了能够处理信念,有的研究者认为经典逻辑的唯一合理扩张是概率测度([5],第3-25页;[6,7]),依据上面的结论,可以得出这个论断是不正确的。所以精确概率理论的力量不足以完成推广经典命题逻辑的任务,但是融贯下界预期理论可以。
3 非精确概率谓词逻辑推理
在上一部分,把命题逻辑嵌入到非精确概率逻辑中起到关键作用的是Lindenbaum代数上的Stone表示定理,它把命题转换成子集,用集论运算来刻画命题演算,但是集论运算不能表达谓词,因此同样的思想不能把谓词逻辑和IP连接起来。但是把卡尔纳普的逻辑主义同主观主义相结合可以实现这一步。
首先定义一个一阶语言L,它具有变量x1,x2,...,关系符号R1,...,Rq(分别具有有穷多个变元r1,...,rq),常量an,n∈,没有函数符号和等号。令SL表示L的一阶语句集,QFSL表示L的无量词语句集。令T L表示L的带有全集{a1,a2,...}的模型集,很明显ai被解释为ai本身。如果Γ⊆SL是一致的,并且在Γ中的任意语句都没有涉及无穷多个常量ai时,那么存在M∈T L满足
3.1 从状态描述到SL的IP推理
为了在L上讨论IP,首先需要在SL上定义IP。
定义2.函数wi:SL→[0,1](i∈)是SL上的概率函数,如果对于任意θ,ϕ,∃xψ(x)∈SL,wi,i∈满足
这个定义是很直观的,虽然概率函数有无穷多个,但是wi定义在SL上,它必须满足三条直观的限制:一、如果某个语句是定理,那么它的概率必须为1(即P1);二、如果两个语句互斥,那么这两个语句析取的概率等于这两个语句的概率和(即P2);三、语句的概率等于满足此语句的个体的概率和(即P3)。
命题6.假设主体的信念被表达为wi:QFSL→[0,1],i∈,那么它不能被荷兰赌。([8],第30页)
命题7.wi:QFSL→[0,1],i∈是QFSL上的概率函数,当且仅当=infi∈Nwi避免确定损失。
证明.(⇒)假设wi是QFSL上的概率函数,那么wi不能被荷兰赌,即wi避免确定损失,那么避免确定损失。
命题8.假设一簇概率函数:QFSL→[0,1],i∈,对于任意θ,ϕ∈QFSL,都满足P1、P2。那么就具有唯一扩张到SL上的概率函数wi,并且对于任意θ,ϕ,∃xψ(x)∈SL,wi满足P1、P2、P3。
证明.假设是定义在QFSL上的任意概率函数,对于任意θ∈QFSL而言,所有的T L子集
可以生成一个集合代数A。且把定义为
很明显,它是A上的有穷可加测度。
那么一定存在某个有穷的n满足
是有穷可满足的,通过谓词逻辑的紧致性定理,(3)在L的某个模型上将是可满足的,尽管这个模型不一定在T L中,但是它的一个特殊子模型——集合为{a1,a2,...}的子模型——一定在T L中,那么此子模型将满足(3)的所有公式,当然也满足θ,由(1)得出也将满足{ϕi|i∈N},矛盾。
由于[ϕi]不相交和(2),那么[ϕi]=∅,i>n,所以,因此
由A可以产生σ-代数B,通过Caratheodory扩张定理([1]),存在唯一的定义在B上的扩张uwi。注意对于∃xψ(x)∈SL
因为B在补运算和可数并下封闭,所以它包含了所有集合[θ],θ∈SL。
现在可以在SL上定义一个函数wi
注意因为uwi扩张了,所以wi也扩张了。因为uwi满足P1和P2,所以wi也满足。由于uwi是可数可加的,且(4),得出wi满足P3。
wi一定是满足P1、P2和P3的唯一扩张,如果还存在其它的扩张函数很显然假设且只有个体a1满足则
矛盾。
命题9.假设存在一簇概率函数那么自然扩张
命题9表明了Caratheodory扩张和自然扩张的关系,即Caratheodory扩张是自然扩张过程中最关键的一步。假设存在一个前提集它被表示为通过定义1把它转换为精确概率函数的集合,然后对每个精确概率函数进行Caratheodory扩张,最后再通过定义1把Caratheodory扩张后的精确概率函数转换成下界预期,即所以自然扩张包含了Caratheodory扩张。
定义3.假设存在一个概率函数
此定义的直观意思是对于T L中的某个模型M而言,如果模型M满足θ,那么VM(θ)取值为1,即θ在M中为真。如果M不满足θ,那么VM(θ)取值为0,即θ在M中为假,所以VM(θ)是一个二值的概率函数。
在SL上定义了一个概率函数。
命题10.假设wi,i∈是SL上的一簇概率函数,那么在集合代数B上存在一簇可数可加测度uwi,i∈满足
证明.如果令,那么从命题8得出存在一个B上可数可加测度µui满足对于任意θ∈SL
通过唯一性得出ui必须等于wi,那么就得到µwi=µui,则
命题10的直接结论就是“主体对语句θ的非精确赋值问题”等价于“主体对T L的Borel子集A的非精确赋值问题,即如何挑选µwi(A)”。但是主体如何挑选的问题又是一个统计问题,而不是一个逻辑问题,所以这就不是这里所关心的问题了。
综上,为了确定SL上的非精确概率函数,只需要确定这些函数在无量词语句上的赋值就够了。简单地说,令L是默认的语言,它带有常量a1,a2,...,还带有参数数量分别为r1,...,rq的关系符号R1,...,Rq。对于来源于a1,a2,...的不同常量b1,...,bm而言,一个关于b1,...,bm的状态描述就是下述形式的L语句
这里任意cri∈{b1,...,bm},因此c1,...,cri可能重复。±Ri要么表示Ri要么表示¬Ri。大写字母Θ,Φ,Ψ,...被用来表示状态描述。
一个关于b1,...,bm的状态描述表明:对于关系符号Ri和来源于b1,...,bm的任意常量而言,那些Ri(c1,...,cri)成立,那些不成立。此外任意两个关于(b1,...,bm)的状态描述都是互斥的,因为它们的合取是不一致的。
例1.为了表达世界杯比赛,令L有二元关系符号W(赢球)、L(输球)、D(平局),两个常元a1,a2(代表两个球队),那么W(a1,a2)∧¬L(a1,a2)∧¬D(a1,a2)就是一个关于a1,a2的状态描述,通过它就能得出¬W(a1,a2)是假的。
通过析取范式定理([4]),任何θ(b1,...,bm)∈QFSL都逻辑等价于一个关于b1,...,bm的状态描述的析取,
因为状态描述都是互斥的,所以
从这里就可以看出:通过概率函数wi,i∈确定了在状态描述上的非精确取值,就可以确定它在QFSL上的取值,再通过命题8就能确定它在SL上的取值。
从形式上来看就是,如果wi,i∈是定义在状态描述Θ(a1,...,am),m∈上的函数,它满足:
那么通过(5)
(这里k足够大以至于bi都在a1,...,ak中),wi,i∈就可以扩张成QFSL上的概率函数,进而扩张成SL上的概率函数。有了定义在SL上的一簇概率函数wi,i∈,通过定义1就能得到定义在SL语句上的下界预期。
以上就是用经典概率语言表达的非精确谓词逻辑,但是通过命题1也能得到用IP语言表达的非精确概率谓词逻辑。假设确定了概率函数wi,i∈在所有状态描述上的取值,这就相当于确定了在所有状态描述上的线性预期P,然后再对进行线性扩张,得到了定义在SL上这种方法和命题8的方法是等价的,因为线性扩张包含了Caratheodory扩张。([3])
例2.在例子1中,所有的状态描述是X={ω1,...,ω8}
但是有意义的只有三种,即S={ω4,ω6,ω7}
假设在S上的存在n∈个概率函数wi,i∈{1,...,n},它们满足
这些概率函数的确定来源于这两个球队过去交锋的经历,它们是推理的前提。在语言L中,推理的前提主要是两种语句:无量词语句和量词语句。对于无量词语句,因为任何θ∈QFSL都逻辑等价于一个关于b1,b2的状态描述的析取,比如θ=¬W(a1,a2)≡ω6∨ω7。对于量词语句,它总是可以转化为无量词语句的析取。所以这就表达出了归纳推理前提的特点——个别现象。
在IP推理中,主要关心的是前提对不能必然推出的结论的非精确支持度,在这里就是这次比赛胜负的情况,即确定S中状态的非精确概率。首先找出满足C的所有概率函数wi,i∈{1,...,n},这等价于确定了在所有状态描述上的线性预期P,然后对P进行线性扩张,得到了定义在SL上,即利用同样的思想,就能确定表达这次比赛结果的无量词语句和量词语句的非精确概率,比如令α=∃xW(a1,x)≡ω4,那么0.33,即通过IP推理得出这次比赛a1赢的最低概率是0.33。
至此实现了从状态描述到任意谓词语句的IP推理,但是得到所有状态描述是一个很强的要求,因为它对所有个体都进行了断定,在日常推理中,通常只能得到有限个体的断定,因此需要研究从有限的个体断定出发,如何进行IP推理。由于已经完成了从状态描述到任意谓词语句的IP推理,所以还需要解决的是从有限的个体描述到状态描述的IP推理,通过状态描述集(即可能空间)的精炼可以实现这一步。
3.2 从有限的个体描述到状态描述的IP推理
状态描述集X1表达的是主体已经知道了所有个体的性质,但是在归纳推理开始时,主体只知道有限多个个体的性质,其它个体的性质是未知的,这种认知状态使得主体只能确定状态描述属于X1的某个子集,然后由这些子集构成X0,那么从X1到X0就构成了一个映上([10],第180页),这就是X0到X1的精炼A,X0对应于X1的一个划分,即对于∀x0∈X0,它都等同于一个X1中的精炼状态描述集A(x0)。所以X0上的任意概率分布f等同于X1中的概率分布g,这里g(x1)=f(x0),x1∈A(x0)。对于任意g,定义X0中的下界概率g∗(x0)=inf{g(x1):x1∈A(x0)},那么精炼后的模型就是然后再通过定义1就能得到定义在状态描述集上的一簇概率分布。
例3.假设语言L只具有一元谓词R,对于个体a1,a2的状态描述是:
但是主体只知道a1具有性质R,其它一无所知,那么此时它只能确定a1,a2的可能状态要么属于t1={ω1,ω2},要么属于t2={ω3,ω4},所以X0={t1,t2}。当主体知晓了a2的性质之后,它就能确定a1,a2的可能状态属于X1={ω1,ω2,ω3,ω4}。因此X0是X1的一个划分,即A(t1)={ω1,ω2},A(t2)={ω3,ω4},所以X0上的任意概率分布f等同于X1中的概率分布g,g(ωi)=f(tj),ωi∈A(tj),i∈{1,...,4},j∈{1,2}。对于任意g,定义X0上的下界概率g∗(tj)=inf{g(ωi):ωi∈A(tj)},那么精炼后的模型就是
4 结语
综上,通过滤可以在IP推理中表达出命题逻辑,但是滤不能处理谓词,为了让IP概率逻辑能够表达谓词,必须另辟蹊径。通过在状态描述上引入非精确概率,然后把非精确概率扩展到QFSL,进而通过IP推理的自然扩张扩展到SL上。这样就实现了非精确概率同谓词逻辑的结合,得出了非精确概率谓词逻辑推理。
得到了非精确概率谓词逻辑推理之后,IP同模态逻辑的关系成为了一个自然而然的问题,从直观上来看,非精确概率逻辑等同于模态逻辑加概率,因为从贝叶斯敏感度分析可以看出,非精确概率是一簇概率,其中每个概率都是可能的,这将是一个有价值的研究方向。