关于偏好关系的质化与量化研究<br/>——中间道路的探索

关于偏好关系的质化与量化研究
——中间道路的探索

2020-01-06刘奋荣付小轩

浙江大学学报(人文社会科学版)预印本 2020年8期

关键词：命题逻辑概率

刘奋荣付小轩

(1.清华大学人文学院，北京 100084; 2.中国政法大学人文学院，北京 100088)

一、引言

在哲学、经济学、计算机科学和人工智能等领域，对偏好概念的研究具有重要的理论价值，这些学科对偏好概念的分析方式各不相同。本文重点关注的是作为主观评估的偏好概念，它往往与“主体”和“对象”概念联系在一起。

一般而言，任取两个对象X和Y，主体对它们的偏好大致存在以下三种关系：

(1)主体偏好X胜于Y；

(2)主体偏好Y胜于X；

(3)偏好X与偏好Y对主体而言都是一样的。

利用数学表达式，这三种关系也可以分别表示为：Y

关于≤-关系的质化与量化研究，由于研究方式上的差异，往往会产生不同的逻辑系统。本文将从两个研究方向出发，基于不同的逻辑系统，分别介绍≤-关系从质化到量化的研究以及从量化到质化的研究。通过比较这两类研究方式，本文将提出一种结合质化与量化研究的新方法——概率与偏好关系的结合，以探索质化与量化研究之间的中间道路。

二、 ≤-关系从质化到量化的研究

在逻辑层面，关于≤-关系的研究主要采取质化分析。由于研究重点的不同，这些质化分析可以大致分为两种方式：一种是将≤-关系解释为偏好关系，另一种是将≤-关系解释为信念关系。前一种研究方式将在下一节具体讨论，此处不赘述。后一种研究方式通常将≤-关系作为置信度关系引入。

从质化研究的角度来说，对任意的两个对象X和Y而言，X≤Y表示的是：Y至少和X一样可信。基于这种定义，巴尔塔格(Baltag)等将其与信念更新理论相结合，提出了一套完备的信念逻辑系统[1]。范·本特姆(van Benthem)等进一步将该定义扩展到了动态认知逻辑领域，并引入了概率来刻画信念更新[2]。

≤-关系的量化研究可以追溯到德·菲尼蒂(de Finetti)1937年的工作[3]。他第一次将概率解释与逻辑研究相结合，并提出了一个重要猜想,即给定一个任意非空有穷的集合S，以及其所有子集X和Y上的≤-关系，存在一个概率函数P，使以下命题成立：

X≤Y当且仅当P(X)≤P(Y)。

直观上，这个命题表达的是：对任意两个有穷子集X和Y，如果Y至少和X一样好，那么一定可以找到一个概率分布P，它能保证Y出现的概率至少和X出现的概率一样大。通过寻找这样的概率分布，德·菲尼蒂将逻辑层面对≤-关系的质化比较转变为概率之间的量化比较。

与此同时，德·菲尼蒂也给出了满足这个命题需要确保的五个条件，分别是：

(1)空集≤X。该条件既是为了满足≤-关系的基本要求，也是为了契合概率分布的要求。因为空集里面不具有任何元素，所以一个主体通常会认为空集不会比有元素的其他集合更好。一般而言，一个概率分布必须是落在0到1之间的一个实数，譬如0.1。而空集的概率的基本定义就是等于0。由此，借助以上命题，该条件表示的是：任意一个至少和空集一样好的集合X，其概率大于等于0。

(2)S>空集。其中，>是并非≤的缩写。由于S是个非空集合，与第一个条件同理，该条件也需要保证S比空集更好。

(3)X≤Y，或者Y≤X。该条件被称作完全性，它表示的是：任意两个集合之间都可以比较。

(4)如果X≤Y，并且Y≤Z，那么X≤Z。该条件被称作传递性，它表示的是：假定Y至少和X一样好，又有至少和Y一样好的Z，那么Z也至少和X一样好。

(5)任取一个与X、Y都不相交的集合Z。X≤Y，当且仅当X与Z的并集≤Y与Z的并集。该条件被称作有穷求和性，它表示的是：假定Y至少和X一样好，那么将同样的元素都分别加进这两个集合，扩充之后的Y集合依然至少和扩充之后的X集合一样好。同理，假定扩充后的Y集合至少和扩充后的X集合一样好，那么去掉它们当中共同新增的元素，Y依然至少和X一样好。

德·菲尼蒂的这五个条件不仅保证了≤-关系的一般属性，而且还契合了概率分布的定义。但是，他所提出的条件对概率分布而言不充分。卡夫(Kraft)等给出了一个具有以下关系的集合S={p,q,r,s,t}:

{q,s}<{p}、{p,q}<{r,s}、{p,s}<{t,q}、{r,t}<{p,q,s}。(<-关系集)

他们证明了上述<-关系集可以扩充成同时满足德菲尼蒂五个条件的序列，然而，并不存在一个概率函数可以同时满足这四个<-关系[4]。

为了避免这个问题，斯科特(Scott)去掉了德·菲尼蒂的条件四，并加强了条件五[5]。他在考虑线性关系的基础上找到了一个平衡性条件来保证：

{q,s}<{p}、{p,q}<{r,s}、{p,s}<{t,q}必然蕴涵{p,q,s}<{r,t}。

因为{r,t}<{p,q,s}与{p,q,s}<{r,t}无法同时成立，所以平衡性条件与<-关系集中的四个关系也就无法同时成立。由此，斯科特在德·菲尼蒂的前三个条件的基础上加上了平衡性条件，不仅避免了卡夫等人所给出的反例，也保证了下述命题依然成立：

X≤Y当且仅当P(X)≤P(Y)。

借助斯科特的研究成果，范·埃克(van Eijck)等从贝叶斯(主观)概率出发，利用概率化的方式来表示置信度关系[6]。在他们看来，命题φ比命题ψ更可信，表达的是:命题φ的概率大于命题ψ的概率。由此，他们利用概率化的量化方式取代了质化的置信度关系比较(1)范·埃克等人的这种量化定义方式还避免了纯粹质化定义方式(譬如KD45类的信念模型)所面临的“彩票悖论”。具体参见van Eijck J. & Renne B., ″Update, Probability, Knowledge and Belief,″ in Beklemishev L., Demri S. & Máté A. (eds.), Advances in Modal Logic： Volume 11, London: College Publications, 2016, pp.551-570。。而这种定义方式正好也契合了德·菲尼蒂的猜想。

三、 ≤-关系从量化到质化的研究

≤-关系作为偏好关系的量化研究，主要集中于经济学领域尤其是决策论方面。在决策论中，效用函数可以看作其量化研究的起点。而效用函数主要分为三类：第一类是序数效用，第二类是区间值效用，第三类是比值效用。在使用序数解释效用时，对于任意集合S以及其中的任意元素x和y:

U(x)≤U(y)当且仅当x≤y。

例如，假设U(x)=5并且U(y)=10，那么就有x≤y。不过，当开始考虑具体差异时，自然会出现一个问题：假设U(x)=6并且U(y)=10，那么也有x≤y，它与前一个例子有什么区别？为了回答这个问题，哈里森-崔那(Harrison-Trainor)提出了所谓的区间值效用，以此来表示效用值之间的“距离”也至关重要[7]。比值效用也是类似的解决方案，它通过计算效用值的比率来比较偏好。例如，10的效用是5的两倍。

在决策论中，经济学家们更关心主体在不确定情境下的偏好关系。因此决策论在效用函数的基础上加入了概率，由此引入了期望效用。此时主体的偏好关系通过期望效用值之间的大小比较体现出来。而其中作为奠基性工作的正是冯·诺伊曼(von Neumann)等人所提出的计算方式：

EU(L)=∑kU(Ok)·Pk。

在该公式中，EU表示的是一个从彩票集合到实数集合的期望值函数[8]。对每张彩票L而言，考虑所有可能的结果O及每个Ok的效用值，概率分布P都给予每一个可能结果Ok发生的客观概率Pk。直观上，这个公式表达的是：一张彩票的期望效用值需要综合考虑开奖后的所有可能结果与这些结果发生的概率，以判断该彩票是不是比其他彩票更好。用≤-关系来表示的话，亦即对其他的彩票L′而言，是否满足L′≤L。

区别于客观概率，利用主观概率来定义期望效用主要有以下两种方式：

一种是沿袭了冯·诺伊曼的定义方式，由萨维奇(Savage)提出的计算方式[9]。萨维奇将等式中的彩票L转变为行为F，而Pk所表达的是主体相信某个结果有多大概率可能发生。那么萨维奇提出的计算方式所要比较的就是：主体基于自身的信念会更偏好哪个行为。萨维奇的理论不仅引入了概率来表示某个状态出现的置信程度，也通过效用函数揭示出了主体对某个行为(或行为的结果)的偏好程度。由此，利用萨维奇的定义方式，主体就能比较不同行为的期望效用值，从而推导出自身应该偏好哪个行为(实际上就是期望效用值最大的行为)。

另一种是杰弗里(Jeffrey)所提出的计算方式[10]。区别于前面两者，杰弗里将命题作为偏好关系的基本组成部分。主体的行为和可能的结果都通通被看作命题。对于每个可能结果的概率，杰弗里利用条件概率来区分。例如，主体需要选择是否带伞，可能的结果是下雨或者不下雨，那么条件概率就能表示在带伞(或者不带伞)的情况下下雨以及不下雨的概率。

虽然以上三种计算方式在表达形式上有所不同，但它们本质上都是一样的理念：通过考虑每个行为(或命题)所产生的效用值，以及所发生行为的状态出现的概率，来计算这个行为的最终期望值。

≤-关系作为偏好关系的质化研究，可以追溯到冯·赖特(von Wright)对它的逻辑研究[11]。他第一次为偏好逻辑提供了完全的系统。基于他的工作，刘奋荣区分了静态与动态的偏好模型，并进一步为偏好逻辑的动态变化提供了完全的系统[12]。霍利迪(Holiday)等为了避免亚尔钦(Yalcin)所提出的蕴涵问题[13]，提出了定义≤-关系的新方法：X≤Y当且仅当存在一个从X到Y的通胀函数，并且该函数是单射[14]。其中，从X到Y的函数f是通胀的，指的是：对X中每一个x而言，x≤f(x)都成立。霍利迪等认为主体根本不会有足够的信息来完全确定命题(或状态)的总体排序，因此允许了许多不可比性。哈里森-崔那等认为霍利迪等所提出的这个新方法相对于埃隆(Alon)等所提出的不精确概率的比较逻辑是可靠并且完全的[15]。而最为重要的是：通过这些设定，他们以纯粹质化的形式表达了≤-关系的概率化解释。

实质上，在偏好关系的研究中，逻辑学家们更多关注的是≤-关系应该满足的性质。一般而言，这些性质主要是：

(1)自反性。该性质表示的是一个对象(或命题)至少和自身一样被偏好。

(2)完全性。该性质表示的是任意两个对象(或命题)都可以比较。

(3)传递性。该性质表示的是：假定一个对象(或命题)A至少和一个对象(或命题)B一样被偏好，又有一个对象(或命题)C至少和A一样被偏好，那么C至少和B一样被偏好。

在关于≤-关系的研究中，逻辑学家们着重考虑≤-关系是否满足以上这些性质，从而将≤-关系转变为纯粹的质化研究。

四、新道路: 量化与质化方式的结合

综合以上讨论可以看出，质化与量化的研究方式都在逻辑层面有所运用。但量化方式主要局限于将≤-关系作为信念关系来考量，而质化方式主要局限于将≤-关系作为偏好关系来分析。那么一个问题就自然而然地产生了：当≤-关系作为偏好关系时，是否也能类似于信念关系那样，利用概率化的形式表现？

举个最简单的例子：X≤Y当且仅当P(X)≤P(Y)这样的定义方式是否能直接应用到偏好关系上？假如可以的话，这个关系所表达的就是：如果集合Y至少和集合X一样被偏好，那么Y出现的概率至少和X出现的概率一样大。反之也成立。

当然，这种假定的方式和偏好关系的逻辑性质并不矛盾，也与概率的定义相一致。借助斯科特的条件，确实也能找到唯一的概率函数来表示该关系。但是，这种定义方式不仅与信念的概率化定义雷同，而且遗漏了个体之间的偏好关系。例如，集合Y至少和集合X一样被偏好，直观上，往往是需要集合Y里面被偏好的元素出现的概率至少与集合X里面被偏好的元素出现的概率一样大。

那么该如何既保留个体之间的偏好关系，又将概率纳入偏好逻辑中考量?这里就面临一个挑战：如何将质化的≤-关系与概率相结合?

下面将针对这个问题，以集合X和集合Y中的元素之间的两两对比为出发点，通过定义一种概率化偏好比较方法，将元素之间的≤-关系与它们出现的概率结合起来，以此来定义两个集合之间的偏好关系。

这种结合量化与质化方式的概率化偏好比较方法的定义如下：

对任意两个集合X和Y而言，如果Y比X更被偏好，亦即X≤Y，当且仅当如下条件被满足：

∑xXyYP(x)P(y)y≤x≤∑xXyYP(x)P(y)x≤y。

其中，P(x)是元素x出现在集合X中的概率，P(y)是元素y出现在集合Y中的概率。y≤x是个分段函数，它表示的是：如果Y≤X成立，那么y≤x的值等于1；反之，y≤x的值等于0。

这个定义表达的是：任取集合X和集合Y中的一对元素x和y，如果y≤x这类关系出现的概率比x≤y这类关系出现的概率小，那么集合Y就更被偏好。反之同理。此定义的重点在于计算y≤x以及x≤y这两类关系各自出现的概率。若前者出现得更多，则集合X就更被偏好；若后者出现得更多，则集合Y就更被偏好。

例如，假定集合X={x,x′}且集合Y={y,y′}，两个集合的元素之间的偏好关系分别是：x≤y、x≤y′、x′≤y、y′≤x′。不妨假定这四组关系出现的概率相同，那么通过以上概率化偏好比较方法的计算可以得出：主体会更加偏好Y。此处当然也可以假定每对关系出现的概率不一样，它们具体的概率都取决于主体对每个状态(或结果)的置信度。

与≤-关系作为偏好关系的质化研究相比较，上述定义方式保留了元素之间的≤-关系和该关系对应的逻辑性质，以保证元素之间的偏好关系能够在最终的计算结果中体现出来。与此同时，上述定义方式在质化研究的基础上增加了概率的维度。也就是说，一个集合是否更被偏好，不仅仅需要考虑该集合中更被偏好的元素有哪些，还需要计算这些元素出现的概率是否更大。由此，这种定义方式既保证了元素之间的偏好关系满足逻辑上的性质，又能保证集合之间的偏好关系综合考虑了元素之间的对比与每个元素各自出现的概率。

与将≤-关系作为偏好关系的量化研究相比较，上述定义方式把决策论中求解期望效用的比较方式分解成以下三个步骤：

第一步，考虑两个集合中所有元素的可能配对组合；

第二步，考虑每组元素之间的大小关系，并乘以该组两个元素各自出现的概率；

第三步，分别计算出x≤y以及y≤x这两类关系出现的概率总和，再进一步进行比较。

其中第三个步骤是重点：此处抛弃了决策论中对≤-关系的赋值(亦即并没有将该二元关系转化为效用函数来表示)，而直接利用集合中元素之间的大小关系，将它们用-函数计算出来。对任意两个元素x和y而言，如果x≤y成立，那么x≤y就需要“记录”这个关系(用1表示)，从而通过乘以这组关系出现的概率，作为最终求和的一部分；反之，x≤y则不需要“记录”该关系(用0表示)。因而在最终对比x≤y和y≤x这两类关系的概率总和时，-函数就有效记录了这两类关系所出现的总次数。

不过，这种概率化偏好比较方法与纯量化的计算方式还是存在一些区别：将概率加入≤-关系考量之后，集合之间的≤-关系不再具备传递性(2)满足概率化偏好比较方法定义的≤-关系并不传递。对于这个结论可以举出三类反例：(1)假设X={2}，Y={3}且Z={1，4}，这些元素之间的偏好关系是1<2<3<4，并且对其中的任意两个集合而言，每一对元素出现的概率都是它们在各自集合中被抽出的客观概率。那么根据概率化偏好比较方法可以得出：X=Z，Y=Z并且X

接下来简单介绍这个方法在概率悖论方面的一个应用即掷骰子游戏：

张三邀请李四玩骰子。现在桌子上有三个骰子：A、B和C。它们分别是：

A={3,3,5,5,7,7}；B={2,2,4,4,9,9}；C={1,1,6,6,8,8}。

张三要求李四首先选择一个骰子，然后他选择剩下两个中的一个。在投掷两个骰子的过程中，掷出更大数字的人就是胜利者。那么张三应该选择哪一个骰子？

在以上游戏中，无论李四选择了哪个骰子，张三都可以有获胜的策略。通过对任意两个骰子之间的点数以及出现概率的比较，并且计算每个骰子各自点数出现的概率，可以推断出：

因此，如果李四选A，那么张三将选择C；如果李四选择B，那么张三将选择A；如果李四选择C，那么张三将选择B。显然，这三组之间的偏好并不具有传递性，而本节所定义的概率化偏好比较方法恰好可以用来解释这种概率悖论。

基于以上对概率化偏好比较方法的阐释，接下来引入概率偏好模型。

首先，需要对命题逻辑语言进行扩充，引入形如φ≤ψ这样的公式。其中，φ和ψ都是由命题变号或者仅仅是由布尔运算构成的命题。在语义上，φ≤ψ这个公式表达的是：公式ψ至少和公式φ一样被偏好。

接下来给出关于概率偏好模型的定义：

概率偏好模型M是一个四元组M=。其中，S是一个非空且有穷的状态集；⪯是S上的一个自反且传递的二元关系；V指派给每个命题变号一个S的子集；P是从S到[0,1]的一个概率分布。

再次，根据模型的定义给出模型上的可满足关系。命题变号以及布尔运算按照通常的定义。其中，最为关键的是定义φ≤ψ这类公式如何在模型M上被满足。依然借助概率化偏好比较方法，模型M上的一个状态满足φ≤ψ公式，当且仅当满足ψ公式的那些状态y以及满足φ公式的那些状态x，能够保证x≤y这类关系出现的总概率至少和y≤x这类关系出现的总概率一样大。这个定义方式在直观上与概率化偏好比较方法的定义相同。它们之间唯一的差异在于：此处x和y的概率是分别基于φ公式和ψ公式的条件概率。这是因为在定义模型M时，P是从S到[0,1]的一个概率分布，由此必须首先计算出在S中分别满足φ公式和ψ公式的那些状态的概率，再来各自计算它们中每个元素出现的概率。

最后，根据以上关于概率偏好模型的定义以及模型上可满足关系的定义，接下来列举该逻辑的一些有效式和非有效式，并以此来解释该模型的一些逻辑性质。

概率偏好模型中的有效式枚举如下，我们省略证明：

(φ≤ψ)(ψ≤φ)。该公式表示的是：概率偏好模型保证了偏好关系的完全性。

φ≤φ。该公式表示的是：概率偏好模型保证了偏好关系的自反性。

(φ≤ψ)((φ)≤(ψ))。该公式表示的是：概率偏好模型保证了偏好关系的有穷求和属性。

(φ≤ψ)(φ≤(φψ)≤ψ)。该公式表示的是：概率偏好模型满足了决策论所关心的独立性条件，它也是杰弗里在考虑量化的偏好关系时所提出的必要条件。

(φ≤ψ)(≤ψ)((φ)≤ψ)。该公式表示的是：对三个对象(或公式)而言，假如主体有个最偏好的对象，那么即使将另外两个对象结合在一起，主体依然会选择他最偏好的那个对象。

概率偏好模型中的非有效式枚举如下，同样省略证明：

φ≤┬。该公式不是有效的，它表示的是：存在一些公式使得它们的概率至少和重言式一样大。

(φ≤ψ)(ψ≤)(φ≤)。该公式不是有效的，它表示的是：概率偏好模型的偏好关系并不传递。

由此可见，概率偏好模型满足了第三节探讨偏好逻辑时所提到的偏好关系应该具有的大部分性质，并且去除了那些显然不应该具有的性质。虽然这种定义方式不能保证传递性，但也不失为一种统一逻辑和概率的新方法。

五、结论

本文遵循了两个研究方向，具体探讨了≤-关系在质化和量化两方面的研究成果，引入了概率与≤-关系相结合的中间道路，详细介绍了其中的-函数及其具体应用。作为一种初步尝试，本文试图将量化的研究方式引入偏好逻辑的研究中。除此之外，本文还为这种新方式提供了逻辑模型，并探讨了该概率偏好模型所具有的逻辑性质。

当然，针对偏好逻辑的概率化研究，逻辑定义方面可以做更多的尝试。本文主要是通过回顾质化以及量化方法，揭示出了两种截然不同的思维方式，并展示了这两种方式结合的可能性。虽然完全公理化仍然是一个未解决的问题，但总体而言，本文所提出的研究方式为偏好逻辑的研究提供了一个新的维度，也为逻辑的概率化研究指出了一条中间道路。