从抽样悖论看概率的主观解释
2014-03-25黄闪闪
黄闪闪,李 铁
(天津理工大学法政学院,天津 300384)
科学推理对概率的重视,源于两个重要因素:一是古典归纳逻辑的沉寂。古典归纳逻辑实际上是一套针对归纳问题的方法论。自从休谟问题提出后,归纳方法的合理性遭到质疑,特别是简单枚举法等古典归纳方法。二是概率归纳逻辑的产生和发展。概率归纳逻辑是应用概率论来系统地研究和表述或然性推理的,它呈现了一种不同于古典归纳法的新思路。
为了保证和体现科学推理的客观性,我们在哲学层面上必须讨论主观概率和客观概率的选择问题,而事实上许多学者比较推崇客观概率,对主观概率进行了诘难和否定。尽管贝叶斯主义者不回避且接受了主观概率,但是由此带来的一些问题使其遭到了非议。特别是一些坚持频率解释的频率主义者,他们认为概率的主观解释背离了科学推理的客观性理想,证据对科学假设的支持度完全是客观的,容不得主观因素掺杂进来[1]81。这似乎表明概率解释问题的答案必须是一元的。然而,通过分析随机抽样悖论,我们看到完全的客观概率是难以实现的。从概率的应用上看,概率解释的选择是多元的,并且这种多元化观点为主观概率解释的发展提供了一些启示,例如吉利斯的主体交互概率解释。
一、概率的客观与主观之争
自引入帕斯卡概率以后,归纳逻辑开启了一条新的研究进路——定量机制。这种机制代表了现代归纳逻辑的主流,即承认存在统计规律,虽然无法判定假说内容的真实性,但我们可以判定证据对假说给予了多大程度的支持,有多大的概率可以相信假说是正确的。这一进路建立在帕斯卡的概率演算规则之上,经逻辑学家们赋予其不同的解释而向前发展。
客观概率与主观概率的划分,既是不同归纳定量机制争论的焦点之一,也是科学推理必须选择和回答的问题。具体而言,坚持客观概率的频率主义者认为,概率的频率解释可以满足科学推理的客观性理想;而贝叶斯主义者认为,客观概率可以说明假说与证据之间的必然关系,科学推理需要客观概率。面对客观概率可能无法计算的问题,贝叶斯主义者①具体而言,本文出现的“贝叶斯主义者”特指“主观贝叶斯主义者”。认为可以通过相关条件原则来对主观性进行约束。换言之,贝叶斯主义者坚持概率的主观解释。
频率主义者认为,概率就是某一事件或属性在无穷序列中出现的相对频率的极限。频率解释的代表人物有冯·米塞斯和莱欣巴赫等人。莱欣巴赫主张通过渐近认定的简单枚举法来确定基本概率。这一特点决定了频率解释适用于可重复发生的独立事件,如为了表示天津夏季(6~8月)日降水量在20毫米以上的天气事件的可能发生数,可用历年天津6~8月较长历史时期内的大样本资料来表征。然而,这一特点也带来了频率解释的困难:无法判定单个事件的概率。如“W女士会不会在最近的选举中投左翼候选人的票”这类不可重复发生的事件。为了解决这类问题,莱欣巴赫引入了“权重”概念,即个别事件属于相应的参照类,根据参照类可以给特定事件一个权重值。但是,这一方法仍带有主观性,因为同一事件可分属于不同的参照类,而参照类的选择在于个人的意愿。可见,尽管频率主义者认为频率解释是一种客观概率,但是在实际操作中回避不了主观性。
贝叶斯主义者认为,概率是特定个体的信念度,具有同样证据的不同个体被允许对同一假说赋予不同的概率。概率的这一主观理论由拉姆齐和德·芬内蒂大约在同一时期独立完成。主观解释采用最大赌商的方法来确定先验概率,即概率的大小取决于特定个体的合理信任度,而这种主观的信任度可通过客观行为来进行测量。由于科学推理中很难计算一个科学理论的客观概率,所以贝叶斯主义者对主观概率进行了约束,试图摆脱主观性的诘难。科学哲学中的贝叶斯主义发展迅速,主要包含两个假设:首先,我们能够分辨不同的信念度或主观概率;其次,对于一个理性人,这些主观概率应该遵守概率演算公理。显然,对于多种不同的命题,我们持有不同的信念度或置信度。我们完全可以确定某些事件,比如草是绿的或者不是绿的;同时也可能不相信某些事件,例如某个朋友会偿还数周前借的100块钱。具体来说,主观概率的约束问题与两条定理相关——荷兰赌定理与意见收敛定理。荷兰赌定理规定,合理的信念度必须满足概率演算公理。意见收敛定理表明,随着证据的增加,先验概率的主观任意性会被后验概率的客观确定性所取代。
面对概率的主客观之争,贝叶斯主义者采取的态度是:追求客观性,不回避主观性。单单对贝叶斯定理本身分析,如果只是作为一种关于客观概率的断言,这个数学公式是完全不可能客观的,因为根据概率演算公理和条件概率的定义可知,贝叶斯定理无法避免主观性。但是上升到哲学层面,将贝叶斯定理用以解释理论与证据之间的关系时,贝叶斯主义者又需要客观概率,因为只要将客观概率纳入其中,贝叶斯定理就能表现出理论与证据二者之间的必然关系,而这正是逻辑学家所希冀和追求的结果。可见,客观性理想与主观性约束是一致的。问题在于:可数可加性在荷兰赌定理中面临可满足性问题,概率演算公理要求的可数可加性,其附带的信念不对称;以及意见收敛定理相关的条件化中的一致性问题,使得主观解释重新面临主观性诘难[2]11,进而影响贝叶斯方法的合理性基础。
二、随机抽样悖论中的主观性
斯图尔特(Stuart)认为抽样悖论在经典推理中不可避免,是有效经典统计方法必须“咽下的一副苦药”[3]253。抽样悖论是频率解释无法回避主观性的一个例证。随机抽样悖论表明,经典统计推理将样本数据视为有待分析的唯一具“客观的”形式的资料,即只有样本数据才是适合进行定量化和加以形式分析的。然而,推理者的先验信息或偏好事实上也是量化处理和形式分析的重要部分,经典统计方法忽视了这一点,进而导致了矛盾。
经典统计推理有时候也可以称为频率主义[3]131。频率主义认为客观世界存在统计规律,用频率表示的概率正好能显示事件过程和客观趋势。这种立场表明,经典统计推理必须以频率解释作为唯一根据。虽然文恩(Venn)于1866年已经提出这种根据相对频率刻画概率的思想,但是频率理论真正得以发展和系统化却是在20世纪,代表人物有费希尔、冯·米塞斯和莱欣巴赫。例如冯·米塞斯认为,他的频率理论为概率的科学应用提供了基础。根据概率的频率解释,在一次硬币投掷实验中,参数p被看作近似于一个比率,即正面朝上在n次硬币投掷中出现的次数除以n的比率。这个比率被称为正面朝上在n次硬币投掷中的相对频率。
统计推理是证明各种统计假说合理性的归纳推理,它是一种现代意义上的归纳推理。统计假说与概率陈述的对称性,表明经典统计推理采取了概率的频率解释。经典统计推理坚持频率说,认为统计假说应该用频率表征。但是统计假说和概率陈述之间可以完全的对应。对于任何统计假说来说,都能够表述为相对应的概率陈述。例如,这个学校的1/4学生是二年级学生,这个真的统计假说对应的概率陈述是:(随机地)选出一个二年级学生的概率是1/4。为了便于理解,我们一般用概率来表述经典统计推理的结论。从这个意义上来看,经典统计推理接受了概率的频率解释。
经典统计推理是以统计数据或资料为前提,以概率论为基础的推理。这决定了经典统计推理需要一个抽样过程。统计假说是一种带有百分比的特称假说,如57%的泰国成年男子是佛教徒。在统计中,我们将这类假说所要考察对象的全体称为总体。上例中的全体泰国男子就是我们研究的总体。由于总体的数量通常比较庞大,一般会选择总体的一部分个体或分子作为被研究对象,这些被抽取的个体或分子称为样本。从总体中抽取样本的方法叫抽样。为了保证样本的代表性,经典统计推理通常采取的是随机抽样的方法。
统计假说和统计推理的可靠性主要取决于样本的代表性。通常采取的抽样方法有两种:随机抽样和判断抽样。随机抽样原则主张,恰当的估计只能通过客观上随机选择的样本才能获得。例如,一个装有相同筹码的袋子,每个筹码分别对应总体中的单个成员,给它们相应地做上标记,彻底抖动袋子并随意抽取一个筹码;按照规定的次数重复抽取,而挑选的总体成员就是这些抽取出来的筹码,它们就组成了一个随机样本。判断抽样加入了抽样者的判断,这种抽样不是随意的,容易受到偏好的影响。例如,市场调查中的定额抽样,被采访者被指定了某些特性和特征,诸如特定社会阶层与地理区域。判断抽样具有实用性的优点,例如,出于实用性考虑,大概90%的市场调查采用定额抽样,并且在大多数情况下,它在提供一致性结果上是充分可靠的。
但是一些经典统计学家坚持随机抽样,他们认为抽样应该是一个物理随机过程,而随机抽样不要求个体判断,它是相当客观和不带个人色彩的。经典统计学家对判断抽样的异议主要有三点:(1)判断抽样把一种不需要的主观性引入到估计过程中。判断抽样中包含个体判断,即个体特征与正在计算的总体参数相关联,例如作出判断时要考虑一个人的社会阶层、年龄和性别等,判断抽样认为这些都是一个抽样过程的相关因素。但是,没有全面彻底的调查总体就绝对不能断定有多少可能相关因素的关联性,因此从一个实验者到另一个实验者之间存在相当大的意见变化空间。这与随机抽样形成对比,随机抽样不要求个体判断,它是相当客观和不带个人色彩的。(2)第二种异议实际上从属于第一种异议,即判断样本容易受到偏好的影响,或者因为实验者的无知,或者凭借无意识的训练,甚至是有意识的个人偏见。Yate用一些事例阐明了偏好对抽样的危害。在这些事例中,实验者选择代表性样本的尝试被一次评估和考察决定性变量的失败而破坏。(3)第三种异议认为,判断抽样不能作为一种适用于估计的客观方法。
随机抽样的随机性特点,满足了经典统计推理对客观性的要求。经典估计和显著性检验用于推断过程的数据都是样本数据,它们都把样本数据作为定量化分析的唯一客观资料。然而,这种观点忽略了推理主体的背景知识,这不仅不符合科学推理活动的实际过程,毕竟推理主体掌握的背景知识或先验信息也是推理的重要部分,同时也带来了斯图尔特描述的“抽样悖论”。
一方面,随机抽样原则主张只能通过客观上随机选择的样本才能获得恰当的估计。统计学家声称估计和检验的经典方法是完全客观的。为保证科学推理的客观性,他们要求数据的样本分布也是客观的。这要求必须通过一个无偏倚的物理过程产生用于估计的样本来确保每个总体元素客观上具有同等被选择的可能。可见,一个随机过程产生完全相同的样本都是完全没问题,且是可接受的。另一方面,为了确保随机过程产生完全相同的样本,使得总体各个元素正好被赋予样本中包含的相同客观概率,统计学家在抽样时会带有一定的目的和意图。这样,随意刻画的样本对一个恰当的经典统计将不会提供任何信息,且是不可接受的,这就是“抽样悖论”。一个随机过程产生的完全相同样本,既是可接受的,又是不可接受的。
三、贝叶斯主义对抽样悖论的消除
将贝叶斯方法用于统计假说的相关结果,构成了贝叶斯统计推理的内容。贝叶斯统计推理同样属于归纳推理的范畴,它是一种依托贝叶斯定理,通过相应先验分布而来的后验概率或密度分布来获取新信息的计算。数十年来,贝叶斯主义的观点和方法在经历被轻视和拒绝后,最终在统计推理中得以复兴。
贝叶斯统计推理同样受到抽样方法的影响,但是它认为抽样方法本身不存在任何悖论,因为通过收集数据可以获得有用的信息。抽样悖论的产生,在于经典方法单纯的采用样本数据,排除了很难量化的先验知识,进而导致了主客观之间的矛盾。而贝叶斯方法用赌商的方式量化了先验知识,将它作为先验分布,与通过似然函数方式引入的观测数据一起计算后验分布,这样就很好地协调了主客观之间的关系。例如,要估计一个特定党派的投票支持者(属性A)在总体θ中所占的比例,样本由一个投票支持者(属性A)组成,且这个投票者超过了60岁(属性B),根据这些信息,通过能够获得后验分布。可以通过多种方式来收集这个样本,它可以是一个来自整个总体的随机变量,也可以只是来自包含B属性(年龄超过60岁)的那部分总体。如果是后者,那么P(B)=P(B|θ)=1;如果是前者,当且仅当B和θ是概率上独立的,P(B)=P(B|θ)。不管是哪种情况,这两种抽样方法都会导出同样的贝叶斯结论。虽然这是一个特例,通常一个指定样本的归纳力会受到选择过程的影响,但是这在直觉上是正确的。
贝叶斯主义立场与经典立场都同意抽样方法和样本是归纳上相关的,他们的分歧在于随机样本的作用。经典立场认为,只有通过物理随机化机制得到的随机样本才能够提供信息,所以不能使用其他类型的样本。而贝叶斯主义则认为,除了随机抽样外,还认同立意抽样和判断抽样。
四、概率的多元论:从概率的应用上看
贝叶斯主义对抽样悖论的消除,再次表明主观解释并不忌讳主观性,并且认为主观性在贝叶斯推理中是恰当的。具体来说,第一,科学评估本来就含有科学家的主观因素,而贝叶斯主义中的主观性是以先验概率的形式明确表现的,这是没有必要隐讳的;第二,贝叶斯推理是客观的归纳推理,这套逻辑将先验概率作为前提,以贝叶斯定理作为推理规则,产生一个有效的推论:后验分布。这种推理非常类似于演绎逻辑,即首先筛选前提,然后推理机制根据这些前提导出有效的推论[4]。
上述讨论表明,纯粹的客观概率难以满足,概率的一元论观点值得商榷。甚至从实际应用上看,概率应该是多元的。
概率的应用性与归纳逻辑的第三次转折密切相关。归纳逻辑发展的3次转折点分别是:其一,古典归纳逻辑向现代归纳逻辑的转向,这一阶段的特点是,从定性推理模型转为定量模型,引入数学概率,重视数理形式化方法,研究归纳逻辑的形式系统的句法结构。主要代表模型有莱欣巴赫的频率逻辑系统和卡尔纳普的概率逻辑系统。其二,研究重点转移到归纳形式系统的句法修正和语义解释的多元化,主要表现在两个方面:非帕斯卡概率逻辑的兴起,以及先验概率的哲学解释的发展。其三,归纳逻辑的关注点由元逻辑研究转向应用性逻辑。在社会科学领域,经济学家、社会学家、政治学家把概率应用于主体间行为、群体行为的研究,发展了经济博弈论和经济博弈的逻辑。在自然科学领域,计算机科学家和人工智能研究者把概率逻辑作为工具对包括专家系统、基于主体的系统等知识系统的知识进行推理,推动了贝叶斯网络、知识挖掘、知识处理等方面的研究。
一般来说,概率的客观解释适用于自然科学,因为自然科学中很容易找到一系列独立的可重复条件;而主观解释则更适用于社会科学,因为不可能所有的社会事件是可以完全重复的。而且客观概率与主观概率之间不是非此即彼的对立关系,它们之间具有连续谱系的性质。例如同是将人作为研究对象的人口学和医学,前者的研究重点在于社会科学方面,因为大范围内的人口增降更多与经济、战争等社会因素相关;而医学的研究则是自然科学方面大于社会科学方面,因为病人的生理状况是疾病的主要原因,而信仰和情绪等这类社会和心理因素则是次要的。可以说,人口学隶属于社会科学,其中的主导概率是主观解释。而就治病救人这一医生的基本职责而言,医学属于自然科学,其中客观概率起主要作用。
因此,每种概率都有它的适用范围,没有普适性的唯一概率。这就是概率解释的多元论观点。与概率一元论比较,概率多元论更为恰当。“这种观点的理论依据在于逻辑哲学的恰当性原理。每一种概率解释以及据此建立的概率逻辑系统都要面临形式系统内外是否恰当相符的问题。概率解释的适用范围和可应用性是由形式系统内外的恰当相符性所决定的。”[5]
概率的多元论观点也为贝叶斯主义的概率解释提供了一些发展依据。正如江天骥先生指出,“贝叶斯解释或主观主义的解释在许多方面是逻辑解释的弱化形式。它基本上是心理的而不是逻辑的。”[6]可见,贝叶斯主义并非通常理解的“主观主义”,对概率的私人主义解释是“认识解释”、“心理解释”,它把主观与客观两方面因素都考虑进去了,比自称纯客观解释的“频率解释”,更切合实际。
在概率的解释上,吉利斯尝试发展了一种关于把主观解释从个体扩展到社会群体的主体交互解释。这种解释将概率看成一个社会群体的共同信念度,而不像主观解释那样,将概率解释成一个特定个体的私人信念度。
吉利斯定义了主体交互解释,并提出了形成这种解释的满足条件。一个社会群体形成主体交互概率具体包括两个条件[7]:(1)具有共同的旨趣。也就是说构成一个群体的成员必须有共同的关注、利益或兴趣等。(2)保持信息流的传递(Flow of Information)。一个群体的成员之间必须要有信息流的传递和观点的交流,只有通过采用直接的(在任何两个成员之间)或是间接的(通过第三个成员的介入)方式及时地交换相互取得的发现与信息,才能保证信息得到真正的沟通和传递。由于主体交互解释是把荷兰赌论证从个体向群体扩展的结果,所以它在某种意义上可以看做是主观解释的发展,而与主观解释并不矛盾。与主观解释可以任意选择信念度相比,主体交互解释更为强调一个社会群体所形成的一致的或共同的信念度。这在某种程度上避免了主观解释的主观任意性问题,对先验概率进行了一定的约束,更具客观性。
除了引入主体交互概率外,吉利斯还介绍了完全客观概率和人造客体概率,继而陈述了一个从主观延伸到客观的概率解释系列[8],即主观—主体交互—人造客体—完全客观。这里的“人造客体”强调“客观”存在于物质世界,但它是人类与自然界相互作用的产物。例如木桌,它是人类发挥主观能动性,在自然木材的基础上加工而成的。“完全客观”是完全独立于人类的客观事物,如太阳,自人类产生前便一直独立存在。这些丰富的概率解释的提出,将促进对贝叶斯方法中的主客观问题的积极讨论,继而为主观概率解释的发展提供一些启发性意见。
[1]陈晓平.贝叶斯方法与科学合理性[M].北京:人民出版社,2010:81.
[2]黄闪闪.贝叶斯主义的主观性问题及其发展进路探析[J].山东科技大学学报:社会科学版,2012,14(6):11-20.
[3]Howson C,Urbach P.Scientific Reasoning:The Bayesian Approach[M].Chicago:Open Court,2006.
[4]任晓明,黄闪闪.贝叶斯推理的逻辑与认知问题[J].浙江大学学报:人文社会科学版,2012(4):106-113.
[5]任晓明,桂起权.非经典逻辑系统发生学研究[M].天津:南开大学出版社,2011:116.
[6]江天骥.逻辑经验主义的认识论·当代西方科学哲学·归纳逻辑论[M].武汉:武汉大学出版社,2012:467.
[7]李旭燕,任晓明.主观解释新发展:主体交互解释[J].心智与计算,2007(3):293-299.
[8]李旭燕.帕斯卡概率解释之系列:从主观到客观[J].社会科学辑刊,2011(1):46-48.