贝叶斯统计理论的形成与嬗变
2020-09-29刘玉清
刘玉清
摘 要:贝叶斯统计理论是现代数理统计学中较具影响力的理论,其在长期发展中逐渐成为了一种学派,对现代数理统计有着巨大的影响。本文为了了解该理论的形成与嬗变将展开研究,对该理论的起源、发展历史进行论述。通过分析了解到,贝叶斯统计理论来源于概率论的思想背景与机会学理论,在后续发展中该理论被广泛应用,且逐渐与经典学派分离,形成了一种独立的学派。
关键词:贝叶斯统计理论;形成;嬗变
数理统计学本身就是一种通用性的学术领域,在现代各大领域中都需要通过数理统计学手段來开展工作,而贝叶斯统计理论作为树立统计学的理论手段,自然受到了人们的广泛关注与采纳。但现代多数人对贝叶斯统计理论的形成与嬗变并不了解,使得使用相关手段时不知变通,限制了理论的作用发挥,因此对其形成与嬗变进行研究具有一定现实意义。
一、贝叶斯统计理论的形成
(一)概率论的思想背景
概率论最早出现在“赌博”活动中,活动参与者会通过各种非数学的方法对自身行为的获胜概率进行统计,这种统计结果比较主观,且不科学,因此当时概率并不属于数学范畴,是一个非数学观念。但这种非数学范畴的概率统计方法引起了当时数学界的关注,多数数学家都发现了概率中隐含的数学规律,而这种规律在当时还模糊不清,这也引起了数学家们的研究,随后出现了很多有关于概率论的研究。例如1657年,荷兰科学家克里斯蒂安·惠更斯(Christiaan Huygens)发表了《论赌博中的计算》文章,此举成功将概率论带入到了数学范畴,奠定了概率数学逻辑。而这些关于概率论的研究中,不少研究并不能清晰展示概率论的逻辑,因此在贝叶斯统计理论出现之前,概率论中依旧存在很多模糊的地方,计算方法也不完全可靠。这种模糊不清的现象一直持续到托马斯·贝叶斯的出现,他受前人影响对以往模糊不清的概率论进行研究,撰写了对概率进行深入探讨的著作《机会学说中一个问题的解》,该文章由贝叶斯好友普莱斯在贝叶斯逝世后发表,这篇文章中贝叶斯针对概率论基础理论使用了归纳推理法,这种方法成功让概率论有据可依,至少可以解决当时大部分无法用以往方法无法进行概率计算的问题,而这也是贝叶斯统计理论的起源。
(二)机会学理论
在贝叶斯统计理论当中,机会学理论是该理论体系的核心概念,即《机会学说中一个问题的解》就是以机会学为核心来撰写的。在《机会学说中一个问题的解》中,贝叶斯希望找到一种可以在给定、假定情况下对事件的发生概率进行判断的方法,这种方法的重点在于“假定”,即假定是指我们对事件情况完全不了解的情况下,根据事件曾经发生的次数、失败的次数进行计算,计算结果代表了该事件在假定情况下其发生概率在任意二值之间的机会,在贝叶斯的描述中该方法所计算的问题被称为“逆概率问题”,这一问题也是《机会学说中一个问题的解》文章所论述的核心。
在研究当中,贝叶斯首先提出了他要研究的问题“给定一个未知事件发生和失败的次数,求其在一次试验中发生的概率在任意指定的概率度之间的机遇”,其次针对这一问题贝叶斯展开了n重伯努利试验,试验步骤见下文。
1.步骤一,问题假设
在n重伯努利试验中,贝叶斯将事件发生的次数设为X、每次试验的事件发生概率为θ,随后给出了问题假设表达式,见公式(1)。
2.步骤二,问题定义
单纯围绕问题假设公式,其中θ就会成为一个随机变量,而这种变量显然会造成结果上的争议,说明计算结果不可靠,这时贝叶斯也发现了这一问题,随后在文章中进行了问题定义:在多个相互独立事件同时存在的条件下,其中任意事件发生后,其他事件都不可发生;两个对立的事件中,任意事件一旦发生,则另外事件不能同时发生;若事件1未发生或对立的事件2发生,则代表事件1发生失败;当事件发生或失败,则事件被确认;事件的发生概率代表了它发生的期望价值除以它发生时得到的价值;机会即概率;任意事件如果不会对其他事件的发生概率造成影响,则说明该与其他事件相互独立。这种定义代表贝叶斯通过公理化的演绎式推理使问题变得清晰。
3.步骤三,问题计算
在问题假设与问题定义基础上,贝叶斯开始对问题进行计算,目的在于解决逆概率问题。他提到,当未知事件M的发生概率为θ,且θ未知时,M在n次试验中的成功次数为r,失败次数为n-r,因此通过公式(3)能够对θ在常数a、b之间的概率进行计算。
通过贝叶斯定理公式,我们可以在不知道事件发生概率,但知道在相同情况下事件发生次数、失败次数的条件下,通过积分对事件发生概率进行判断,同时这种规则适用于任何事件,说明贝叶斯统计理论使用范围广泛。
二、贝叶斯统计理论的嬗变
(一)嬗变的起源
贝叶斯统计理论的形成时间很早,可追溯到18世纪至19世纪期间,但在当时该理论并没有得到大家的重视,多数人依旧非常依赖传统方法所代表的经典学派。这种现象一直延续到20世纪,当时大量数理统计领域学者发现传统方法难以得出令人满意的结果,而尝试性地使用了贝叶斯统计理论方法,结果出人意料,因此在20世纪很多人对贝叶斯统计理论进行了研究,如英国学者哈罗德·杰弗里斯、伦纳德·吉米·萨维奇等,对弗兰克·拉姆齐在1931年提出的主观概率概念进行了研究,研究中就采用了贝叶斯理论对主观概率的结构进行了描述与分析;1955年赫伯特·罗宾斯在基础贝叶斯统计理论上提出了经验贝叶斯方法,该方法至今仍受学术界关注;1958年贝叶斯《机会学说中一个问题的解》被英国某统计杂志刊登发表。这既为贝叶斯统计理论嬗变起源。
(二)嬗变历程
贝叶斯统计理论作为一个发源于18世纪的理论,距今已经300余年,在冗长的历史时间当中,它的嬗变历程大体可以分为三个阶段,即主观概率、“后验概率∝先验概率*似然”概率论释义、经验贝叶斯方法,各阶段具体内容见下文。
1.主观概率
主观概率由弗兰克·拉姆齐提出,这种概率论与贝叶斯概率观点相符,因此被认为是贝叶斯概率观点之一。根据弗兰克·拉姆齐描述可知,主观概率与经典概率论学派最大的不同在于前者反对后者提出的频率理论,即不能以频率的结构与分析概率,但主觀概率非常强调“信任”,如在弗兰克·拉姆齐的著作《真理与概率》当中,他提出了一种基于信任的“打赌”概念:在生活中我们时常会进行打赌,而打赌就是对概率的赌博,但赌博必须建立在信任基础上,如我与某人打赌今日某个商店是否开门,若我认为商店不开门,就代表我对商店开门的不信任,否则反之,或者我对商店开门与否都不信任,则我会拒绝打赌,脱离对商店开门概率的追究。这种理论就来源于人主观意识上的信任,与贝叶斯理论所表述的观点一致。
2.“后验概率∝先验概率*似然”概率论释义
“后验概率∝先验概率*似然”概率论释义来源于哈罗德·杰弗里斯,他将概率论视作理解科学方法的必要条件,并根据贝叶斯统计理论提出了“后验概率∝先验概率*似然”概率论释义,认为贝叶斯对概率论的意义重大,值得推广。
3.经验贝叶斯方法
经验贝叶斯方法来源于赫伯特·罗宾斯,他在1955年提出了这种方法。经验贝叶斯方法中,采取了贝叶斯统计理论的统计推断过程,且具有归纳性,符合贝叶斯的归纳推理法,过程中需要先采集先验样本,再通过客观方法将样本代入到主观的贝叶斯理论中,通过这种方法所得出的结果与原始贝叶斯统计方法高度一致。该方法的出现基本奠定了贝叶斯统计理论在数理统计理论中的地位,即原始贝叶斯统计方法被认为过于主观,在样本分布上太过随意,因此结果不可靠,这一点常被经典学派人员诟病,而经验贝叶斯方法则消除了这一缺陷,该方法以客观为主导再转向主观,使得原始贝叶斯统计方法具有客观属性,结果自然更加可靠,因此经验贝叶斯方法一直流传至今,现行统计学方法一般具有该方法的影子。
三、结语
综上,本文对贝叶斯统计理论的形成与嬗变进行了分析,通过分析阐述了贝叶斯统计理论形成背景与起源,描述了该理论在数理统计中的观点与操作方法,该理论中的方法成功突破了传统概率论模糊不清的现象,因此意义重大,而在后期发展中,人们还是发现了原始贝叶斯统计理论的不足,使得大量研究人员对贝叶斯统计理论进行了研究,促使该理论发生嬗变,最终形成了经验贝叶斯方法,该方法对现代数理统计研究影响重大,可消除以往缺陷、确保统计结果质量。
参考文献:
[1]苏岩.贝叶斯统计的发展及其争鸣[J].保定师范专科学校学报,2003(2):1-3.
[2]谢宏斌.贝叶斯公式的应用和推广[J].数学学习与研究,2017(10):8.
[3]王彩琴.贝叶斯公式的推广[J].数学学习与研究,2017(11):9.
[4]朱慧明.现代贝叶斯统计理论的基本观点与研究现状[J].江苏统计,2003(1):12-13.