借一斑以窥全豹
——贝叶斯公式教学研探
2016-05-16张卓尹晓丽
张卓,尹晓丽
(山西大学商务学院,山西 太原 030031)
在概率论中,全概率公式与贝叶斯公式是十分重要的一组公式,它们是处理复杂随机事件有关概率问题的得力工具。教学中既是重点也是难点,以下通过一则实例展开教学初探。
【实例】某地区肝癌发病率为0.04%。在该地区进行血检,肝癌患者化验呈阳性概率为99%,健康人化验呈阳性概率为0.1%。现从中随机抽查一人,求化验为阳性的概率。
【初窥】化验呈阳性有两种可能:患者化验呈阳性或正常人化验呈阳性。所以,呈现阳性这一结果确实是受多种因素影响的复杂随机事件,将其设为B。导致B 发生的原因设为完备事件组。设A:在该地区随机抽查一人为患者。A:在该地区随机抽查一人为健康人。由全概率公式可知,B 事件的概率可拆分为两个互斥的,受单因素影响的事件概率之和,即:
【再窥】事实上,普查的目的并不在此,而是想知道化验为阳性的人是否真的患病。故提出新问题:“已知某人检查结果呈阳性,求其确为癌症患者的概率”,即已知结果事件B 发生了,求事件A 发生的概率,这样的问题属于贝叶斯理论研究的范畴。下面我们来看贝叶斯公式:
设A1,A2,…An…是一个完备事件组,且P(B)>0,P(A1)>0(i=1,2,…),
此处引导学生自己推导:等号左侧为条件概率,按公式展开,分母按照全概率公式展开,考虑各个情形下事件B 发生的概率,分子按照乘法公式展开,考虑单一因素影响下事件B 发生的概率,即可得贝叶斯公式。
贝叶斯公式貌似简单,就是条件概率公式、乘法公式、全概率公式的重组,但它的出现引发了概率界的巨大变化,出现了贝叶斯学派、贝叶斯统计。这是因为在此之前的概率,均为正向概率,如分母上的全概率公式,是计算结果的概率,是从原因到结果的正向思维。而贝叶斯公式是在结果发生后,反推其原因的概率,是逆向思维,又称为逆概公式,是质的飞跃。
下面利用贝叶斯公式来解决以上提到的新问题“已知化验结果呈阳性,问确实为癌症患者的概率”。依照贝叶斯公式,代入数据可得,结果为P(A|B)=0.2846。这表明医务工作者仅凭一次化验为阳性就判断此人为癌症患者的把握并不到3 成。于是建议此人复查。若化验结果仍为阳性,则几乎可以认定他是患者,而不是怀疑。如何解释态度的转变呢? 下面我们将其量化,具体计算第二次试验为阳性的条件下,此人为患者的概率。注意此时我们就不能再利用P(A)=0.04%来计算分母了。因为此人第一次化验结果呈阳性。有了这一新信息的加入,判断他患病的可能性就增大至0.2846,而非对自然人群患病率的判断0.04%。再次使用贝叶斯公式,代入数值计算可得结果为0.997。
【三窥】这三个概率的关系:本例中患病的概率P(A)先于试验,是在没有已知任何复杂事件是否发生的情况下人们通过已有的经验给出的,称为先验概率。P(A|B)是在增加了结果(检验出阳性)发生的这个新信息后,对原因事件发生概率P(A)的重新判断,后于试验,称为后验概率。故,贝叶斯公式的作用可看作是由先验概率获得后验概率,再由后验概率修正先验概率。比如第一次做化验后,医务人员就用后验概率0.2846 修正了先验概率0.0004,从而怀疑此人患病。复查后医务人员对其患病这一事件态度的转变正是源于用第二次试验后的后验概率0.997 修正了先验概率0.2846,是对先验概率的重新认识。只要细心观察,贝叶斯公式无处不在,马航搜救正是利用了贝叶斯理论,在获得新信息后不断修正并确定新的搜救范围来寻找失联客机。
【总结】全概率公式与贝叶斯公式都是原有知识的重组,是条件概率、乘法概率公式结合的产物,它们的应用背景都是处理受多重因素影响的复杂随机事件的概率问题。不同之处在于:由因索果用全概,执果溯因用逆概。