APP下载

贝叶斯公式与一种连续的“信息加工器”

2013-04-29李翰芳罗幼喜

考试周刊 2013年70期

李翰芳 罗幼喜

摘 要: 本文从信息加工的角度分析了贝叶斯公式的核心思想,阐述了公式如何将“历史信息”和“当前信息”相结合,并可以连续进行“信息”加工的动态过程.文章利用两个实例进行了详细分析,不仅让学生深刻理解了公式的内涵,而且让学生灵活掌握了公式的外延.

关键词: 贝叶斯公式 历史信息 当前信息 信息加工器

1.引言

贝叶斯公式是英国数学家托马斯·贝叶斯(ThomasBayes)在1763年最早发表的,但当时其结果没有受到应有重视,后来法国数学家拉普拉斯在贝叶斯基础上进一步总结,人们才逐渐认识到这个公式的重要性.虽然这个公式形式上只不过是条件概率与乘法公式及全概率公式的推论,但理论本身蕴含了深刻的思想,而且有重要的现实应用.由该公式思想发展起来的“贝叶斯学派”在统计学历史发展过程中占据着不可或缺的地位.

在传统的教学过程中,大多是将该公式看做是一种计算概率的方法,没有深层次地挖掘该公式所蕴含的思想,故学生理解起来比较困难,因而不能够灵活掌握并应用.本文绕过贝叶斯公式繁杂的数学表达式,另辟蹊径,从“信息加工”的角度理解贝叶斯,让学生更直观而深刻地理解此公式背后隐含的思想和功能.

2.贝叶斯公式

这个公式也称为逆概率公式.

其中P(A)称为先验概率,可以看成是人们对事件A发生概率的初步判断或历史经验信息,P(A|B)称为后验概率,是指在当前某个事件B发生后,即有了“当前信息”后对A发生概率的重新评估.从上式可以看到,P(A|B)是综合了“历史信息”和“当前信息”之后得到的结果.贝叶斯方法的推断正是基于后验概率进行的,从而使该方法能够有效地将历史经验和当前数据相结合,做出更科学全面的决策.更难能可贵的是,该公式具有连续“信息”加工的能力,即我们可以进一步将P(A|B)作为先验,等到有另一个事件B′发生后对可以发生概率再做重新评估,从而一步一步地积累信息,不断加深对事件的认识.下面,我们就从几个生活中的实际例子阐述贝叶斯公式是如何对“历史信息”和“当前信息”进行逐步加工的.

3.案例分析

例1:设某银行根据客户的还款情况及时调整对客户的信用评价(信用良好的可信度).以往统计资料表明,信用良好的客户按期还款率为95%,信用不足的客户按照还款率为50%,某同学向银行办了张信用卡,办卡时的信用评价为0.9,问为什么该学生连续几次刷卡不还款后,最后终身都不享受向银行贷款的资格.

解:设事件A={信用良好},事件B={按期还款},根据题意分别有:

下面分别讨论2次刷卡没有按期还款的情况下,银行对该学生的信用评价.

第一次:

下面以0.47为银行对学生的信用评价,此学生第二次刷卡未按期还款,求银行对此学生的信用评价.

在上述例子中,办卡时的信用评价为0.9,这个可以看做是银行根据资料得到的客户“历史信息”.当学生有一次刷卡没有按期还款这个事件发生后,银行就会根据“当前信息”对学生信用作重新评价,即上述第一次有贝叶斯公式得到的后验概率0.47.于是银行将0.47作为学生的信用评价先验概率,等到如果有再次有刷卡未按期付款事件发生后,则可利用贝叶斯公式再次对学生信用进行评价,即第二次得到后验概率0.081.整个过程很好地体现了贝叶斯公式根据历史和当前资料,一步一步连续加工信息的能力.

从上面计算的结果我们也不难看出,第二次未还款后,银行对该学生的信用评价非常小,几乎为0,再经过连续几次故意不还款银行会将此学生打入黑名单,在以后将不能申请银行贷款.

例2:设根据往年调查资料表面,某地区患某种疾病的概率约为千分之一,假设患者对该种疾病化验反应是阳性的概率为0.95.正常人对该种疾病化验反应是阳性的概率为0.04,现抽查了一个人,其化验反应呈阳性,问此人确患该疾病的概率有多大?如果要对此人是否患该疾病进行确诊,还是否需要做再次化验检查?

此问题中,如果不做化验,抽查一人,那么他是患者该种疾病的概率P(A)=0.001,这个可以看成是先验信息,即根据历史调查资料所获得的信息.当某次体检化验呈阳性反应这个事件发生后,我们需要将“历史调查信息”与“当前化验信息”相结合,对此人患病概率进行重新估计,利用贝叶斯这个信息加工器,我们很容易计算出此人患该病的概率为P(A|B)≈0.023,从0.001增加到0.023,化验结果表明该人患病风险增加将近23倍,说明当前的化验对于诊断一个人是否患有该疾病非常有意义.

但从另一方面来看,此人患此疾病的概率也仅为P(A|B)≈0.023,这说明即使化验呈阳性,确实患此种疾病的可能性也只有2.3%.所以通常在这种情况下,医生也不会立即给病人下结论,而是建议重新做化验,下面我们来看如果此人接着做第二次化验后仍呈阳性的话,他确患此病的概率.则此时我们可将P(A|B)≈0.023来代替原来的P(A)=0.001作为患该疾病的先验概率,于是在第二次检测还呈阳性的情况下该人确实患此疾病的概率:

这进一步提高了检测的准确性,如果觉得还不精确,则可再化验一次,在进行第三次化验还是阳性的情况下该人确实患此疾病的概率:

这时医生就已经有很大的把握判定此人患有该疾病了,从上面的例子可以看到,医学上对于病人患病的确诊,就是借用贝叶斯公式这个“连续信息加工器”,将病人当前化验检查结果同历史资料信息相结合,一步一步对病人患病概率进行重新估计,逐步确诊.

4.结语

本文主要从信息加工的角度看待贝叶斯公式,分析了公式中先验概率即可看成是“历史信息”,当某个事件发生后,公式就将“历史信息”与“当前信息”相结合,对事件发生概率进行重新估计,得到后验概率,再通过后验概率做进一步的统计推断.并且,还分析了贝叶斯公式连续动态处理信息的能力,即将上一次得到的后验概率作为下一次的先验概率,结合下一次事件的发生对问题进行重新评估以做出更准确的决策.这样逐步积累“历史信息”,逐渐加深了解事物发生概率的过程符合人们的思维习惯.这样的解析可以让学生更容易、更清晰地理解和掌握贝叶斯公式.本文利用日常生活中常见的实例进行分析,将知识性与趣味性相结合,既让学生学到理论知识,又让学生学会理论知识在现实生活中的应用,加深对贝叶斯公式的理解和灵活运用.

参考文献:

[1]李子强.概率论与数理统计教程(第三版)[M].2011.

[2]费锡仙.概率论与数理统计习题集[M].国防科技大学出版社,2011.

[3]燕建梁.用贝叶斯公式解释化验结果[J].大学数学,2012,VOL28(3):111-113.