贝叶斯公式在实际生活中的应用
2020-07-21易强
易强
【摘要】贝叶斯公式被用于已知信息对原有判断进行修正提供完美的方法。凭借以往的经验,经济主体对先前的假设有预先的估计,对于先验概率的评估,一般可根据事物本身的经验加以判断;贝叶斯公式的应用十分广泛。
【关键词】贝叶斯公式全概率公式条件概率
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2020)25-0094-02
1.定理
已知试验E的样本空间记为S,A是E的事件,B1,B2,…,Bn是S的一个划分,且满足P(A)>0,P(Bi)>0(i=1,2,…,n),则:
称其为贝叶斯公式。
证明:根据条件概率的定义,以及全概率公式可得:
注:若n=2时,将B1改成B,并將B2改成B,则有如下两个式子成立:
2.贝叶斯公式的实际应用
(1)根据以前的临床记载,某种检验癌症的试验存在以下的效果,现记A代表事件“试验反应呈阳性”,记C代表事件“被诊断成癌症”,并有P(A|C)=0.95,P(A|C)=0.95。经过对自然人群进行普查,假设被检测的人存在癌症的概率是0.005,故P(C)=0.005,则P(C|A)等于多少?
由此结果可得,虽然有P(A|C)=0.95,P(A|C)=0.95,此两概率均比较大。但是将此试验拿来普查,却得P(C|A)=0.087,它的正确率只有8.7%(即每1000个存在阳性反应的人中,大概具有87人具有癌症)。如果没有注意到此点,则会得出错误的结论;当将P(A|C)与P(C|A)混淆后必定造成可怕的结果。
(2)某个工厂存在四个车间生产相同的一种零件,已知四个车间的产量依次占总产量的15%,20%,30%和35%,这四个车间生产的次品率,分别为0.04、0.03、0.02和0.01。工厂规定,如果发现了次品就会追究相关车间的经济责任。现在从该厂生产的产品中任取一件,结果是次品,但该件次品是哪个车间生产的代码已经脱落,则厂方该怎样处理这件次品比较合理?
再通过贝叶斯公式计算得:
根据上面的规定,4个车间依次应该承担27.91%,27.91%,27.91%和16.28%的经济赔偿,这样处理结果是比较合理的,由此还可以发现,尽管第四个车间的产量占到总产量的35%,但是它的次品率却是最低的,如果单凭经验按照生产的产量多少来处罚,就不好。
(3)通过资料介绍,存在某一项艾滋病的血液测试的敏感度(也就是确实有艾滋病的患者的检测结果会呈阳性)是95%,但是如果没有得艾滋病的检测者测得的精确度(即健康的人检测为阴性)是99%。众所周知,美国是一个艾滋病发病较为平凡的国家,约有1/1000的人员患有艾滋病。如果希望能有效的控制这种疾病,并且希望有效的控制艾滋病的快速传播,最近几年,有医药专家提议对新结婚的年轻夫妇要用这种方法进行检测,但是该方案提出后,却遭到了另外一些医药专家的反对,使得此项计划未能通过。
如何来解释医药专家没有通过这项决议,现用贝叶斯公式来对其进行解释:
记:A={测试的结果呈现阳性反应},B={某人被确诊成了艾滋病患者},由以上分析可得:
通过以上计算结果可得,被检测的患者确确实实是艾滋病患者的概率仅有0.087,这个结果概率很小,和我们实际的感受很不符合,依据我们提供的资料表明,这种检测结果表面上看来似乎精确度很高,这样就会使得一般人会这样认为,假定一个人检测出阳性,他就可能会认为,他患艾滋病的概率大约是90%,然而计算的结果实际上却是很小的,为8.7%,因此,假定要是通过了这项决议,就会导致更多的新婚夫妇产生不必要的恐慌,因为这其中其实大约有接近91.3%的患者并没有得上艾滋病,产生这个结果的原因是什么呢?这是由于得上艾滋病的人员的概率其实是相当低的,仅有1/1000的小概率事件,从而,在被检测出为阳性的所有患者里面,有很大一部分人员是没有得艾滋病的,举例说明如下:随机的在当地抽取1000名实验者,则存在1名得了艾滋病的人员,而另外的999名人员未患艾滋病,由全概率公式:1×0.95+999×0.01=10.94,即呈阳性的人约11人,但只有1人真正的患了艾滋病,这需要重新进行检测。
(4)一般进行普通检测的40岁左右的妇女患乳腺癌的几率大概为1%,假定某位妇女患有乳腺癌,那么她将有80%的概率进行早期的胸部肿瘤的X射线的检测。即使某位妇女没有患乳腺癌,她也有大约9.6%的几率进行早期的胸部肿瘤的X射线的检测,如果在这个群体中做常规检测的妇女,又做了早期的胸部肿瘤的X射线检测,试问该名妇女患乳腺癌的可能性是多少?
此问题中,对于心理专家来说,他们最关心的问题是,那
些不懂贝叶斯原理的人是如何分析概率的,现将他们的主观判定结果和利用贝叶斯公式算出来的答案作对比,进行推理其规律,结果是什么呢?有95%的内科医生的判断处于70%~80%这个范围,和正确答案相差较大。
记:B={患上乳腺癌的人},A={进行早期的胸部肿瘤的X射线的检查},则有:
P(B)=0.01,P(B)=0.99,P(A|B)=0.8,P(A|B)=0.096;由全概率公式可得:
再利用贝叶斯公式可得:
从而可得,从这个年龄段的妇女在做常规检测的同时做了早期的胸部肿瘤的X射线的检测,但其实她患得乳腺癌的可能性是0.0776。
(5)测谎仪是一种测试是否说谎的仪器,常常用于刑事案件的侦破,或审问犯人时使用。
记:T={测试出某人在说谎话},L={某人真正在说谎话},参考以往的经验:
P(T|L)=0.88,P(T|L)=0.86,据此表面上看,测谎仪有一定效果,现假定在一次实验中,被检测者在说谎话,依据前面提到的数据,可能很多人都或多或少的认为,此人说谎的概率是很高的,不妨就设为0.87,实际上,在公安部门审问过程中,大部分人员说话还比较诚实,不妨记:P(L)=0.01,从而由全概率公式可得:
再利用贝叶斯公式可得:
依据所检测的结果来看,大约有94%的检测均是错误的。要是测谎仪导致了被测者被逮捕,那后果比较严重。
(6)如果某人患有精神分裂症,则当进行CAT扫描时,存在30%的案例是脑萎缩,如果对正常人进行CAT扫描,只有2%的脑萎缩,在美国大约有2%的人患有精神分裂症,试分析CAT扫描成脑萎缩的人,患精神分裂症的概率是多少?
记:A={某人CAT扫描脑萎缩},B={某人做扫描就患有精神疾病},P(B)=0.015,
由全概率公式得:
3.小结
小结.贝叶斯率最先提出了基于先验概率的条件概率的计算方法。自从提出后一直有广泛的应用,例如在统计学、概率论、风险管理、人工智能领域等方面均有广泛的运用。本文主要借助贝叶斯公式在修正先验概率中的应用。对于贝叶斯公式的介绍,很多书都讲得比较少,而所举的例子也是简单的,本文主要是对教材的讲解加以扩充和加深,贝叶斯公式还有一个很好的用处就是对那些看似正确的结论可以加以检验。
参考文献:
[1]曹小玲.浅谈概率论中“数学期望”概念的讲解[J].教育教学论坛,2014(45):199-200.
[2]谢永钦.概率论与数理统计[M].第2版.北京:北京邮电大学出版社,2013:89-98.
[3]段丽凌.浅析数学期望在经济生活中的应用[J].商场现代化,2008(11):71-72.
[4]谢国瑞.概率论与数理统计[M].北京:高等教育出版社,2002.
[5]王梓坤.概率论基础及其应用[M].北京:北京师范大学出版社,2007.