基于贝叶斯公式应用问题的比较研究
2016-11-16吴佳毛金舟李媛王姝娜
吴佳+++毛金舟+++李媛++王姝娜
【摘要】对于一道考研真题,比较分析了文献[1]和[2]中的方法,借助MATLAB将随机试验并不直观的样本空间以编程的方式呈现,利用MATLAB仿真随机试验的数值结果进行曲线拟合,拟合结果与文献[1]中的结果非常接近,误差不超过10-3,因此验证了文献[1]中方法是正确的。并通过理论分析指出了文献[2]中方法错误的原因,修正了文献[2]中方法的计算过程,给出了P( 1|A2)正确的计算公式。理论分析方法能更深刻地理解贝叶斯公式,理论分析结果与文献[1]中方法相同。
【关键词】条件概率 全概率公式 贝叶斯公式 MATLAB仿真
【中图分类号】O211.5 【文献标识码】A 【文章编号】2095-3089(2016)08-0128-02
文献[1]和[2]中对于同一道概率问题给出了两种解法,分析也是大相径庭,结果迥异。究竟哪种方法是正确的,本文将通过MATLAB数值模拟和理论分析两种方法进行讨论分析,两种方法的结果都与文献[1]相同。文献[1]和[2]中讨论的概率题如下:
例:设有来自三个地区的各10名,15名和25名考生的报名表,其中女生的报名表分别为3份,7份和5份,随机地取一个地区的报名表,从中先后抽出两份。已知后抽到的一份是男生表,求先抽到的一份是女生表的概率P。
文献[1]中方法:用事件Hj表示报名表是第j地区考生的,j=1,2,3,事件Ai表示第i次抽到的是男生表,i=1,2。显然A1,A2,A3构成完备事件组,且
P(H1)=P(H2)=P(H3)= ,P(A2|H1)= ,P(A2|H2)= ,P(A2|H3)= ,P( 1A2|H1)= = ,P( 1A2|H2)= = ,P( 1A2|H3)= = 。
由全概率公式得
文献[2]中方法:当H1发生时,P( 1|A2)= ,当H2发生时,P( 1|A2)= ;当H3发生时,P( 1|A2)= ,因此,
以下通过MATLAB数值模拟和理论分析论证文献[1]中方法是正确的。
1.利用MATLAB仿真随机试验
利用定义计算条件概率,通过缩减样本空间的方式也可以计算条件概率。本文借助MATLAB将并不直观的样本空间以编程的形式呈现出来,从而实现在缩减的样本空间中计算条件概率。
条件概率满足概率的三个公理化条件,因此条件概率也是概率。根据伯努利大数定律可以得到:在取法条件不变的情况下,相互独立地重复试验多次,在第二次抽取到的是男生表的条件下,第一次抽取到的是女生表的频率近似于其概率。
在MATLAB R2014a环境下进行仿真随机实验,利用40次得到的数值结果进行曲线拟合,拟合函数为y=-2.437×10-11x+0.3279,显然,此拟合曲线(如图1)几乎平行与x轴,y轴截距为0.3279,非常接近0.32787.
两次改变女生数据,通过MATLAB模拟出的概率值依然与文献[1]中结果非常接近(见表1),且误差不超过10-3。 综上,本文认为文献[1]中方法正确,文献[2]中方法错误。
2.理论分析
文献[2]中方法忽略了“先抽到的一份是男生表的条件下”这个条件,错误地认为取自三个地区的概率仍为 ,违背了贝叶斯公式,人为地制造出P(A2|A1|H1)这样不存在的概率。
在先抽到的一份是男生表的条件下,经过计算发现报名表来自第一区的概率为
文献[2]中方法产生错误的另一主要原因是利用不存在的概率,错误地使用贝叶斯公式,“当H1发生时,P( 1|A2)= ”的确切表述应该是“P( 1H1|A2H1)= ”。
结合上面两种原因,将文献[2]中方法修正如下:
当H1发生时,P(H1|A2)= = = ,P( 1H1|A2H1)= ;
同理,当H2发生时,P(H2|A2)= ,P( 1H2|A2H2)= ;当H3发生时,P(H3|A2)= ,P( 1H3|A2H3)= ;
3.结论
本文利用MATLAB仿真随机试验的方式验证了文献[1]中方法的正确性,通过理论分析指出了文献[2]中方法错误的原因,修正了文献[2]中方法,给出了P( 1|A2)又一计算公式:
P( 1|A2)= P(Hi|A2)P( 1Hi|A2Hi)。
通过对此问题的研究,有助于加深对于条件概率问题的理解,尤其对于全概率公式和贝叶斯公式的掌握具有实际的指导意义。本文方法可以使学生今后避免犯同类错误,对于教师的教学也具有指导意义。
参考文献:
[1]张宇.概率与数理统计(9讲)[M].北京:北京理工大学出版社,2016.
[2] 李永乐,王式安,季文铎. 考研数学复习全书(数学三)[M]. 国家行政学院出版社,2016.
作者简介:
吴佳(1994-),女,本科。