建立概率模型需谨慎
2020-09-09安徽省阜阳市临泉田家炳实验中学236400安振亚
安徽省阜阳市临泉田家炳实验中学(236400) 安振亚
2019年5月,在某市教研活动上,笔者执教了“2.2 建立概率模型[1]”一课,其中例1 引起了与会者的很大争议.那么,“争议”何在? 如何解释这些“争议”? 怎样认识古典概型的两个特征? 针对以上三个问题,笔者谈谈自身的一些看法,期待与大家分享.
1 问题与解答
例1口袋里共有4 个球,其中有2 个是白球,2 个是黑球,这4 个球除颜色外完全相同.4 个人按顺序依次从中摸出一个球(不放回),试计算第二个人摸到白球的概率.
此例是生活中很多问题的模型,比如抓阄发奖问题、抽签问题、排序占位问题等.它的4 种解法如下(图形略):
解法1考察试验E1:4 个人按顺序依次从中摸出一个球,记录摸球的所有结果.
把2 个白球编上序号1,2,记摸到1,2 号白球的结果分别为w1,w2;2 个黑球也编上序号1,2,记摸到1,2 号黑球的结果分别为b1,b2.试验E1的样本空间
Ω1={w1w2b1b2,w1w2b2b1,w1b1w2b2,w1b1b2w2,w1b2w2b1,w1b2b1w2,w2w1b1b2,w2w1b2b1,w2b1w1b2,w2b1b2w1,w2b2w1b1,w2b2b1w1,b1w1w2b2,b1w1b2w2,b1w2w1b2,b1w2b2w1,b1b2w1w2,b1b2w2w1,b2w1w2b1,b2w1b1w2,b2w2w1b1,b2w2b1w1,b2b1w1w2,b2b1w2w1}
共有24 个样本点.由于口袋内的4 个球除颜色外完全相同,因此可以认为这24 个样本点出现的可能性是相等的,从而用古典概型来计算概率.
用事件A表示“第二个人摸到白球”,则此时事件
A={w1w2b1b2,w1w2b2b1,w2w1b1b2,w2w1b2b1,b1w1w2b2,b1w1b2w2,b1w2w1b2,b1w2b2w1,b2w1w2b1,b2w1b1w2,b2w2w1b1,b2w2b1w1}
解法2因为是计算“第二个人摸到白球”的概率,所以只考虑前两个人摸球的情况.考察试验E2:前两个人按顺序依次从中摸出一个球,记录摸球的所有结果.
试验E2的样本空间
Ω2={w1w2,w1b1,w1b2,w2w1,w2b1,w2b2,b1w1,b1w2,b1b2,b2w1,b2w2,b2b1}
共有12 个样本点.由于口袋内的4 个球除颜色外完全相同,因此可以认为这12 个样本点出现的可能性是相等的,从而用古典概型来计算概率.
依题意可知此时事件A={w1w2,w2w1,b1w1,b1w2,b2w1,b2w2},包含6 个样本点,因此P(A)=
解法3由于口袋内的4 个球除颜色外完全相同,因此可以对2 个白球不加区别,对2 个黑球也不加区别.考察试验E3:4 个人按顺序依次从中摸出一个球,只记录摸出球的颜色.试验E3的样本空间Ω3={wwbb,wbwb,wbbw,bwwb,bwbw,bbww},共有6 个样本点.由于口袋内的4 个球除颜色外完全相同,因此可以认为这6个样本点出现的可能性也是相等的,从而用古典概型来计算概率.
依题意可知此时事件A={wwbb,bwwb,bwbw},包含3个样本点,因此P(A)=
解法4进一步简化,只考虑第二个人摸球情况.考察试验E4:4 个人按顺序依次从中摸出一个球,只记录第二个人摸出球的情况.试验E4的样本空间Ω4={w1,w2,b1,b2},共有4 个样本点.由于口袋内的4 个球除颜色外完全相同,因此可以认为这4 个样本点出现的可能性也是相等的,从而用古典概型来计算概率.
依题意可知,事件A={w1,w2},包含2 个样本点,因此
2 争议与解释
争议一
根据例1“4 个人按顺序依次从中摸出一个球(不放回)”,只能建立解法1 中的古典概型,其他三种解法中的古典概型都是错误的.
解释
该争议主要聚焦在“对于同一个问题能不能建立不同的模型”上.对于该争议,在2019年11月“首届京师数学教育大会”上,张饴慈教授就曾作出说明:“现实中,一个试验有哪些结果是一回事,一旦用数学来描述它有哪些结果,已经是在建立模型了.也就是说,当研究一个问题时,我们认为这个试验有哪些结果,是我们认定的.”因此,对于一个随机试验,可以从不同的视角建立不同的概率模型.这些模型只要满足所有出现的可能结果的概率之和为1,就没有正确与错误之分,只有简单与复杂之别.比如例1,要计算第二个人摸到白球的概率,结合四个人摸球顺序以及球是否区分,建立四种概率模型.这四种模型均满足有限性和等可能性,都属于古典概型.需要说明一点,建立古典概型,关键是抓住刻划欲求概率事件的本质特点,将无关条件尽可能的去掉不予考虑,即在保证有限等可能的条件下使考虑范围尽可能小[2],达到优化模型的目的.
争议二
不难看出,解法2 是解法1 的简化.类似地,可对解法3、解法4 做同样的简化(由于解法4 与解法3 简化的结果类同,因此只研究解法3 的简化),得到:
解法5因为是计算“第二个人摸到白球”的概率,所以只考虑前两个人摸球的情况,并对2 个白球不加区别,对2 个黑球也不加区别.考察试验E5:前两个人按顺序依次从中摸出一个球,记录摸出球的颜色.
试验E5的样本空间Ω5={ww,wb,bw,bb},共有4 个样本点.由于口袋内的4 个球除颜色外完全相同,因此可以认为这4 个样本点出现的可能性也是相等的,从而用古典概型来计算概率.
依题意可知事件A={ww,bw},包含2 个样本点,故P(A)=
与会者的争议聚焦在“试验E5是否属于古典概型”上.
解释
从解答的过程与结果看,解法5 似乎没有问题.然而,如果解法5 没有问题,那么教材为何给出了前四种解法,而“无视”解法5 呢? 难道是教材篇幅受限的缘故吗? 在回答这两个问题之前,先看一个例子.
例2口袋里共有5 个球,其中有2 个是白球,3 个是黑球,这5 个球除颜色外完全相同.5 个人按顺序依次从中摸出一个球(不放回),试计算第二个人摸到白球的概率.
利用解法5 建立的模型容易得到P(A)=然而,事实并非如此这说明该模型不能实现有效迁移.我们可以大胆的猜测:该模型满足有限性,不满足等可能性,不属于古典概型.这应该是教材没有安排解法5 的缘故吧!
为了说明试验E5不满足等可能性,首先构造正四面体,2 个白球和2 个黑球分别在四个顶点上(如图1);然后在第一个人从四个球中摸出一个球的情况下,考虑第二个人的摸球情况.比如第一个人摸出的是白球,第二个人只能从剩下的三个球中摸出一个,由于这三个球除颜色外完全相同,并且黑球数是白球数的2 倍,因此摸到黑球的可能性是摸到白球的2倍,即{wb}出现的可能性是{ww}的2 倍.同样,{bw}出现的可能性是{bb}的2 倍.故试验E5不满足等可能性,不属于古典概型.
图1
从另一个角度看,因为解法5 是解法3 的简化,所以Ω5的样本点与Ω3的样本点存在一种对应,即ww→wwbb;wb→wbwb,wbbw;bw→bwwb,bwbw;bb→bbww,可以认为P({ww})=P({bb})=P({wb})=P({bw})=由此可以说明试验E5不满足等可能性.然而,这样计算容易产生误解,因为{ww}、{bb}、{wb}、{bw}不是Ω3的子集,所以它们的概率在试验E3中并不存在.
如果既想算出每一个样本点的概率,又不引起误解,那么可以这样:由解法2 得到试验E2的样本空间Ω2={w1w2,w1b1,w1b2,w2w1,w2b1,w2b2,b1w1,b1w2,b1b2,b2w1,b2w2,b2b1},共有12 个样本点.由于口袋内的4 个球除颜色外完全相同,因此可以认为这12 个样本点出现的可能性是相等的,因此该试验属于古典概型.而{ww}、{wb}、{bw}、{bb}是试验E5的随机事件,也是试验E2的随机事件.故在试验E2中,随机事件{ww}包含两个样本点w1w2、w2w1,故P({ww})=同样,可计算出P({bb})=P({wb})=P({bw})=故试验E5不满足等可能性.
争议三
解法5 在模型错误的情况下,结论却是正确的,这是一种巧合还是一种必然?
解释
试验E5虽然不属于古典概型,但并不代表不属于其他模型.由争议2 的解释知,试验E5的样本空间有四个样本点,并且P({ww})=P({bb})=P({wb})=P({bw})=因为P({ww})+P({bb})+P({wb})+P({bw})=1,所以试验E5是一个概率模型.由于A={ww}∪{bw},且{ww}∩{bw}=Ø,因此P(A)=P({ww})+P({bw})=
故解法5 的结果“正确”既是一种巧合,也是一种必然.
以上的解释告诉我们:建立概率模型需要谨慎,不要被随机试验表面的“等可能性”所迷惑,从而作出错误的判断.
3 对古典概型两个特征的认识
判断一个随机试验是否属于古典概型,关键看它是否满足有限性和等可能性.
(1)有限性
对于一个随机试验,一旦样本空间确定,它的样本点就确定了.因此,判断随机试验是否满足有限性,只需研究样本空间即可.而样本空间只与问题的背景有关[3],也就是与对应的随机试验有关.对于同一个问题,建立的随机试验不同,得到的样本空间也有差别.然而,样本空间不是高中数学课程固有的,而是新增加的内容,为什么要增加它呢?
关于这个问题,史宁中、王尚志在《普通高中数学课程标准(2017年版)解读》中作出说明:“古典概型是有限样本空间的重要实例.如果不讲有限样本空间,直接从古典概型说起,会对学生理解概率造成一定的影响.[4]”笔者认为“影响”体现在以下两个方面:
一方面,引进样本空间可以避免混淆与谬误.
首先,在数学中,研究问题总是在一定的空间内进行的,如果空间变化了,那么结果也可能会发生变化.比如研究函数,需要明确它的定义域,因为定义域变了,函数也就变了.研究随机现象同样如此.要计算一个随机事件的概率,首先要明确它所在的范围,即样本空间.样本空间可以有不同的取法,但是一定要认清,样本点数和随机事件包含的样本点数的计算都要在同一个样本空间中进行,否则会引起混淆并导致谬误!
其次,在引进样本空间之前,随机试验的每一个结果叫基本事件,所有的基本事件构成基本事件空间.在这里,基本事件是一个元素.因为随机事件是基本事件空间的子集,基本事件是特殊的随机事件,所以基本事件也是一个集合.然而在利用古典概型的概率公式计算概率时,又把基本事件当成了随机事件的元素.尽管这不重要,但是会对初学古典概型的学生造成一定的困扰.
另一方面,引进样本空间可实现随机现象“数学化”.
概率论研究的对象是客观世界的随机现象.而每一类随机现象都可由一个随机试验刻画.考察一个随机试验E有n个可能结果:w1,w2,···,wn,其中wi(i=1,2,···,n)称为样本点.这n个样本点组成的集合称为有限样本空间,记作Ω={w1,w2,···,wn}.Ω 有2n个子集,每一个子集都代表一个随机事件,其中必然事件与不可能事件可看作特殊的随机事件纳入其中.这样,可以用集合的关系与运算来表达随机事件的关系(比如“A发生导致B发生”可用“A ⊆B”表达),为概率的研究带来了集合的语言与工具,从而实现了随机现象的初步数学化.更进一步,随机试验E的2n个随机事件构成事件域F.对于给定的随机试验E,就有相应的一个样本空间Ω,事件域F和概率P,其中F是一个布尔代数,P是定义在F上的一个非负的、规范的有限可加集函数.对随机试验这样的一个直观对象,就可以用“数学化”的语言来描述它们,从而为学生进一步学习概率论奠定基础.
(2)等可能性
“等可能性”是古典概型的一个基本特征,是判断一个随机试验是否属于古典概型的关键.古典概型适用于“一些特殊情况”,是区别于通过大量重复试验估计概率的一种简捷方法,但它的前提是“理想状态”下的,具有高度的抽象性.其中“等可能性”是一个原始概念,无法确切证明,只能借助实际背景体会[5].对于一些简单的随机试验,比如掷硬币、掷骰子等,其“等可能性”尚能通过试验工具的直观得到体会.而对于复杂的随机试验(比如例1 的解法3)又该如何体会呢?综观现行的不同版本高中数学教材,往往一句“每个样本点出现的可能性都相等”,就把“等可能性”这一关键特征讲完了.然而它岂是一句话所能讲清楚的,尤其面对模型简化以及学生的知识局限的情况.
在古典概型中,所谓“等可能性”,正是“对称性”的一种后果,因为各个样本点处在“对称”的位置上,所以才有“等可能性”[6].然而关于“对称”,我们比较熟悉“轴对称”、“中心对称”,它们既可以通过“形”的直观判定,也可以通过“数”的严谨推导.而样本点的对称,对于学生而言又谈何容易理解,就是教师也不一定能说清楚.所以,这不仅要求学生结合具体的随机试验体会,还要求教师尽可能的构造直观模型(比如图1)帮助学生领悟.
当然,在现实生活中很难界定“事件的等可能性”,有些随机事件虽符合此特征,但由于多方面现实因素不易得出基本事件的个数.要解决这类问题,仍需要利用概率的统计定义,通过大量重复试验进行估计.