是巧合还是必然
2015-06-11第五河清
第五河清
在一次高三练考中,一道试题引起大家的讨论,试题是这样的:对某篮球运动员在100场比赛中的得分情况进行统计,得分统计表如下:
在所进行的100场比赛中,按表格中各分值区间的场数分布采用分层抽样法取出10场比赛,再从这10场比赛中随机选出2场作进一步分析,记这2场比赛中得分不低于30分的场数为,求的分布列和数学期望。
考试中出现了两种不同的解法:
解法一:按照分层抽样法,在[0,10),[10,20),[20,30),[30,40)内抽出的比赛场数分别为1,2,3,4,的取值为0,1,2,按超几何分布建立的分布列,
求得E=0·+1·+2·=
解法二:的取值为0,1,2,按照二项分布的分布列,求得E=0·+1·+2·=
分布列不一样,为什么期望却一致?是巧合还是必然?我们尝试改变数据进行检验。
改变1:将随机选出2场改为随机选出3场,所得期望分别如下:
二项分布:=np=3×=,超几何分布:
改變2:将随机选出2场改为随机选出4场,所得期望分别如下:
二项分布:E=,超几何分布:E=
结果是期望依然相等,而且,随着数据的增大,两种不同分布列对应概率之间的差距逐渐缩小,我们做出这样的猜想:样本个数越大二项分布和超几何分布的对应概率之间的差距越小,当样本个数无穷大时,二项分布和超几何分布的对应概率相等,换言之,超几何分布的极限就是二项分布,即=Cnkpk(1-p)n-k。参考有关资料,证明我们的直观思想正确,当产品总数很大而抽出的产品较少时,每次抽出产品后,次品率近似不变。这样就可以近似看成每次抽样的结果是相互独立的,抽出产品中的次品件数近似服从二项分布,人们在实际工作中常利用这一点,把抽取对象数量较大时的无放回抽样(例如破坏性试验发射炮弹,产品的寿命试验等),当作有放回来处理。
编辑 谢尾合