APP下载

二项分布与超几何分布的区别与联系

2022-05-23胡云兵

中学生数理化·高二版 2022年5期
关键词:次品概率频率

胡云兵

在人教版《数学选修2—3》的课本中,第二章《随机变量及其分布列》分别介绍了两种离散型随机变量的概率分布:超几何分布与二项分布。通过实例,让同学们认识模型所刻画的随机变量的共同特点,从而建立新的模型,并能运用两个模型解决一些实际问题。然而部分同学不能准确地辨别要解决的问题是超几何分布还是二项分布,对这两个模型的定义不能很好地理解,一遇到含“取”或“摸”的题型,就认为是超几何分布,不加分析,滥用公式。事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别,

课本对于超几何分布的定义是这样的:

对于二项分布的定义是这样的:若随机变量X的分布列为P(X=k) =Cp*(1—p)",其中0

其概率分布如表2。

超几何分布与二项分布都是取非负整数值的离散分布,表面上看,两种分布的概率求法有截然不同的表达式。

课本中对超几何分布的模型建立是这样的:若有N件产品,其中M件是次品,无放回地任意抽取n件,则其中恰有的次品件数X服从超几何分布。而对二项分布则使用比较容易理解的射击问题来建立模型。若将超几何分布的概率模型改成:若有N件产品,其中M件是次品,有放回的任意抽取n件,则其中恰有的次品件数X服从二项分布。在这里,两种分布的差别就在于“有放回”与“无放回”的差别,超几何分布是不放回地抽取,二项分布是有放回地抽取;超几何分布需要知道总体容量,二项分布不需要知道总体容量,但需要知道“成功率”。

教材上用高尔顿板导出了正态分布,事实上在这个试验中,小球落进各个槽中的分布是一个概率p=0.5的二项分布,从一个二项分布导出正态分布,正好揭示了二项分布与正态分布之间的联系,

我们知道二项分布的随机变量是离散的,当n取不同值时,它的分布会有差别,随着n的增加,二项分布越来越接近于正态分布。

题型一超几何分布

例1某批产品共有10件,已知从该批产品中任取1件,则取到的是次品的概率为p=0.2,现从该批产品中任意抽取3件。

(1)求取出的3件产品中恰好有1件是次品的概率;

(2)求取出的3件产品中次品的件数X的概率分布列与期望,

解析:

点评:超几何分布的特征是:只做了一次试验,且这一次试验是在有限个(个数非常明确、具体)元素中选取若干个元素。典型案例是抽球时每次抽完不放回。

例2 (2021年北京高三期末)在学期末,为了解学生对食堂用餐满意度情况,某兴趣小组按性别采用分层抽样的方法,从全校学生中抽取容量为200的样本进行调查。被抽中的同学分别对食堂进行评分,满分为100分。调查结果显示:最低分为51分,最高分为100分。随后,兴趣小组将男、女生的评分结果按照相同的分组方式分别整理成了频数分布表和频率分布直方图,如表4和图1所示。

女生评分结果的频率分布直方图(图1)。

男生评分结果的频数分布表如表4。

为了便于研究,兴趣小组将学生对食堂的评分转换成了“满意度情况”,两者的对应关系如表5。

(1)求a的值;

(2)为进一步改善食堂状况,从评分在[50,70)的男生中随机抽取3人进行座谈,记这3人中对食堂“不满意”的人数为X,求X的分布列。

解析:

点评:“在6个元素中选取3个元素”,符合超几何分布的特征。

题型二二项分布

例3 (2021年太原高三5月模拟)人的体重是人的身体素质的重要指标之一。某校抽取了高二的部分学生,测出他们的体重(kg),体重在40 kg至65 kg之间,按体重进行如下分组:第1组[40,45),第2组[45,50),第3组[50,55),第4组[55,60),第5组[60,65],并制成如图2所示的频率(视为概率)分布直方图。已知第一组与第三组的频率之比为1:3,第3组的频数为90。

(1)求该校抽取的学生总数以及第2组的频率;

(2)用这些样本数据估计全市高二学生(学生数众多)的体重,若从全市高二学生中任选5人,设X表示这5人中体重不低于55 kg的人数,求X的分布列和数学期望。

解析:

点评:当题目当中出现“将频率视为概率”,“某某与某某相互独立”,“从大量(且不知道大量具体的数值)中选取少数几个个体”等关键字眼时,该分布即为二项分布。

例4 某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品进行检验,如检验出不合格品,则更换为合格品。检验时,先从这箱产品中任取20件检验,再根据检验结果决定是否对余下的所有产品检验。设每件产品为不合格品的概率都为p(0

(1)記20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点po。

(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p。作为p的值,已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用。

①若不对该箱余下的产品检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);

②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?

解析:

点评:题目当中出现了“各件产品是否为不合格品相互独立”的字眼,符合二项分布的特征。

(责任编辑徐利杰)

猜你喜欢

次品概率频率
找次品
处理器频率天梯
概率与统计(1)
概率与统计(2)
振动与频率
找次品的最优策略
概率与统计解答题集锦
一类非线性离散动力系统的频率收敛性
速查次品
我是小小检验师