把握两个关键点,求解离散型随机变量的分布列
2023-02-24李桂春
李桂春
(北京师范大学附属实验中学)
新高考关注培养学生阅读和审题的习惯,关注生活与数学的联系,注重培养学生在复杂情境下解决数学问题的能力.概率与统计的试题正是以生活实际问题为背景,考查学生阅读理解、推理分析、数据运算等能力,因此每年的高考试题中均有涉及.而在概率统计的试题中经常考查离散型随机变量的分布列.对于离散型随机变量的分布列,首先要把握概念的本质,理解概念中的关键要素,才能合理地运用概率模型计算离散型随机变量各个取值对应的概率,从而得到离散型随机变量的分布列.
求解离散型随机变量的分布列时,把握以下两个关键点:
1)正确写出离散型随机变量X的所有可能取值xk(k=1,2,3,…,n);
2)求出离散型随机变量取每一个值的概率P(X=xk)=pk(k=1,2,…,n),在求概率时要分清用哪一种概率模型来解决.
1 正确写出离散型随机变量的所有可能取值
求解离散型随机变量的分布列的关键点之一是明确随机变量的所有可能取值,以及取每一个值时对应的意义,有时一个随机变量的取值可能对应一个或多个随机试验的结果,在解答过程中不要漏掉某些试验结果.
例1从装有6个白球、4个黑球和2个黄球的箱中随机地取出两个球,规定每取出一个黑球得2分,而每取出一个白球失1分,取出黄球不得分,以X表示所得的分数,随机变量X可以取哪些值呢? 求X的分布列.
当取到2个白球时,X=-2;
当取到1个白球和1个黄球时,失1分,X=-1;
当取到1个白球和1个黑球时,X=1;
当取到2个黄球时,X=0;
当取到1个黑球和1个黄球时,X=2;
当取到2个黑球时,X=4.
X的所有可能取值为-2,-1,0,1,2,4,则
所以X的分布列如表1所示.
表1
例2盒子中装着标有数字1,2,3,4,5 的卡片各2张,从盒子中任取3张卡片,每张卡片被取出的可能性都相等,用ξ表示取出的3张卡片上的最大数字,求:
(1)取出的3张卡片上的数字互不相同的概率;
(2)随机变量ξ的概率分布.
(2)由题意知ξ的所有可能取值为2,3,4,5,则
所以随机变量ξ的分布列如表2所示.
表2
2 分析离散型随机变量分布列的模型,合理选择计算概率的方法
2.1 超几何分布,利用古典概型计算概率
(1)求某位消费者在一次抽奖活动中抽到的4张卡片上都印有“幸”字的概率;
(2)记随机变量X为某位消费者在一次抽奖活动中获得代金券的金额数,求X的分布列和数学期望E(X);
(3)该商家规定,消费者若想再次参加该项抽奖活动,则每抽奖一次需支付3元.若你是消费者,是否愿意再次参加该项抽奖活动? 请说明理由.
(2)随机变量X的所有可能取值为10,5,0,则
所以X的分布列如表3所示.
表3
(3)方法1记随机变量Y为消费者在一次抽奖活动中的收益,则.因此不愿意再次参加该项抽奖活动.
方法2记“某位消费者在一次抽奖中能获得奖券”为事件B,则因为中奖概率不足因此不愿意再次参加该项抽奖活动.
板安窑村为了帮助贫困户,提供了打扫卫生的公益岗位,一个月500块钱,但是很多人看不到眼里,觉得钱少。知道消息的郭书凤马上找到了村干部,并爽快地接住了这个工作。
例4已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.
(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.
(ⅰ)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;
(ⅱ)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.
(2)(ⅰ)随机变量X的所有可能取值为0,1,2,3,则,所以随机变量X的分布列如表4所示.
表4
(ⅱ)设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(ⅰ)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=所以事件A发生的概率为
启示解决上面两道有关离散型随机变量分布列问题的关键是分清随机变量的分布列是超几何分布,用古典概型计算其概率.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征:1)考查对象分两类;2)已知各类对象的个数;3)从中抽取若干个个体,考查某类个体个数X的概率分布.
2.2 二项分布,利用独立重复试验计算概率
例5共享交通工具的出现极大地方便了人们的生活,也是当下一个很好的发展商机.某公司根据市场发展情况推出共享单车和共享电动车两种产品.市场调查发现,两种产品中,共享电动车速度更快,更受消费者欢迎,一般使用共享电动车的概率为,使用共享单车的概率为.该公司为了促进大家消费,使用共享电动车一次记2分,使用共享单车一次记1分.每个市民各次使用共享交通工具选择意愿相互独立,市民之间选择意愿也相互独立.
(1)现有4 位市民使用该公司共享交通工具出行,求至少有一人使用共享单车的概率;
(2)从首次使用共享交通工具的市民中随机抽取3人,记总得分为随机变量ξ,求ξ的分布列.
设“至少有一人使用共享单车”为事件A,则
(2)由题意,从首次使用共享交通工具的市民中随机抽取3人,总得分ξ的可能取值为3,4,5,6,则
所以ξ的分布列如表5所示.
表5
例6为了防止受到核污染的产品影响我国民众的身体健康,要求产品在进入市场前必须进行两轮核辐射检测,只有两轮都合格才能进行销售,否则不能销售.已知某产品第一轮检测不合格的概率为,第二轮检测不合格的概率为,两轮检测是否合格相互没有影响.
(1)求该产品不能销售的概率;
(2)如果产品可以销售,则每件产品可获利40元;如果产品不能销售,则每件产品亏损80元(即获利-80元).已知一箱中有产品4件,记一箱产品获利X元,求X的分布列,并求出均值E(X).
P(A)=1-,所以该产品不能销售的概率为
(2)由已知,4件产品能否销售有以下5种情形:
4件不能销售,0件能销售,对应的X取值为-320;
3件不能销售,1件能销售,对应的X取值为-200;
2件不能销售,2件能销售,对应的X取值为-80;
1件不能销售,3件能销售,对应的X取值为40;
0件不能销售,4件能销售,对应的X取值为160.
X的所有可能取值为-320,-200,-80,40,160,则
所以X的分布列如表6所示.
表6
2.3 利用相互独立事件的概率公式计算
例7从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为
(1)设X表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X的分布列和数学期望;
(2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率.
所以随机变量X的分布列如表7所示.
表7
(2)设有2辆车独立地从甲地到乙地,这2辆车共遇到1个红灯为事件A,则
2.4 辨别离散型随机变量满足的分布列,采用相应的计算概率的方法
例8袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.
(1)若每次抽取后都放回,设取到黑球的个数为X,求X的分布列;
(2)若每次抽取后都不放回,设取到黑球的个数为Y,求Y的分布列.
所以X的分布列如表8所示.
表8
(2)若每次抽取后都不放回,则随机抽取3次可看成随机抽取1次,但1次抽取了3个球,因此黑球数Y服从参数为10,3,2 的超几何分布,即Y~H(10,3,2),因此
所以Y的分布列如表9所示.
表9
启示在产品检验中,若N件产品中,共有M件次品,当我们从这些产品中每次抽取一件,共抽取n次进行检查时,若是有放回地抽样,则抽到的次品数X服从的是二项分布;若是不放回地抽样且n≤N,则抽到的次品数X服从的是超几何分布.
例9某校高二(1)班的一个研究性学习小组在网上查知,某植物种子在一定条件下发芽成功的概率为,该研究性学习小组又分成两个小组进行验证性试验.
(1)第一小组做了5次这种植物种子的发芽试验(每次均种下一粒种子),求他们的试验中至少有3次发芽成功的概率;
(2)第二小组做了若干次发芽试验(每次均种下一粒种子),如果在一次试验中种子发芽成功就停止试验,否则将继续进行下次试验,直到种子发芽成功为止,但试验的次数最多不超过5次.求第二小组所做种子发芽试验的次数ξ的概率分布列.
所以至少有3次发芽成功的概率为
(2)随机变量ξ的所有可能取值为1,2,3,4,5,则
所以ξ的分布列如表10所示.
表10
启示本题中的第(1)问中至少有3 次发芽成功,即有3次、4次、5次发芽成功.而其中每一种情况,例如,有4次发芽成功,只需在5次中恰有4次成功即可,故满足独立重复试验;第(2)问中的随机变量取每一个值,例如,ξ=4时,是前3次未发芽,第4次才发芽,故不满足独立重复试验,应按相互独立事件的概率计算.
例102016年微信用户数量统计显示,微信注册用户数量已经突破9.27亿.微信用户平均年龄只有26岁,97.7%的用户在50 岁以下,86.2%的用户在18~36岁之间.为调查大学生这个微信用户群体中每人拥有微信群的数量,现从北京市大学生中随机抽取100位同学进行了抽样调查,结果如表11所示.
表11
(1)求a,b,c的值;
(2)若从这100 位同学中随机抽取2 人,求这2人中恰有1人微信群个数超过15个的概率;
(3)以这100个人的样本数据估计北京市的总体数据且以频率估计概率,若从全市大学生中随机抽取3人,记X表示抽到的是微信群个数超过15个的人数,求X的分布列和数学期望E(X).
(2)记“2人中恰有1人微信群个数超过15个”为事件A,则所以2 人中恰有1人微信群个数超过15个的概率为
所以X的分布列如表12所示.
表12
启示此题要分清超几何分布和二项分布的区别,超几何分布中随机变量取某一值时的概率符合古典概型,古典概型需满足有限性,即在一次试验中,基本事件发生的次数是有限的.第(2)问是在样本中考虑,从100人中随机抽取2人,符合古典概型.当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,且每次抽取时又只有两种试验结果,此时可以把它看成独立重复试验,利用二项分布求其分布列.第(3)问是利用样本估计总体,在北京市的总体数据中抽取,符合二项分布.
在求离散型随机变量的分布列时,一般按照如下步骤进行:分析题意→分别写出取值所表示的结果→写出X的所有可能取值→求出X取每一个值的概率→列表得出X的分布列.
在具体过程中,应把握两个关键点:
1)离散型随机变量的所有可能取值及对应的随机试验结果,二者之间可以相互转化;
(2)分清分布列的模型,并用相应的概率公式计算,这样就能准确高效地解答有关离散型随机变量的分布列问题.
(完)