二项分布最值问题的结论与应用
2024-07-03王震
王震
摘 要:本文利用作商法探究二项分布中的最值问题,给出“最可能成功次数”的定义,并得到最值问题的相关结论,最后结合高考模拟试题谈谈结论的应用.
关键词:二项分布;最值问题;最可能成功次数
中图分类号:G632 文献标识码:A 文章编号:1008-0333(2024)15-0014-03
二项分布的最值问题,实质上就是在求“最可能成功次数”.这是二项分布的一个重要概念,在2019年人教A版教科书《数学选择性必修第三册》中虽然没有直接提到这一概念,但在81页《探究与发现》栏目中,专门讨论了二项分布的性质,其所讨论的问题就是在求最可能成功次数.
1 二项分布
一般地,在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则
P(X=k)=Cknpk(1-p)n-k,k=0,1,2,…,n.
此时称随机变量X服从二项分布[1],记作X~B(n,p),并称p为成功概率.
注 注意到Ckn(1-p)n-kpk,k=0,1,2,…,n,是二项式[(1-p)+px]n展开式中xk项的系数,因此称其为二项分布.
2 二项分布的期望与方差
若X~B(n,p),则E(X)=np,D(X)=np(1-p).
3 二项分布最值问题的一个结论当n,p固定时,P(X=k)=Ckn(1-p)n-kpk先随k增大而增大,达到某一最大值后又逐渐下降.
由于0
P(X=k)P(X=k-1)=(n-k+1)pkp=1+(n+1)p-kkp,
因此
当k<(n+1)p时,P(X=k)>P(X=k-1);
当k=(n+1)p时,P(X=k)=P(X=k-1);
当k>(n+1)p时,P(X=k)
令m=[(n+1)p](即m是(n+1)p的整数部分),由以上分析知,当k从0变到n时,P(X=k)先单调递增,当k=m时达到最大值,然后单调递减.但若(n+1)p=m,则此时P(X=k)=P(X=k-1)同时达到最大值.
使P(X=k)取最大值的项P(X=m)称为P(X=k)的中心项,而m称为最可能成功次数.若(n+1)p是整数,也是最可能成功次数.
4 结论的应用
例1 如果某射手每次击中目标的概率为0.8,每次射击的结果相互独立,那么他在10次射击中,最有可能击中目标几次[2]?
解 设他在10次射击中,击中目标的次数为X,由于射击中每次射击的结果是相互独立的,因此X~B(10,0.8).于是恰好k次击中目标的概率为
P(X=k)=Ck10×0.8k×0.210-k,k=0,1,2,…,10.
从而
P(X=k)P(X=k-1)=(10-k+1)×0.8k×0.2
=1+11×0.8-kk×0.2,k=0,1,2,…,10.
于是,当k<8.8时,P(X=k-1)
8.8时,P(X=k-1)
由以上分析可知,他在10次射击中,最有可能击中目标8次.
例2 (2020年东北三省二模)N95型口罩是新型冠状病毒的重要防护用品,它对空气动力学直径≥0.3 um的颗粒的过滤效率达到95%以上.某防护用品生产厂生产的N95型口罩对空气动力学直径≥0.3 um的颗粒的过滤效率服从正态分布N(0.97,9.025×10-5).
(1)当质检员随机抽检10只口罩,测量出一只口罩对空气动力学直径≥0.3 um的颗粒的过滤效率为93.6%,他立即要求停止生产,检查设备和工人工作情况.请你根据所学知识,判断该质检员的要求是否有道理,并说明判断的依据.
(2)该厂将空气动力学直径≥0.3 um的颗粒的过滤效率达到95.1%以上的N95型口罩定义为“优质品”.
①求该企业生产的一只口罩为“优质品”的概率;
②该企业生产了1 000只这种N95型口罩,且每只口罩互相独立,记X为这1 000只口罩中“优质品”的件数,当X为多少时可能性最大(即概率最大)?
解 (1)过程略.
(2)①不妨记:“N95口罩的过滤效果”为Y,则一只口罩为“优质品”的概率为
P(Y>0.951)=P(Y>0.97-2σ)
=1-[12-P(0.97-2σ =0.977 2. ②依题意X~B(1 000,0.977 2),记n=1 000,p=0.977 2,P(X=k)=Cknpk(1-p)n-k(k=0,1,2,…,1 000). 问题等价于求当k取何值时P(X=k)=Cknpk(1-p)n-k取得最大值. 方法1 由 Cknpk(1-p)n-k≥Ck-1npk-1(1-p)n-k+1Cknpk(1-p)n-k≥Ck+1npk+1(1-p)n-k-1, 化简得pk≥1-pn+1-k1-pn-k≥pk+1,即(n+1)p-1≤k≤(n+1)p, 从而1 001p-1≤k≤1 001p,解得k=978. 方法2 由于对0 P(X=k)P(X=k-1)=(n-k+1)pkp=1+(n+1)p-kkp, 因此 当k<(n+1)p时,P(X=k)>P(X=k-1); 当k=(n+1)p时,P(X=k)=P(X=k-1); 当k>(n+1)p时,P(X=k) 以上分析知,P(X=k)在(0,(n+1)p)单调递增,在((n+1)p,n)单调递减. 代入数据得,(n+1)p=1 001×0.977 2=978.177 2,而k是正整数,所以P(X=978)>P(X=977)且P(X=979) 例3 设某种疾病的发病概率是0.01,问在500人的社区中进行普查,最有可能的发病人数是. 解 设发病人数为X,易知X~B(500,0.01). 知n=500,p=0.01,(n+1)p=5.01,[(n+1)p]=5, 所以最有可能发病的人数为5. 例4 (2020年吉林梅河口五中模拟)在庆祝澳门回归祖国20周年之际,澳门特别行政区为了解人们对回归20年的幸福指数,随机选择了100位市民进行了调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图1所示的频率分布直方图. (1)现从年龄在[20,30),[30,40),[40,50)范围内的人员中,按分层抽样的方法抽取8人,再从这8人中随机选取3人进行座谈,用ξ表示年龄在[30,40)范围内的人数,求ξ的分布列和数学期望; (2)若将样本的频率视作概率,记X表示用随机抽样的方法从该地区抽取20名市民进行调查,其中年龄在[30,50)范围内的人数.当P(X=k)(k=0,1,2,…,20)最大时,求k的值. 图1 例4题图 解 (1)E(ξ)=3/4,过程略. (2)由题意知,X服从二项分布,由频率分布直方图可知,年龄在[30,50)范围内的频率为(0.010+0.025)×10=0.35,则X~B(20,0.35),P(X=k)=Ck20(0.35)k(0.65)20-k(k=0,1,2,…,20). 设t=P(X=k)P(X=k-1)=Ck20(0.35)k(0.65)20-kCk-120(0.35)k-1(0.65)21-k=7(21-k)13k(k=0,1,2,…,20). 若t>1,则k<7.35,P(X=k)>P(X=k-1); 若t<1,则k>7.35,P(X=k) 所以k=7时,P(X=k)最大. 例5 某款自营生鲜平台以及提供配送服务的生活类App主要提供的产品有蔬菜、豆制品、水果、肉禽蛋、水产海鲜、米面粮油、食品等.某机构为调查顾客对该软件的使用情况,在某地区随机抽取了100人,调查结果整理如下: 年龄段20以下[20,30)[30,40)[40,50)[50,60)[60,70)70以上 使用人数510188420未使用人数002123630 (1)从被抽取的年龄在[40,60)的使用者中,随机抽取2人进一步了解情况,求这2人年龄在[50,60)的概率; (2)为鼓励居民使用,该机构拟对首次下载使用App的居民赠送1张5元的代金券.若某区预计有6 000人具有购物能力,试估计该机构至少应准备多少张代金券; (3)记X表示用随机抽样的方法从该地区抽取20名市民进行调查,其中年龄在[20,40)的人数.试求P(X=k)(k=0,1,2,…,20)的最大值. 解 (1)1/11,(2)2 820,过程略. (3)由题意,X服从二项分布,且年龄在[20,40)内的概率为10/100+20/100=0.3,所以X~B(20,0.3). 所以P(X=k)=Ck20(0.3)k(0.7)20-k(k=0,1,2,…,20). 设t=P(X=k)P(X=k-1)=Ck20(0.3)k(0.7)20-kCk-120(0.3)k-1(0.7)21-k=3(21-k)7k(k=0,1,2,…,20). 若t>1,则k<6.3,P(X=k)>P(X=k-1); 若t<1,则k>6.3,P(X=k) 所以k=6时,P(X=k)最大,最大值为P(X=6)=C620(0.3)6(0.7)14. 5 结束语 我们可以利用作商法或者组合数的单调性得到二项分布的最值问题的结论,即在“最可能成功次数”处取得最大值.“最可能成功次数”虽是高等数学的概念,但二项分布最值问题的这个性质却出现在教材中,这就要求我们一线教师要重视对教材的研究,要深度解读教材. 参考文献: [1]李鸿昌.高考题的高数探源与初等解法[M].合肥:中国科学技术大学出版社,2022. [2] 胡翠莲,叶雪云.自主探究 水到渠成:二项分布模型构建的数学设计[J].中学数学,2010(13):22-23,29. [3] 周冬梅,尹承利.计数原理与概率复习备考专题透视[J].中学数学杂志,2020(3):46-51. [4] 聂小涵.聚焦几种常考的概率分布模型[J].高中数理化,2019(1):6-7. [责任编辑:李 璟]