离散型随机变量的期望与方差
2018-01-29赵碧云余锦银
赵碧云+余锦银
离散型随机变量的分布列、期望、方差是三个紧密相连的有机统一体,一般综合在一起进行考查. 其解题的关键是求出分布列,然后套用公式即可求出期望与方差. 下面我们结合实例谈一谈离散型随机变量的期望与方差及其应用.
常见分布列的数学期望与方差
例1 一个口袋内装有5个白球和2个黑球,现从中每次摸取一个球,取出黑球就放回,取出白球则停止摸球. 求取球次数[ξ]的数学期望[Eξ]与方差[Dξ].
分析 每次取出黑球就放回,取到白球才结束. 每次从袋内取出白球的概率[p=57],取出黑球的概率[q=27]. [ξ]的取值为1,2,3,…,有无穷多个. 因此[ξ]服从几何分布.
解 用[ξ=k]表示前[k-1]次均取到黑球,而第[k]次取到白球,
故[pξ=k=qk-1?p=27k-1?57],[k=1,2,3,…].
又[ξ]服从几何分布.
从而[Eξ][=1p=75],[Dξ][=1-pp2=1-57572=1425].
点评 (1)几何分布:概率为[p]的事件[A],以[X]记为[A]首次发生所进行的实验次数,则[X]的分布列:[pX=k=1-pk-1?p,k=1,2,3,…],具有这种分布列的随机变量[X],称为服从参数[p]的几何分布. (2)几何分布的期望[Eξ=1p],方差[Dξ=1-pp2].
例2 某校校庆,各届校友纷至沓来,某班共来了n位校友(n>10且[n∈N*]),其中女校友6位,组委会对这n位校友制作了一份校友名单. 现随机从中选出2位校友代表,若选出的2位校友是一男一女,则称为“最佳组合”.
(1)若随机选出的2位校友代表为“最佳组合”的概率等于[12],求n的值;
(2)当n=12时,设选出的2位校友中女校友人数为ξ,求ξ的分布列以及Eξ,[Dξ].
解析 (1)由题意可知,所选两人为“最佳组合”的概率[P=C1n-6C16C2n=12n-6nn-1].
则[12n-6nn-1=12].
化简得,n2-25n+144=0,
解得,n=9(舍去),或n=16.
故n=16.
(2)由题意得,[ξ]的可能取值为0,1,2.
则P(ξ=0)=[C26C212=522],P(ξ=1)=[C16C16C212=611],
P(ξ=2)=[C26C212=522].
[[ξ] 0 1 2 [P] [522] [611] [522] ]
[∴][Eξ=0×522+1×611+2×522=1],
[Dξ=0-12×522+1-12×611+2-12×522=511.]
点评 ①在含有[M]件次品数的[N]件产品中,任取[n]件,其中含有[X]件次品數,则事件[{X=k}]发生的概率为[P(X=k)=CkMCn-kN-MCnN],[k]=0,1,2,…,[m],其中[m=min{M,n}],且[n≤N],[M≤N],[n],[M],[N∈N*],称此分布列为超几何分布列.
②超几何分布的期望[EX=nMN],[DX=nMN-][nMN2+nn-1MM-1NN-1].
离散型随机变量在实际中的应用
例3 甲、乙两个野生动物保护区有相同的自然环境,且野生动物的种类和数量也大致相等. 而两个保护区内每个季度发现违反保护条例的事件次数的分布列如下. 试评定这两个保护区的管理水平.
甲保护区
分析 一是要比较一下甲、乙两个保护区内每季度发生的违规事件的次数的均值,即数学期望;二是要看发生违规事件次数的波动情况,即方差值的大小. (当然,亦可计算其标准差,同样说明道理. )
解 甲保护区的违规次数[ξ1]的数学期望和方差为:
[Eξ1=0×0.3+1×0.3+2×0.2+3×0.2=1.3,]
[Dξ1=(0-1.3)2×0.3+(1-1.3)2×0.3+(2-1.3)2×0.2 ]
[+(3-1.3)2×0.2=1.21.]
乙保护区的违规次数[ξ2]的数学期望和方差为:
[Eξ2=0×0.1+1×0.5+2×0.4=1.3,]
[Dξ2=(0-1.3)2×0.1+(1-1.3)2×0.5+(2-1.3)2×0.4 ]
[=0.41].
因为[Eξ1=Eξ2,Dξ1>Dξ2],所以两个保护区内每季度发生的违规平均次数是相同的;乙保护区内的违规事件次数更集中和稳定,而甲保护区的违规事件次数相对分散和波动.
(标准差[σξ1=Dξ1=1.1,σξ2=Dξ2≈0.64]这两个值在科学计算器上容易获得,显然,[σξ1>σξ2].)
点评 数学期望只体现了随机变量取值的平均大小,但有时仅知道均值大小还是不够的(比如:两个随机变量的均值相等了,即数学期望值相等),这就还需要知道随机变量的取值如何在均值周期变化,即计算其方差(或是标准差). 方差大说明随机变量取值分散性大,方差小说明取值分散性小或者说取值比较集中、稳定.
期望、方差与其他知识的综合应用
例4 某厂用鲜牛奶在某台设备上生产[A,B]两种奶制品. 生产1吨[A]产品需鲜牛奶2吨,使用设备1小时,获利1000元;生产1吨[B]产品需鲜牛奶1.5吨,使用设备1.5小时,获利1200元. 要求每天[B]产品的产量不超过[A]产品产量的2倍,设备每天生产[A,B]两种产品时间之和不超过12小时. 假定每天可获取的鲜牛奶数量W(单位:吨)是一个随机变量,其分布列如下.endprint
[[W] 12 15 18 [P] 0.3 0.5 0.2 ]
该厂每天根据获取的鲜牛奶数量安排生产,使其获利最大,因此每天的最大获利[Z](单位:元)是一个随机变量.
(1)求[Z]的分布列和均值;
(2)若每天可获取的鲜牛奶数量相互独立,求3天中至少有1天的最大获利超过10000元的概率.
解析 (1)设每天[A,B]两种产品的生产数量分别为[x,y],相应的获利为[z],
则[2x+1.5y≤W,x+1.5y≤12,2x-y≥0,x≥0, y≥0. ] (*)
目标函数为[z=1000x+1200y].
①当[W=12]时,(*)表示的平面区域如图1,三个顶点分别为[A(0, 0), B(2.4, 4.8), C(6, 0)].
[图1]
将[z=1000x+1200y]变形为[y=-56x+z1200],
当[x=2.4, y=4.8]时,直线[l]:[y=-56x+z1200]在[y]轴上的截距最大,
最大获利[Z=zmax=2.4×1000+4.8×1200][=8160].
②当[W=15]时,(*)表示的平面区域如图2,三个顶点分别为[A(0, 0), B(3, 6), C(7.5, 0)].
将[z=1000x+1200y]变形为[y=-56x+z1200],
当[x=3, y=6]时,直线[l]:[y=-56x+z1200]在[y]軸上的截距最大,
最大获利[Z=zmax=3×1000+6×1200=10200].
③当[W=18]时,(*)表示的平面区域如图3,四个顶点分别为[A(0, 0), B(3, 6), C(6, 4), D(9, 0)].
将[z=1000x+1200y]变形为[y=-56x+z1200],
当[x=6,y=4]时,直线[l]:[y=-56x+z1200]在[y]轴上的截距最大,
最大获利[Z=zmax=6×1000+4×1200=10800].
故最大获利[Z]的分布列为
[[Z] 8160 10200 10800 [P] 0.3 0.5 0.2 ]
故[E(Z)=8160×0.3+10200×0.5+10800×0.2]
[=9708.]
(2)由(1)知,一天最大获利超过10000元的概率[p1=P(Z>10000)=0.5+0.2=0.7].
由二项分布知,3天中至少有1天最大获利超过10000元的概率为[p=1-(1-p1)3=1-0.33=0.973.]
点评 本题是随机变量的分布列、期望、二项分布与线性规划的综合应用. 很多同学由于题目较长读不懂题意,无法转化,导致丢分. 其实只需根据[W]的取值和线性规划的知识求出[Z]的所有可能取值及对应的概率就可得到[Z]的分布列,问题也就迎刃而解了.endprint