APP下载

概率统计中“伽马分布”的教学研究及探讨

2014-02-28张艳,周圣武,韩苗,索新丽

教育教学论坛 2014年2期
关键词:性质

张艳,周圣武,韩苗,索新丽

摘要:讨论了伽马分布的性质,给出伽马分布的三个特例及中心极限定理形式,并利用极限分布,得到n充分大时x2(n)分布和n阶爱尔朗分布的上α分位点的近似计算公式.最后,应用伽马分布给出了指数分布参数的置信区间并给出了应用实例。

关键词:伽马分布;性质;极限分布;上分位数

中图分类号:O211.1?摇 文献标志码:A 文章编号:1674-9324(2014)02-0057-02

一、引言

伽马分布是概率统计中一类重要的分布,它和指数分布、x2分布、爱尔朗(Erlang)分布等一些常见的重要分布都有着密切的联系。张永利[1]通过伽马分布的可加性得到了构造卡方分布和均匀分布的方法,本文将通过对伽马分布的特征函数进行研究,从特征函数出发,推导伽马分布关于尺度参数的可加性,研究伽马分布及其三个特例的数字特征,以及强度为λ的泊松流的第n个事件出现时所需要时间长度的分布问题,应用伽马分布推导指数分布参数的区间估计形式,并给出应用实例。

定义1.1[2] 若随机变量X具有概率密度

f(x)=■xα-1e-βx x>0,0 x≤0.

其中α>0,β>0,则称X服从参数为α,β的伽马(Gamma)分布,记为X~?祝(α,β);α称为形状参数,β称为尺度参数;?祝(α)=■xxα-1e-xdx为?祝函数,伽马分布因此而得名。?祝函数具有以下基本性质[1]:?祝(α+1)=α?祝(α),?祝(1)=1,?祝■=■,特别,当对于n取自然数,有?祝(n)=(n-1)!.

伽马分布的概率密度f(x)是单峰函数,当α>1时,f(x) 在x=(α-1)/β处达到最大值,在α<1时,纵轴为f(x)的渐近线。

二、伽马分布的特例

设X~?祝(α,β),当α,β取某些特殊值时,伽马分布可变为一些常见的分布.

(1)当α=1,β=λ时,即X~?祝(1,λ),由?祝(1)=1可知 X的概率密度为

f(x)=λe-λx x>0,0 x≤0.

表明X服从参数为λ的指数分布,可见指数分布是伽马分布的一个特例。

(2)当α=■,β=■时,即X~?祝■,■,X的概率密度为f(x)=■x■e■ x>0,0 x≤0.

这也是自由度为n的x2分布随机变量的概率密度,所以 X~x2(n),由此可见x2分布也是伽马分布的一个特例。

(3)当α=n,β=λ时,即?祝(n,λ),由?祝(n)=(n-1)!可得

f(x)=■x■e■■ x>0,0 x≤0.

此分布称为参数为n和λ的爱尔朗(Erlang)分布[4]。爱尔朗分布被广泛应用于排队论与可靠性理论中,它描述了强度为λ的泊松流的第n个事件出现时所需要时间长度的分布。爱尔朗分布是伽马分布的一个特例,而指数分布又是爱尔朗分布的一个特例,阶数n=1的爱尔朗分布即为指数分布。

三、伽马分布的基本性质

命题3.1 设随机变量X~?祝(α,β),则X的特征函数 φ(t)为φ(t)=1-■■.

证 X的特征函数φ(t)为:φ(t)=E(eitX)=■eitxf(x)dx=■■xα-1e-(β-it)xdx,令(β-it)x=u,则上式化为

φ(t)=■■■■uα-1e-udu=■■■?祝(α)=1-■■

命题3.2 伽马分布具有可加性,即若随机变量X~?祝(α1,β),Y~?祝(α2,β),且相互独立,则X+Y~?祝(α1+α2,β).

利用伽马分布的特征函数证明可加性非常方便。

证 由特征函数的性质可知,X+Y,Y与X的特征函数满足φX+Y(t)=φX(t)φY(t),

由命题3.1可得,可以得到X+Y的特征函数为

φX+Y(t)=1-■■1-■■=1-■■1-■■

具有这种形式的特征函数的随机变量服从参数为α1+α2,β的伽马分布,故X+Y~?祝(α1+α2,β).

由命题3.2知,两个具有相同尺度参数的相互独立伽马变量之和仍服从伽马分布,即伽马分布关于形状参数具有可加性.此可加性对有限个具有相同尺度参数的相互独立的伽马分布变量的情形也是成立的。

命题3.3 具有参数为n和λ的爱尔朗分布的随机变量可以分解为n个相互独立的具有相同参数λ的指数分布的随机变量之和。

证 设X1,X2,Λ,Xn相互独立,且都服从参数为λ的指数分布.由指数分布与伽马分布的关系可知Xt~?祝(1,λ)(i=1,2,L,n),再由命题3.2 可得

X1+X2+L+Xn~?祝(n,λ),

即?祝(n,λ)分布可以分解为n个相互独立的分布参数为 λ的指数分布的随机变量之和。

命题3.4 设X~?祝(α,β),则

E(xk)=■.

证 X的特征函数为φ(t)=1-■■,所以X的k阶矩为

由命题3.4可知,若X~?祝(α,β),E(X)=α/β,E(X2)=α(α+1)/β2,由此可得X的方差为D(X)=α/β2.特别对于伽马分布的三个特例有以下结论:

命题3.5 ①若X~?祝(1,λ),则E=(X)=■,D(X)=■;

②若X服从自由度为n的x2分布,即X~?祝(■,■),则 E(X)=n,D(X)=2n;

③若X~?祝(n,λ),则E(X)=■,D(X)=■.

四、极限定理

命题4.1 若Yn~?祝(nα,β),则对于任意实数x,有

■P■≤x=■■e■dt=Φ(x)

证 由于Yn可看成是n个相互独立、服从同一?祝(α,β)分布的随机变量X1,X2,Λ,Xn之和,即有Yn=■X■,且EXi=α/β,DXi=α/β2,i=1,2,L,n应用独立同分布的中心极限定理[2,3]有endprint

■P■≤x=■P■≤x=■■e■dt=Φ(x).

当n充分大时,近似地有:Yn~N(nα/β,nα/β2).

对于卡方分布和爱尔朗分布,当n充分大时,利用命题4.1的极限定理,可以近似得到这两种分布的上分位数与标准正态分布的上分数的关系,证明省略。

命题4.2 设x2α、?祝α(n,λ)、zα分别为卡方分布、爱尔朗分布和标准正态分布的上α分位点,则当n充分大时,有 x2α(n)≈n+■zα,?祝α(n)≈■.

五、应用

命题5.1 设总体X服从参数为λ的指数分布,X的样本为X1,X2,Λ,Xn则

①参数λ的置信水平为1-α的置信区间为:■,■,

②指数分布均值的置信水平为1-α的置信区间为:■,■.

证 ①X~E(λ),注意到X~?祝(1,λ),则由命题3.3知:Y=nX=■Xi-?祝(n),其概率密度为fY(y)=■y■e■,y>00, y≤0,令Z=2λY=2nλX,则Z的概率密度为fZ(Z)=■fY■z=■e■■,z>00, z≤0=■e■■,z>00, z≤0 所以Z=2nλX~x2(2n),对于给定的置信水平1-α,由P{x■■(2n)<2nλX

②指数分布的均值■的置信水平为1-α的置信区间:■,■.

例5.1 某电子元件的使用寿命服从参数为λ的指数分布,现从一批这种电子元件中随机抽取72只进行测试,算得平均寿命为x=2580h,求这批电子元件的平均使用寿命的置信水平为0.95的置信区间。

解:样本容量n=72,α=1-0.95=0.05,应用x2(2n)分布的上α分位点的近似公式x■■(2n)≈2n+■zα/2,可得x■■(144)≈177.26,x■■(144)≈110.74,

所以这批电子元件的平均使用寿命的置信水平为0.95的置信区间为■,■≈■,■=(2095.88,3354.96)

注意:样本比较大时,也可依据极限定理,用正态分布对大样本均值进行区间估计,对于参数为1/λ的指数分布,指数分布均值1/λ的置信水平为1-α的置信区间近似地为:■,■,对于本例,n=72是大样本,可以用近似方法求平均使用寿命的置信水平为0.95的置信区间为(2095.88,3354.96).可见对于大样本,两种方法求得置信区间几乎相同,但如果样本容量较小,用前者给出的置信区间去做估计效果比较好。

参考文献:

[1]张永利.关于伽马分布及相关分布性质的一点研究[J].大学数学,2012.3:135-140.

[2]周圣武,李金玉,周长新.概率论与数理统计(第二版)[M].北京:煤炭工业出版社,2007:105,127-138.

[3]盛骤,谢式千,潘承毅.概率论与数理统计(第四版)[M].北京:高等教育出版社,2007:147-153.

[4][美]Sheldon M.Ross著,郑忠国,詹从赞译.概率论基础教程(第8版)[M].北京:人民邮电出版社,2010:174-180.

■P■≤x=■P■≤x=■■e■dt=Φ(x).

当n充分大时,近似地有:Yn~N(nα/β,nα/β2).

对于卡方分布和爱尔朗分布,当n充分大时,利用命题4.1的极限定理,可以近似得到这两种分布的上分位数与标准正态分布的上分数的关系,证明省略。

命题4.2 设x2α、?祝α(n,λ)、zα分别为卡方分布、爱尔朗分布和标准正态分布的上α分位点,则当n充分大时,有 x2α(n)≈n+■zα,?祝α(n)≈■.

五、应用

命题5.1 设总体X服从参数为λ的指数分布,X的样本为X1,X2,Λ,Xn则

①参数λ的置信水平为1-α的置信区间为:■,■,

②指数分布均值的置信水平为1-α的置信区间为:■,■.

证 ①X~E(λ),注意到X~?祝(1,λ),则由命题3.3知:Y=nX=■Xi-?祝(n),其概率密度为fY(y)=■y■e■,y>00, y≤0,令Z=2λY=2nλX,则Z的概率密度为fZ(Z)=■fY■z=■e■■,z>00, z≤0=■e■■,z>00, z≤0 所以Z=2nλX~x2(2n),对于给定的置信水平1-α,由P{x■■(2n)<2nλX

②指数分布的均值■的置信水平为1-α的置信区间:■,■.

例5.1 某电子元件的使用寿命服从参数为λ的指数分布,现从一批这种电子元件中随机抽取72只进行测试,算得平均寿命为x=2580h,求这批电子元件的平均使用寿命的置信水平为0.95的置信区间。

解:样本容量n=72,α=1-0.95=0.05,应用x2(2n)分布的上α分位点的近似公式x■■(2n)≈2n+■zα/2,可得x■■(144)≈177.26,x■■(144)≈110.74,

所以这批电子元件的平均使用寿命的置信水平为0.95的置信区间为■,■≈■,■=(2095.88,3354.96)

注意:样本比较大时,也可依据极限定理,用正态分布对大样本均值进行区间估计,对于参数为1/λ的指数分布,指数分布均值1/λ的置信水平为1-α的置信区间近似地为:■,■,对于本例,n=72是大样本,可以用近似方法求平均使用寿命的置信水平为0.95的置信区间为(2095.88,3354.96).可见对于大样本,两种方法求得置信区间几乎相同,但如果样本容量较小,用前者给出的置信区间去做估计效果比较好。

参考文献:

[1]张永利.关于伽马分布及相关分布性质的一点研究[J].大学数学,2012.3:135-140.

[2]周圣武,李金玉,周长新.概率论与数理统计(第二版)[M].北京:煤炭工业出版社,2007:105,127-138.

[3]盛骤,谢式千,潘承毅.概率论与数理统计(第四版)[M].北京:高等教育出版社,2007:147-153.

[4][美]Sheldon M.Ross著,郑忠国,詹从赞译.概率论基础教程(第8版)[M].北京:人民邮电出版社,2010:174-180.

■P■≤x=■P■≤x=■■e■dt=Φ(x).

当n充分大时,近似地有:Yn~N(nα/β,nα/β2).

对于卡方分布和爱尔朗分布,当n充分大时,利用命题4.1的极限定理,可以近似得到这两种分布的上分位数与标准正态分布的上分数的关系,证明省略。

命题4.2 设x2α、?祝α(n,λ)、zα分别为卡方分布、爱尔朗分布和标准正态分布的上α分位点,则当n充分大时,有 x2α(n)≈n+■zα,?祝α(n)≈■.

五、应用

命题5.1 设总体X服从参数为λ的指数分布,X的样本为X1,X2,Λ,Xn则

①参数λ的置信水平为1-α的置信区间为:■,■,

②指数分布均值的置信水平为1-α的置信区间为:■,■.

证 ①X~E(λ),注意到X~?祝(1,λ),则由命题3.3知:Y=nX=■Xi-?祝(n),其概率密度为fY(y)=■y■e■,y>00, y≤0,令Z=2λY=2nλX,则Z的概率密度为fZ(Z)=■fY■z=■e■■,z>00, z≤0=■e■■,z>00, z≤0 所以Z=2nλX~x2(2n),对于给定的置信水平1-α,由P{x■■(2n)<2nλX

②指数分布的均值■的置信水平为1-α的置信区间:■,■.

例5.1 某电子元件的使用寿命服从参数为λ的指数分布,现从一批这种电子元件中随机抽取72只进行测试,算得平均寿命为x=2580h,求这批电子元件的平均使用寿命的置信水平为0.95的置信区间。

解:样本容量n=72,α=1-0.95=0.05,应用x2(2n)分布的上α分位点的近似公式x■■(2n)≈2n+■zα/2,可得x■■(144)≈177.26,x■■(144)≈110.74,

所以这批电子元件的平均使用寿命的置信水平为0.95的置信区间为■,■≈■,■=(2095.88,3354.96)

注意:样本比较大时,也可依据极限定理,用正态分布对大样本均值进行区间估计,对于参数为1/λ的指数分布,指数分布均值1/λ的置信水平为1-α的置信区间近似地为:■,■,对于本例,n=72是大样本,可以用近似方法求平均使用寿命的置信水平为0.95的置信区间为(2095.88,3354.96).可见对于大样本,两种方法求得置信区间几乎相同,但如果样本容量较小,用前者给出的置信区间去做估计效果比较好。

参考文献:

[1]张永利.关于伽马分布及相关分布性质的一点研究[J].大学数学,2012.3:135-140.

[2]周圣武,李金玉,周长新.概率论与数理统计(第二版)[M].北京:煤炭工业出版社,2007:105,127-138.

[3]盛骤,谢式千,潘承毅.概率论与数理统计(第四版)[M].北京:高等教育出版社,2007:147-153.

[4][美]Sheldon M.Ross著,郑忠国,詹从赞译.概率论基础教程(第8版)[M].北京:人民邮电出版社,2010:174-180.

猜你喜欢

性质
含有绝对值的不等式的性质及其应用
MP弱Core逆的性质和应用
一类非线性随机微分方程的统计性质
随机变量的分布列性质的应用
一类多重循环群的剩余有限性质
妙用等差数列的性质
完全平方数的性质及其应用
三角函数系性质的推广及其在定积分中的应用
性质(H)及其摄动
九点圆的性质和应用