APP下载

负二项分布的两种近似分布及其比较

2011-09-08生志荣

统计与信息论坛 2011年1期
关键词:二项分布泊松正态

生志荣

负二项分布的两种近似分布及其比较

生志荣

(南京师范大学泰州学院,江苏泰州225300)

负二项分布是一个重要的离散型随机变量的分布,可以用泊松分布和正态分布作为其近似分布,通过对两种近似分布进行比较分析,结果表明:在参数q很小时,泊松近似的精度好于正态近似,而且在参数q很小时,即便r不是很大,用泊松分布也能获得负二项分布较好的近似;当参数q较大时,泊松近似效果不好,相比之下,正态近似的结果不错。

负二项分布;泊松分布;正态分布;近似计算

一、引言

负二项分布是一个重要的离散型随机变量的分布,具有比较优良的统计特性,在风险管理、排队论等问题中有着广泛的应用。近年来,很多文献对负二项分布进行了研究,内容涉及负二项分布的统计性质及其应用[1-2]以及负二项分布的参数估计问题[3],对负二项分布的近似计算问题还未见讨论。本文通过建立负二项分布与二项分布在概率值上的关系式,利用常用统计软件中二项分布的计算功能来获得负二项分布的概率精确值;给出并证明了负二项分布的泊松近似定理;利用负二项分布随机变量的和式分解以及独立同分布中心极限定理,给出了负二项分布的正态近似;最后对两种近似分布进行了比较分析。

负二项分布亦称为帕斯卡(Pascal)分布,它可以由下列两种模型来描述:

定义1 设p(0

定义2 设p(0

负二项分布的这两种定义是一致的,由定义1中的变量Y与定义2中的变量X各自的含义可得

其中NB(r,p;k)表示参数为r,p的负二项分布在k处的概率值,B(k,p;r)表示参数为k,p的二项分布在r处的概率取值,利用这个关系式,可以通过常用统计软件中二项分布的计算功能来获得负二项分布的概率精确值。

二、负二项分布的近似分布

定理1 设在贝努利试验中每次试验成功的概率为p(0

证明 由负二项分布的实际背景可知,Y为在一系列贝努利试验(每次试验成功的概率为p)成功r次时试验的次数,设Y1为第一次试验成功的试验次数,Y2为第二次试验成功的试验次数(从第一次试验成功之后算起),…,Yr为第r次试验成功的试验次数(从第r-1次试验成功之后算起),则Y1,Y2,…,Yr相互独立,且Yi(i=1,2,…,r)服从几何分布G(p),此时有Y=Y1+Y2+…+Yr,即Y可以分解为r个独立同服从几何分布的随机变量之和,由几何分布的期望和方差得到负二项分布的期望与方差分别为EY=r/p,DY=r(1-p)/p2,根据独立同分布中心极限定理可得负二项分布的正态近似分布N(r/p,r(1-p)/p2),标准化之后得到式(5)。

注:因为负二项分布是离散分布,而正态分布是连续分布,所以用正态分布作为负二项分布的近似计算时,作些修正可以提高精度。若k1

定理2 设在贝努利试验中每次试验成功的概率为pr(与r有关),X表示试验进行到第r次成功为止已经失败的试验次数,令qr=1-pr。如果当r→+∞时,rqr→λ,则有

证明 记rqr=λr,即qr=λr/r,由式(2)可得:

对于固定的k有:

从而

三、两种近似分布的比较研究

下面对负二项分布的泊松近似与正态近似进行比较,其中负二项分布的概率精确值根据式(4)转化为二项分布概率值计算得到,负二项分布的泊松近似利用式(3)和式(6)得到:

负二项分布的正态近似为:

不同参数的负二项分布、泊松分布以及正态分布的概率值比较见表1~4。所有数值均由Minitab软件算得。

由表1可知:对于负二项分布的概率取值,在成功概率p很大(接近于1时),随着k-r的增大,概率值将很快趋向于0,这与负二项分布的实际背景是一致的,因为在成功概率p很大(接近于1)时,成功r次所需的试验次数k一般不会比r大很多。同时也看到,在q(=1-p)很小,r很大时,用泊松分布作为负二项分布的近似分布是合理的,q越小r越大时,近似程度越高。

表1 负二项分布NB(100,0.99)、NB(200,0.995)与泊松分布P(1)的部分概率值比较表

表2 负二项分布NB(20,0.99)与泊松分布P(0.2)的部分概率值比较表

由表2可知:对于负二项分布的概率取值,在q很小时,即便r不是很大,用泊松分布也能获得负二项分布较好的近似。

表3 负二项分布NB(200,0.995)、正态分布N(201, 1/0.9952)与泊松分布P(1)的部分累积概率值比较表

由表3可知:当负二项分布的参数q很小时,泊松分布对负二项分布的近似要好于正态分布对负二项分布的近似。

表4 负二项分布N(200,0.8)、正态分布N(250,40/0.64)与泊松分布P(40)的部分累积概率值比较表

由表4可知:当负二项分布q较大时,用泊松分布去逼近负二项分布的效果不好,相比之下,用正态分布来近似计算负二项分布的值所得结果不错。

[1] 孙道德.关于负二项分布的性质及其应用[J].阜阳师范学院学报:自然科学版,2000,17(2).

[2] 孟生旺.负二项分布的优良特性及其在风险管理中的应用[J].数理统计与管理,1998,17(2).

[3] 程维虎,王莉丽.负二项分布两种参数估计及其比较[J].数理统计与管理,2004,23(5).

[4] 茆诗松,程依明,濮晓龙.概率论与数理统计教程[M].北京:高等教育出版社,2004.

Two kind of Approximate Distributions of Negative Binomial Distribution and It’s Comparison

SHENG Zhi2rong
(Taizhou College,Nanjing Normal University,Taizhou 225300,China)

The negative binomial distribution is an important discrete random variable distribution and may use the poisson distribution and the normal distribution as its approximate distribution.The comparative analysis to two kind of approximate distributions has been carried on and the results indicated: When parameter q is very small,poisson approximation has better accuracy than normal approximation, moreover,even if r is not very big,good approximation can also been obtained with the poisson distribution.When parameter q is big,the poisson approximation is not good,the normal approximate result is comparatively good.

negative binomial distribution;poisson distribution;normal distribution;approximate calculation

O211

A

1007-3116(2011)01-0020-03

(责任编辑:马 慧)

2010-09-06

生志荣,男,江苏泰兴人,讲师,硕士,研究方向:概率统计。

猜你喜欢

二项分布泊松正态
基于泊松对相关的伪随机数发生器的统计测试方法
二项分布与超几何分布的区别与联系
一类带有两个参数的临界薛定谔-泊松方程的多重解
深度剖析超几何分布和二项分布
概率与统计(1)——二项分布与超几何分布
带有双临界项的薛定谔-泊松系统非平凡解的存在性
利用二元对数正态丰度模型预测铀资源总量
二项分布参数的E-Bayes估计及其应用
双幂变换下正态线性回归模型参数的假设检验
基于泛正态阻抗云的谐波发射水平估计