Lindley分布在定时截尾样本下的统计分析

2018-03-21王蓉华徐晓岭

统计与决策 2018年1期

代莹，王蓉华，徐晓岭

（1.上海师范大学数理学院，上海 200234；2.上海对外经贸大学统计与信息学院，上海 201620）

1 问题的提出

非负随机变量X服从参数为θ的Lindley分布，则其概率密度函数f(x)和分布函数

Lindley分布是由Lindley[1,2]提出的一种分析寿命数据的新的分布。该分布在应力-强度模型的可靠性研究中具有非常重要的作用，而且Ghitany等人在文献[3]中指出，Lindley分布具有的很多数学性质比指数分布的还要灵活，利用Lindley分布模型来拟合寿命数据在很多方面比用指数分布模型的效果还要好。Zakerzadeh和Dolai在文献[4]中提出了广义Lindley分布。文献[5]和文献[6]中也分别对Poisson-Lindley分布和zero-truncated Poisson-Lindley分布进行了讨论。杜伟娟等在文献[7]中讨论了独立同分布样本情形下Lindley分布参数的经验Bayes（EB）单侧检验问题，利用密度函数的递归核估计构造了参数的EB检验函数，在适当条件下证明了所提出的EB检验函数的渐近最优性，并获得了其收敛速度。龙兵在文献[8]中研究了Lindley分布参数的区间估计和假设检验问题，在全样本场合下给出了参数的置信区间和假设检验的拒绝域，并通过Monte-Carlo模拟说明了所给方法的应用。

Lindley分布有如下基本性质：

定理1[3]：设非随机变量X服从参数为θ的Lindley分布，则：

（6）当θ≥1时，f(x)严格单调下降；当 0＜θ＜1时，f(x)呈“倒浴盆”形；

2 定时截尾样本场合下参数θ的统计分析

设产品寿命X服从参数为θ的Lindley分布，随机从一批产品中抽取n个样品进行寿命试验，定时截尾时间为t0，若记xk为第k个样品的寿命，则第k个样品的试验时间Sk(t0)是如下随机变量：

其试验总时间为：

2.1 Sk(t0)的分布函数

显然，S1(t0),S2(t0),…，Sn(t0)是独立同分布的随机变量，若记其分布函数为G(t)，则在t≤0时，Sk(t0)的分布函数G(t)=0，当t＞0时有：

上式的第一项为：

上式第二项为：

由此可得Sk(t0)的分布函数为：

2.2 Sk(t0)的期望和方差

由Sk(t0)的分布函数可以看出，诸Sk(t0)是既非离散又非连续的随机变量，由于Sk(t0)又都是有界随机变量，它的期望与方差总存在，分别为：

容易验证，当t0→+∞时，上述期望和方差分别为Lindley分布的期望和方差。

2.3 Sk(t0)的极限分布：由于诸样品的试验时间

S1(t0),S2(t0),…，Sn(t0)是独立同分布的有界随机变量，所以由中心极限定理知，当n很大时，总试验时间S(t0)近似服从正态分布，即：

2.4 参数θ的近似置信区间

首先给出定时截尾下参数θ的极大似然估计。设X1,X2,…,Xn为来自参数为θ的Lindley分布总体X的一个容量为n的样本，试验进行到t0（t0是预先给定的正数）时刻停止。设在时刻t0以前有r个产品失效，记相应的失效时间为x(1)≤x(2)≤…≤x(r)≤t0

似然函数为：

则上述方程的根即为参数θ的极大似然估计。

引理：对a＞0，θ＞0 的方程有唯一正实根。

则所求方程有唯一正实根。

下面用所得的参数θ的极大似然估计部分替换枢轴量H(θ)中的θ，从而容易得出近似置信区间和近似置信限。

记Uα2为标准正态分布的上侧α2分位数，则参数θ的置信水平为 1-α的近似置信区间为 [1,2]，其中1,2分别为如下方程的根：

也即：

3 随机模拟

首先产生来自Lindley分布θ=0.5,θ=1,θ=1.5,θ=2,θ=2.5,θ=3的随机样本，其样本容量分别为10,15,20,25,30，然后取置信水平为α=0.1，根据上述公式计算θ的近似置信区间，如此重复1000次计算出各个样本量和各种截尾次数下近似置信区间的覆盖率及区间长度如表1所示。

表1 近似置信区间的覆盖率和平均长度

从上述模拟结果可以看出，在置信水平方面该方法还是可行的。

4 实例分析

例1：取n=35,θ=0.5随机产生一组服从Lindley分布的数据：

0.0862 ，0.2368，0.5039，0.5777，0.8323，0.9287，1.0101，

1.1329 ，1.1397，1.3328，1.3364，1.3729，1.4431，1.5088，

1.5890 ，1.7558，1.9672，2.0647，2.2915，2.4510，2.5994，

3.0736 ，3.3280，3.4773，3.8549，3.9115，4.5798，5.0378，

5.1388 ，5.7566，6.7986，7.1352，7.3523，9.5156，10.8070

取截尾时间t0=5，取置信水平为α=0.1，标准正态分布的分位数U0.05=1.64，在定时截尾样本下θ的极大似然估计为=0.5266，按上述方法得到的近似置信区间为[0.3656,0.8547]。

例2：文献[9]中某一型号坦克维修过程中，经过47次观察得到基层Ⅰ级预防性维修二级保养时间的现场观测值如下（单位：小时）：

0.80 ，1.00，1.00，1.41，1.50，1.50，1.50，2.00，2.00，2.00

2.00 ，2.50，2.50，2.75，3.20，3.30，3.70，3.80，3.80，4.00

4.00 ，4.00，4.00，4.00，4.00，4.10，5.00，5.00，5.50，5.50

5.50 ，6.00，6.50，7.00，7.16，7.75，8.00，8.00，9.50，9.73

10.00 ，11.40，12.00，12.00，14.00，15.21，15.50

先对样本数据进行拟合检验，检验其是否服从Lindley分布：

在文献[9]中对样本数据进行了χ2拟合优度检验，按照文献[9]的分组方法对样本进行分组，假设H0：该型坦克的基层Ⅰ级预防性维修二级保养时间服从艾拉姆伽分布，参数t0的极大似然估计为：t̑0=5.4598，检验结果如表2所示。

表2 原假设H0的 χ2检验计算结果

χ2拟合优度检验的自由度取值为：区间数-未知参数个数-1，在文献[9]中将样本分成了6个区间，艾拉姆伽分布的分布函数中含有一个未知参数θ，但其检验的自由度取3，这是不正确的，所以此处取自由度为4更为妥当。

χ2拟合优度检验依赖于区间的划分，即使原假设H0:F(x)=F0(x)不成立，在某种划分下还是可能有F(ai)-F(ai-1)=F0(ai)-F0(ai-1)=pi0,i=1,2,…,m，从而不影响统计量的值。所以，下面用柯尔莫哥洛夫检验对样本数据进行检验。

柯尔莫哥洛夫检验：设随机变量X的分布函数F(x)未知，X1,X2,…,Xn为从中抽取的简单随机样本，F0(x)为给定的某个分布函数。检验问题H0:F(x)=F0(x)。首先，将样本观测值从小到大排列为x(1),x(2),…,x(n)，求出F(x)的经验分布函数为：

给出检验水平α，查表得到检验的临界值Dn,α，在n较大时可近似的决定检验的临界值，其中，当α给定时，λ可查表求出。若Dn＞Dn,α则拒绝原假设H0，否则就接受原假设H0。

柯尔莫哥洛夫检验此样本是否服从Lindley分布：取置信水平为α=0.05 ，查表得λ1-α=1.36，则检验统计量：

故接受原假设H0，即认为这批产品的寿命服从Lindley分布。

如取定时截尾时间为t0=9，置信水平为α=0.1，标准正态分布的分位数U0.05=1.64，在定时截尾样本下θ的极大似然估计为=0.3137，按上述方法得到的近似置信区间为[0.1714,0.5058]。

[1]Lindley D,Introduction to Probability and Statistics from a Bayesian Viewpoint[J].Cambridge University Press,1965.

[2]Lindley D V,Fiducial Distributions and Bayes’theorem[J].Journal of the Royal Statistical Society,1958,(20).

[3]Ghitany M E,Atieh B,Nadarajah S.Lindley Distribution and Its Application[J].Mathematics and Computers in Simulation,2008,78(4).

[4]Zakerzadeh H,Dolati A.Generalized Lindley Distribution[J].Journal of Mathematical Extension,2017.

[5]Sankaran M,The Discrete Poisson-Lindley Distribution[J].Biometrics,1970,(26).

[6]Ghitany M E,Al-Mutairi D K,Nadarajah S.Zero-truncated Poisson-Lindley Distribution and Its Application[J].Mathematics and Computers in Simulation,2008,79(3).

[7]杜伟娟，彭家龙，李体政.Lindley分布参数的经验Bayes检验的收敛速度[J].统计与决策，2012,(21).

[8]龙兵.Lindley分布中参数的区间估计和假设检验[J].广西民族大学学报，2014,20(1).

[9]吕会强,高连华,陈春良.艾拉姆咖分布及其在保障性数据分析中的应用[J].装甲兵工程学院学报,2000,16(3).