Gompertz分布尺度参数的最短区间估计

2020-03-26周会会

山东理工大学学报(自然科学版) 2020年3期

周会会

(广东海洋大学数学与计算机学院, 广东湛江 524088)

对总体参数的区间估计是数理统计中基本而重要的内容。与参数的点估计相比，区间估计不仅给出了参数真值所在的范围，还给出了该范围包含真值的置信水平。在置信水平确定的前提下，置信区间的长度越短越好。在正态总体的情形下有多种经典的估计方法[1-3]。在经典统计下，一些常见分布的位置参数最短区间估计问题，如指数分布，伽玛分布，瑞利分布，文献[4-6]已有叙述。

文献[7]较为详细地说明了Gompertz分布模型的应用，其可用来描述普通的动力学，动物和哺乳动物的胚胎肿瘤的生长以及可靠性增长模型，还证明了Gompertz分布具有“把时钟调回到零点”的性质。文献[8]介绍了基于Gompertz模型的人口预测问题。文献[9]用Gompertz模型拟合了高龄阶段的人口死亡率。

在Gompertz分布尺度参数最优置信区间估计问题中，枢轴量服从卡方分布，其概率密度函数是非对称的，置信区间的长度一般不是最短的。本文在假设形状参数β已知的前提下，首先给出总体服从X正半轴上Gompertz分布的尺度参数θ的极大似然估计；其次给出尺度参数θ的区间估计方法，在此基础上研究尺度参数θ的最短置信区间估计;最后通过实例验证。

1 预备知识

定义1 称总体X服从参数为2n的卡方分布χ2(2n)，若其密度函数为

定义2称总体X服从正半轴上参数为θ,β的Gompertz分布G(θ,β)，若其密度函数为

式中：θ>0为尺度参数；β为形状参数，β可正可负，如果β>0，则它是增的，如果β<0，则是降的。

引理1设总体X服从Gompertz分布G(θ,β)，X1,X2,…，Xn为来自该总体的样本，则有

易知，

2 Gompertz分布尺度参数的极大似然估计

定理1 设总体X服从Gompertz分布G(θ,β)，X1,X2,…，Xn为来自该总体的样本，则尺度参数θ的极大似然估计量为

(1)

3 Gompertz分布尺度参数的区间估计

定理2设总体X服从Gompertz分布G(θ,β)，X1,X2,…,Xn为来自该总体的样本，在显著性水平α下，尺度参数θ的1-α同等置信区间为

(2)

则对于显著性水平α，有

成立，从而解出θ的1-α同等置信区间为

对Gompertz分布尺度参数θ作区间估计时，在给定置信度下，一般认为置信区间越短越好，而卡方分布的密度函数关于峰值是非对称的，所以得到的置信区间不是最短的，下面本文在前面的基础上寻求最短的置信区间。

定理3Gompertz分布尺度参数θ的最短区间估计问题可转化为如下条件极值问题：求a*,b*，使

成立，其中f(y)为χ2(2n)的概率密度函数，此时置信区间的长度L为

可得

则参数θ的置信区间的长度L为

(3)

因此，求b-a的最小值等价于求L的最小值。

定理4 当n>1时，定理3中的条件极值问题有唯一解(a*,b*)，且满足

证明利用拉格朗日乘数法，令

对a,b和λ分别求偏导数并令其为0，有

化简整理得

(4)

(5)

所有驻点(a,b)是式(4)和式(5)的解。这样仅需证明式(4)和式(5)有解且唯一。

为保证b>a>0且式(4)成立，必须

(6)

因此，对任意满足式(6)的b，可以由式(5)唯一地解出a=u(b)，且u(b)是b的单调减函数，即当b→+时，a=u(b)→0，当b→2(n-1)时，a=u(b)→2(n-1)。

4 实例应用

在对某一电信产品集成测试中[10]，测试执行时间共计16天，测试数据见表1。

表1 某电信产品集成测试数据
Tab.1 Integrated test data of a telecom product

测试天数/d01234567当天发现的缺陷数/个91234433发现缺陷数累计/个910121519232629测试天数/d89101112131415当天发现的缺陷数/个22110100发现缺陷数累计/个3133343535363636

注：测试第0天，进行自动化测试，执行的测试用例多，发现9个缺陷。第1天至第15天，全部为手工测试，中间测试人员未发生变动，以手工测试作为分析的数据。

文献[10]已经用Gompertz增长模型对缺陷数累计值进行了很好地拟合。定理4的结论与文献[4]中有关指数分布的最短区间估计的结论一致，所以可以查文献[4]中的表1，借助Excel数据处理功能，对θ的估计做如下分析。

表2表明，对于不同的n，θ的置信区间都包含其极大似然估计值；当n≤6时，最短置信区间较一般置信区间有明显地缩短，幅度在4%～13%，置信区间缩短的幅度随着观察天数n的增大呈递减趋势。因此，在小样本下，研究Gompertz分布的尺度参数θ的最短置信区间是必要的。

表2θ最短置信区间精度分析
Tab.2 Accuracy analysis of the shortest confidence interval ofθ

nθ A0B0A1B1L0L1r/%20.086 0[0.010 4,0.239 5][0.001 8,0.204 8]0.229 10.203 012.8530.076 0[0.015 7,0.183 1][0.007 7,0.162 3]0.167 50.154 68.3340.066 3[0.018 1,0.145 2][0.011 8,0.131 7]0.127 20.119 96.1050.058 0[0.018 8,0.118 8][0.014 0,0.109 4]0.099 90.095 44.8060.051 8[0.019 0,0.100 7][0.015 2,0.093 7]0.081 70.078 63.9570.046 8[0.018 8,0.087 3][0.015 7,0.082 0]0.068 50.066 33.3580.043 0[0.018 6,0.077 6][0.016 0,0.073 3]0.059 00.057 32.9290.040 0[0.018 3,0.070 1][0.016 1,0.066 6]0.051 80.050 52.58100.037 7[0.018 1,0.064 3][0.016 2,0.061 4]0.046 30.045 22.31110.035 8[0.017 9,0.059 8][0.016 2,0.057 3]0.042 00.041 12.10120.034 4[0.017 8,0.056 3][0.016 3,0.054 1]0.038 60.037 91.91130.033 1[0.017 6,0.053 4][0.016 3,0.051 4]0.035 80.035 11.76140.032 1[0.017 6,0.051 0][0.016 3,0.049 2]0.033 40.032 91.64150.031 3[0.017 5,0.049 0][0.016 4,0.047 4]0.031 50.031 01.52