APP下载

Gompertz分布尺度参数的最短区间估计

2020-03-26周会会

关键词:卡方置信区间总体

周会会

(广东海洋大学 数学与计算机学院, 广东 湛江 524088)

对总体参数的区间估计是数理统计中基本而重要的内容。与参数的点估计相比,区间估计不仅给出了参数真值所在的范围,还给出了该范围包含真值的置信水平。在置信水平确定的前提下,置信区间的长度越短越好。在正态总体的情形下有多种经典的估计方法[1-3]。在经典统计下,一些常见分布的位置参数最短区间估计问题,如指数分布,伽玛分布,瑞利分布,文献[4-6]已有叙述。

文献[7]较为详细地说明了Gompertz分布模型的应用,其可用来描述普通的动力学,动物和哺乳动物的胚胎肿瘤的生长以及可靠性增长模型,还证明了Gompertz分布具有“把时钟调回到零点”的性质。文献[8]介绍了基于Gompertz模型的人口预测问题。文献[9]用Gompertz模型拟合了高龄阶段的人口死亡率。

在Gompertz分布尺度参数最优置信区间估计问题中,枢轴量服从卡方分布,其概率密度函数是非对称的,置信区间的长度一般不是最短的。本文在假设形状参数β已知的前提下,首先给出总体服从X正半轴上Gompertz分布的尺度参数θ的极大似然估计;其次给出尺度参数θ的区间估计方法,在此基础上研究尺度参数θ的最短置信区间估计;最后通过实例验证。

1 预备知识

定义1 称总体X服从参数为2n的卡方分布χ2(2n),若其密度函数为

定义2称总体X服从正半轴上参数为θ,β的Gompertz分布G(θ,β),若其密度函数为

式中:θ>0为尺度参数;β为形状参数,β可正可负,如果β>0,则它是增的,如果β<0,则是降的。

引理1设总体X服从Gompertz分布G(θ,β),X1,X2,…,Xn为来自该总体的样本,则有

易知,

2 Gompertz分布尺度参数的极大似然估计

定理1 设总体X服从Gompertz分布G(θ,β),X1,X2,…,Xn为来自该总体的样本,则尺度参数θ的极大似然估计量为

(1)

3 Gompertz分布尺度参数的区间估计

定理2设总体X服从Gompertz分布G(θ,β),X1,X2,…,Xn为来自该总体的样本,在显著性水平α下,尺度参数θ的1-α同等置信区间为

(2)

则对于显著性水平α,有

成立,从而解出θ的1-α同等置信区间为

对Gompertz分布尺度参数θ作区间估计时,在给定置信度下,一般认为置信区间越短越好,而卡方分布的密度函数关于峰值是非对称的,所以得到的置信区间不是最短的,下面本文在前面的基础上寻求最短的置信区间。

定理3Gompertz分布尺度参数θ的最短区间估计问题可转化为如下条件极值问题:求a*,b*,使

成立,其中f(y)为χ2(2n)的概率密度函数,此时置信区间的长度L为

可得

则参数θ的置信区间的长度L为

(3)

因此,求b-a的最小值等价于求L的最小值。

定理4 当n>1时,定理3中的条件极值问题有唯一解(a*,b*),且满足

证明利用拉格朗日乘数法,令

对a,b和λ分别求偏导数并令其为0,有

化简整理得

(4)

(5)

所有驻点(a,b)是式(4)和式(5)的解。这样仅需证明式(4)和式(5)有解且唯一。

为保证b>a>0且式(4)成立,必须

0

(6)

因此,对任意满足式(6)的b,可以由式(5)唯一地解出a=u(b),且u(b)是b的单调减函数,即当b→+时,a=u(b)→0,当b→2(n-1)时,a=u(b)→2(n-1)。

4 实例应用

在对某一电信产品集成测试中[10],测试执行时间共计16天,测试数据见表1。

表1 某电信产品集成测试数据
Tab.1 Integrated test data of a telecom product

测试天数/d01234567当天发现的缺陷数/个91234433发现缺陷数累计/个910121519232629测试天数/d89101112131415当天发现的缺陷数/个22110100发现缺陷数累计/个3133343535363636

注:测试第0天,进行自动化测试,执行的测试用例多,发现9个缺陷。第1天至第15天,全部为手工测试,中间测试人员未发生变动,以手工测试作为分析的数据。

文献[10]已经用Gompertz增长模型对缺陷数累计值进行了很好地拟合。定理4的结论与文献[4]中有关指数分布的最短区间估计的结论一致,所以可以查文献[4]中的表1,借助Excel数据处理功能,对θ的估计做如下分析。

表2表明,对于不同的n,θ的置信区间都包含其极大似然估计值;当n≤6时,最短置信区间较一般置信区间有明显地缩短,幅度在4%~13%,置信区间缩短的幅度随着观察天数n的增大呈递减趋势。因此,在小样本下,研究Gompertz分布的尺度参数θ的最短置信区间是必要的。

表2θ最短置信区间精度分析
Tab.2 Accuracy analysis of the shortest confidence interval ofθ

nθ A0B0A1B1L0L1r/%20.086 0[0.010 4,0.239 5][0.001 8,0.204 8]0.229 10.203 012.8530.076 0[0.015 7,0.183 1][0.007 7,0.162 3]0.167 50.154 68.3340.066 3[0.018 1,0.145 2][0.011 8,0.131 7]0.127 20.119 96.1050.058 0[0.018 8,0.118 8][0.014 0,0.109 4]0.099 90.095 44.8060.051 8[0.019 0,0.100 7][0.015 2,0.093 7]0.081 70.078 63.9570.046 8[0.018 8,0.087 3][0.015 7,0.082 0]0.068 50.066 33.3580.043 0[0.018 6,0.077 6][0.016 0,0.073 3]0.059 00.057 32.9290.040 0[0.018 3,0.070 1][0.016 1,0.066 6]0.051 80.050 52.58100.037 7[0.018 1,0.064 3][0.016 2,0.061 4]0.046 30.045 22.31110.035 8[0.017 9,0.059 8][0.016 2,0.057 3]0.042 00.041 12.10120.034 4[0.017 8,0.056 3][0.016 3,0.054 1]0.038 60.037 91.91130.033 1[0.017 6,0.053 4][0.016 3,0.051 4]0.035 80.035 11.76140.032 1[0.017 6,0.051 0][0.016 3,0.049 2]0.033 40.032 91.64150.031 3[0.017 5,0.049 0][0.016 4,0.047 4]0.031 50.031 01.52

猜你喜欢

卡方置信区间总体
卡方检验的应用条件
卡方变异的SSA的FSC赛车转向梯形优化方法
卡方检验的应用条件
2020年秋粮收购总体进度快于上年
基于预警自适应技术的监控系统设计
三大抽样分布的理解与具体性质
外汇市场运行有望延续总体平稳发展趋势
效应量置信区间的原理及其实现
直击高考中的用样本估计总体