双边定数截尾下Pareto分布的Bayes估计

2022-09-21周菊玲

枣庄学院学报 2022年5期

刘芹，周菊玲

(新疆师范大学数学科学学院，新疆乌鲁木齐 830017)

0 引言

在可靠性分析与寿命分析等领域中，常会出现数据缺失的情形，而双边定数截尾数据是一种特殊的缺失数据，其模型为：在可靠性实验中假定选取n个产品投入实验，直到r个产品失效时终止实验，设观察到的次序失效数据为x1≤x2≤…≤xr。在实际问题中，由于实验手段等其他因素的影响，导致有些数据未被观察到。假设前s-1个数据丢失，则剩下的次序数据xs≤xs+1≤…≤xr，1≤s≤r≤n，此数据即为双边定数截尾样本。对于此类样本，有不少学者对其展开了研究，李艳玲[1]研究了双参数指数分布在双边定数截尾下的贝叶斯预测问题，郭红莹等[2]、邓严林[3]在双边定数截尾下分别研究了Burr分布、Topp-Leone分布参数的Bayes估计，田霆[4]在双边定数截尾下讨论了Weibull分布两参数的联合置信区间。

Pareto分布是一种重要的寿命分布，具有递减的失效函数，因此常被应用于个人收入、股票价格的波动、保险风险等模型。该分布的概率密度函数及分布函数为：

(1)

式中：a>0，θ>0，a为尺度参数，θ为形状参数。近年来关于Pareto分布的研究有很多，例如，李如兵等[5]在移动极值排序集抽样下，针对共轭先验和杰弗莱先验，研究了Pareto分布形状参数的Bayes估计；周巧娟等[6]基于定数截尾数据，在复合Mlinex损失下，研究了Pareto分布参数的稳健Bayes估计；刘璐等[7]在定数截尾试验时，给出了Pareto分布参数的最优置信区间，使得估计更加精确；Han等[8]在不同损失函数下研究了Pareto分布形状参数的E-Bayes估计及其均方误差。本文在前面学者研究的基础上，基于双边定数截尾样本研究Pareto分布在LINEX损失函数和复合LINEX函数下参数的Bayes估计问题。

1 预备知识

在Bayes统计决策中，无信息先验分布和共轭先验分布是两种常用的先验分布，Pareto分布参数的这两类先验分布有如下形式：

(2)

(3)

对于双边定数截尾样本，当产品服从Pareto分布时，记x=(xs，xs+1，…，xr)，则由文献[2]知样本(xs，xs+1，…，xr)的联合分布密度函数为：

(4)

将(1)式带入式(4)得到

(5)

2 参数的Bayes估计

2.1 LINEX损失函数下参数的Bayes估计

取LINEX损失函数

Lc(θ，δ)=ec(θ-δ)-c(θ-δ)-1，c≠0

(6)

这里讨论c>0的情况。

引理1 在LINEX损失函数下，对于任意先验分布π(θ)，θ的Bayes估计为

(7)

且若此估计的Bayes风险有限，则它是唯一的Bayes估计。

定理1 设X=(X1，X2，…,Xn)是服从Pareto分布的简单随机样本，在LINEX损失函数下，有以下两种情况

(8)

(9)

证(i)由(2)和(5)式，根据Bayes公式可得θ在无信息先验分布下的后验分布

(10)

式(10)的分母可化为

由引理1可知，在无信息先验分布下参数的Bayes估计为

(ii)由(3)和(5)式，根据Bayes公式可得参数θ在共轭先验分布下的后验分布为

(11)

由引理1可知在共轭先验分布下参数的Bayes估计为

2.2 复合LINEX损失函数下参数的Bayes估计

复合LINEX损失函数的表达式为

L(θ，δ)=L-c(θ，δ)+Lc(θ，δ)=e-c(θ-δ)+ec(θ-δ)-2，c>0

引理2 在复合LINEX损失函数下，对任意先验分布π(θ)，θ的Bayes估计为

(12)

定理2 设X=(X1，X2，…,Xn)是服从Pareto分布的简单随机样本，在复合LINEX损失函数下，有以下两种情况

(13)

(14)

由引理2，类似定理1 的证明过程即可证得。

3 数值模拟

表1 模拟结果

由表1可知，在同一个损失函数下，对比两先验先分布下参数估计的均方误差，发现共轭先验分布下参数估计的均方误差较小，因此参数θ取共轭先验分布时，参数的Bayes估计更接近真值；在同一个先验分布下，LINEX损失函数下参数的Bayes估计的均方误差较小，同时在LINEX损失下，参数θ取共轭先验分布时，参数的Bayes估计模拟效果更好。

4 实例分析

Arnold在其著作中给出了一组服从Pareto分布的数据。 50名高尔夫球手收入超过70 000美元，他们到1980年为止的收入为3581、1690、1433、1184、1066、1005、883、841、778、753、2474、1684、1410、1171、1056、1001、878、825、778、746、2202、1627、1374、1109、1051、965、871、820、771、729、1858、1537、1338、1095、1031、944、849、816、769、712、1829、1519、1208、1092、1016、912、844、814、759、708美元，且这些数据服从尺度参数a≈703，形状参数θ≈2.23的Pareto分布。

首先将上述数据按照由小到大的顺序排列，然后利用R软件根据这组数据选取其中符合要求的部分进行参数估计。这里仅考虑在不同损失函数下先验分布选Γ分布的参数估计，设c=10，α=100，β=100。结果如表2所示。

表2 形状参数的Bayes估计

由表2可知，当样本量一定并且先验分布选Γ分布时，参数在LINEX损失下估计的偏差最小，此时的参数估计效果较好，且与数值模拟的结果一致。

5 结论

双边定数截尾是一种在可靠性试验中会遇到的特殊截尾数据。本文在双边定数截尾场合下，基于LINEX损失函数和复合LINEX损失函数，采用Bayes估计的方法对Pareto分布中的形状参数进行估计。在无信息先验分布和Γ先验分布下，将不同损失函数下参数的Bayes估计与其真值进行比较分析，结果表明，在LINEX损失下，选用Γ先验分布时，参数估计更接近真值，并且通过实例也验证了此结论。