APP下载

基于缺失数据下混合Pareto分布参数的估计

2022-12-20徐圣楠张桂颖刘洋萍

通化师范学院学报 2022年12期
关键词:正态参数估计总体

徐圣楠,张桂颖,刘洋萍

在统计学中,由于Pareto 分布具有递减的失效率函数,故能较好地描述股票价格和微信流量波动.文献[1]通过实证分析验证了广义Pareto 分布能够较好地刻画保险公司每年的最大索赔损失金额;文献[2-3]分别通过贝叶斯和极大似然估计法研究了Pareto 分布的参数估计问题.数据缺失是统计工作中的常见问题,文献[4-7]分别研究了两种离散型和连续型分布总体的估计问题;文献[8]利用MLE 算法研究了在丢失部分样本数据时Pareto分布的参数估计问题.本文以高等数理统计学为理论基础,进一步分析缺失数据下混合Pareto 分布总体的参数估计问题,通过建立矩估计方程组,解出未知参数的估计值.然后,验证估计量是否具有相合性和渐近正态性.最后,对估计结果进行随机模拟,说明估计的可行性.

1 矩估计及其渐近性质

假设混合Pareto 分布,其密度函数为:

其中:设定门限参数α> 0.其次,分别取形状参数θi> 0(i=1,2)为总体的未知参数.然后,对两个混合Pareto 分布进行n次独立观测,抽取分布总体做样本观测时,记1-P为丢失样本时的概率.最后,用(Xi,δi)表示混合Pareto 分布的第i个总体观测值,Xi表示该分布总体的第i个样本观测值,i=1,2,…,n.若缺少第i个样本值记δi=0,反之记δi=1.

下面考虑θ1,θ2的矩估计.根据得到的样本观测值(Xi,δi),i=1,2,…,n,建立矩估计方程

解方程得

其中:

由上述参数的矩估计结果,下面验证,的相合性和渐近正态性.

证明{Xiδi,1

并且

同理得到

于是有

其中:

引理1[9]记Tn=(T1n,T2n,…,Tkn)T,α=(α1,α2,…,αk)T,设∑=(δij)k×k,又设g(t1,t2,…,tk)对各ti有连续偏导数,则当n→∞时,有

其中:δ2=

定理2 在前面记号,有

证明 令Wi=(δi,δiXi,δiXi2)T,{Wi,i≥1}为独立同分布随机变量序列,从而

令∑=E(W1-EW1)(W1-EW1)T,于是利用多元中心极限定理得到

于是得出

根据引理1

同时

同理,令

依据引理1

其中

其中:

2 模拟研究

使用MATLAB 软件进行随机模拟,验证此方法的可行性.设定门限参数α=2,混合概率q=0.4,分别给定样本量n=100,n=300,n=500,缺失概率为1-P=0.01 的模拟研究结果如表1所示.

从表1可以看出,当数据不完整时,混合Pareto 分布的参数估计量具有渐近正态性.在给定θ1、θ2不同参数真值时,进行1 000 次随机模拟比较两参数的均方误差,得到参数估计的误差值不受样本量大小的影响,并且和的均方误差都在可接受范围内,再次验证矩估计方法具有可行性.

表1 模拟结果

3 结语

针对数据不完整情况下的混合Pareto 分布总体参数估计问题,目前还很少有人研究.本文利用ME 算法证明了其优良性,同时随机模拟的结果也验证了其合理性.通过对本文的研究,为今后应用Pareto 分布的相关性质做了准备.

猜你喜欢

正态参数估计总体
基于新型DFrFT的LFM信号参数估计算法
用样本估计总体复习点拨
不完全观测下非线性非齐次随机系统的参数估计
利用二元对数正态丰度模型预测铀资源总量
2020年秋粮收购总体进度快于上年
直觉正态模糊数Choquet 积分算子及其决策应用
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
外汇市场运行有望延续总体平稳发展趋势
直击高考中的用样本估计总体
基于竞争失效数据的Lindley分布参数估计