APP下载

基于分层排序集抽样方法的改进比率估计

2015-03-22张建军乔松珊

关键词:估计量均方比率

张建军, 乔松珊

(1.河南农业大学 信息与管理科学学院, 郑州 450002; 2.中原工学院 信息商务学院, 郑州 450007)



张建军1*, 乔松珊2

(1.河南农业大学 信息与管理科学学院, 郑州 450002; 2.中原工学院 信息商务学院, 郑州 450007)

基于分层排序集样本提出了总体均值的改进比率估计方法,讨论了改进比率估计量的均方误差和偏差估计式,证明了改进的比率估计比原来的联合比率估计更加有效.最后,利用一组幼儿黄疸病胆红素含量的数据进行实例分析,结果表明,基于分层排序集样本的改进比率估计可以有效提高估计精度.

辅助变量; 分层抽样; 排序集抽样; 改进比率估计

排序集抽样是另一种利用辅助信息提高抽样效率的方法,具体过程为,从总体1次抽取r2个样本,随机地划分为r组,对每组样本进行排序,从第i组抽取秩为i的样本单元并具体测量,i=1,2,…,r.类似过程重复m次,得到样本量为mr的排序集样本,记为X(i)j,i=1,2,…,r;j=1,2,…,m.排序集抽样下的比率估计已有一些研究结果,文献[3]利用排序集样本讨论了总体均值的比率估计,并证明该方法有效提高了估计精度;文献[4]与文献[5]采用不同的方式对排序集抽样下的比率估计形式进行改进.

研究发现,总体参数的估计精度很大程度上依赖于对辅助信息的利用程度,鉴于此,文献[6]探讨了辅以排序集样本的分层抽样方法,分析了总体均值的简单估计量及性质,文献[7]利用排序集抽样代替随机抽样,基于分层排序集抽样构造比率估计量.为了进一步在估计量设计阶段提高分层比率估计的精度,文中基于分层排序集样本讨论了一种新改进的比率估计方法.第1部分介绍分层排序集抽样下改进比率估计的构造方法;第2部分讨论了新改进比率估计的均方误差和估计量偏移;第3部分研究了估计量中参数的优化方法;第4部分证明了改进比率估计可以有效提高估计精度;最后,通过实际例子进一步分析,并给出结论.

1 构造改进的比率估计量

(Xh(1)k,Yh[1]k),(Xh(2)k,Yh[2]k),…,(Xh(rh)k,Yh[rh]k),k=1,2,…,m;h=1,2,…,L,

其中,Xh(i)k为变量X在第h层秩为i的次序统计量,Yh[i]k为伴随变量,i=1,2,…,rh.

若μX已知,则总体均值μY的联合比率估计量为:

(1)

简单随机抽样下,Prasad(1989)曾经提出如下的比率估计量[8]

(2)

(3)

2 改进估计量的性质

为了比较改进的估计量是否比原来的估计量更加有效,下面来分析估计量的偏差与近似方差.

其中,TXh(i)=μXh(i)-μXh,TYh[i]=μYh[i]-μYh,μYh[i]=E(Yh[i]),μXh(i)=E(Xh(i)),TXhYh(i)=TXh(i)·TYh[i],ρXhYh为变量X,Y在第h层的相关系数.

(4)

TXhYh(i)=TXh(i)·TYh[i],TXh(i)=μXh(i)-μXh,

TYh[i]=μYh[i]-μYh,

μYh[i]=E(Yh[i]),μXh(i)=E(Xh(i)),

从而

(5)

由文献[3]可知

其中,TXh(i)=μXh(i)-μXh,μXh(i)=E(Xh(i)),代入(5)中得到

(6)

由引理1,得到

由于TXhYh(i)=TXh(i)·TYh[i],从而

(7)

(8)

引理3[7]分层排序抽样下总体的比率估计量为近似无偏估计,并且

(9)

下面,利用上述引理给出改进比率估计量的方差和偏差估计式.

证明利用引理3结论,可以得到

(10)

将引理2的结论代入(10),得到

从而

(11)

根据引理1的结论,可知

3 利用辅助信息确定待定系数k

下面,考虑如何利用辅助信息确定待定系数k,计算待定系数的原则是估计量的均方误差最小,故将均方误差表达式视为系数k的函数, 具体过程如下:

解方程得到最优参数值,

(12)

由引理2容易看出0

注意,在实际计算系数k*时,可以用样本均值代替μY,各层的方差也可以用相应的样本方差代替,估计量方差的计算类似.

4 改进比率估计的有效性

(13)

事实上,根据(12),即

5 实例分析

通过计算,得到分层排序集抽样下各层样本方差sx1=0.5850,sx2=0.2587,sy1=41.304,sy2=18.298,样本均值μx1=2.911,μx2=2.631,μy1=12.878,μy2=10.838,以及相关系数ρx1y1=0.259,ρx2y2=-0.318.用各层的样本方差代替各层总体方差,利用公式(12),得到分层排序抽样下改进比率估计的待定系数k=0.992.由公式(7)、(8)、(10)可分别求出总体均值在不同比率估计形式下的方差,并计算出相应的估计值,结果见表2.

表1 基于SSRS与SRSS的抽样结果

表2 总体均值的不同比率估计结果

容易计算估计的相对效率为eff(ySRSS,ySSRS)=0.819,eff(ykSRSS,ySSRS)=0.984.计算结果表明,分层排序集抽样下均值的比率估计精度比分层随机抽样下的估计精度明显提高,基于分层排序集样本的改进比率估计比原有估计量的估计精度也有所提高,与前者相比估计效率的提高不是十分明显,分析原因主要是由于所选取例子中两变量的相关性不高造成的,对于辅助变量与研究变量相关性较强的情形,读者可做进一步研究.

6 结论

分层排序集抽样方法充分利用了辅助信息,是一种新的获取样本的手段,文中基于分层排序集样本构造了总体均值的改进比率估计量,研究了改进比率估计的性质,并给出了改进比率估计量的偏差和均方误差的近似估计式.最后,利用实际例子作进一步分析,结果表明,改进比率估计的均方误差最小,特别是与分层随机抽样方法相比,有效地提高了估计量的精度.

[1] KADILAR C, CINGI H. Ratio estimators in stratified random sampling[J].Biometrical Journal, 2003, 45(2):218-225.

[2] KADILAR C, CINGI H. A new ratio estimators in stratified random sampling[J].Comm Statist Theor Meth, 2005, 34:597-602.

[3] SAMAWI H M. Estimation of ratio using rank set sampling[J].Biometrical Journal, 1996, 38(6):753-764.

[4] KADILAR C, UNYAZICI Y, CINGI H. Ratio estimation for the population mean using ranked set sampling[J]. Stat Papers, 2009, 50(2):301-309.

[5] JOZANI M J, MAJIDI S. Unbiased and almost unbiased ratio estimators of the population mean in ranked set sampling[J].Stat Papers, 2012, 53(3):719-737.

[6] 张建军, 乔松珊. 辅以排序集样本的分层抽样方法研究[J].统计与信息论坛, 2012, 27(5):14-18.

[7] SAMAWI H M, SIAM M I. Ratio estimation using stratified ranked set sample[J]. Metron International Journal of Statistics, 2003(1):75-79.

[8] PRASAD B. Some improved ratio type estimators of population mean and ratio in finite population sample surveys[J].Commun Statist Theor Meth, 1989, 18(1):379-392.

[9] 杜子芳. 抽样技术及其应用[M].北京:清华大学出版社,2005:134-138.

A new ratio estimation in stratified ranked set sample

ZHANG Jianjun1, QIAO Songshan2

(1.Collage of Information and Management Science, Henan Agricultural University, Zhengzhou 450002;2.College of Information and Business, Zhongyuan Institute of Technology, Zhengzhou 450007)

A new ratio estimation of the population mean based on stratified ranked set sample is established in this paper, with its mean square error and deviation discussed. It is proved that the new estimator is more efficient than the existing combined ratio estimation in all conditions. Finally, a practical application on bilirubin level in jaundiced babies is analyzed. The results show that the new ratio estimator using stratified ranked set sampling improve the precision of estimation effectively.

auxiliary variable; stratified sample; ranked set sample; new ratio estimation

2015-05-22.

河南省教育厅科学技术研究重点项目(13B110057);河南省高等学校青年骨干教师计划项目(2014GGJS-158).

1000-1190(2015)06-0816-06

O212.2

A

*E-mail: zhangjianjunbox@163.com.

猜你喜欢

估计量均方比率
一类具有时滞及反馈控制的非自治非线性比率依赖食物链模型
构造Daubechies小波的一些注记
最小二乘估计量优于工具变量估计量的一个充分条件
Beidou, le système de navigation par satellite compatible et interopérable
比率分析公司财务状况——以步步高及永辉超市为例
浅谈估计量的优良性标准
基于线性最小均方误差估计的SAR图像降噪
一种适用于微弱信号的新颖双峰值比率捕获策略
基于最小均方算法的破片测速信号处理方法
正态总体方差和标准差的无偏估计