APP下载

面板数据分位数回归模型的诱导光滑估计

2018-07-16袁晓惠王纯杰

统计与决策 2018年11期
关键词:置信区间位数面板

袁晓惠,司 贺,王纯杰

(长春工业大学 数学与统计学院,长春 130012)

0 引言

作为一种稳健性方法,分位数回归由Koenker和Bassett(1978)[1]提出后,就得到国内外统计学家广泛的研究与应用,取得了很多重要成果。Koenker(2005)[2]的专著详尽地总结了近30年来分位数回归相关的理论及研究结果。

面板数据是经济学中比较常见的一类数据,此数据既含有时间序列的信息又包括个体截面的信息。对面板数据的有效分析能为研究者提供更多的信息。Wooldridge[3]介绍了处理面板数据的一些经典统计方法。

面板数据的分位数回归方法的相关研究,近十年来成为国内外一个研究热点。对于固定效应的面板数据模型,罗幼喜和田茂再(2010)[4]通过模拟研究比较了三种分位数回归估计方法,其中固定效应变换分位回归估计(FEQR)表现最好。Kato和Galvao(2012)[5]推导了固定效应模型的分位数回归估计渐近正态性质。Galvao和Kato(2016)[6]基于核提出光滑的分位数回归估计,并用核函数构造回归参数的渐近置信区间。核方法的估计效率依赖于窗宽的选择,且一般需要假定数据独立同分布,如果数据异质性较强,估计的效率可能会较低。

Brown和Wang(2005)[7]提出诱导光滑(IS)方法来估计秩回归参数及相应的置信区间。Brown和Wang(2009)[8]运用此方法构造分位数回归参数的点估计和区间估计,相比于核光滑方法,诱导光滑方法不需要选择窗宽,近几年,此方法得到广泛运用。

本文针对固定效应的分位数回归模型,运用诱导光滑的思想,构造回归参数的诱导光滑点估计和置信区间估计。通过蒙特卡洛实验和实例分析,说明新方法在回归参数的点估计区间估计中具有一定的优势。

1 面板数据分位数回归模型

考虑含有个体固定效应的分位数回归模型:

其中:τ∈(0,1)是感兴趣的分位数,其中 yit是响应变量在截面i和时刻t时的观测值,相应的xit是 p维协向量,β0∈Rp是未知的参数向量,αi是个体i的个体效应。

通过求解如下优化问题可以求得αi和β0的估计:

其中 ρ()

u=u(τ-I(u≤0))。在实际问题中,往往 n比较大但T却比较小,即对于每个个体而言,其观测值并不多,要想利用这少量的个体观测值去估计每个个体效应αi并非易事,而且即使能够得到参数估计,其估计的效率也比较低。考虑到大多数的研究中,参数值β0才是人们的兴趣所在,所以本文的重点将放在对β0的估计上。

β0的FEQR估计方法如下:然后基于考虑

最小化上述目标函数得到β0的FEQR估计为:

相应地,个体效应的估计:

罗幼喜和田茂再(2010)[4]通过模拟比较了FEQR估计和另外两种方法在有限样本下的估计效率,FEQR估计表现较好。

2 诱导光滑估计及其算法

本文将诱导光滑思想[6]应用于式(2),首先构造关于β的诱导光滑估计函数。

其中ϕ(),Φ()分别为是标准正态分布的密度函数和分布函数。通过最小化(β)可得 β0的诱导光滑估计及相应的个体效应

在此方法中,Γ未知,首先令Γ=(nT)-1Ip,通过不断迭代更新Γ。

令和

(2)在第k步迭代中,

(3)重复(2)直到 β(k+1)收敛于,(nT)Γ(k)收敛于ΣIS。

3 蒙特卡洛模拟

本文根据固定效应面板数据模型产生模拟数据,用以比较诱导光滑估计和其他几种估计在有限样本下的表现。

设定的产生数据的模型如下:

误差分布选择有3种:①标准正态分布N( )0,1 ,②标准柯西分布C(0,1),③自由度为3的T分布t(3)。真值β0=1,令 τ=0.3,0.5,0.7 及 n=10,T=30。在不同的误差分布影响下计算β0的5种估计:

(1)忽略个体固定效应,直接使用混合数据的最小二乘估计,记为LS估计;

(2)忽略个体固定效应,直接使用混合数据的分位回归估计,记为QR估计;

(3)考虑个体固定效应的最小二乘估计,记为FELS估计;

(4)考虑个体固定效应的变换分位数回归估计,记为FEQR估计;

(5)本文提出的考虑个体固定效应的诱导光滑估计,记为FEIS估计。

首先从均方根误差(RMSE)的角度来衡量β0的估计的好坏。

这里K是模拟重复次数,设定K=1000。RMSE越小,说明估计的效率越高,估计效果越好。表1列出了在不同的误差分布及不同的分位数下,以上5个估计的RMSE。为了说明估计效果,每一行中,最小的RMSE用“*”标出。

表1 在不同分位点不同误差分布下β0的五种估计

从表1可以看出:

LS和QR的RMSE远远大于其余3种估计,说明在固定效应面板数据模型中,忽略个体效应,导致估计效率降低。在参数估计中应该将个体效应纳入估计方法中。

当误差分布为正态分布时,FELS估计的RMSE最小,而当误差分布为柯西分布和T分布时,FELS的RMSE变得很大,尤其是柯西分布时,FELS估计的RMSE是FEQR和FEIS的RMSE的几十甚至上百倍。而在实际数据的分析过程中,误差分布的识别一般比较困难,且不一定会是正态分布。FELS估计在稳健性方面的表现呈现一定劣势。

在3种误差分布下,FEQR和FEIS估计的RMSE都非常小,说明这两个估计对误差分布的依赖较弱,具有稳健性。

大多数情形下,FEIS的RMSE小于FEQR的RMSE,说明FEIS方法在有限样本下的点估计具有一定的优势。

表2 β0的FEIS估计的标准差95%的置信区间的覆盖率

表2列出了FEIS估计的标准差SD和估计的标准差的平均SE以及95%的置信区间的覆盖率。

正如表2所示,FEIS估计的SD和SE比较接近,且基于估计的标准差而构造的置信水平为95%的置信区间的覆盖率基本接近95%,说明FEIS方法置信区间估计表现较好。

4 实证

本文通过一个真实的数据来展现FEIS方法在实际运用中的表现。数据来源于《中国统计年鉴》。包含华北地区5省市,东北地区3省,华东地区7省市,中南地区6省从1996—2013年的城镇居民家庭平均每人全年消费性支出和城镇居民平均每人全年家庭可支配收入的数据。目标是探索居民消费和收入之间的关系。

本文采用1978年全国年度消费物价指数CPI对变量进行平减,平减后的变量作为本文分析的对象。

表3 回归结果比较

表3列出了上文中的5个估计的参数估计值(τ=0.5)。LS和QR的估计值较大,而考虑个体固定效应的其他3个估计比较接近。

图1 三种方法的回归结果

图1画出了FELS和FEQR、QR在不同分位点的估计值。QR估计波动性较大,FELS和FEQR估计值很接近。说明FELS的估计比较稳定,而FELS可以同时得到区间估计,可以得到更可靠的信息,具有一定优势。

5 结论

本文提出了面板数据分位数回归的诱导光滑估计方法,可以在识别参数估计中同时得到参数点估计和区间估计,给实际工作者提高具有更可靠的信息。接着本文给出估计的简单且有效的算法,通过很少的迭代数就可得到收敛的参数估计。蒙特卡洛模拟实验表明本文所提方法在小样本下表现出色。实例分析说明此方法操作简单,估计效果稳定,具有实用价值,总体来说,诱导光滑估计方法在面板数据分位数回归模型的参数估计中,具有一定的竞争力。

猜你喜欢

置信区间位数面板
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
定数截尾场合Pareto分布形状参数的最优置信区间
连续自然数及其乘积的位数分析
石材家具台面板划分方法
MasterCAM在面板类零件造型及加工中的应用
Photoshop CC图库面板的正确打开方法
面板塑件凸毂结构优化及模具设计
两组率同为100%或0%时率差置信区间估计的SAS实现*
比大小有窍门