Panel数据模型中两步估计在均方误差意义下的优良性
2015-10-17杨晓霞范永辉
杨晓霞,范永辉
(天津师范大学数学科学学院,天津 300387)
Panel数据模型中两步估计在均方误差意义下的优良性
杨晓霞,范永辉
(天津师范大学数学科学学院,天津 300387)
研究Panel数据模型的参数估计问题.在均方误差矩阵意义下,得到了两步估计优于BetweenTime估计、Between Individual估计、Within估计的充分条件.从这个充分条件可以看出,对于中等大小的样本容量,就有两步估计优于其他3个估计.
两步估计;Within估计;Between Time估计;Between Individual估计
Panel数据模型是一种具有套误差结构的线性回归模型,常产生于重复测量试验、两级抽样调查、裂区试验以及含时间和个体的经济调查等[1-2].这种模型常用在计量经济、市场分析、区域经济研究等领域[3-4].含有时间和个体效应的Panel数据模型可表示为
其中:yit表示第i个个体在时刻t的因变量观测值;xitj表示第i个个体上第j个自变量在时刻t的取值;β1,β2,…,βk为未知回归系数;νt是时间效应;μi是第i个个体的效应,假定这N个个体是从一个大的个体总体中随机抽取的,于是个体效应是随机的;εit是随机误差.假定所有μi、νt和εit都是彼此相互独立的,且μi~N(0,σ2μ),εit~N(0,σ2ε),νt~N(0,σ2ν).
为方便,将模型(1)写成矩阵的形式:
其中:yT=(y11,y12,…,y1T,y21,…,y2T,yN1,…,yNT),εT=(ε11,ε12,…,ε1T,ε21,…,ε2T,…,εN1,…,εNT),1N为分量全为1的N维列向量,
IT表示T阶的单位矩阵,茚是Kronecker乘积,μT=(μ1,μ2,…,μN),νT=(ν1,ν2,…,νT),βT=(β1,β2,…,βK),XT=(XT1,XT2,…,XTN),
由μ、ν、ε的正态性可知u服从正态分布,E(u)=0,且
许多学者研究了Panel模型的统计推断问题.文献[5]系统介绍了相关的参数估计结果及其实际应用.文献[2]研究了模型中误差的结构以及估计的性质.当模型(1)中不包含时间效应时,文献[6]在均方误差矩阵意义下,给出了两步估计优于Within估计和最小二乘估计的充分条件.文献[7]在Pitman准则下比较了几种常见估计,给出了两步估计优于其他几种估计的优良性.文献[8]利用广义p值和广义置信区间构造了含3个随机效应的Panel模型的方差分量的新的精确检验和置信区间.文献[9]采用两阶段估计步骤,对于非参数固定效应Panel data模型给出了估计量的具体表达式.文献[10]给出了两步估计的一种改进.
1 Panel数据模型的估计
为方便,若A、B是方阵,用A>0表示A是对称正定矩阵,用A≥0表示A是对称半正定矩阵,用A≥B表示A-B是半正定矩阵,A>B表示A-B是正定矩阵.
考虑一个T阶正交矩阵OT,其第1行为1TT/,令同样,取一个N阶正交矩阵ON,其第1行为).分别令Q3=C2茚C1,易得引理1.
引理1 对于矩阵Q1、Q2、Q3有如下结论:
(1)Q1、Q2、Q3的秩分别为T-1、N-1、(N-1)·(T-1);
将矩阵Q1、Q2、Q3应用于模型(2),并做变换,得到3个新的模型:
用Σi表示ui的协方差矩阵(i=1,2,3),则有
注意到Σi,i=1,2,3的形式,易得到模型(4)~(6)中未知参数向量β的最佳线性无偏估计分别为
它们也是β的最小二乘估计,分别称为Between Time估计,Between Individual估计和Within估计,这3个估计的协方差矩阵为
其中:n2=N-1-K,n3=(N-1)(T-1)-K=NT-NT+1-K,并且易知
将模型(4)~(6)联立,得到新的模型
Σ4是对角矩阵,这表明u1、u2、u3是相互独立的,自然y1、y2、y3也是相互独立的.
对参数β而言,模型(7)和模型(2)是等价的,在模型(7)中β的最佳线性无偏估计为
基础设施建设不完善,而且工程建设之后的维护与修整通常做不到位,即便是开展了新的农田水利工程项目建设,也只是局限在少数环节,不能从整体角度对本地区水资源利用效率做出全面考量。再加上工程建设后期,由于缺少有效的养护管理,在较大程度上进一步限制了节水灌溉技术的推广应用。
2 两步估计优于Within估计的充分条件
其中H=ξ1W1+ξ2W2,则的充要条件是
因为
先考虑i=1的情况.注意到
其中V=W-1/21W2W-1/21.当ξ1≤2ξ3时,(2ξ3-ξ1)ξ1≥0,
当ξ1>2ξ3时,(2ξ3-ξ1)ξ1<0,ξ1I≥2ξ3I,
由ξi,i=1,2,3的独立性有
综上可知
利用同样的方法考虑E(2ξ3-ξ2)ξ2(I+H)-1W2·(I+H)-1,则可得到如下定理.
定理1 如果nin3-8n3-2ni>0,i=1,2,则,即在均方误差矩阵意义下两步估计优于Within估计
注意到n1=T-1-K,n2=N-1-K,n3=(N-1)·(T-1)-K,所以当T≥3,N≥3时,有n3≥2(N-1)-K>n2,n3≥2(T-1)-K>2n1.所以,当ni≥9,i=1,2时,有
nin3-8n3-2ni=(ni-8)n3-2ni>1×2ni-2ni=0因为当ni≥9时,必有N≥3,T≥3,故有如下推论.
推论1 当ni≥9,i=1,2时,
由推论1可知,对具有中等大小的N、T(即观测的个体数和观测的时间数比回归自变量的个数大9),两步估计优于Within估计.
用类似的方法可讨论两步估计优于Between Time估计和Between Individual估计的充分条件.在此不再证明,只列出结果.
推论2 (1)若n1n2-8n1-2n2>0,n1n3-8n1-2n3>0,则.
(2)若n2n1-8n2-2n1>0,n2n3-8n2-2n3>0,则.
因为ninj-8ni-2nj=(ni-2)(nj-8)-16,i≠j,所以,当ni≥11,i=1,2,3时,总有ninj-8ni-2nj>0.故有如下定理.
定理2 当ni≥11,i=1,2,3时,在均方误差矩阵意义下,优于Between Time估计、Between Individual估计和Within估计
[1] 王松桂,史建红,尹素菊,等.线性模型引论[M].北京:科学出版社,2004.
[2]AVERY R B.Error components and seemingly unrelated regressions[J]. Econometrica,1977,45:194-208.
[3]金春雨,韩哲,张浩博.基于Panel模型的金融业发展与经济增长关联性的计量检验[J].管理评论,2013,25(1):16-23.
[4]孙德红,李锡玲.基于Panel data模型的FDI对我国低碳经济发展的影响研究[J].生态经济,2013,28(2):28-33.
[5]BALTAGI B H.Econometric analysis of Panel data[M].New York:John Wiley,1995.
[6]王松桂,范永辉.Panel数据模型中两步估计的优良性[J].应用概率统计,1998,14(2):177-184.
[7] 马铁丰,王松桂.Panel模型中常见估计的比较[J].数学进展,2008,37(1):107-114.
[8] 程靖,王松桂,岳荣先.Panel数据模型中方差分量的精确检验[J].应用概率统计,2010,26(1):89-97.
[9]解其昌.两阶段估计非参数固定效应Panel data模型[J].复旦学报:自然科学版,2015,54(3):301-307.
[10]张蕊,范永辉.Panel数据模型中两步估计的改进[J].天津师范大学学报:自然科学版,2013,33(4):4-8.
(责任编校 马新光)
Optimality of two-stage estimator in Panel models under mean squared error criterion
YANG Xiaoxia,FAN Yonghui
(College of Mathematical Science,Tianjin Normal University,Tianjin 300387,China)
The parameter estimation in the Panel data models with random time and individual effects is studied.Under the mean square error criterion,a sufficient condition for the superiority of the two-stage estimator over Between Time estimator,Between Individual estimator and Within estimator is obtained.The condition shows that the two-stage estimator is better than the other three estimators even for medium sample size.
two-stage estimator;Within estimator;Between Time estimator;Between Individual estimator
1671-1114(2015)04-0008-04
O212.4
A
2015-03-15
中国水利水电科学研究院开放研究基金资助项目(IWHR-SKL-201403).
杨晓霞(1990—),女,硕士研究生.
范永辉(1972—),男,教授,主要从事概率统计方面的研究.