APP下载

Panel数据模型中两步估计的改进

2013-11-01范永辉

关键词:对角数据模型协方差

张 蕊,范永辉

(天津师范大学数学科学学院,天津300387)

Panel数据是指对任何同一组的个体在一段时间内重复观测到的数据,这里的个体可以是工人、家庭、公司、行业、地区或国家等.Panel数据常出现在重复测量试验、两级抽样调查以及含时间和个体的经济调查中[1].用于分析此类数据的模型往往称为Panel数据模型.从本质上看,Panel数据模型是一种具有套误差结构(nested error structure)的线性回归模型.

只含一个随机效应的Panel模型可表示为

其中:yit表示第i个个体(如区组、家庭、国家或地区等)在时刻t的因变量观测值;xitj表示第i个个体上第 j个自变量在时刻 t的取值,j=1,2,…,k;β0,β1,β2,…,βk为未知回归系数;μi是第 i个个体的随机效应,εit是随机误差,假定所有μi和εit都彼此相互独立,且 μi~ N(0,σμ2),εit~ N(0,σε2).

将模型(1)写成矩阵形式:

其中:1NT和1T分别表示分量全为1的NT维和T维列向量,

假定 X 的秩为 k;βT=(β1,…,βk);u=(IN⊗1T)μ +ε;符号⊗表示 Kronecker乘积,且 μT=(μ1,μ2,…,μN),εT=(ε11,…,ε1T,ε21,…,εNT).那么 μ 和 ε 相互独立,且

其中:P=IN⊗JT-JNT,Q=I-IN⊗JT,σ12=Tσμ2+σε2.

为方便起见,用 rank(A)和 tr(A)分别表示矩阵A的秩和迹,M(A)表示矩阵A的列向量张成的空间.如果矩阵A,B满足ATB=0,线性子空间M(A)和 M(B)相互正交,则简单地说矩阵 A,B正交.Cov(·)表示随机向量的协方差矩阵.

1 两步估计及其改进

由于P、Q都是对称幂等矩阵,所以存在列满秩的矩阵 C1、C2,使得

2)C1TPC1=IN-1,C2TQC2=IN(T-1).

证明 1)注意到 M(P)=M(C1),M(Q)=M(C2),并且 P=C1C1T,Q=C2C2T,由引理 1 可知NT,C1,C2相互正交.C1TQ=(C1TC2)C2T=0,C2TP=(C2TC1)·C1T=0.同理可得PC2=0,QC1=0.

2)C1TPC1=(C1TC1)2=IN-1.同理可证 C2TQC2=IN(T-1).证毕.

由引理 2 可得 Cov(u1)=Cov(C1Tu1)=C1TΣC1=σ12IN-1,Cov(u2)=σε2IN(T-1).那么用 C1、C2对模型(2)做变换可得如下2个新模型:

其中:yi=CiTy,Xi=CiTX,ui=CiTu,i=1,2.由此可知在线性模型(4)和(5)中的最佳线性无偏估计分别为分别称为 Between 估计和 Within 估计[1],它们都是β的无偏估计,且它们的协方差阵为

总假定XTPX为可逆阵,在实际中这个假设总是成立的.由残差可以得到 σ12,σε2的无偏估计 s12,s22:

其中:n=N-1-k,m=N(T-1)-k.

对于β的Between估计和Within估计,以及s12、s22,有以下结论:

证明 注意到y1、y2都是y的线性函数,y~N(X β,Σ),故y1,y2的联合分布也是正态分布.由知 y1,y2相互独立.都是 y1的函数都是 y2的函数,所以和相互独立.和s12之间的独立性以及之间的独立性的证明可见文献 [2].X1Ty1,X2Ty2,s12,s22之间独立性的证明可见文献[3].证毕.

为方便起见,记B=X1TX1,W=X2TX2.

将模型(4)和模型(5)合并,得到新模型:

在此模型中,β的最佳线性无偏估计为

其中 σ2=(σ12,σε2).由上式可以看出的依矩阵为权组合.实际上也是模型(2)中 β的最佳线性无偏估计.但是中包含未知参数σ12和σε2,是不能使用的估计量,将它们用各自的估计来代替,得到β的两步估计

其中 s2=(s12,s22),而不再是 β 的最佳线性无偏估计.由定理1可得

从而,只要

从而,当0< z≤ 2时,φ(2-z)z≥0,

当 z> 2时,φ(2-z)z< 0,

由以上可知,

由此可知,只要 E(2-z)z> 0 ,则β(s2)优于βW.因为 z~ Fm,n,当 z>4时,Ez2存在,且

同样方法可以得到:

由定理2~3可得如下推论.

这个推论说明中等的样本量就能保证两步估计优于Between估计和Within估计.

下面在均方误差矩阵意义下改进两步估计.

由于D1=W1/2BW-1/2是正定矩阵,故存在正交阵O,使得OTD1O=diag{d1,d2,…,dk}=ΔD,这里d1≥d2≥…≥dk≥0是D1的特征值,也是BW-1的特征值.令L=W1/2OLDLTOTW-1/2,那么

构造β的估计量

显然,当li=0,i=1,2,…,k 时

由定理1可知它是β的无偏估计,且由定理1可得

其中G(L)是对角阵.记 ci= φdi,则 G(L)的第 i个对角元g(li)可表示为

由上式可知g(li)是li的二次函数,当时,取最小值g(li0).由此可得如下定理.

定理4 对于i=1,…,k,若li位于 0和li0之间,则Cov(β(L))≤ Cov(β(0))=Cov(β(s2)).

虽然当li=li0时,β(L)优于β(s2),但是 li0包含未知量,下面在0和li0之间找一个与位置参数无关的量.令f(c)=1-E,由,可知

引理3 若Ez3存在,则f(c)可导,且

以及Ez3<+∞,所以Ez2<+∞.再由上式及控制收敛定理可知对c的导数存在,且求期望和求导可以交换顺序.所以

同样,注意到对任意的c2>c1≥0,有

以及Ez3<+∞,根据控制收敛定理可知对c的导数存在,且

由 f(c)的定义可知 f(c)可导,且

由Cauchy-Schwarz不等式[4-5]可得所以f′(c)≤0,f(c)是c的减函数.证毕.

因为ci=φdi<di,所以f(ci)≥f(di).若f(di)>0,那么0<因为z ~ Fm,n,且

所以存在 d,使得 f(d)≥ 0.而

所以取

则有0≤li1<li0,由定理4可得

这里L1=,且当 L1≠0时,不等号严格成立.估计β(L1)在均方误差矩阵意义下一致优于β(s2),并且,β(L1)是一个可以使用的估计.

其中 G(L1)是对角矩阵,其第i个对角元为g(li1).当ci< 2m/n时,

其中:δ0(i)=n+2,δ1(i)=2cili1n,δ2(i)=ci[1-2li1+当ci≥2m/n时,

其中:δ0*(i)=m(n+2)/n,δ1*(i)=2mcili1,δ2*(i)=ci[1-2li1+(1+ci)li12](m+2).

证明 由式(13)可得β(L1)的协方差矩阵为

其中G(L1)是对角矩阵,其第i个对角元为

Gauss超几何函数的定义为

其中:(a)s=(a+i),(b)s,(c)s类似.当 c > b > 0时,式(16)可用积分表示为

其中 B(·,·)表示 Beta函数.

因为 z~ Fm,n,所以

将以上结果代入式(15)即得结论.

[1]BALTAGIBH.Econometric Analysisof Panel Data[M].Weinheim:John Wiley,2008.

[2]王松桂.线性模型的理论及应用[M].合肥:安徽教育出版社,1987.

[3]王松桂,范永辉.Panel模型中两步估计的优良性[J].应用概率统计,1998,14(2):177—184.

[4]SHIRYAYEVAN.Probability[M].New York:Springer-Verlag,1984.

[5]严士健.概率论基础[M].北京:科学出版社,1982.

猜你喜欢

对角数据模型协方差
与对角格空时码相关的一类Z[ζm]上不可约多项式的判别式
高效秩-μ更新自动协方差矩阵自适应演化策略
面板数据模型截面相关检验方法综述
会变形的忍者飞镖
用于检验散斑协方差矩阵估计性能的白化度评价方法
二维随机变量边缘分布函数的教学探索
不确定系统改进的鲁棒协方差交叉融合稳态Kalman预报器
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
基于数据模型的编程应用
折大象