部分线性变系数EV模型估计的渐近正态性
2011-04-07冯三营牛惠芳
冯三营,牛惠芳
(洛阳师范学院数学科学学院,河南洛阳471022)
0 前言
考虑部分线性变系数模型:
其中,Y为一维响应变量;X为p维协变量;Z为q维协变量;T为一维协变量;β为p维未知参数向量; α(T)=(α1(T),…αq(T))τ是q维未知函数向量;ε是不可观测的随机误差。
作为变系数模型和部分线性模型的推广,模型(1)最近得到了广泛的关注,已有大量学者进行了深入的研究,例如,文献[1]基于局部多项式方法最早研究了该模型;文献[2]利用小波方法估计了模型中的参数部分和非参数部分;文献[3]基于局部线性方法提出了一种新的有效估计;文献[4]提出了Profile最小二乘估计并且基于广义似然比检验方法研究了该模型的检验问题。但在实际操作中,协变量X,Z往往带有测量误差。对协变量X带有测量误差的部分线性变系数模型,文献[5]在测量误差向量协方差阵已知的情形下,获得了模型中参数和非参数部分的估计,并证明了估计量的相合性和渐近正态性。文献[6]运用经验似然方法构造了模型中参数的最大经验似然估计及其经验似然置信域,并证明了估计量的渐近正态性。对于协变量Z带有测量误差的部分线性变系数模型尚未见到相关文献。
本文考虑协变量Z带有测量误差的部分线性变系数模型,运用局部纠偏方法和Profile最小二乘估计方法得到了模型中未知参数和未知系数函数的估计,并在适当条件下研究了它们的渐近性质,并对本文所提估计方法在有限样本下的实际表现进行了数值模拟研究。
1 方法与主要结果
假设记录数据{Xi,Wi,Ti,Yi是来自以下模型的一组独立同分布的可观测随机样本,
其中,{εi}为相互独立的模型误差,且E(εi)=0,Var(εi)=σ2<∞。测量误差{ui}独立同分布,其均值为0,协方差为Σu,且ui与(Xi,Zi,Ti,εi)相互独立。
其中,K(·)为核函数;且Kh(·)=K(·/h)/h,h为收敛于零的常数,称之为窗宽。
记Y=(Y1,…,Yn)τ;ε=(ε1,…,εn)τ;ωT=diag(Kh(T1T),…,Kh(TnT));X=(X1,…,Xn)τ;
由于Zi不可观测,如果在式(5)中直接用Wi替代Zi,则得到的估计不再是相合估计。为了消除测量误差造成的估计偏差,借鉴文献[7]的思想,对式(5)进行如下的局部纠偏:
于是系数函数{αj(·),j=1,…,q}的估计为
A3.{αj(·),j=1,…,q}关于T∈有二阶连续导数。
A4.核函数K(·)为概率密度函数且具有紧支撑。当n→∞时,nh2/log2n→∞,nh8→0。
A5.矩阵Γ(T)=E(Z1ZT )非退化。E(X1XT )和Φ(T)=E(Z1XT)均为Lipschitz连续。
Σ1=E(X1X)E(Φτ(T1)Γ1(T1)Φ(T1));A⊗2表示AAτ;→L表示依分布收敛。
定理2 设条件A1~A5成立,如果α(T)是系数函数真值,则
2 模拟研究
表1 参数β估计的均值、标准差与均方误差
通过数值模拟试验研究文中所得结论在有限样本下的实际表现。考虑模型:Y=Xτβ+Zτα(T)+ε,W=Z+u,这里β=(1,2)τ;系数函数α(t)=2t(1t);(Xτ,Z)τ服从多元正态分布,其均值向量为(1,1,1)τ;协方差阵(σij)满足σij=0.5|ij|。T服从区间[0,1]上均匀分布,εN(0,1),u服从均值为0方差为σ的正态分布。在下面的模拟中,分别取样本容量 n=100,200,400,σ= 0.42,0.82。取核函数为Epanechnikov核K(t)=0.75(1t2),窗宽采用Cross-Validation方法进行选择,重复模拟2 000次,计算β重复估计对应的均值(Mean)、标准差(SD)与均方误差(MSE)。模拟结果见表1和图1。对于系数函数α(t),在此仅给出n=200,σ=0.42时的模拟结果,其他情形下的模拟效果图和图1类似。
图1 n=200,σ=0.42时,α(t)的估计曲线(虚线)和真实曲线(实线)
3 定理的证明
引理1 若条件A1~A5成立,则当n→∞时,
其中,j,j1,j2=1,…,q;k=0,1,2,4;Γj1j2(T)是矩阵Γ(T)的第(j1,j2)元素。
证明 见文献[8]引理2的证明,此处省略。
引理2 若条件A1~A5成立,则
证明 见文献[6]引理A.2的证明,此处省略。
引理3 令G1,…,Gn为i.i.d.随机变量,若对任意s>1,Es有界,则=o(n1/s)a.s.。
证明 见文献[9]引理1的证明,此处省略。
引理4 若条件A1~A5成立,则
证明 类似于文献[4]中引理7.2的证明可证明本引理,此处省略。
定理1的证明 由式(8)可知:
由引理1,引理2和引理3简单计算可得
其中,ΨT=diag{((T1T)/h)2,…,((TnT)/h)2}。由引理1和引理2简单计算可得:
又由引理1,引理2及定理1得(Iq0q){(D)τωTDΩ}1(D)τωTX(ββ)=Op(n1/2),故
类似于文献[7]中A4~A6式的证明,可得:
[1] ZhangW,Lee SY,Song X.Local Polynomial Fitting in Semi-varying CoefficientModels[J].JMultivariate Anal,2002,82: 166-188.
[2] Zhou X,You JH.Wavelet Estimation in Varying-coefficient Partially Linear Model[J].Stat Probab Lett,2004,68:91-104.
[3] Xia Y C,ZhangW Y.Efficient Estimation for Semivarying-coefficientModel[J].Biometrika,2004,91:661-681.
[4] Fan JQ,Huang T.Profile Likelihood Inferences on Semi-parametric Varying-coefficient Partially Linear Models[J].Bernoulli,2005,11(6):1031-1057.
[5] You JH,Chen G M.Estimation of a Semi-parametric Varying-coefficient Partially Linear Errorsin-variables Model[J].J Multivariate Anal,2006,97:324-341.
[6] Wang X L,Li G R,Lin L.Empirical Likelihood Inference for Semi-parametric Varying-coefficient Partially Linear EV Models[J].Metrika,2011,73(2):171-185.
[7] You JH,Zhou Y,Chen G M.Corrected Local Polynomail Estimation in Varying Coefficient Models with Measurement Errors[J].The Canadian Journal of Statistics,2006,34:391-410.
[8] Xia Y C,LiW K.On the Estimation and Testing of Functional-coefficient Linear Models[J].Statistics Sinica,1999,9:737-757.
[9] Shi J,Lau T S.Empirical Likelihood for Partially Linear Models[J].JMultivariate Anal,2000,72(1):132-148.
[10] Li L,Greene T.Varying Coefficients Model with Measurement Error[J].Biometrika,2007,84:1-8.
[11] Xue LG,Zhu L X.Empirical Likelihood for a Varying Coefficient Model with Longitudinal Data[J].JAm Statist Ass,2007,102:642-654.