APP下载

面板数据分位数回归模型的工具变量估计

2019-10-16邹灵吴东晟杨宜平

应用数学 2019年4期
关键词:内生性数据模型位数

邹灵,吴东晟,杨宜平

(重庆工商大学数学与统计学院,经济社会应用统计重庆市重点实验室,重庆400067)

1.引言

面板数据模型越来越广泛应用于经济、环境、生物等领域,是近20年计量经济学模型的重要模型之一.关于模型的参数估计,大多数采用最小二乘法对兴趣参数进行估计.当数据出现尖峰、厚尾、异方差、异常点等情况时,最小二乘法不再适用.为了解决该问题,Koenker和Bassett[1]首次提出分位数回归的方法,分位数回归以其稳健的性质已经在医学和经济领域得到广泛的应用.目前已有一些学者对面板数据分位数回归进行相关研究.Koenker[2]通过正则化的方法将分位数回归用于面板数据当中;罗幼喜和田茂再[3]讨论了固定效应的面板数据模型的三种分位数回归方法并使用蒙特卡洛进行模拟;Canay[4]通过数据转化消除固定效应,提出一种简单的面板数据分位数回归方法;Billger和Lamarche[5]使用面板数据分位数回归的方法对英国和美国的移民收入分配进行研究;Galvao和Kato[6]研究了面板数据分位数回归的固定效应问题.

从上述可以看出,面板数据分位数回归的使用越来越广泛,以上研究都是基于协变量是外生变量的情况下讨论的面板数据分位数回归.但在实际应用中,很多变量都具有内生性.如:在研究外商直接投资对环境污染的影响时,外商直接投资作为解释变量具有内生性[7];在讨论城镇居民人均消费支出和人均可支配收入时,通过豪斯曼检验证实了城镇居民人均可支配收入是具有内生性的[8].然而当前关于含内生变量的面板数据的分位数回归的研究却很少.因此促使本文讨论面板数据分位数回归模型的工具变量估计.

本文讨论含有内生变量的面板数据模型,为了解决协变量的内生性问题,引入工具变量消除协变量的内生性,再通过组内中心化消除面板数据个体效应项,采用分位数回归的方法估计回归系数,并证明其渐近性质.最后对Naive最小二乘估计、Naive分位数回归、两阶段最小二乘估计和分位数回归的工具变量估计进行模拟研究,比较四种方法在不同分布下的估计效果.

2.面板数据分位数回归模型的工具变量估计

讨论如下面板数据模型

其中Yit是响应变量,Xit是p维内生协变量,Zit是q维外生协变量,(θ,β)是未知参数,αi是不可测量的个体固定效应,εit表示随机误差项.为了模型可识别,假定

由于解释变量Xit具有内生性,已有估计不再适用.为了消除内生变量对参数θ估计的影响,假定存在一个工具变量ωit,且满足

其中Γ是p × k的未知参数矩阵,ωit是k ×1的工具变量,且与随机误差项εit不相关,并满足E(eit|ωit)=0.

下面讨论(θ,β)的分位数回归估计.首先,由(2.2)可以得到Γ的估计,即

其中Xi=(Xi1,Xi2,...,XiT),ωi=(ωi1,ωi2,...,ωiT),则=那么模型(2.1)转化为:

由于αi未知,通过组内变化消除αi的影响,即

其中ρτ(s)=τs−sI(s<0).

3.渐近性质

下面讨论(θ,β)的估计的渐近性质,需如下正则条件:

(C1)Ω是正定矩阵,其中

定理3.1如果(C1)和(C2)成立,则有

其中ψ(τ)=E(η+f(0)eTθ)2,η=(I(0)−τ).

其中由Knight[9]中等式(2-13),我们有

首先,考虑BN,

其中ηit=(I(≤0)−τ).则有

4.模拟研究

本节通过模拟研究所提出方法的有限样本性质.考虑如下含有内生变量的面板数据模型:

该模型中θ=1.5,β=2,Γ=1,其中Xit是内生性变量,Zit是外生性变量,Zit∼N(0,1),ωit∼N(0,1),eit∼N(0,0.42),εit=eit+δit.分别讨论服从以下分布,具体如下:δit∼0.5N(0,1),δit∼0.2t(1),δit∼0.2C(0,1).我们计算了偏差(Bias)和标准差(SD),分别取样本量为50、100和150.模拟研究比较了四种方法:Naive 最小二乘估计(NLS)、Naive分位数回归估计(NQR)、两阶段最小二乘估计(2SLS)和分位数回归的工具变量估计(IVQR)的估计效果,其中分位数回归给出的是分位点为0.5的估计.重复试验次数1000次.模拟研究结果如表4.1所示.

根据表4.1可以看出,无论模型误差分布是何种情形,对θ的估计,NLS和NQR0.5是有偏的.由于Naive估计忽略了内生变量的影响,直接用内生变量估计,所得的估计是有偏.对模型误差是正态分布时,2SLS和IVQR0.5两者差别并不大,但是,当模型误差分布为非正态分布时,2SLS方法的Bias和SD都很大,效果不好,而本文提出的IVQR0.5仍表现出良好的效果.随着样本量的增加,本文提出的IVQR0.5偏差和标准差变小.因此,本文提出的估计方法消除了内生变量对估计造成的偏差,同时,估计不受模型误差分布的影响.

为了验证本文提出的分位数回归的工具变量估计的渐近正态性,图4.1和图4.2分别给出了样本量N=100,不同误差分布情形下参数θ和β的Q-Q图.

表4.1 四种估计方法下参数估计的偏差与标准差

图4.1 参数θ的Q-Q图

从图4.1,图4.2可以看出,图上的点近似地在一条直线上.因此,所提出的IVQR估计具有渐近正态性.

图4.2 参数β的Q-Q图

猜你喜欢

内生性数据模型位数
五次完全幂的少位数三进制展开
连续自然数及其乘积的位数分析
面板数据模型截面相关检验方法综述
比较优势内生结构变动与政策干预
基于内生性视角的大股东掏空与公司绩效关系研究
高管与职工薪酬差距对企业绩效的影响
高管与职工薪酬差距对企业绩效的影响
慈善捐赠、企业绩效与合理区间把控——基于内生性视角的经验分析
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
遥感卫星CCD相机量化位数的选择