APP下载

分位回归理论及应用研究

2016-05-30何晓申

经济研究导刊 2016年16期
关键词:最小二乘法

何晓申

摘 要:分位数回归(QR)是给定变量,估计响应变量条件分位数的一种基本方法。它不仅可以度量回归变量在分布中心的影响,还可以度量在分布上尾和下尾的影响,当存在左偏或右偏时,分位回归的系数估计会更稳定,更能体现出分析的全面特征。因此,较之经典的最小二乘回归(OLS)具有独特的优势。据此,对分位数回归的理论、分位数回归渐进性质、似然比检验、分位数回归置信区间及应用进行深入研究。

关键词:分位回归;最小二乘法;渐进性质;似然比检验

中图分类号:F224 文献标志码:A 文章编号:1673-291X(2016)16-0006-02

引言

传统的线性回归模型中最小二乘回归应用最为广泛。它描述的是因变量条件均值分布受自变量X的影响过程。如当模型的数据存在严重的异方差或厚尾时,最小二乘估计将不再具有优良性质。Laplace[1]第一次提出了中位數回归估计。在此基础上,Koenker[2]将中位数回归推广到分位数回归。分位数回归可以捕捉到分布的尾部特征,分位回归能更加全面地刻画分布的特征从而得到全面的分析[3],而且分位回归系数比最小二乘回归系数估计更稳健。

一、分位回归理论

定义:分位数回归的线性模型为y=X'β+ε,其中y为随机变量,x为解释变量向量,ε为误差项。定义样本的τ分位数函数为Qy(τ|x)=X'β(τ),可以进一步写作:

其中τ∈(0,1),β为系数向量,不同的τ会估计出不同的系数。当τ=0.5时,上式意味着最小化绝对离差[4],也就是中位数回归。分位回归本质就是通过不同的分位数τ来调节回归平面,对数据进行完整的描述但是侧重于极端数据。

二、分位数回归的渐近性

假设一列独立同分布的随机变量Y1,Y2,…,Yn,其分布函数F在分位点的邻域内具有恒大于零的连续密度函数f,gn(ξ)为梯度函数,τ分位数的目标函数ξτ。

三、分位回归似然比检验

如果约束条件成立,则约束模型与非约束模型的极大似然函数值应该近似相等。在条件分位数回归模型y=X'β+ε中,ε独立同分布,其密度函数为f,Basset[5]对中位数回归进行了似然比检验。原假设为H0∶Rβ=r

原假设成立时Tn渐近服从χ2(q)分布,推广到τ分位数回归的检验统计量为:

四、置信区间

在随机误差项独立同分布且分布已知的情况下,由似然比检验统计量的分布可以很容易求出回归分位数的置信区间。但当随机误差分布未知时,我们就不能通过直接估计法来求得置信区间。对于这种情况,Efon[6]提出了自助法,自助法是根据经验分布函数是总体分布函数的充分估计量来进行置信区间估计的。

五、实证研究

我们利用R软件自带Engel数据集来研究家庭收入与食物支出的关系。Engel数据集可在quantrey包中找到,其中数据集包含235个观测值,共有两个变量:income——家庭收入连续变量自变量;foodexp——家庭食物支出连续变量因变量。

(一)异方差情形下的QR与OLS

我们得到最小二乘法估计的线性模型:Y=150.37+0.48X,

t统计量值为33.74,R2=0.83,F=1 138.11,White检验,TR2=

176.11>χ2 0.05=6,存在异方差。

由表1可知,随τ取值逐渐变大,自变量X的回归系数β也逐渐增大,变化范围在0.34~0.71之间,全距0.37。在0.05分位数上,每增加1个单位的X,Y增加0.34单位,而在0.95分位数上,每增加1个单位的X,Y增加0.71单位。因变量Y由低水平到高水平,自变量X所起的作用越来越大。

(二)同方差情形下的QR与OLS

克服异方差的方式有很多,本文利用取对数法,得到两个新变量。普通最小二乘法估计的线性模型为:LnY=0.57+

0.85LnX,t统计量值为41.99,R2=0.88,F=1 763.58,τ值取不同值时,回归方程和曲线(如表2所示)。随着τ取值逐渐变大,自变量X的回归系数β并没有发生显著的变化,无论因变量LnY处于哪一水平,增加一个单位自变量LnX,都会使LnY增加0.85单位左右的大小。

结论

通过以上实例可以看出,分位数回归可视为普通最小二乘法的有益补充。当普通最小二乘法的前提假设不能满足时,分位数回归则提供了一种新的统计方法和视野。通过对因变量分布的不同部分进行研究,挖掘出更多有用的信息,从而更真实、准确地反映自变量与因变量之间的相互关系。

猜你喜欢

最小二乘法
基于压电陶瓷的纳米定位与扫描平台模型辨识算法研究
基于惯导角度量测的轨道平面最佳线形参数估计算法
马尔科夫链在市场预测中的应用
一种改进的基于RSSI最小二乘法和拟牛顿法的WSN节点定位算法
最小二乘法基本思想及其应用
全国各省份经济发展影响因素的实证分析
全国主要市辖区的房价收入比影响因素研究
手动求解线性回归方程的方法和技巧
一种基于最小二乘法的影子定位技术
基于最小二乘拟合的太阳影子定位模型