分位数回归分析及其在经济中的应用
2015-04-20苏建超
苏建超
摘 要:在实际问题研究中,人们感兴趣的是研究预测变量的改变对响应变量的影响,线性回归模型是解决这类问题的方法之一,常用最小二乘法或最小一乘法来估计未知参数。本文重点讨论了线性分位数回归分析的数学原理,以及通过数学建模挖掘其在经济领域实际问题分析中的应用。
关键词:分位数;回归分析;经济;应用
分位数回归方法从1978年提出后,无论从理论还是应用方面都得到了很大的发展。它不仅能够拓展模型使用的范围,而且还能够度量出回归变量对分布的影响,以及分布的尾部特征,较之经典的最小二乘法更具有优势。随着分位数回归理论和算法的不断发展,分位数应用的领域更加广泛。
一、分位数回归分析解决实际问题的研究背景
传统的线性回归模型具有悠久的历史,其中经典的最小二乘回归应用最为广泛。它描述了因变量的条件均值分布受自变量X的影响过程。最小二乘法是估计回归系数的最基本的方法。如果模型的随机误差项来自均值为零,且方差相同的分布,那么回归系数的最小二乘估计为最佳线性无偏估计如果随机误差项是正态的,那么回归系数的最小二乘估计,与极大似然估计一致,均为最小方差无偏估计。此时它具有无偏性、有效性等优良性质。
但是,在实际的经济生活中,这种假设常常得不到满足。例如当数据中存在严重的异方差,或者存在厚尾、尖峰等情况时,最小二乘法的估计将不再具有上述的优良性质,而且稳健性极其糟糕。特别的,对于大量数据而言,应用最小二乘回归只能得到一条回归线,而一条回归线所能反映的信息量是有限的。因此,人们在使用经典的线性回归的同时,也一直在不断的探索更新更好的回归方法。
为了弥补最小二乘法在回归分析中的缺陷,有科学家提出了分位数回归,分位数回归相对于最小二乘回归,应用条件更加宽松,挖掘的信息量更加丰富。它依据因变量的条件分位数对自变量X进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通的最小二乘回归,能够更精确的描述自变量X对于因变量Y的变化范围,以及条件分布形状的影响。分位数回归能够捕捉到分布的尾部特征,当自变量对因变量分布的不同位置产生不同的影响时,它就能更加全面的刻画分布的特征,从而得到全面的分析,而且分位数回归系数估计比最小二乘回归系数估计更加稳健。
二、分位数回归理论和分析方法的优势
普通线性回归模型实际上是研究被解释变量的条件期望,人们当然也关心解释变量与被解释变量分布的中位数,分位数呈何种关系。这就是分位数回归,它最早由Koenker和Bassett提出,是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法。
正如普通最小二乘OLS回归估计量的计算是基于最小化残差平方和一样,分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化,其中,中位数回归运用的是最小绝对值离差估计。它和OLS主要区别在于回归系数的估计方法和其渐近分布的估计。在残差检验、回归系数检验、模型设定、预测等方面则基本相同。所以,分位数回归的优点是能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值),也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同。
另外,中位数回归的估计方法与最小二乘法相比,估计结果对离群值则表现的更加稳健,而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健。
三、分位数回归分析在经济问题中的应用分析
线性分位数回归是近年发展起来的一种统计方法。线性回归模型要求满足同方差性,随机误差项两两不相关等条件,在进行回归系数的显著性推断时,通常还要假设残差服从正态分布。尤其是当分布是重尾或存在强影响点,以及异常点时,推断结果的稳健性往往很差。分位数回归避免了这种缺陷,其结果具有强烈的稳健性。
下面就结合分位数回归分析在房地产行业中的应用为代表,来剖析其中的科学原理和社会价值。房地产行业作为第三产业,与国民的生活密切相关,是国民经济的支柱产业之一,同时也是一个自身就很庞大和复杂的系统,对国民经济的整体态势和国民的生活水平影响都很大。近年来,我国房地产业十分迅速的发展,一方面为国民经济发展做出了突出贡献,另一方面在改善居民居住条件方面发挥了极其重要的作用。与此同时各方对房地产业有诸多争议,各方都从自己的角度出发,从政策、心理和资金等因素来予以考虑,定性的分析多于定量的分析。显而易见,从定量的角度来把握各个指标间的数量关系,系统的梳理当前房地产业的发展态势,深刻的认识房地产业的经济规律,从而准确的对房地产业进行预见和调控,最终实现可持续发展。由于我国房地产发展的地区差异性大,不能用一个平均水平的模型概况性的估计,因此需要通过建立一个正确并且全面的模型来把握房地产业内在发展规律,弄清房价的增长与其他环境、人口、经济、社会等因素之间的具体关系。分位数回归估计模型就能解决这一问题一种方法。
同时要强调的是,位数回归方法不仅能够度量回归变量对分布中心的影响,而且能度量回归变量对分布上尾和下尾的影响,它是在不同的分位数下进行预测,得到的信息更为全面和精确。我国房地产业发展空间差异巨大,经典的条件均值回归只能反映平均趋势,对于房地产业发展水平区域性的特点,这种回归结果与实际情况有时差别会很大。通过分位数回归的方法研究,可以建立一种较为全面衡量房价影响因素的指标体系,确立对不同水平下房价起伏状况与相关影响因素之间的作用性质和强弱。
四、结语
从分位数回归理论的发展来看,它并没有一经问世便迅速普及开来,因为分位数回归本身计算过程较为复杂,随着计算机的快速发展,以及与线性规划理论的相结合,各种分位数回归软件包才应运而生,进而分位数回归理论逐渐进入了大众的视线内。
参考文献:
[1]解其昌. 分位数回归方法及其在金融市场风险价值预测中的应用[D].西南财经大学,2012.
[2]李红梅. 居民收入的分位数回归与反事实因素分解[D].首都经济贸易大学,2012.
[3]张利. 线性分位数回归模型及其应用[D].天津大学,2009.