关于经济回归分析方法的使用评价
2011-01-06张贺祺
张贺祺
(内蒙古财经学院 经济学院,内蒙古 呼和浩特 010051)
关于经济回归分析方法的使用评价
张贺祺
(内蒙古财经学院 经济学院,内蒙古 呼和浩特 010051)
回归分析方法在经济分析方法中占据着举足轻重的地位,也为现代西方经济学的科学化作出了突出贡献,当然,其中也有很多不足和问题有待解决。本文主要介绍了现代回归分析方法的适用范围和限制条件及随机扰动项的含义。重点分析了经济回归分析模型的误用中的“伪回归”与未考虑异方差和自相关问题,并举出了实例,总结了应用回归模型应注意的事项及带给我们的启示。
回归分析方法;误用;伪回归;异方差;自相关
引言
在现代意义上,回归分析是用来研究一个变量(称之为被解释变量或应变量)与另一个或多个变量(称为解释变量或自变量)之间的依赖关系。其目的是通过解释变量的给定值来预测被解释变量的平均值或某个特定值。这种一个变量依赖于另一个或几个变量并相随变动的例子在社会生活中有很多。例如收入与支出的关系、失业率与通货膨胀率的关系(菲利普斯曲线)、广告效应与广告费用、广告媒介的关系等。回归分析就是研究这种变量之间相随变动的关系。
回归分析的功能:确定被解释变量与解释变量之间的回归模型,并根据样本观测值对回归模型中的参数进行估计,给出回归方程;对回归方程中的参数和方程本身进行显著性检验;评价解释变量对被解释变量的贡献并对其重要性进行识别;利用所求得的回归方程,并根据解释变量的给定值对被解释变量进行预测,对解释变量进行控制。
一、现代回归分析方法的适用范围及限制条件
(一)回归分析方法的适用范围
现代回归分析方法的应用已经被广大经济学家及机构认可,其主要研究三个方面,即分析市场供求、分析经济现象及制定相关政策、分析投入产出。
市场供求分析,是回归分析方法适用的最主要的一个方面,其主要是为了通过回归分析使政府及时有效地进行宏观调控,使市场经济更加有序进行。例如,价格增长1%时,需求将下降0.5%。用0.5%比1%即为需求的价格弹性。又如,牛肉价格上涨后,消费者转而购买猪肉;由于牛肉价格上涨1%,猪肉需求将增加2%,用2%比1%得到猪肉的替代弹性为2。由此政府会制定一系列抑制牛肉价格政策,以保证市场的稳定运行。
经济现象分析是建立经济活动模型以便分析和预测整个经济变动,是回归经济分析的重要组成部分。以分析影响我国钢材供应量相关因素为例:
通过分析我国改革开放以来(1978-1997)钢材供应量的历史资料,可以建立一个单一方程模型。根据理论及对现实情况的认识,影响我国钢材供应量Y(万吨)的主要因素有:原油产量X1(万吨),生铁产量X2(万吨),原煤产量X3(万吨),电力产量X4(亿千瓦小时),固定资产投资X5(亿元),国内生产总值X6(亿元),铁路运输量X7(万吨)。
obsX1X2X3X4X5X6X7Y 1978104053479.006.812566668.723624.11101192208 19791061536736.352820699.364038.21118932497 19801059538026.23006746.94517.81112792716 19811012234176.223093638.214862.41076732670 19821021235516.663277805.95294.71134952920 19831060737387.153514885.265934.51187843072 19841146140017.8937701052.4371711240743372 19851249048348.7241071523.518964.41307093693 19861306950648.9444951795.3210202.21356354058 19871341455039.2849732101.6911962.51406534386 19881370557049.854522554.8614928.349484689 198913764582010.5458482340.16909.14894859 199013831623810.862121506815153 199114099676510.87677581528935638 199214210758911.167526638.11576276697 199314524895611.5534634.41626637716 19941460897419355.3546759.41630938428 199515004.9510529.2710070.310702.9758478.11658558979 199615733.3910722.510813.112185.7967884.61688039338 199716074.1411511.4113.7311355.5313838.9674772.41697349978
钢材供应量数据如下:
设模型的函数形式为:
运用OLS估计法对上式中参数进行估计,通过对数据的拟合优度、多重共线性、异相关、自相关等分析,用EV IEWS3.0软件,得出的结果为:
VariableCoefficietStd.Errort-StatisticProb.X20.2753790.0893373.0824850.0068 X40.5595510.0992585.6373330.0000 X50.0406090.0155242.6158180.0181 R-squared0.997244Mean dependent var5153.350 Adjusted R-squared0.996920S.D.dependent var2511.950 S.E.of regression139.4060Akaike info criterion12.85014 Sum squared resid330378.5Schwarz criterion12.99950 Log likelihood-125.5014F-statistic3075.985 Durbin-Watson stat0.790639Prob(F-statistic)0.000000
最优模型为:Y=0.28X2+0.56X4+0.04X5(保留2位有效数字)
从最优模型结果可以得出,生铁产量、电力产量和固定资产投资对被解释变量的影响很大。同时,可以根据这些数据和分析制定相应的政策,使回归分析方法更具有现实意义。
投入产出分析是美国经济学家里昂惕夫在30年代首创的。所谓投入产出分析,就是在编制反映各部门之间产品量交流情况的“投入产出表”的基础上,确立一套线性方程,用以研究各部门产品分配和产品消耗之间的关系,即对各生产部门和消费部门的相互依存关系进行数量分析。下面以一个公司的固定资产投资和销售额的关系为例:
某企业1990-2010年固定资产投资Y与销售额X的资料(单位:万元)
经过模型的估计所得结果如下:
VariableCoefficientStd.Errort-StatisticProb.C-18.216244.249673-4.2865050.0004 X0.8325360.02716430.648880.0000 R-squared0.980174Mean dependent var102.2729 Adjusted R-squared0.979131S.D.dependent var51.19713 S.E.of regression7.396014Akaike info criterion6.930152 Sum squared resid1039.319Schwarz criterion7.029631 Log likelihood-70.76660F-statistic939.3536 Durbin-Watson stat1.021410Prob(F-statistic)0.000000
得出的最终拟合效果较好的一元线性回归方程为:Y=-18.22+0.83X。
模型估计结果表明,该公司销售额每增加一个单位,其固定资产投资额增加0.83个单位。现在该公司可以利用此模型进行投资预算和销售额估计,近而根据期望利润确定一年的投资计划。
(二)回归分析使用的限制条件与随机扰动项的含义
1.对模型和变量的假定。如:Yi=β1+β2Xi+μi,假定解释变量是非随机的,或者虽然是随机的,但与扰动项u是不相关;假定解释变量X在重复抽样中为固定值;假定变量和模型无设定误差;假定随机扰动项u为零均值:在给定的条件下,u的条件期望为零;同方差:在给定的条件下,u的条件方差为某个常数;无自相关:假定随机扰动项u的逐次值互不相关;假定随机扰动u与解释变量X不相关;假定随机扰动u服从均值为零、方差为δ2的正态分布。
2.随机扰动项u的含义。随机扰动项为观察值Yi围绕它的期望值E(Y|Xi)的偏差或离差,是一个不可观测的随机变量,又称为随机干扰项或随机误差项。这一偏差由于条件期望的未知性以及观测值的随机性,误差项可正可负。但在给定解释变量的情况下,假定其数学期望为零。虽然一次观测误差项有正有负,但多次重复观测所得到的平均误差为零,即大量的随机干扰因素对被解释变量的总影响由于相互抵消而为零,这也表明,回归直线通过条件均值。随机扰动项包括被省略而未进入回归方程但又影响被解释变量的因素、变量观测值的观测误差的影响、变量替代造成的影响、模型关系的设定误差的影响、随机因素的影响。
在回归分析中,随机误差项起着关键的作用,这不仅由于随机误差项含有丰富的内容,而且用总体回归模型可知,被解释变量的特性完全由它确定。
二、经济回归分析模型的误用
近几年中,定量分析在经济学、金融学、管理学、营销学以及一些相关学科的研究中,用得越来越多。回归分析方法之所以备受经济学家的青睐,主要是因为回归经济模型因果关系清楚,有定性、定量分析,还可以借助计算机进行大批量的运算,使得计算结果既快捷又准确。但在模型运用的过程中也有很多局限性,如不慎误用,也会导致严重的后果。我们在对回归经济模型进行评价时,容易曲解模型的真实面目,因此,有必要全面、客观地去认识回归经济模型,以避免误用回归模型。这对于促进回归经济学和经济理论研究的健康发展有着十分重要的意义。
(一)“伪回归 ”问题
当我们用一个或者多个非平稳随机变量来回归另一个非平稳随机变量时,就产生了伪回归。非平稳时间序列的严重影响是,虽然它们会破坏经典回归分析的基础和有效性,但根据分析的结果,不一定能够发现问题。有时候即使时间序列非平稳,分析结果应该是无效的,但t、F等指标却很正常,模型的拟合度和显著性看起来都很好。例如在选取截面数据进行平稳性测试时,有一篇关于区域发展差距、成因与走向的文章。该文作者利用单位根检验法对人均GDP指标进行检验,得出:
方法 统回归P LLC调整的t-4.9873450.000000
采用此种方法对人均GDP指标进行单位根检验。得到调整后t值对应的概率P小于0.05,从而选择拒绝原假设,即人均GDP指标的时间序列是平稳的,不存在单位根。以上回归结论明显错误,因为人均GDP无论如何也不可能是平稳的时间序列。
又如另一篇关于我国国内旅游经济分析中,以10年间的旅客流量y1(百万人次)、人均旅游消费水平y2(元/人)、全国商品x1、零售价格指数(%)x2、国内生产总值x3(亿元)、基本建设投资(t-2)(亿元)、城乡居民人民币储蓄存款年终余额x4(亿元),来建立多元线性模型。最后得出R2=0.989680,F=205.0448,DW=1.119668。可以看出,x2、x3、x4的t检验均未能通过。因而采用逐步回归消除多重共线,采用逐步加入变量法。此文考虑到了多重共线和可能产生的异方差,但该文作者没有考虑到“伪回归”现象,因为是用的时间序列分析,而文章中的各个因素都不是平稳的时间序列。因此,该文作者的结论有欠妥和不足之处。
(二)未考虑异方差和自相关
有的模型只给出拟合优度检验和参数的显著性检验,并没有考察模型可能存在的异方差和自相关问题。当利用时间序列数据或截面数据估计参数时,很有可能存在异方差、自相关,但文章作者没有考虑,也就是说其他结论缺乏说服力。这类情况是目前最常见的回归经济学模型误用,或者说是运用不完全恰当。
引起异方差的原因很多,有两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。遗漏的变量就进入了模型的残差项中,当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。二是截面数据中总体各单位的差异。引起自相关的原因主要有:1.经济数据的固有的惯性带来的相关,比如经济系统自身的惯性和滞后效应。在时间序列数据当中,经济变量在时间上的惯性往往是造成自相关的主要原因。2.模型的设定误差,主要是遗漏变量的影响,将遗漏的变量归入了残差项,由于遗漏的变量在不同时间点上是相关的,造成了残差项的自相关。3.对数据的处理造成了数据的内在联系,在实证分析中,通常原始数据是要加工的。如:在季度数据的时间序列中,数据通常通过月度数据推导而来,即将3个月的数据简单加总再除以3。这样平均的结果,消除了月度数据的波动性,而这种处理很可能引入自相关。
例如在一篇有关城镇居民人均消费支出影响因素回归分析中,该文作者利用SPSS软件,对某市10年间的城镇居民人均可支配收入、人均消费性支出数据原始数据进行统计分析,得出的结论是:在0.01的显著性水平下,城镇居民可支配收入与消费支出相关性达到了0.993,非常显著。常数项t的显著性概率为0.081>0.05,表明没有显著性差异,故常数项不应出现在方程中;而人均可支配收入的t的显著性概率为0.000<0.05,表明有显著性差异,人均可支配收入应当作为解释变量出现在方程中。因此应当采用标准回归方程及其系数。同时,调整后的可决系数R2表明年度指标模型在整体上拟合非常好;并且从经济意义上看,β=0.781,符合经济理论中绝对收入假说边际消费倾向在0与1之间,表明在这10年中,该市居民年人均可支配收入每增加1元,居民年人均消费支出平均增加0.78元,显著性影响显而易见。该文作者的这篇文章中,仅仅给出拟合优度检验和参数的显著性检验,并没有考察模型可能存在的异方差和自相关问题,而这是利用时间序列数据估计参数,因此很有可能存在自相关,但该文作者没有考虑。
又如另一篇关于灰色系统理论的GDP分析中,该文作者以国内生产总值GDP增长率为例,得出的结论为:回归模型估计式为Y=9.63889X-19075.26。解释变量X表示年份,被解释变量Y表示GDP增长率,R2=0.99634105,由上式的拟合优度检验可以看出,拟合程度很高。该文作者的这篇文章中,仅仅给出拟合优度检验,虽然可决系数很多,表明拟合优度很高,但该文作者也没有考察模型可能存在的异方差和自相关问题,而这是利用时间序列数据估计参数,因此很有可能存在自相关,但该文作者没有考虑。
再如一篇关于人民币均衡汇率的回归分析中,该文作者运用eviews软件以人民币均衡汇率与名义有效汇率比较,得出的结论为:可决系数R2=0.99,修正后可决系数R2=0.98,DW=2.35,统计量F=198.95,F统计量的概率P=0.00。各项指标都非常好,可决系数很高,F值也很好。此文章中,该文作者用对各个变量时间序列进行单位根检验,得出:各变量在差分前是不平稳序列,经一阶差分后是平稳序列,于是可以进行协整检验。回归的结果可以看出方程中的各变量都较为显著,对静态回归的残差作单位根检验表明它是平稳序列。因此,上述变量的序列之间的确存在协整关系,并写出了协整方程。此文中,该文作者考虑到了应用时间序列时,先进行平稳性测试,防止“伪回归”现象发生,但该文作者也没有考虑到可能存在的异方差和自相关问题。
异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,最小二乘法(OLS)得到的参数估计是无偏的,OLS估计量仍然是线性的,但是已经不具备最小方差性。无论样本大小,OLS估计量都不再是最优线性无偏估计量。即建立在t分布和F分布之上的置信区间和假设检验是不可靠的,它会破坏OLS估计及假设检验过程。自相关的存在,OLS估计量仍然是线性的无偏的,但却无效。OLS估计量的方差是有偏的,会导致t值变大,因此,t检验和F检验一般来说也是无效的。通常计算的R2不能测度真实,因为它很可能低估了真实的标准差。
三、结论与启示
(一)应用回归模型应注意的事项
在我国,学习、引进和应用经济计量模型研究方法的时间还不长,但取得的成绩是显著的。在我们边探索边应用的过程中,出现一些不足也在所难免,我们应当正视,不断完善。当我们应用时间序列分析进行分析问题时,我们要考虑数据间的平稳性问题,基于此选用正确的模型进行参数估计。还要考虑拟合优度检验和参数的显著性检验,考察模型可能存在的异方差和自相关问题。通过大量研究发现,异方差通常出现在截面数据当中,自相关通常出现在时间序列当中。当我们进行参数估计时,先要考虑以上的注意事项,以求结果更具有说服力。
(二)应提倡定性与定量的结合、数学表述与文字描述相结合的经济研究方法
计量经济学应用研究的普及和数量的增长,已不是我们追求的目标。而水平和质量的提高,是我们目前及今后应该追求的。现代西方经济学给我们的启示,不在其理论和概念,而是其研究的方法和过程。实证分析的方法是现代西方经济理论普遍采用的方法,实证的过程是其基本的研究过程。我们应该提倡定性与定量的结合、文字描述与数学表述相结合的经济研究方法。
近几年来,回归分析在经济学、管理学、营销学、金融学以及一些相关学科的研究中,应用的越来越多。其中,数学语言作为一种适宜于回归分析的比较严格的符号系统,在经济分析的演绎和归纳过程中应用的越来越广泛。数学给分析者提供新的思维工具和视角,展示普通语言逻辑系统所无法展示的现实奥妙,有较强的客观性,可在一定程度上减少分析中的主观随意因素的影响,正是数学的这些特征,经济学更充满活力。但同时作为回归分析方法的运用,必须以质的分析为前提,相对于质的分析,量的分析处于次要地位;在现实的经济活动中,很多因素很难用数学方法加以把握。所以,经济学不等同于数学,不能“数学化”,更不能搞“数字游戏”。必须以实际出发,实事求是,更好地运用回归分析方法研究经济问题。
虽然,回归分析是用来处理一个因变量与另一个或多个自变量之间的关系,但它并不一定表明存在因果关系。也就是说,它并不意味着自变量是原因,而因变量是结果。两个变量是否存在因果关系,必须以经济理论为判断基础。如:需求法则,它表示当所有其他变量保持不变时,一种商品的需求量与该商品的价格成反比关系。这里,微观上的经济理论表明价格是原因,而需求量是结果。总之,回归并不意味着因果关系的存在,因果关系的判定或推断,须经过实践和相关理论的检验。
(三)应逐步将计量经济学理论及方法应用于更广泛的经济社会领域
在西方,计量经济学理论方法已经被应用于更广泛的经济社会领域,例如:1992年诺贝尔经济学奖得主贝克尔,将计量经济学模型方法应用于社会经济学领域研究中,1993年诺贝尔经济学奖得主福格尔和诺斯,将计量分析用于经济史研究。在高水平的经济学杂志上,与计量经济学相关的论文也越来越多。在现代计量经济学理论方法中,应该重视时间序列分析模型和截面数据模型。从比较分析中发现,宏观和微观两个层次上的时间序列分析模型和截面数据分析模型,是所有现代计量经济学模型中应用最多的。用单位根检验和协整分析方法研究宏观经济变量之间的关系。例如金融市场时间序列分析,区域经济发展的差异与协调分析等,都是经济研究中的热点,宏观经济变量、区域经济变量的时间序列数据和金融市场的时间序列数据也较容易获得。所以,逐步将计量经济学理论方法应用于更广泛的经济社会领域,使社会问题研究更具科学性,将是我们现在及将来的研究重点。
[1] 宁伟,王传会.基于灰色系统理论的GDP回归分析[J].岱宗学刊,2009,(12).
[2] 张建斌.论定量分析在经济学研究中的应用[J].学术争鸣,2008,(7).
[3] 曲三省.现代经济回归分析方法应用研究[J].经济经纬,2008,(1).
[4] 梁立光.人民币均衡汇率的回归模型及其实证分析[J].职教与经济研究,2006,(3).
[5] 李世军,袁光才.城镇居民人均消费支出影响因素回归分析——基于成都市的实证分析[J].技术经济与管理研究,2006,(2).
[6] 杨群.我国国内旅游经济实证分析[J].安阳师范学院学报,2007,(2).
F222.1
A
1004-5295(2011)02-0015-05
2011-03-10
张贺祺(1985-),男,内蒙古巴彦淖尔人,内蒙古财经学院经济学院在读硕士研究生,从事社会主义市场经济理论与实践研究.
[责任编辑:张晓娟]