江西省第三产业发展对GDP影响实证分析
2018-09-18
一、 引言
诸多因素会对一个国家经济的发展产生影响,第三产业就是其中之一。产业结构不断升级使得第三产业占GDP比重越来越大,注重发展第三产业是必然趋势。江西省人口众多且经济尚不发达,研究第三产业对经济的影响有利于江西省经济更好发展。本文内容安排如下:第二部分主要说明数据的来源和设定;第三部分检验数据的平稳性;第四部分利用最小二乘法对模型进行参数估计;第五部分检验估计的模型准确模拟现实情况的程度;第六部分给出结论和政策建议。
二、模型设定及数据说明
要研究江西省第三产业对经济发展的影响,设定江西省内生产总值GDP为被解释变量;第三产业中的交通运输、仓储和邮政业X1、批发、零售、住宿和餐饮业X2、金融业X3分别为模型的三个解释变。模型如下:
GDP=β0+β1X1+β2X2+β3X3+Ui(i=1,2,3)
其中β0表示即使Xi对GDP没有影响时固有的生产总值。βi表示Xi行业占江西省内GDP总量的加权比例;μi为随机误差项。
本文数据来自江西省年统计年鉴,选取1978—2015年样本数据值求出βi的参数值,江西省GDP随Xi变动的变化趋势,从而提出合理的建议。
三、数据平稳性检验
回归分析的一个重要假设数据是平稳的,因此在得到数据之后首先需要对数据进行平稳性检验。本文用ADF检验法检验数据的平稳性。
检验结果LNGDP的ADF检验的统计量-2.853005小于临界值-2.6265,LNGDP平稳;LNX1的ADF的检验统计量-4.226045小于临界值-3.6959,LNX1平稳;LNX2的ADF的检验统计量-4.026576小于临界值-3.6959,LNX2平稳;LNX3的ADF的检验统计量-3.453067小于临界值-2.9750,LNX3平稳。变量均通过ADF检验,因此数据符合平稳性假设。
四、模型参数估计
本文采用最小二乘法进行参数估计,根据图1模型如下:
图1 第三产业各要素对江西省经济发展影响权重估计结果
t=(62.02858) (-1.684518) (1.260626) (18.28940) (2.361863)
R2=0.997256 F=3028.793 D.W=0.876836
五、模型的检验
通过线性回归求出参数后,还需要验证模型是否能够较好的替代真实参数值才能使用。
1. 经济意义检验
进行经济意义检验,主要检验模型参数估计量对现实经济意义是否合理:
(1)β0=3.199013,表示即使第三产业对GDP增长无影响,江西省内GDP取对数值也会上升3.199013个百分点。经济中第一产业和第二产业也会使GDP增长,与现实经济相符。
(2)β1=-0.091601,表示当其他自变量不变时,江西省内第三产业中的交通运输、仓储和邮政业的对数值每上升1个百分点,GDP的对值值就下降0.091601个百分点,与现实经济增长趋势不符。
(3)β2=0.0908608,表示当其他自变量不变时,第三产业中的批发、零售、住宿和餐饮业的对数值每上升1个百分点,GDP的对数值也相应上升0.0908608个百分点,与现实经济相应的增长趋势相符。
⑷ β3=0.064284,表示当其他自变量不变的时,第三产业中的金融业的对数值每上升1个百分点,GDP的对数值相应上升0.064284个百分点;与现实经济增长趋势相符。
综上所述,X1未通过经济意义检验;X2、X3通过经济意义检验。
2.统计意义检验
(1)拟合优度检验
拟合优度检验主要检验样本回归线是否能很好地拟合样本数据,模型的拟合程度通常用可决系数R2来表示,R2介于0~1之间且越接近1拟合程度越好。
在图1中,R2=0.997256,但由于模型包含多个自变量,要消除自变量对拟合优度的影响就要对拟合优度进行调整。调整后R2=0.996927,模型拟合程度高。
(2)方程显著性检验
方程显著性检验主要检验自变量与因变量之间的线性关系是否显著成立。样本数据离差平方和TSS的自由度为28(n-1),回归平方和ESS的自由度为3,则残差平方和RSS的自由度为25(n-k-1)。
H0∶βi=0 H1∶βi≠0
在H0成立的条件下,构造统计量:F=(ESS/k)/(RSS/(n-K-1))=3028.793。该统计量服从自由度为(k,n-k-1)的F分布,当α=0.05,n=25,k=3时F0.05(3,25)=2.99小于3028.793,因此拒绝原假设H0,方程检验显著。
(3)参数显著性检验
参数显著性检验主要检验在一定显著水平下解释变量是否对被解释变量有显著影响。
H0∶βi=0 H1∶βi≠0
在H0成立的条件下,计算t统计量
Ti=(^βi-βi)/S(^βi)
当βi=0时,T1=-1.684518、T2=18.28940、T3=2.361863;当α=0.05,n=29,k=3时 T0.025(25)=2.0595。如果Ti>2.0595,那么拒绝原假设,βi显著。因此β1未通过参数检验,β2、β 3对应的解释变量在α=0.05显著水平下对被解释变量有显著影响
3.计量经济学检验
(1)多重共线性检验
多重共线性会导致参数估计不合理,进而使变量显著性检验无法进行和预测失效。从相关性检验结果图2可知自变量之间的相关系数均大于0.8,多重共线性现象严重。本文使用逐步回归法消除多重共线性。LNX1、LNX2、LNX3分别对LNGDP做一元线性回归,结果如下:
t=(15.82805)(24.22878)
R2=0.956028,DW=0.153696
t=(58.91386)(87.79338)
R2=0.996509,DW=0.743431
t=(12.79305)(13.37021)
R2=0.868781,DW=0.1542664
由于X2的t统计量数值较大,变量线形关性强,拟合程度最好,把X2作为基本变量,依次引入X1,X3重新估计参数。结果如图3、4、5:加入X1,R2增加,但是参数为负数违背事实,所以舍弃X1。加入X3,可决系数提高且参数为正数符合事实,变量通过t检验。舍弃变量X1,修正后得到模型:
t=(62.02858) (18.28940) (2.361863)
R2=0.997256,F=3028.793,DW=0.876836
图2 相关系数矩阵
图3
图4 加入X1
图5 加入X3
(2)异方差检验
(3)序列相关性检验
回归模型中假定随机误差项相互独立,而序列相关是指违背这一假定即随机干扰项具有相关性,序列相关会使参数估计和显著性检验无效,预测失效。
在5%显著水平下,n=29,k=2,得到dL=1.27,dU=1.56均大于多重共线性修正后模型DW=0.876836,所以存在正自相关。
自相关修正采用科克伦—奥克特迭代法,根据图7的修正结果可知,DW=1.736357,当 n=27,k=2,α=0.05时DW统计量表,得dL=1.24,dU=1.56 t=(11.50784)(13.19316)(3.013605) R2=0.998168,F=2996.574,DW=1.736357 根据检验后的最终模型结论如下:1.江西省第三产业中交通运输、仓储和邮政业对GDP的贡献受批发、零售业住宿和餐饮业以及金融业的影响,排除交通运输、仓储和邮政业对GDP的影响后,对江西省GDP影响最大的是,其次是金融业。2.江西省第三产业发展的重点在批发、零售业住宿和餐饮业和金融业,交通运输、仓储和邮政业会随这两行业的发展而发展。3.若要江西省第三产业快速增长主要发展批发、零售业住宿和餐饮业,因其对GDP影响最大;若要第三产业均衡增长主要发展金融业,因其对GDP影响较小是江西省第三产业中发展薄弱行业。 图6 White检验 图7 自相关修正六、结论