基于多元回归模型对河北省GDP影响因素的探究
2020-08-25杨清
杨 清
(天津外国语大学 天津 300204)
一、引言
作为国民经济核算的重要指标,GDP在衡量国家或地区总体经济状况方面有指示作用。通过对河北省经济增长情况的相关研究和发展趋势的考量,能够正确有效地预测河北省GDP,并针对河北省经济发展方面提出合理化的建议。因而提供一个科学合理的预测模型对影响GDP总值的因素进行定量化分析和预测具有重要意义。
近年来河北省GDP呈现出持续上升的趋势,其政治、经济、环境、人文等方面都有了很大改善,使得国内外学者在GDP影响因素研究方面进行深入研究。谷亚丽(2016)选取居民消费、进出口贸易等作为变量通过对GDP增长贡献率的计算得出贡献率变化的主要原因是速度。黄虹等(2017)在结构向量自回归(SVAR)模型中创造性地引入了绿色GDP,得出人口、产业分类结构与其的内在联系;通过研究,另外有学者认为居民收入、产业调整等也对GDP有影响。
本文以河北省为例,基于2010-2017年8年的统计数据,在建立指标体系的基础上运用SPSS软件对GDP的影响因素进行深入分析,建立合理的多元线性回归模型,挖掘各个参数的经济意义,最后根据回归结果提出合理化的政策性建议。
二、多元线性回归分析原理
回归分析的优势在于能定量地描述各个变量间的相关关系,采用因素分析还能得出解释变量与被解释变量之间关系的强弱以及整体解释显著性水平的高低,多元线性回归模型的一般形式为:
Y=b0+b1X1+b2X2+b3X3+…+bpXp
B0表示回归常数,b1,b2,b3…bp为偏回归系数。因变量Y由其估计值和残差构成,估计值与自变量有关,残差虽然与自变量无关,但是对于能否建立多元回归模型有重要意义。多元线性回归分析要求各个解释变量之间没有多元共线性关系,所以应对模型采用多重共线性诊断的方法,为了达到模型的预期效果,还要保证自变量和因变量有显著性影响同时相关性密切。
三、指标选择和数据来源
(一)指标选择
通过结合前人研究成果和对统计结果科学性、可比性、可操作性原则的遵循,选取地区生产总值(亿元)Y为因变量,就业人数(万人)X1、固定资产投资额(亿元)X2、财政收入(亿元)X3、价格指数(上年=100)X4为自变量,旨在探究各自变量对因变量的影响。指标显示河北省就业人口总数与其经济发展水平相关密切,说明经济增长和经济结构能够影响就业,同时人口结构也反作用于经济发展,在某种程度上对河北省发展和稳定具有重要意义;固定资产投资额被认定为GDP增长的主要保障之一,反应固定资产投资规模、速度和比例关系,能够平衡资本的投入;另外财政收入是衡量财力的指标,价格指数是显示价格变动指标,在统计学研究领域,这些都是常用的用来衡量地区宏观经济状况的指标。
(二)数据来源
根据河北省2010-2017年8年来的相关数据,借助SPSS软件建立回归模型,并对因变量和自变量进行分析。数据来源:《中国统计年鉴》
表1 原始数据
四、模型建立与数据分析
统计学中多元线性回归模型变量Y与Xi之间的线性模型为:Y=β0+β1X1+β2X2+β3X3+β4X4。根据表1相关数据和指标,建立以河北省地区生产总值Y为因变量,城镇就业人数、固定资产投资额、财政收入、价格指数为自变量X1、X2、X3、X4的模型。
(一)相关性分析
通过对两个及以上具备相关性的变量进行分析来衡量变量间相关密切程度的分析称为相关性分析。表2为SPSS软件生成的相关系数表,显示各指标之间的相关系数,包括自变量和因变量在内的5个变量之间的Pearson相关系数以及单侧检验显著性概率。
表2 相关系数表
根据表2,财政收入与GDP相关系数最大为0.992,财政收入与就业人数相关系数最小为0.340,由于最大值与最小值差距较大所以该模型不存在自变量间的共线性问题。另外根据表格中大于0.9的数据得出河北省GDP与固定资产和财政收入间关系较为密切。
表3 模型拟合程度表
表3为模型拟合程度表,回归模型中可知多元相关系数R=0.999,修正后的判决系数为0.996,说明模型的拟合效果很理想。
表4 方差分析表
表4为方差分析表,在对回归方程的显著性检验中,F检验的统计量的显著性概率P=0.000<α=0.001说明四元线性回归方程高度显著。
表5 回归系数表
表5为回归系数表,四个自变量的B值都是正数,说明四个自变量对因变量的影响是正向的,随着相关自变量数值增大,因变量数值也增大,反之亦然。根据表5第一列,回归模型中自变量的回归系数分别为7.794,0.008,7.228,366.466,回归系数的显著性检验t值分别为0.102,0.012,1.024,0.127,显著性P值为0.034,0.942,0.005和0.067,说明城镇就业人数和财政收入对河北省GDP的影响达到显著性水平,其中财政收入的影响特别显著。
(二)数据分析
统计结果显示就业人数X1、固定资产投资额X2、财政收入X3和消费价格指数X4对河北省地区生产总值有显著影响,且模型不存在自变量间的共线性问题,数据分析结果有效、可靠。根据表5和各项指标得出回归方程为:
Y=-31317.068+7.794X1+0.008X2+7.228X3+366.466X4
该模型的常数项系数为-31317.068,假设模型中所有自变量为0,河北省地区生产总值为-31317.068。城镇就业人数、固定资产投资、财政收入和CPI系数均为正数,相关系数分别为7.794、0.008、7.228、366.466,说明当就业人数增加,河北省GDP增加;随着固定资产投资额的增加,GDP的产出也会相应增加;财政收入增加也会带动GDP的增加;价格指数中相关子指标例如商品零售价格和固定资产投资价的变动均会对地区生产总值造成相应的变动,反之亦然。
五、结论与建议
本文结合统计学相关知识,以2010-2017年河北省GDP以及相关数据为基础,运用SPSS软件构建多元回归模型,探究影响河北省GDP的影响因素。总结出城镇就业人数、固定资产投资额、财政收入以及居民消费价格指数是影响河北省GDP的主要因素,影响均为正向。另外从SPSS软件的输出结果看出,该回归模型的拟合程度较好,且模型不存在自变量间的共线性问题,模型可信度较高,对相关部门针对河北省经济发展的研究有一定的借鉴意义。
根据SPSS软件的分析结果以及模型的建立,针对出河北省经济面临的主要问题提出以下几个方面的建议:首先,政府应加大对服务业等的鼓励和培育,积极实行国家优惠政策;其次,要充分利用好雄安新区这一政治经济副中心的资源,增大吸引外资的力度,号召和鼓励技术人员入省,不断提高城镇就业率;第三,政府应重视“看不见的手”对河北省GDP的作用,财政方面调节政府与市场的关系,出台政策控制财政支出;最后政府应关注民生问题,多角度全面推进河北省经济的可持续发展。