基于多元回归模型的内蒙古地区年平均工资的影响因素分析
2021-01-10杨晓宇
摘 要:本文基于内蒙古自治区1991年-2020年数据,建立了年平均工资与职工人数、内蒙古地区生产总值、工业生产总值、失业人数、社会商品零售价格指数的多元回归模型,并且对回归模型进行了统计学检验以及多重共线性、异方差性、自相关性等一系列计量经济学检验和修正。在对检验分析的基础上,做出估计和预测,使我们明确影响职工工资的主次因素,对于了解地区经济发展程度,预测未来工资水平等具有积极的现实意义。
关键词:回归模型;年平均工资;计量经济学检验
一、变量与样本
1.选题背景
改革开放以来,我国经济进入快速发展的时期,居民收入快速增加,人民生活水平显著提升。从内蒙古地区来看,随着市场经济体制的逐步完善,内蒙古地区职工年平均工资也不断增加。2005年,内蒙古职工年平均工资仅15985元。到2019年,职工年平均工资达到了80563元,相比增长了5.04倍。因此,借助Eviews软件,选取1991年到2020年三十年的数据,基于多元线性回归模型,选取多个变量,分析相关因素对内蒙古自治区年平均工资是否有影响以及影响程度,进而预测未来职工工资水平以及与地区经济发展的联系。
2.海选变量
3.变量的相关分析与因果分析
(1) 变量的相关分析
由变量的相关系数矩阵可以看出:解释变量X2、X3、X4的相关系数均在0.9以上,说明解释变量X2、X3、X4之間是高度相关的,X1、X5与其他解释变量的相关系数较小或为负值,相关性弱,X2、X4与Y的相关系数均在0.9以上,所以X2、X4与Y是高度相关的,X3与Y相关性较大,X1、X5与Y的相关性弱。
(2) 变量的因果分析
变量X1为职工人数,职工人数增加,年平均工资Y减少。变量X2为内蒙古地区生产总值,内蒙古地区生产总值增加,年平均工资Y增加。变量X3为工业生产总值,工业生产总值增加,年平均工资Y增加。变量X4为失业人数,失业人数增加,年平均工资Y增加。变量X5为社会商品零售价格指数,社会商品零售价格指数增加,年平均工资Y减少。所以被解释变量Y与解释变量X1、X2、X3、X4、X5之间具有因果关系。
二、计量经济学检验
1.多重共线性检验与修正
判定系数检验法:
若R2值越大,则代表多重共线性越大,根据表格中数据删除解释变量X2,继续进行检验。得到:
根据表中数据,解释变量X1 X3 X4 X5的R2值都没有超过0.9,则代表变量不存在多重共线性,保留解释变量X1 X3 X4 X5。
2.异方差检验与修正
(1) 检验
通过预测评价可以得出本模型为非线性回归模型,非线性回归模型表达式:
Yt=b0+b1ln(X1t)+b2ln(X3t)+…+bkln(Xkt)+ut(1)
怀特检验法:
利用Eviews建立回归模型:LS LOG(Y)C LOG(X1)LOG(X3) LOG(X4)LOG(X5)。
检验异方差性:在方程窗口中依次点击View\ResidualTest\Heteroskedasticity Tests,弹出异方差检验设定窗口,在Test type中选择White,并选择在辅助回归模型中包含交叉乘积项。
结论:根据怀特检验结果可知,nR2=27.29420>χ20.05(13)=22.362拒绝原假设,表明模型存在异方差性。
(2) 修正
首先,运行一次LS命令生成残差序列,然后在命令窗口输入:LS(W=W1)LOG(Y)C LOG(X1)LOG(X3)LOG(X4)LOG(X5)GENR W1=1/ABS(RESID),并重复上述检验异方差性的步骤,消除异方差性。
结论:根据怀特检验结果知,nR2=10.19279<χ20.05(5)=11.071接受原假设,表明模型不存在异方差性。
3.自相关检验与修正
(1) 检验
DW检验:
当0≤DW≤dL时,存在一阶正相关性,并且正自相关的程度随DW靠近0而增强;当dL≤DW≤dU时,不能确定是否存在自相关;当dU≤DW≤4-dU时,不存在一阶自相关性;当4-dU≤DW≤4-dL时,不能确定是否存在自相关;当4-dL≤DW≤4时,存在一阶负相关性,并且负自相关的程度随DW靠近4而增强。
利用Eviews,计算本文模型中的DW=0.673039。取n=30,k=4,查表得dL=1.14,dU=1.74。可知DW=0.673309<dL=1.14,表明该模型存在正自相关性。
(2) 修正
①在Eviews命令窗口键入LS LOG(Y)C LOG(X1)LOG(X3)LOG(X4)LOG(X5)AR(1) 得到DW=1.554428,dL=1.14≤DW= 1.554428≤ dU=1.74,表明无法判定模型存在自相关性。
②在Eviews命令窗口键入LS LOG(Y)C LOG(X1)LOG(X3) LOG(X4)LOG(X5)AR(1) AR(2) 得到DW=2.808661,4-dU= 2.26≤DW=2.808661≤4-dL=2.86,表明无法判定模型存在自相关性。
③在Eviews命令窗口键入LS LOG(Y)C LOG(X1)LOG(X3) LOG(X4)LOG(X5)AR(1) AR(2) AR(3),DW=2.083982,dU= 1.74≤DW=2.083982≤4-dU=2.26,表明模型已不存在自相关性。
三、统计学检验
1.拟合优度检验
拟合优度检验是检验样本回归直线对样本数据拟合的精确程度。
由表中数据得知,决定系数R2=0.999155,修正的决定系数=0.998833,R2和都大于临界值R02=0.9,说明通过拟合优度检验,模型对数据的拟合效果较好。
2.变量的显著性检验
T检验:
(1) 提出原假设H0:b0=0,b1=0,b2=0,b3=0,b4=0,备择假设H1:b0,b1,b2,b3,b4不都为零;
(2) 给定显著性水平α=0.05,查自由度为25的t分布表,得临界值t0.025(25)=2.0595;利用Eviews,计算每个解释变量t统计量的值,t0=1.763877,t1=-0.522676,t2=7.603004,t3=4.372129,t4=-1.040662;
(3) 比较得t2>t0.025,t3>t0.025则拒绝原假设H0,接受H1,说明解释变量X3,X4对因变量Y的影响是显著的,t0<t0.025,t1<t0.025,t4<t0.025说明常数项和解释变量X1,X5对因变量Y的影响是不显著的。
3.方程的显著性检验
F检验:
(1) 提出原假设:H0:b0=b1=b2=b3=b4=0,备择假设:H1:b0,b1,b2,b3,b4都不为零;
(2) 给定显著性水平α=0.05,在F分布表中查出第一自由度为4和第二自由度为25的临界值F0.05(4,25)=2.76,利用Eviews计算统计量F值,F=3102.587。
(3) 结论:因为F=3102.587>F0.05(4,25)=2.76说明小概率事件发生,拒绝原假设,该回归模型在总体上是显著的。
四、模型设定检验
1.提出假设:H0:有重要变量被遗漏;H1:没有重要变量遗漏。
2.结论:F===0.031,
在α=0.05下,查得临界值F0.05(4,25)=2.76,因为F=0.031< F0.05(4,25)=2.76,接受原模型与引入新变量的模型可决系数无显著性差异的假设,表明该模型没有重要变量遗漏。
五、模型的應用
1.点预测
点击主界面Proc/Structure/Resize Current Page,在对话框将数据结构“2020”改为“2021”,然后将Y X1 X3 X4 X5按组打开,将2021年解释变量补充预测数据X1 =263.40,X3= 16000.60,X4=27.13,X5=100.25。在命令窗口输入“LS LOG(Y)C LOG(X1)LOG(X3)LOG(X4)LOG(X5)AR(1) AR(2) AR(3) ”,得出Y2021年的预测值:
=5.420136+0.88691*ln(X1f)+0.021704*ln(X3f)+ 0.140333*ln(X4f)+0.519229*ln(X5f)=8.980191
2.区间预测
的标准差为3.507147,查自由度为25的t分布表,得临界值t0.025(25)=2.0595的95%的预测区间为-t0.025(25) × s()≤ ≤ + t0.025(25)×s()=[1.757222,16.20316]
六、结语
由模型和检验结果可知,回归模型对于选取1991年-2020年的观测值拟合效果很好,X1(职工人数)、X3(工业生产总值)、X4(失业人数)、X5(社会商品零售价格指数)整体能够建立与Y之间较为理想的回归模型且没有重要变量遗漏。其中X3、X4与Y之间是高度相关的,说明工业生产总值和失业人数是影响年平均工资的重要因素,尤其内蒙古地区工业生产总值对年平均工资的增长至关重要,所以长期来看,增加工业生产总值是提高职工工资,促进地区经济发展,提升人民生活水平的关键举措。此外,对失业人员再就业问题也应予以高度重视,并应当积极预测未来几年内蒙古地区年平均工资水平。
参考文献:
[1]李滨生.我国职工工资收入影响因素分析[J].研究探索,2010(2):20-22.
[2]内蒙古自治区统计局.内蒙古统计年鉴[M].北京:中国统计出版社,2015.
[3]内蒙古自治区统计局.内蒙古统计年鉴[M].北京:中国统计出版社,2019.
作者简介:杨晓宇(2000.05- ),女,汉族,内蒙古呼和浩特人,内蒙古农业大学经济管理学院,本科在读,研究方向:金融学