APP下载

R语言环境下的广州市就业情况分析

2017-11-07

福建质量管理 2017年19期
关键词:平均工资总值外资

(广东财经大学 广东 广州 510000)

R语言环境下的广州市就业情况分析

李雪薇

(广东财经大学广东广州510000)

新世纪以来,中国一直被誉为“世界工厂”,庞大的劳动力、廉价的土地资源和相对成熟的基础设施,从世界各地吸引了大量的资本。然而现今,关于外资是否正从中国撤离的话题,正引发激烈的争论。而广州去年实际使用外资57亿美元 新设外商投资企业1757家增长达23%。本文利用广州市历年相关数据,运用R软件对数据进行分析,研究2006~2015年间广州市外商投资对广州就业岗位的影响,通过对解释变量的选择以及判断,消除违反多元线性回归模型假设的因素,从而建立正确的回归模型,在此基础上合理的进行回归分析与预测。

多元线性回归;虚拟变量;多重共线性;预测

一、问题重述

(一)背景资料

近两年,关于外资从中国撤离的消息屡屡被曝光。2月16日,根据商务部公布的数据显示,今年1月份,中国实际使用外资额为120亿美元,同比下跌14.73%。这更让外资撤潮说重新成为热门话题。权威的解读认为月度数据不代表长期趋势,但从实际情况来看,每一次外资撤离都涉及到人数众多的裁员。因此,正确预测外商投资对广州就业岗位的影响对于即将毕业的大学生来说起到了一定的参考价值。

(二)本文主要讨论以下几个问题:

1.从广州市产出水平(以地区人均生产总值为指标)、在职职工平均工资水平、历年利用外资情况指数(取外商直接投资使用外资金额)、进出口总值中选择合适的变量作为解释变量。

2.根据预测目标选择广州市从业人数作为被解释变量。

3.通过建立恰当的多元线性回归模型,对广州市从业人数进行点预测和区间预测。

二、模型的假设

(1)变量Y和X1,X2,…Xk之间存在线性随机函数关系Yi=β0+β1X1i+β2X2i+…+βkXki+εi

(2)每组观测数据的误差项εi都为零均值的随机变量。

(3)误差项εi的方差为常数。

(4)对应不同观测数据的误差项不相关。

(5)解释变量Xk为确定型变量而非随机变量。当存在多个解释变量时,不同解释变量不存在线性关系。

(6)误差项εi服从正态分布。

三、模型的建立

(一)数据来源和模型变量的选择

通过查找广州统计信息网站中2006-2015年广州市就业人数与广州市产出水平(以人均地区生产总值为指标)、在岗职工平均工资水平、历年利用外资情况指数(取外商直接投资使用外资金额)、广州市进出口总值(亿美元)的数据,将数据汇总见附录。

分析:由于影响广州市就业人数的因素有很多,为了简化分析,我们选择其中四个经济变量作为主要影响因素建立多元线性回归模型。根据预测目标以广州市就业人数(人)作为被解释变量Y;解释变量分别为广州市人均地区生产总值X1(元)、在岗职工平均工资水平X2(元)、外商直接投资使用外资金额X3(万美元)、进出口总值(亿美元)X4,设定线性回归模型为:Yi=β0+β1X1i+β2X2i+β3X3i+β4X4i+εii=1、2、3…n

其中ε为随机误差,且认为ε服从N(0,σ2)的正太分布。对于式中未知参数的估计采用最小二乘法,求相关系数R2,并做显著性检验,通过二者表明模型建立的是正确的。

参数βi误差项εi虚拟变量Ni广州市就业人数(qscy)Y广州市人均地区生产总值(rjGDP)X1在岗职工平均工资水平(gzsp)X2外商直接投资使用外资金额(wzje)X3进出口总值(jckzz)X4

(二)模型的建立与分析

1.绘制趋势图

导入函数

Y

X1

X2

X3

X4

分析:从曲线趋势图上我们大致可以看出,被解释变量Y和解释变量X1、X2、X3、X4随着时间的变化有明显的增长趋势,说明人均地区生产总值、在岗职工平均工资水平、外商直接投资使用外资金额、进出口总值随着年份的增加在不断的上升。

2.画相关图选择回归方程的形式

可见,X1、X2、X3、X4与Y的关系是明显的线性的。

3.做回归,并检视回归结果

对样本相关系数进行分析

综合以上的结果,所有四个变量与Y的相关性较好。

4.模型分析

(1)对三个变量建立多元回归方程得到如下结果:

通过观察,X2、X3没有通过显著性检验

(2)逐步回归分析

剔除X2后

剔除X3后:

回归系数的显著性水平有所提高,但是x1 x2 x4的显著性水平仍然不理想

(3)逐步回归分析的优化

如果去掉x1,AIC的值从230.75增加到234.70是三个变量中增加最小的

(4)进一步进行多元回归分析

结果发现两个变量与Y的相关性依旧不大,得到的线性回归方程为Y=4331000+23.65X2+1406X4,但该模型并不是最优模型,说明引入的虚拟变量不是最合适的指标,所以只能得出结论是:两者存在正相关关系,但不显著,可能是样本量不够,或者代理变量选择不同造成的,只能部分验证假设。

5.模型检验

收集2006/2010/2015年对应的X2、X4数据,得到

200620102015实际数值599497371106958109811计算数值6097104.227086163.638132878.23误差比例0.017036140.003449930.00284436

所以,这个模型的相关性检验并没有很高的拟合度,但是三组数据得出的结果误差比例却很低,那么或许更多的样本量可能会得到更合适的结果。

6.结论说明

由以上可得出广州市就业人数与广州市在岗职工平均工资水平、广州市进出口总值有较明显的关系,且之间成正相关,这是符合实际的,工资刚性理论认为,工资可以对劳动力供求的变化作出反映,但其调整过程是非常缓慢的,正是调整的缓慢才导致失业的上升和下降,也影响就业率的变化;进出口总值反应了广州市的对外经济贸易活跃度,对就业率也是起到了正面的影响。

四、模型的评价

该模型从相关性的分析来看并不是一个很好的契合模型,变量的参数P值也只是都小于0.1,但是将原数据带入方程式所得到的误差值却很小,因此猜想或许是样本量过少,但是因为其中有关于外商直接投资实际使用金额(X3)这一项,因此数据库中资料不足,所以函数的构建应该还是有待改进

R代码

读取数据

mydata<-read.csv("gzjy3.csv")

mydata

Y<-mydata[,1]

X1<-mydata[,2]

X2<-mydata[,3]

X3<-mydata[,4]

X4<-mydata[,5]

绘制趋势图

plot(Y)

plot(X1)

plot(X2)

plot(X3)

plot(X4)

画相关图选择回归方程的形式

plot(Y~X1);abline(lm(Y~X1))

plot(Y~X2);abline(lm(Y~X2))

plot(Y~X3);abline(lm(Y~X3))

plot(Y~X4);abline(lm(Y~X4))

对样本相关系数进行分析

cor(mydata)

做回归,并检视回归结果lm.test<-lm(Y~X1+X2+X3+X4,data=mydata)

summary(lm.test)

lm.test<-lm(Y~X1+X3+X4,data=mydata)

summary(lm.test)

lm.test<-lm(Y~X1+X2+X4,data=mydata)

summary(lm.test)

逐步回归分析的优化

drop1(lm.test)

进一步进行多元回归分析

lm.test<-lm(Y~X2+X4,data=mydata)

summary(lm.test)

李雪薇(1993.01-),女,硕士,广东财经大学,人力资源管理。

)

猜你喜欢

平均工资总值外资
No.6 2021年平均工资出炉
一季度我国服务贸易进出口总值11581.9亿元
东盟取代美国成中国第二大贸易伙伴
中外资管合作大有可为
人民币债券为何持续受到外资青睐
外资进入A股:用其“利”防其“弊”
20条稳外资措施将出台
我国去年贸易额跌13.9%