大学毕业生就业工资影响因素的线性回归分析
2010-10-16曹文方
曹文方
(浙江工业职业技术学院,浙江 绍兴 312000;华东理工大学 理学院,上海 200237)
大学毕业生就业工资影响因素的线性回归分析
曹文方
(浙江工业职业技术学院,浙江 绍兴 312000;华东理工大学 理学院,上海 200237)
以上海某高校毕业生就业月工资收入为研究对象,采集了1267个数据样本,建立线性回归模型,对影响工资收入的性别、民族、政治面貌、生源所在地、就业所在地、就业单位的性质和所在学校的院系等因素进行了分析,得出了相应的结论.
工资;虚拟变量;OLS回归
1 引言
大学毕业生就业问题一直受到社会的广泛关注,毕业上岗就业,从某种意义上讲,是学校整个教学过程的结束,是学校教学质量好与坏以及学校能否持续发展的反映.就现阶段而言,我国大学毕业生对个人薪酬的期望值与实际工资水平还存在很大的落差.毕业生的学校、专业、性别、家庭背景等客观条件与行业选择、地区选择等主观因素交织在一起[1],使得大学生们对于就业的薪酬期望很难达到理性的价值判断.我们以某高校大学本科生为研究对象,采集了1267个数据样本,以分析性别、民族、生源所在地、就业所在地、是否党员、就业单位的性质和所在学校的学院等因素对薪酬的影响程度为目的,建立线性回归模型.
2 多元线性回归模型
假设随机变量y与m(≥2)个自变量x1,x2,…,xm之间存在相关关系,且满足
即 y~N(β0+β1x1+β2x2+…+βmxm,σ2).其中 β0,β1,β2,…,βm,σ2是与 x1,x2,…,xm无关的未知参数,ε~N(0,σ2)是表示误差的随机变量,称式(1)为m元理论线性回归模型[2].可以写成矩阵形式为Y=Xβ+ε
多元线性回归,就是要求出 β0,β1,β2,…,βm的估计值β赞0,β赞1,β赞2,…,β赞m,使得回归方程y赞=β赞0+β赞1x1+β赞2x2+…+β赞mxm能够尽可能精确地将自变量x1,x2,…,xm与因变量y之间的统计相关关系表达出来.
最小二乘(OLS)法的原理是求残差(误差项的估计值)平方和最小.可以求得β赞=(X’X)-1X’Y,因为X的元素是非随机的,(X’X)-1X是一个常数矩阵,则β赞是Y的线性组合,为线性估计量[3].
3 毕业生工资与影响因素的回归分析
这里我们以上海某高校毕业生的就业薪酬为研究对象,抽取1267名学生为样本来进行毕业生就业薪酬的影响因素分析.可能影响毕业生薪酬的因素有很多,这里我们对抽取的1267名学生分别考虑性别(XB)、民族(MZ)、是否共产党员(DY)、生源所在地(SYD)、就业所在地(JYD)、就业单位的性质(国有企业(DW1),三资企业(DW2),中小企业(DW3),事业单位(DW4))和所在学校的院系(资源与环境工程学院(XY1),艺术设计与传媒学院(XY2),药学院(XY3),信息科学与工程学院(XY4),外国语学院(XY5),生物工程学院(XY6),社会与公共管理学院(XY7),商学院(XY8),理学院(XY9),机械与动力工程学院(XY10),化学与分工工程学院(XY11),化工学院(XY12),材料科学与工程学院(XY13))对薪酬的影响,运用逐步回归方法[4],从而分析出在这些变量中哪些对毕业生的薪酬影响是显著的,而哪些不是显著的.
将变量以虚拟变量取代,分别取值为1或0,在Eviews环境下,用OLS回归得到如下表1回归结果[5].
从表1中的数据可以看出,R2的值很小,说明方程的拟合效果不好,所得出的系数存在很大的不合理性,对变量不能进行合理的解释.
观察其残差分布图,如图1所示.
表1 OLS分析结果1
从图中可以看出,其残差主要分布在-1000到1000之间,去除不合理的数据,重新整理得到1074个数据.再运用eviews软件继续分析,得出结果见表2.
从表2中的数据可以看出,R2的值较之前有较大的提高,说明方程的拟合效果较好,但从相伴概率最后一列中我们发现,有些系数的相伴概率偏大,因此方程存在一定的不合理性,暂且不对参数进行解释说明.在此,我们对相伴概率偏大,t值偏小的变量与以去逐步去除(DW1,DW3,MZ,XY5,XY10).再运用eviews软件继续分析,运用相同的办法,发现其残差主要分布在-500到500之间,去除不合理的数据,重新整理得到530个数据,发现变量XY1、XY11、XY12系数的相伴概率偏大,将这些变量去除,用eviews软件继续分析,得出结果见表3.
表2 OLS分析结果2
从表3中的数据可以看出,R2的值0.614133比较理想,说明方程的拟合效果较好,各个变量的相伴概率数据较好,对变量能进行合理的解释.
对应回归系数的条形图见图2.
此模型研究的是大学生毕业工资由哪些因素决定,通过上面的方程,我们可以知道,大学生毕业工资主要由性别、是否共产党员、就业单位的性质和所在学校的院系所决定:
表3 OLS分析结果3
(1)在同等条件下,党员的月平均工资比非党员高125元.
(2)在同等条件下,男性的月平均工资比女性高589元.
(3)在同等条件下,在三资企业工作的学生的月平均工资比在其它单位工作的学生高1178元;
(4)按所在学院分类,工资最高的是材料科学与工程学院,其次是生物工程学院和理学院.
4 结果分析
由民族、生源所在地、就业所在地对大学生毕业工资没有显著的影响,党员、性别对大学生毕业工资影响较小,就业单位的性质、所在学校的院系对工资有显著影响的结论可知:现行国家工资政策对大学生还是比较公平的,没有性别、民族和生源所在地的歧视,大学生毕业工资的高低主要由学生所学的专业和就业单位的性质所决定.
通过这些分析,可以给学生为自己的求学生涯和就业提供一个导向.考虑到毕业时的就业问题,学生在大学入学时选专业就应该更加谨慎,因此该模型能为学生选择专业提供一定的依据,同时学生也可以多选学些容易就业的课程;在三资企业工作的月平均工资明显高于其他性质的单位,所以学生在就业时可以多关注企业的性质.
另一方面,可以给学校的专业招生数量和就业重视方向提供一个依据.为了提高学生就业率,学校可以多开设一些易就业的专业,或者是提高易就业专业的招生人数,在学生学习的过程中,学校也可以开设第二学位课程,使得相对冷门专业的学生可以选择同时学习其它专业课程,使就业更具有竞争力.该模型也很好的告诉我们哪些专业易于就业,因此学校的就业部门可以及时发现问题,从而更好的解决问题.
〔1〕陆建民,万仁孝.性别差异与决定大学毕业生就业收入主要因素[J].中国人口科学,2002(6):29-34.
〔2〕邰淑彩,孙韫玉,何娟娟.应用数理统计(第二版)[M].武汉:武汉大学出版社,2005.
〔3〕高惠璇.统计计算[M].北京:北京大学出版社,1995.
〔4〕胡敏.高校教师工资影响因素分析[J].统计与信息论坛,2003,18(5):72-76.
〔5〕高铁梅.计量经济分析方法与建模[M].北京:清华大学出版社,2006.
F550
A
1673-260X(2010)02-0093-03