APP下载

影响薪酬水平因素分析

2021-09-07邓多杰张峥

经济研究导刊 2021年23期
关键词:R语言回归分析

邓多杰 张峥

摘   要:为研究薪酬水平的影响因素以及与这些因素之间是否存在线性关系,以R语言中自带数据集wgge1为例,借助R语言提供的丰富高效的统计模型处理方法,对wage1数据集中薪酬与教育水平、工作经验以及婚姻状况等因素进行分析,建立影响薪酬水平的回归模型。基于此,在指出模型分析中不足的同时,也提出了几点现实的参考意见。

关键词:薪酬水平;R语言;回归分析

中图分类号:F069;C936    文献标志码:A    文章编号:1673-291X(2021)23-0057-03

引言

薪酬是组织优化人力资源的有效杠杆,理论界目前对薪酬结构与其影响因素的实证研究也还存在很大空间。同时,随着大数据的兴起,作为由统计学教授Ross·Ihaka 和Robert·Gentleman开发的用于统计分析、绘图的语言和操作环境的一种软件,R语言迅速成为一种热门的数据分析工具。因其具有强大的数据处理能力和持续扩展能力,处理统计和测量问题的方法也越来越丰富,覆盖范围也越来越广[1],所以我们以R语言中自带数据集wgge1为例,在认真查阅和分析资料的前提下,利用R语言这一软件,分析wooldridge包中的wage1数据集中的数据分布情况。

一、数据集描述性分析及数据说明

wage1数据集是由著名的经济学家杰弗里·伍德里奇和亨利·法伯尔在就读于麻省理工学院时,从1976年美国人口现状调查中所收集的关于劳动力薪酬情况。

(一)数据集描述性分析

wage1数据集中包含526行和24列。也就是说,该数据集是对样本为n=526人所作出的24项调查,wage1数据集中共含有24个变量。

(二)数据说明与变量处理

结合研究主题和相关文献的研究,拟采用的变量包括薪酬、教育水平、工作经验、婚姻状况、家属人数及居住区域等。变量具体设定如表1。

二、R语言环境下回归模型的建立与分析

对于薪酬水平与其影响因素的關系,已有许多学者做出了相关研究。叶勤等人对企业的薪酬环境、组织环境和员工具体所从事工作的性质对员工薪酬水平的影响进行了研究,认为环境因素与薪酬水平和满意度之间有显著相关关系[2]。Lawler 和 Edward认为,总体报酬以员工需求为导向的本质,突出了企业利益与个人利益协调、共赢的思想,对员工工作积极性、离职率和其他关键行为发挥着积极的影响[3]。基于此,在wage1数据集中,为了更加细致清楚地描述薪酬与所选变量之间的关系,我们建立薪酬与研究变量之间的回归方程。

(一)建立简单线性回归模型

利用wooldridge包中的wage1中n=526 个人的数据,估计薪酬与教育水平之间是否存在线性关系,建立如下的回归模型1,即总体回归方程为:

W=β01educ+εi(1)

同时建立半对数的回归模型2,其回归方程为:

ln(W)=β01educ+εi(2)

模型1、2中,W代表每小时薪酬水平,β0和β1是回归系数,εi是误差项,是其他一切不确定因素的总和。我们用参数为formula模型公式,函数lm会估计回归系数β0和β1,分别用Intercept和x表示,可得模型中回归方程的参数水平和判决系数(见表2、表3)。在此数据的基础之上,进一步分析所做回归模型的合理性,并对模型回归结果进行分析。

显然,调整之后模型2中的判决系数Multiple R-squared为0.185 8,其值并不接近于1,回归结果也是不理想的;但同时,p-value=2.2e-16,与模型1相比没有变化。我们无法判断哪个模型更好,因此,影响薪酬的因素不只是有教育水平,可能还有其他方面的,比如工作经验、婚姻状况等。为了更好解释影响薪酬的因素,我们就必须用到多元回归模型。

(二)建立多元线性回归模型

在数据集wage1中,我们建立wage与educ、exper以及married之间的多元线性回归模型3,其回归方程为:

W=β01educ+β2exper+β3married+εi(3)

同时,在模型3的基础之上建立模型4,其多元线性回归方程为:

log(W)=β01educ+β2exper+β3married+εi(4)

从回归结果来看,模型3、模型4拟合的效果相对于模型1、模型2的效果还是不错的。常数项以及educ、exper的预测效果较为显著,married的预测能力较好。同时,如表5所示,模型3的判决系数为0.240 1,模型4的判决系数为0.275 8,与模型1中相比较大,回归系数也是较为显著的,但仍偏离1较远。我们用AIC函数来判断4种模型哪一个的拟合效果更好,见表6。

综合以上四种模型,对简单回归模型而言,我们只能说模型2比模型1 的拟合效果好,但不能说模型2中薪酬与教育水平具有显著的共线性关系。同样,对多元回归模型而言,也不能得出薪酬与教育水平、工作年限或者婚否这些因数之间存在明显的线性关系。因此,我们预测,薪酬是由多方面因素影响的,若将教育水平、工作经验、当前工作任期、婚否、家属人数、居住区域等因素都考虑起来,其回归方程的拟合效果会更好,可解释性会更大。

猜你喜欢

R语言回归分析
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
中国经济发展状况与大学生就业情况的相关性研究
城乡居民医疗费用的相关性与回归分析
基于变形监测的金安桥水电站坝体稳定性分析
森林碳汇影响因素的计量模型研究
河北省城镇居民人均可支配收入与消费统计分析
基于R语言的湖南产业结构对其经济增长贡献分析
河南省经济增长质量与创新能力关系的实证分析
注重统计思维培养与应用为主导的生物统计学课程建设