基于极限学习机的企业人才需求量预测
2021-07-12王梦中国石油工程建设有限公司北京100120
王梦(中国石油工程建设有限公司,北京 100120)
0 引言
随着现代企业规模的不断扩大,企业对人才的依赖日益突出,能够准确预测人才招聘中的人才需求量,对于提升企业人事管理水平具有重要意义。因此相关学者就企业人才需求量的预测从定性分析与定量计算进行了一系列的探索。
通过查阅文献在人才需求量上,主要是以建立影响因素指标体系,采集历史数据对未来做出预测,或者基于将人才需求量视为关于时间的变量,通过时间序列预测的方式进行预测。时间序列是收集历史统计数据,将研究的变量按照数据的先后顺序排列起来,通过时间序列分析找出研究变量随时间的变化关系。在分析中对于线性系统可以采用最小二乘法拟合回归方程,而对于非线性系统的回归则需要使用具有非线性拟合能力的计算模型,例如:BP神经网络、支持向量机等模型。此外,相关性预测模型是基于历史统计数据,研究多影响因素对研究变量的回归问题。实际上人才需求量的预测是非线性变化的,具有随机性和突变性,因此传统的线性拟合算法预测的精度往往较低,并且影响人才需求量的因素还在不断的研究探索中,整个预测过程呈现出灰色特征,即部分信息已知而部分信息还未知。本文将人才需求量作为时间变量,通过引入学习速率较高的极限学习机(ELM)机器学习算法模型[1-3],对企业人才需求量进行回归拟合预测,为丰富人才需求量预测模型进行有益的探索与尝试,为企业人才需求量预测决策提供算法参考。
1 ELM理论
与BP神经网络相比,作为一种单隐含层前馈神经网络(SLFN) ELM在进行机器学习之前只需要设置隐含神经元的个数,通过随机产生输入层、隐含层之间的连接权值与阈值便可以获得最优解,无需向BP神经网络一样进行反复多次迭代,采用梯度下降使得误差降低到所要求的的范围内。因此,ELM具有较高的学习效率与精度,有很多学者将ELM应用到自己的研究领域中,例如文献[5-8]。典型的ELM网络结构图如图1所示。
图1 典型ELM网络结构
ELM作为机器学习家族中的一员,除了具有强大的分类与拟合预测功能,还具有高效的学习速率。实际上ELM比同家族的BP的神经网络更容易收敛,训练的时间也较短。ELM自2004年被提出以来,模型在十几年的时间里得到不断的修正,使其泛化能力超过误差反向传播以BP神经网络为代表的机器学习算法。此外,ELM根据自身的神经网络搭建而定,而不需要向BP神经网络一样需要在反复迭代学习中找到自身最合理的结构。
与其他前馈神经网络结构(SLFN)一样,ELM网络层也包括输入X,输出Y以及连接二者的隐含层。假设有n个神经元作为输入层,则对应有n个输入变量。ELM网络的连接权值w表达式如式(1)所示,隐含层与输出层之间的连接权值β表达式如式(2)所示,隐含层阈值b的表达式如式(3)所示,样本输入X与结果输出Y的表达式如式(4)所示,则ELM网络输出量为T表达式如式(5),其中g(x)为hardlim激励函数。
上式可以变形表示为如(6)式所示
其中H的表达式为:
ELM进行机器学习之前通过产生随机权重值w与阈值b,即是说ELM网络的输入神经元个数与隐含层神经元个数数值一旦确定其结构就会确定,则与该结构匹配的连接权重值β就确定,这与BP神经网络相比省去了反复迭代利用梯度下降得到理想解的过程。由于ELM的学习速度、处理精度高,以及泛化能力强,被广泛用于回归、分类、模式识别等领域。
2 企业员工需求量预测
企业在实际确定员工需求量时往往会分岗位,对岗位的工作经验、岗位的学历都有不同的要求,并且不同企业的影响因素不同,因此构造通用的评价指标体系存在难度。本文研究是统计了某个企业2010—2019年的员工总人数,相邻年份的总人数差值即为当年所需要的人才数量,因此是将人才数量作为宏观统计量,而并没有按照岗位和学历等要求进行数据分割。某企业过去10年的员工总人数统计表如表1所示。
表1 某个企业2010—2019年的员工总人数
在学习之前数据已经按照时间顺序排好,但是为了提高ELM的预测精度,我们选用9个样本作为学习输入样本,仅剩下1个样本进行预测,使得ELM不但能够进行关于时间的正推,也可以实现关于时间的逆推,这样可以实现每个样本值的实际值与预测值的比较。ELM的预测结果如表2所示。实际值与预测值的对比如图2(a)、(b)所示,误差在可接受的范围内,并且ELM所预测的趋势与实际非常接近。
表2 实际值与预测值对比
图2 实际值与预测值的对比
3 结语
(1)将企业人才需求量视为基于年份时间变化的函数,以历史统计数据作为样本,省去了构建人才需求量的影响因素评价指标体系,使得预测方法更为通用。
(2)引入ELM作为数据预测模型,以时间序列作为输入变量,由于其预测精度、学习效率较高,可以作为企业人才需求量的预测模型,具有较强的适用性。