基于Hadoop大数据平台的人力资源决策技术研究

2020-08-04杨夏薇

现代电子技术 2020年3期

杨夏薇

摘要：针对传统人力资源决策技术对海量人力资源数据辨别能力不高，导致决策效果不佳，研究基于Hadoop大数据平台的人力资源决策技术。该技术对海量的企业人力资源数据进行分布式处理，将神经网络下的员工信息按照输入层、隐含层、输出层进行组别划分;根据影响每一数据组数据变化的影响因素建立初选数据集合;通过计算人力资源的熵值离散度设立决策指标，以员工的姓名、部门、历史业绩、往期工作效率等要素作为选择条件;采用决策树分类算法构建决策树，生成人力资源决策分析报表，以此实现人力资源决策技术。实验结果表明：所研究的人力资源决策技术面对海量的人力资源数据，其辨识能力更强，决策结果的完整度达到了98.35%，比传统决策技术高出了21.55%。由此可见，所研究的决策技术性能更优越、更能满足企业当前的发展需求。

关键词：人力资源决策技术; Hadoop平台; 数据挖掘; 分布式处理; 决策指标设立; 决策树构建

中图分类号： TN911?34; TP311 文獻标识码： A 文章编号： 1004?373X（2020）03?0183?04

Research on human resource decision?making technology based on Hadoop platform

YANG Xiawei

（Zhixing College of Hubei University， Wuhan 430011， China）

Abstract： The traditional human resource decision?making technology has poor resolving ability on massive human resource data， resulting in unsatisfactory decision?making effect. Therefore， the human resource decision?making technology based on Hadoop platform is studied. As far as the technology is concerned， the massive enterprise human resource data is subject to distributed processing， and the employee information in the neural network is divided into groups according to the input layer， the hidden layer and the output layer. A primary data set is created according to the factors affecting the data change of each data group. The decision?making indicators are set up based on the calculation of entropy dispersion of human resources. The employees′ names， departments， historical performances and previous work efficiencies are taken as the selection conditions， and the decision tree classification algorithm is adopted to build the decision tree and generate the human resource decision analysis report， thus realizing the human resource decision?making technology. The experimental results show that the resolving ability of the studied human resource decision?making technology is more powerful in the processing of massive human resource data， and the integrity of decision?making results reaches 98.35%， which is 21.55% higher than the traditional decision?making technology. It can be seen that the decision?making performance of the technology is better and can further meet the current development needs of enterprises.

Keywords： human resource decision?making technology; Hadoop platform; data mining; distributed processing; decision?making index creation; decision tree establishment

0 引言

人力资源管理是企事业单位中的主要组成部分，对企业的业务往来、前景发展起到重要的影响。为了顺应当前的企业经济结构的變化和发展趋势，提高企业的工作效率和经济效益，国家各行各业都将大数据技术应用到人力资源管理决策中，通过运用大数据平台中的软件系统、框架，实现更加全面化、系统化、效率化和现实化的决策技术，以此提高企事业单位的核心竞争力，满足企业长远发展的目标[1]。

Hadoop是一个分布式系统基础构架，基于Hadoop大数据平台，找出Hadoop与人力资源决策管理之间的联系，提高对人力资源数据吞吐量，以此来访问决策模块中的各类人员信息，实现更加符合员工自身条件的决策。将所研究的决策技术运用到人员数量庞大、产业结构复杂、企业部门多的企业人力资源实际工作之中，实现对企业中海量人员的人力资源决策，并为其他方面的决策技术研究提供理论依据和研究思路，为国家的社会主义经济建设提供技术支持[2]。

1 基于Hadoop大数据平台的人力资源决策技术

收集企业员工的基本信息，包括姓名、性别、年龄、居住地址、籍贯等，将这些信息设定表头按部门进行分组，并将划分好的数据按照部门上传到Hadoop大数据平台上，利用人力资源信息管理决策系统，基于员工的工作年限、受教育程度、专业技能水平等进行决策，该平台的操作页面[3]如图1所示。

根据图1可知，人力资源部门的管理人员登录到上述页面后，将所有数据进行整合，保证所有人员信息的完整性，然后将这些信息格式化统一，根据设置的决策指标建立一个决策树，比较企业员工之间的工作水平及业务能力。

1.1 分布式分类基础数据软件算法设计

当前大型企业中的员工数量较多，企业为增加经济效益和工作效率，对员工的业务能力和发展方向非常重视，因此在面对庞大的企业员工数据时，为了保证决策的合理性和准确性，利用Hadoop大数据平台将这些员工数据信息进行分布式处理。通过员工的受教育程度、实际工作经验、以往工作效率和业绩进行未来发展预测，从而有效地划分出员工能力等级，以此明确每个部门中的员工对企业未来发展的贡献值[4]。

在效益较好、发展较快、产业结构较为复杂的企事业单位中，每名员工都在不断变化，可以说企业人力资源相关数据信息每日都在变更，这就令人力资源信息管理部门收集和分析数据的难度增加，传统的数据平台无法精准地对这样庞大的信息进行准确查找和判断。而Hadoop为海量的人员数据存储和分析处理提供了新的解决方案，Hadoop基于一个开源框架，采用分布式的方法存储和处理大规模数据集，凭借其高容错性和可伸缩性的特点，利用名称节点维护命名空间层次结构和文件系统元数据，将命名空间和元数据存储在RAM中并定期刷新磁盘;数据节点在本地文件系统中存储人员信息文件数据，并定期向名称节点汇报数据存储模块的员工数据信息的变动情况。而分布式的数据处理方式需要利用循环神经网络，对员工信息进行序列处理[5]，该处理结构如图2所示。

通过图2可知，隐含层是该分布结构的核心，同时也是处理信息的地方。假设计入输入层的数据为[n]，隐含层的神经元数量为[m]，输出层的数据量为[r]。图2中利用[Q]表示输入层到隐含层的矩阵;[P]表示该网络中隐含层在[t-1]时刻下输出值在[t]时刻的权重矩阵;[O]则是隐含层到输出层的权重矩阵[6]。设在第[t]时刻输入到序列中的员工信息为[at]，输出的信息为[bt]，隐含层为[ct]，其划分公式为：

式中：[λ]表示激活函数;[β]表示激活函数中所有相关参数的数据集。前[t-1]时间下积累的人员信息[ct]和当前的员工信息[at]共同决定了在[t]时间的员工业绩工作水平等信息。忽略基本人员信息，只考虑员工考核信息进行传递，实现员工信息的分布式划分[7]。

1.2 设置决策指标

根据划分好的员工数据设立一个可供决策的指标，该指标建立在企业人力资源战略决策的目的和影响因素之上，对员工信息进行分析与确认，形成一个能支持人力资源基本战略决策，并能进一步筛选指标的集合，为实现人力资源决策做好铺垫。当前设立决策指标的方法有很多，包括综合分析法、属性类别分析法等，综合分析比较整理选用这些方法中优秀的部分，结合具体实际，以曾经使用过的对企业发展战略有影响的指标作为参考，重新设定新指标，此时的指标受到表1中的因素影响[8]。

通过表1可知，影响决策指标的因素包括内部自身影响和外部环境影响，因此建立一个人力资源决策指标初选集合[M=m1，m2，…，m20]，并用熵值来表示指标的离散度，建立原始数据矩阵为[A=kij×n]，[kij]表示第[i]个备选指标和第[j]个样本数据（其中，[i]和[j]均为[m]个非零自然数）。此时的熵值离散度为：

式中：[s=1ln n]，表示人力资源决策参考数据，[ei]表示第[i]个备选指标下的熵值。当[h]值越大时，说明该指标所能筛选的能力越大;当[h]值过小时则说明该指标设立不够精准，此时的指标对于人员信息的区分能力较小，要重新进行设定[9]。

1.3 构建决策树实现决策算法

人力资源管理决策模块中主要包括企业组织架构、员工信息以及人事事件管理三个子模块，建立决策树利用上述设置的决策指标对这三个子模块进行数据提取，实现企业人力资源的决策。该决策技术[10]的操作过程如图3所示。

企业组织架构中主要包含员工职务、职位、级别、地址以及工资等数据。该技术在Hadoop大数据平台中的系统界面选择相应的组织管理对象后，进行管理对象的信息维护，如员工姓名、开始日期、结束日期、备注、与其他部门的关系等，然后将这些资料保存，根据设定的决策指标进行自动匹配，生成一个决策人员所需要的组织架构树形浏览表。根据需要决策的目标，选择表头的筛选按钮，得到所需要决策的员工信息，同时，每一姓名下的人员入职时间、工作年限等信息通过数据透视表透视到与该表相关联的子表之中。同理，对企业的财务信息、生产和销售数据进行维护，保证企业信息和员工信息的同步[11]。该决策树采用决策树分类算法计算生成：