民航安全信息管理人员能岗匹配测评研究*
2022-05-19杨诗琪徐碧晨
陈 芳,杨诗琪,徐碧晨
(1.中国民航大学 安全科学与工程学院,天津 300300;2.西安咸阳国际机场股份有限公司 现场运行中心,陕西 西安 710086)
0 引言
随着民航运输规模的扩大,民航业已成为数据密集型产业,但却存在绝大部分运行数据未有效利用,数据向信息转化程度不够的问题,面临“数据海量,信息匮乏”的困境。有效的安全管理高度依赖于安全数据收集、分析和综合管理能力[1],从安全数据中获取的安全信息可为管理人员制定安全决策、指导安全管理的具体行动提供支持[2]。民航局虽然对安全信息管理人员设立了准入要求,但并未对人员的数据分析、挖掘等能力做出要求,难以对安全管理决策提供有效的支持。因此,设立民航安全信息管理人员的岗位任职资格要求,构建准确、客观、高效的民航安全信息管理人员能力与岗位匹配测评模型,是提高安全信息管理水平的重要举措。
在民航安全信息管理能力的研究中,学者们从仅关注信息管理某一环节的能力逐步发展到关注信息输入到输出的全过程,从信息收集、信息分析、信息应用、信息共享等方面构建信息管理能力的指标体系[3-4];齐晓云等[5]认为个体的知识、潜在的职业精神等对安全信息管理工作的实施起着关键作用,从业务能力、基本知识等方面设计了人员胜任力模型并构建了安全信息管理人员的胜任力指标体系。但上述研究均将视角局限在传统信息管理层面,注重信息资源本身的管理和利用,较少关注于从信息中挖掘情报即挖掘有效信息的能力,已然难以满足大数据时代“数据驱动安全管理”的要求。
在能力-岗位需求匹配度的测量研究中,学者们一般采用直接测量或间接测量的手段。直接测量要求被调查者对其与工作的组织的匹配程度进行直接评价[6-7],一般为个人直接进行自评,具有非常强烈的主观性。间接测量则通过设置可直接测量的中间特征,并利用数学方法进行测量。传统的间接测量方法包括传统统计学方法、模糊综合评价方法等[8-9],为了适应大数据环境的要求,构建更加客观、精确、高效率的人员能力评价模型,有学者尝试将机器学习算法应用于人员能岗匹配测评中,基于BP神经网络(BPNeural Network,BPNN)构建人员能力评价模型[10-11],但单一BPNN模型结果往往参数取值不确定,稳定性较差,会产生较大误差。
针对上述问题,通过分析胜任力内涵,基于数据生命周期和信息处理层次结构理论,建立民航安全信息管理人员胜任力指标体系,为克服单一BPNN在模型精度和收敛速度方面的不足,引入贝叶斯(Bayes)优化算法对BPNN的超参数寻优,构建基于Bayes优化BPNN的民航安全信息管理人员能力评价模型,以期为民航企事业单位招聘、选拔、评价安全信息管理人员,提供理论依据。
1 民航安全信息管理人员胜任力指标体系构建
1.1 民航安全信息管理人员胜任力概念模型
随着世界各行各业对专业人员的综合素养和跨学科能力的要求逐渐提高,经济合作与发展组织、联合国教科文组织等国际组织认为人员胜任力的内涵为运用行业背景所依托的相关学科或专业交叉的知识、技能和态度解决复杂问题的综合能力[12-14]。
信息管理是以数据管理为基础、以信息流为管理对象的管理模式,而民航安全信息管理的目的是通过民航安全信息收集、分析和应用,实现安全信息共享,推进安全管理体系建设,从而预防民用航空事故发生[15]。因此,民航安全信息管理人员应具备的知识包括:数据科学知识和民航安全管理知识,这些知识能够为民航安全信息管理技能提供支撑。在大数据时代,“数据范式”成为信息管理的新研究范式,对数据进行挖掘、分析和利用以支持安全管理决策成为信息管理的核心[16],通过以上分析可知,民航安全信息管理人员胜任力的本质是数据素养[17]。依据数据生命周期理论构建素养模型能够很好地体现数据的流动过程,故基于“数据驱动的安全管理”过程[1]以及信息处理层次结构理论的数据-信息-知识-智慧层次结构[18],提出民航安全信息管理人员应具备的技能包括:定义问题或目标的能力、民航安全数据收集能力、民航安全数据挖掘能力、民航安全信息分析能力、民航安全信息应用能力、民航安全信息共享能力。最后,具有批判性思维等民航安全信息管理态度能够对技能起到导向作用。构建的民航安全信息管理人员胜任力概念模型见图1。
图1 民航安全信息管理人员胜任力概念模型
1.2 民航安全信息管理人员胜任力指标体系
根据1.1所构建的民航信息管理人员胜任力概念模型,在学者Wang等[17]对关于安全专业人员数据素养研究的基础上,构建民航安全信息管理人员胜任力指标体系,见表1。
表1 民航安全信息管理人员胜任力指标体系
2 民航安全信息管理人员能岗匹配测评模型
2.1 民航安全信息管理人员能岗匹配测评模型构建
由于民航安全信息管理人员胜任力指标体系具有高维度、数据具有小样本的特点,将BPNN用于民航安全信息管理人员能岗匹配测评模型中。又考虑到全局优化算法中的Bayes优化算法能够克服单一BPNN收敛速度慢、学习效率低,易陷入局部极小化的缺陷,能够提升模型的精度和收敛速度,采用Bayes优化算法,依据从未知目标函数获取的信息,找到下一个评估点,从而最快地达到最优解,能够有效地利用完整的历史信息来提高搜索效率,可以有效地对BPNN的超参数进行优化。构建的基于Bayes优化BPNN的民航安全信息管理人员能岗匹配测评模型,如图2所示。
图2 民航安全信息管理人员能岗匹配测评模型
表1(续)
2.2 民航安全信息管理人员能岗匹配测评模型步骤
2.2.1 数据收集及预处理
数据收集及预处理主要包括样本选取及数据收集、模型训练样本数据处理计算2个过程。
1)样本选取及数据收集
选取民航企事业单位从事安全信息管理工作的人员作为调查对象,通过问卷调查的方式收集调查对象各项胜任力指标的得分。
2)模型训练样本数据的处理计算
测评模型的输入数据为问卷调查收集的安全信息管理人员的胜任力指标得分,采用Min-Max法将测评模型的输入数据进行线性变换转换到[0,1]区间[19],如式(1)所示:
(1)
输出数据为人员的能岗匹配分值,由于该数据难以直接获得且胜任力指标体系呈现多准则与模糊性的特点,基于DEMATEL-模糊综合评价计算训练样本输出的能岗匹配分值,步骤[20]如下:
1)确定民航安全信息管理人员能岗匹配测评指标集C={c1,c2,…,cn};
2)确定民航安全信息管理人员能岗匹配的评语集V={v1,v2,v3,v4,v5}={非常匹配,较匹配,一般匹配,较不匹配,非常不匹配},采用百分制的方法使用定量集Q={90,80,70,60,50}对结果向量进行赋值,评价等级的定量标准见表2。
表2 评价等级的定量标准
3)计算民航安全信息管理人员胜任力指标权重。利用DEMATEL分析指标之间相互作用关系,计算指标权重集A。计算步骤参考文献[21]。
4)利用百分比统计法确定民航安全信息管理人员能岗匹配测评指标集对各评价等级的隶属度,隶属度集合为R=[ri1,ri2,…,ri5]。
5)计算民航安全信息管理人员能岗匹配分值,如式(2)~(3)所示。
B=A*R
(2)
E=B*QT
(3)
式中:B为测评指标的最终评价集;E为人员能岗匹配分值。
2.2.2 模型网络结构与参数确定
1)模型网络结构的确定
民航安全信息管理人员能岗匹配测评模型的网络结构由输入层、隐含层、输出层组成,每1层含有多个神经元,每层神经元独立存在。
在民航安全信息管理人员能岗匹配测评模型中,输入层的数据是民航安全信息管理人员胜任力指标体系的量化数据,输入层为民航安全信息管理人员胜任力模型指标,共有25个神经元。
输出层代表的是最后的结果,民航安全信息管理人员能岗匹配测评模型输出的是能岗匹配测评的量化值,因此输出层的神经元数量为1。
隐含层神经元数量经过反复测试最终确定[22],如式(4)所示。
(4)
式中:S表示隐含层节点数量;n为胜任力指标数量,即输入层节点数量;o表示输出层节点数量;k表示1~10之间的常数。
2)模型网络参数确定
为避免神经元的浪费,减少运算时间,选取newff函数自动产生初始权值与阈值。初始权值和阈值确定完成后,采用Bayes优化算法对其进行寻优,最终确定1组最优参数。
民航安全信息管理人员能岗匹配测评模型每层的连接,由激活函数决定。由于本文构建的测评模型用于回归分析,因此输入层到隐含层的激活函数选用非线性函数——双曲正切Sigmod函数,隐含层到输出层选用线性激活函数。
学习速率决定了权值和阈值的调整量,对于trainlm等函数建立的BPNN,为保持网络稳定性,学习速率一般在[0.01,0.1]。经过多次实验,选用自适应学习率的方法,学习速率为0.05。
3 民航安全信息管理人员能岗匹配测评模型验证
3.1 数据收集及预处理
数据收集阶段共发放2份问卷开展问卷调查。第1份问卷为民航安全信息管理人员胜任力指标影响关系问卷,问卷采用李克特五点量表,邀请6名专家对胜任力指标之间相互影响程度打分,用于计算胜任力指标权重。其中4名为民航单位具备5 a以上工作经验的行业专家,2名为开展安全管理研究15 a以上的学术界专家。
第2份问卷为民航安全信息管理人员胜任力调查问卷,选择民航各企事业单位不同年龄段、不同学历、不同从业时间的安全信息管理人员为调研对象,被调查者基于胜任力指标体系对自身的各项能力进行1~5分打分,收集的数据作为能岗匹配测评模型的输入数据。共收集问卷106份,有效问卷102份,使用SPSS进行问卷信效度检验,Cronbachα系数为0.808,达到0.7以上,问卷的一致性水平较高;KMO检验值为0.879,Bartlett的球形度检验sig<0.05,说明问卷通过效度检验。收集的民航安全信息管理人员胜任力调查问卷数据具有合理性。
运用DEMATEL-模糊综合评价计算102份训练样本的能岗匹配分值作为待评价样本的能岗匹配期望值,计算得到部分样本的能岗匹配分值见表3。
表3 部分样本的能岗匹配分值
利用式(1)对收集到的测评模型的输入数据进行标准化处理,准备参与民航安全信息管理人员能岗匹配测评模型的训练。
3.2 模型网络结构与参数确定
由2.2.2可知民航安全信息管理人员能岗匹配测评模型输入层的神经元数量为25,输出层神经元数量为1,根据式(4),隐含层神经元的数量在[6,15]之间。因此,分别设置6~15个隐含层神经元数量进行网络模型训练,除神经元数量外其余参数均不变。使用基于Bayes优化的BPNN迭代100次,计算网络模型输出的能岗匹配分值与期望的能岗匹配分值之间的误差,将该误差值作为选择最佳隐含层神经元个数的标准,误差值越小,网络模型的能力越优。训练误差结果见表4。当网络模型隐含层神经元的数量为11时,网络模型的拟合度最佳。模型初始参数设定见2.2.2。
表4 网络模型训练误差结果
3.3 模型训练与验证
将标准化后的民航安全信息管理人员胜任力指标数据作为样本输入数据,将基于DEMATEL-模糊综合评价计算得到的民航安全信息管理人员能岗匹配分值作为样本输出数据,利用scikit-learn的train_test_split() 函数将所有的102份样本数据按照0.8∶0.2的比例随机划分为训练集82份和测试集20份。由于民航安全信息管理人员能岗匹配测评模型的数据集属于小数据集,在数据集并非充分的情况下,训练过程选用5折交叉验证的方式能够大致反应模型的平均水平。
将20份测试集样本输入已经训练好的Bayes优化BPNN的民航安全信息管理人员能岗匹配测评模型中,将仿真输出的能岗匹配测评结果与测试集的能岗匹配结果进行对比,检验模型的泛化能力,评估模型效果,民航安全信息管理人员能岗匹配测评模型仿真值和期望值的对比如图3所示。
图3 测评模型的仿真值与期望值对比
均方根误差(Root Mean Square Error,RMSE)可以反映测评结果与期望结果在数值上的差异[23],通常RMSE值越小,模型回归效果越好。本文构建的测评模型RMSE为0.29;根据图3,民航安全信息管理人员能岗匹配测评模型在数值仿真和趋势拟合上均表现良好,验证了模型的可行性。
3.4 模型性能对比分析
在相同数据集上,对比基于Bayes优化BPNN与单一的BPNN计算得出的能岗匹配测评结果,对比结果见图4。模型的精度和算法耗时对比见表5。
图4 Bayes优化BPNN和单一BPNN的仿真结果对比
表5 模型的精度和算法耗时对比
由图4可知Bayes优化BPNN的民航安全信息管理人员能岗匹配测评模型的拟合程度优于单一BPNN的拟合程度,由表5可知Bayes优化BPNN的民航安全信息管理人员能岗匹配测评模型相较于单一的BPNN,模型精度得到了提高,算法耗时也显著减少,改善了单一BPNN模型不稳定、误差较大、收敛速度慢的问题。
将目前全局优化算法中使用最广泛的随机搜索(Random Searching,RS)优化算法和Bayes优化算法分别对BPNN进行优化,对比2种算法的优化效果,参数寻优的精度和运行时间对比结果见表6。
表6 参数寻优的精度和算法耗时对比
根据表6可知,Bayes优化的BPNN,整体精确度更高,参数寻优过程中的搜索效果更加稳定;而随机搜索优化的BPNN算法耗时相对更少,在数据规模比较大时具有一定的优势。由于Bayes优化算法涉及到复杂的数学计算,因而耗时更多,针对该问题,可以尝试优化计算资源,加快算法的运行速度。
4 民航安全信息管理人员能岗匹配测评模型实证研究
以来自不同民航企事业单位的5名安全信息管理人员为例,运用训练和验证完成的民航安全信息管理人员能岗匹配测评模型对其能岗匹配情况进行测评,并与利用模糊综合评价计算得到的结果进行对比。结果如表7所示。
表7 能岗匹配测评结果
从对比结果来看,基于Bayes优化BPNN构建的能岗匹配测评模型与模糊综合评价对能岗匹配测评的结果基本一致。说明该测评模型具备模拟专家经验思维的能力,可以适应专家的大脑思维处理样本数据,能够准确地反映安全信息管理人员能岗匹配实际情况。
5 结论
1)构建包括数据科学知识、民航安全管理知识等一级指标和掌握通用数据知识、掌握数据工具的使用等二级指标在内的民航安全信息管理人员胜任力指标体系,该指标体系不仅关注信息管理人员的统计分析、上报能力,也关注数据科学和民航安全管理学科的交叉以及民航安全数据信息流动的全过程,体现了大数据环境对民航安全信息管理人员胜任力的需求。
2)构建并验证基于Bayes优化BPNN的民航安全信息管理人员能岗匹配测评模型。相较于随机搜索优化BPNN,基于Bayes优化BPNN的测评模型 RMSE降低了0.02,准确度更高;相较于单一BPNN模型,基于Bayes优化BPNN的测评模型算法耗时减少了2.25,RMSE降低了0.053,明显地改善单一BPNN易陷入局部极小化和收敛速度慢的缺陷。