APP下载

企业人力资源结构的GA-SVM预测

2010-07-23成立芹

统计与决策 2010年2期
关键词:遗传算法染色体种群

赵 辉,成立芹

(中国民航大学 经济与管理学院,天津 300300)

0 引言

企业人力资源结构取决于企业总产值、经济效益、员工总人数等因素,企业人力资源结构预测明显具有非线性的特点。对企业人力资源结构预测常用的方法有回归分析法、指数平滑法、成长曲线法、外推法等[1]。这些方法所共有的特性就是需要写出常规数学规划模型,并且需要人工确定一些参数。因此,预测难度较大,精度也不能保障。支持向量机(Support Vector Machine,SVM)理论是预测领域的一项新技术,在解决回归分类和回归问题方面都表现出优良的性能[2],在预测领域最常用到的是V-SVM[2]。V-SVM中惩罚系数C,不敏感系数v,核函数参数σ的选择,对SVM的效果具有显著的影响,对这些参数的选择还主要依靠经验、实验对比、大范围搜索或者利用软件包提供的交互检验功能进行寻优[3,4]。遗遗传算法(Genetic Algorithm,GA)是一种模拟生物进化理论的全局搜索策略,具有搜索效率高、鲁棒性强大特点,能很好地克服神经网络的缺陷[5]。

本文采用遗传算法对v-SVM进行参数优化,构造了GA-SVM预测模型对企业人力资源结构进行预测,并采用某公司的实际数据对模型进行了检验,表明了模型的正确性和较高的预测精度。

1 v-SVM原理

对于给定的训练集其中T={(x1,y1),…,(xi,yi)}∈(X×Y)l,其中xi∈X=Rn,yi∈Y=R 按照(1)式进行回归预测。

式中K(xi,x)为满足Mercer条件的核函数。本文采用高斯核

参数 αi*,αi,b*采用 v-SVM 方法来进行求解,

2 参数对V-SVM的影响

参数C体现了模型复杂性与允许出现的拟合误差的关系,是对经验分享和置信范围如何匹配的一个裁决[6]。

参数v控制了函数中不敏感区域的宽度。v取值过小,则不存在能够正确预测的函数;v取值过大,支持向量个数会减少,回归曲线呈现平坦性,造成回归预测性能劣化[7]。

核函数参数σ在某种程度上反映支持向量之间的联系情况,σ太大或者太小都会使得预测误差增大[3]。

3 GA对V-SVM参数优化策略

遗传算法模拟自然界的优胜劣汰的过程,采用种群进化的方式逐步淘汰劣解,逼近问题的最优解。本文中,主要采用遗传算法对v-SVM的参数C,v,σ进行优化,其主要步骤为:

(1)确定变量取值范围

参数C,v,σ的取值范围可以参考文献[2,6]进行确定。

(2)种群初始化

将C,v,σ映射到GA染色体串,即一条染色体的结构为{C,v,σ}。 令 Ri(t)为第 t代的第 i个染色体,则 Ri(t)=(ri1(t),ri2(t),ri3(t))。初始种群中个体rij(t)的设计变量取其上下边界内的随机分布的浮点数,随机生成初始种群。

(3)适应度函数

对于给定染色体Ri(t),其适应度函数计算公式为:

其中:yi为样本真实值, y^i为 v-SVM 预测值,Ymax为 Ri(t)所在时代中Yi的最大值。

(4)交叉操作

对于两条染色体,随机选取染色体上一位,进行两两互换交叉操作,染色体的选择概率为(t))。

(5)变异操作

在染色体上随机选取一位,在其取值范围内随机取值进行变异操作,该操作有利于增加种群多样性,跳出局部最优值。

(6)选择策略

采用贪婪选择[5]的方法进行染色体选择。

计算连续五代染色体的平均适应度差值,如果最大差值小于差值下限或者进化世代数达到最大值,则停机,将种群中最优解作为结果输出,继续循环。

4 算法流程

GA-SVM算法流程如图1所示。

5 预测实例

采用中国船舶重工集团人力资源数据,利用GA-SVM模型进行预测。将企业人力资源划分为管理人员和科技人员两大部分。选取与人力资源结构有密切联系的四个因素作为输入的X值,即企业总产值、经济效益、职工总人数、离职人员比重,将管理人员和科技人员比重作为输出值Y。采用企业1988~1999年的数据作为训练集合,对支持向量机进行训练,利用训练好的模型对2000~2003年的数据 (如表 1所示)进行预测。本模型预测结果与采用文献[8]的神经网络算法(Neural Network,NN)的预测结果对比如表2所示。

表1 中国船舶重工集团公司2000-2003年有关数据

表2 预测结果对比

通过表2的对比数据,可以看出,本文模型对历年人力资源结构的预测精度较[8]的神经网络模型预测精度有不同程度的提高。

6 结论

针对人力资源结构预测问题,构造了GA-SVM数学模型。采用本模型对中船重工集团人力资源结构的真实数据进行了模型检验,并于神经网络预测结果进行了对比,表明了本模型对神经网络模型预测精度有不同程度的提高,为企业人力资源结构决策提供了一种新方法。

[1]G.P.Zhang,B.E.Patuwo,M.Y.Hu.A Simulation Study of Artificial Neural Network for Non-linear Time Series Forecasting[J].Computer&Operations Research,2001,(28).

[2]邓乃扬,田英杰.数据挖掘中的新方法-支持向量机[M].北京:科学出版社,2004.

[3]Cherkassky V,M A Yunqian.Selection of Meta Parameters for Support Vector Regression[C].Proceeding of ICANN2002.Verlag Berlin Heidelberg:Springer,2002.

[4]Cherkassky V,M A Yunqian.Practical Selection of SVM Parameters and Noise Estimation for SVM Regression[J].Neural Networks,2004,17(1).

[5]金鸿章,王科俊,何琳.遗传算法理论及其在船舶横摇运动控制中的应用[M].哈尔滨:哈尔滨工程大学出版社,2007.

[6]Kenneth P,Raner M,Jounia L.Differential Evolution:a Practical Approach to Global Optimization[M].Berlin:Springer,2004.

[7]Kwok J T,Tsang I W.Linear Dependency between and the Input Noise in Support Vector Regression[J].IEEE Transaction on Neural Networks,2003,14(3).

[8]王文富.企业人力资源结构的神经网络预测[J].天津大学学报(社会科学版),2005,7(1).

猜你喜欢

遗传算法染色体种群
山西省发现刺五加种群分布
基于双种群CSO算法重构的含DG配网故障恢复
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
中华蜂种群急剧萎缩的生态人类学探讨
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
能忍的人寿命长
软件发布规划的遗传算法实现与解释
基于改进的遗传算法的模糊聚类算法