基于BP神经网络对大学生就业率预测模型研究——以四川卫生康复职业学院为例
2016-10-13李佳林
李佳林
基于BP神经网络对大学生就业率预测模型研究——以四川卫生康复职业学院为例
李佳林
四川卫生康复职业学院人文社科部,四川 自贡 643000
针对近年来大学生就业发展问题,以四川卫生康复职业学院2000~2015年就业率为依据,采用LMBP算法,构建人工神经网络预测模型,使用MATLAB实验仿真,预测大学毕业生的就业率。通过该网络的训练学习可知,该网络的最大误差为1.72%,满足预期要求;最后通过该模型预测了2016~2018年就业率分别为91.8659%、92.7938%、93.8210%,就业率预测模型研究为大学毕业生的就业指导提供了技术和理论依据,同时为政府和高校提供科学的决策依据。
大学毕业生;就业率;LMBP算法;BP神经网络;预测
大学生就业问题与专业性、行业性、综合性有关,而BP神经网络又具有非线性特性和自学习、自组织、自适应能力,因此本文以BP神经网络的LM(Levenberg-Marquadt)反传算法[1],结合四川卫生康复职业学院近16年的毕业生的就业率的数据统计,构建了基于LMBP神经网络的大学毕业生就业预测模型,并预测了未来3年大学生的就业率,为高校提供了可靠的决策依据和就业指导意义。
1 网络预测模型和LMBP算法
1.1 BP神经网络模型
BP神经网络也称为误差反向传播网络(Back Propagation Network),是1986年由Rumelhart和McCelland等科学家提出一种由非线性变换单元组成的前馈网络,是目前人工神经网络中使用最为广泛的学习算法之一[2]。
结构上,BP神经网络是一种典型的多层网络,分别是输入层、隐含层、输出层,层与层之间采用全链接方式,同一层单元之间无连接。输入层和输出层的节点数一般由实际的要求确定,而隐含层的节点数根据多次试验来确定。
1.2 就业率预测模型
一个隐含层的BP网络可以逼近任意一个连续函数,三层的BP网络可以完成任意的n维到m维的映射。
为此,本文采用三层BP神经网络预测大学毕业生的就业率,学习和训练已有的数据,找到输入与输出一种内在关系,从而建立起一种网络预测模型。如图1所示。
图1 BP神经网络结构
设计每层网络的神经元个数,由于是基于时间顺序的神经网络预测模型,将前3年数据作为一组输入向量,第4年作为输出向量,为此输入层的神经元个数确定为3,相应的输出层的神经元个数为1。对于隐元层神经元个数的确定,目前还没有统一确定的设计方法,目前普遍是根据经验和多次反复试验选择[3]。
根据经验选择如下公式进行设计:
本次就业率预测模型中,输入层到隐含层采用S型传递函数tan-sigmod,该函数能将隐含层网络输出映射到-1~1,且可微。隐含层到输出层采用线性函数purelin,拓宽网络输出。由于该预测网络训练采用LM反转学习算法,为此选用trainlm作为训练函数,加快收敛速度。
1.3 LMBP算法
传统的BP算法的修正权值是采用等量梯度算法,其收敛速度相对较慢,为此采用改进型的LMBP算法达到快速收敛。LMBP算法是利用二阶导数信息进行搜索,既具有拟牛顿算法的快速收敛,同时具有梯度算法的整体收敛性;该算法的改进大大提高了BP算法的学习效率,其修正式
式中:JJ=H,是网络误差函数对权值和阈值一阶导数的雅可比矩阵(Jacobi),是网络误差向量[6]。
2 实验仿真
2.1 样本采集与预处理
本次研究的样本采集是依据四川卫生康复职业学院近16年毕业生就业率,样本如表1所示。
为了适应网络输出,减少网络层之间的权值调整,提高网络的收敛速度,从而将样本进行如下归一化预处理:
表1 2000-2015毕业生就业率
本次设计的就业率预测模型中,前3年作为输入,第4年作为输出,为此将归一化后数据建立如下的样本,如表2所示:
表2 样本建立
2.2 建立训练预测模型
在样本中,以2000~2012年的数据,建立10组作为学习样本P,相应地建立10个监督目标样本T[7]。利用MATLAB的newff函数创建BP网络模型,源代码如下:
Net1=newff(minmax(P),[5,1],{‘tansig’,’ purelin’},’trainlm’);
网络训练的参数如下:
net1.trainParam.show=100;
net1.trainParam.epoch=1000;
net1.trainParam.goal=1e-4;
net1=train(net1,P,T);
2.3 网络学习
通过MATLAB的BP神经网络训练,图2可以看到该预测模型结构以及训练过程的不同参数,同时在图3的误差变化曲线图中发现,经过6次迭代以后就达到了性能要求1e-4。
图2 预测模型与训练参数图
图3 误差变化曲线图
2.4 网络仿真与检验
网络训练后,利用2013~2015年的3个样本来检验该预测网络:
Ptest=[0.9203-0.2717-0.5036
-0.27170.5036-0.5942
-0.5036-0.5942-0.5217];
相应的目标样本,即:
Ttest=[-0.5942-0.5217-0.4239];
利用MATLAB中仿真函数sim()检验预测网络模型,图4是实际值与预测值的误差曲线图。
其中“-+”表示真实数据,“-o”表示预测数据,从图3 中可以发现,2013~2015年的实际值与预测值的最大误差为1.7%,达到了均方误差的要求,说明该预测模型保证可靠的预测精度。
从图4的回归曲线中也可看到该预测模型就有很好的数据拟合能力。
图4 预测回归图
2.5 就业率预测
利用检验好的预测模型,分别对2016~2018年的大学毕业生的就业率进行预测,预测的结果为91.865 9%、92.793 8%、93.821 0%,可以看出就业率在逐年缓慢升高,其原因目前医疗行业还处于需求医务人员状态,该领域毕业生的就业情况相对较好。
3 结语
由于大学毕业生就业率问题具有非线性特点,提出了基于BP神经网络的预测方法。根据四川卫生康复职业学院近年来学生的就业率,使用了MATLAB进行仿真预测,通过已有的数据建立BP神经网络预测模型,经学习和检验,该预测就业率模型达到了预定性能指标,满足要求;同时通过该模型,预测了2016~2018年学院的就业率。由于大学生就业率问题与专业、行业背景等因素有关,在后续的工作研究中会加入这些因素,从而能更加客观地评价大学生就业率问题。
[1]张德丰.MATLAB神经网络应用设计[M].北京:机械工业出版社,2011.
[2]傅荟璇.MATLAB神经网络应用设计[M].北京:机械工业出版社,2010.
[3]马丹丹,于占龙,刘越.BP神经网络在大学毕业生就业率预测中的研究与应用[J].佳木斯大学学报,2014,32(5):751-753.
Research on College Students’ Employment Rate Prediction Model based on BP Neural Network——a Case Study of Sichuan Health and Rehabilitation Career Academy
Li Jialin
Department of Humanities and Social Sciences, Department of Humanities and Social Sciences, Career Academy, Sichuan Zigong 643000
For the employment of university graduates in recent years development, in Sichuan Vocational College of health and rehabilitation 2000-2015 employment rate as the basis by LMBP algorithm, artificial neural network prediction model is constructed, using MATLAB simulation to predict the employment rate of university graduates. Know learning through the training of the network, the maximum error of the network was 1.72%, meet the expected requirements. Finally through the model predicted 2016~2018 employment rate respectively 91.8659%, 92.7938%, 93.8210%, employment rate prediction model research for university graduates employment guidance provides technical and theoretical basis, at the same time as the government and Colleges and universities to provide scientific basis for decision making.
college graduates; employment rate; LMBP algorithm; BP neural network; prediction
F249.2;TP183
A
1009-6434(2016)08-0097-03