APP下载

基于BAS-SVM的学生学业动态预警研究

2021-01-28卢毅

微型电脑应用 2021年1期
关键词:天牛步长适应度

卢毅

(陕西学前师范学院 经济与管理学院, 陕西 西安 710061)

0 引言

大学生与高中生相比,其学习主动性和积极性有所下降,导致学业状态存在较大波动。如何及时发现大学生的真实学业状态并进行预警,可以从理论研究和教学实践两方面提升学生成绩和学校教学管理,价值巨大[1]。

关于状态预测与警示方面常规算法包括有决策树、聚类、关联规则和支持向量机等[2-4]。这些研究主要集中研究历史课程学习成绩对后续学习课程成绩的影响,以及生活习惯、家庭情况对学业状态的影响,但是综合生活特征和学习特征的学业状态预警的文献较为少见。本文在对支持向量机模型基本的参数(惩罚参数以及核值参数)对建模性能的影响的基础上,从对参数优化的角度出发,综合使用天牛须搜索算法,创新性的提出了基于SVM模型的BAS-SVM模型用于大学生就业状态模型的生成。在实验论证的过程中,通过与其他的预测模型(极限学习机和前馈神经网络算法)进行详细的比较后,发现本文提出的BAS-SVM算法可以更加准确的预测学生学业状态,有利于改善、调整主客观因素提升学业水平[5]。

1 BAS算法

作为经典的数据建模算法,BAS算法基于天牛觅食而建立的效率较高的群智能算法,算法的关键步骤如下[6-7]。

(1) 方向向量的明确

明确方向向量的目的是为了对天牛的搜索过程进行模拟,如式(1)。

(1)

式中,j表示空间维度;round()的作用为制作随机数。

(2) 确定天牛头部的左右触须的坐标值,如式(2)。

(2)

式中,设置函数值xr和xl分别表示天牛的左边触须和右边触须出现在t次的空间坐标值,其中t表示循环参数,d是常量值,左右侧触须的须距。

(3) 生成适应度的基本值,如式(3)。

(3)

式中,f(x)表示了适应度获取函数,fr和fl表示天牛的左边触须和右边触须与目前空间的位置比对适应度。

(4) 生成搜索步长,如式(4)。

δt=c1δt-1+δ0,dt=δt/c2

(4)

式中 ,δ值表示天牛搜索的最终步长值;δ0表示天牛基本初始化步长,向大取值;δt表示经过t次搜索后的步长的因子数值;c1、c2表示常量步长因子。

(5) 生成最新位置,如式(5)。

(5)

式中,sign()表示位置函数;δt仍然表示第t次搜索的步长因子。

(6) 判断是否符合预测的规则

主要通过当前位置的适应度的数值与前一次的空间位置适应度值的比较,如果位置更优则更新新的位置,相反的则不更新。

2 支持向量机

ξi≥0,i=1,2,…,n

(6)

(7)

3 基于BAS-SVM的学生就业动态预警

3.1 评价指标

为准确合理地实现学业动态预警,参考文献[8-10]的基础上,选择考勤指数、学习指数、成绩指数、“宅”指数和家境等5个关键指标作为学业预警的主要指标,并将学业预警结果划分为好、中、差三个等级,如表1所示。

表1 学业动态预警评价指标

3.2 适应度函数

在SVM模型中,核心参数g的主要作用于分类的准确度,而惩罚参数值C所影响的是模型控制方面的接近程度、误差大小和复杂度。惩罚参数值与模型准确度成正比,与泛化能力成反比。由于SVM模型算法与惩罚参数值的大小和核函数的关系紧密相关性,因此,引入了BAS算法,主要是对上述两个参数值的合理计算,来提升SVM模型的准确度,如式(8)。

(8)

式中,Total表示选择的样本集合数量值,right函数表示中分类合理的样本集。

3.3 算法主要流程

本文提出的BAS-SVM模型进行学生就业预警执行步骤如下。

(1) 第一步通过BAS算法,明确最优惩罚参数和核函数,选择步长因子c1和c1,并使用BAS算法计算迭代最优次数和当前循环量。将预先准备好的用于学业预警的准备数据分为训练样本、测试样本两种,分别用于本文提出的模型的生成和准确度实验。

(2) 执行迭代。首先设置t的值为0,同时对天牛的初始位置进行定义,选择最佳位置后,通过式(8)来完成天牛的左触须和右触须的位置计算。

(3) 循环结束后,将t的指针下一位,重复步骤(2),并计算出天牛左右须的适应度f(xr)和f(xl)。

(4) 将第三步生产左右须的位置值,带入式(5)中,更新位置xt,同时算出新的适应度值f(xt);

(5) 完成天牛最新位置的获得并更新值。做法为接受概率的数值P,引入式(6)首先判断如果f(xt)

(6) 进行判断,如果t

(7) 最后,获得最准确的预警值,通过最终一轮循环获得的xbest与fbest,使用式(8)计算最合理的惩罚系数C和核函数g,并在二者的基础上完成最佳学生学业预警值测速和核对。

4 仿真实验与结果分析

4.1 数据来源

通过实验,进一步完成本文提出的算法的测算,并对比其他经典算法,数据源选择陕西学前师范学院经济与管理学院各专业学生为研究对象,好、中和差等3种学业状态的样本数据各150组。不同学业状态样本数据,如表2所示。

表2 不同学业状态样本

操作系统为Windows10,CPU为Intel(R)Core(TM)i5-2400 4-core,主频为2.60 GHz,内存8 GB,仿真软件为Matlab2015(a)。

4.2 评价指标

对于学生学业预警的准确性提出了评价指标,使用准确率和误判率作为评判基本指标[11-12]。

(1) 准确率T:假设学业状态被正确识别的数量为A,而学业状态的实际数量为B,则学业状态评估的准确率,如式(9)。

(9)

(2) 误判率F:假设学业状态是第i类的实际数量为H,而将第i类学业状态误判为第j类学业状态的数量为W,则学业状态判断的误判率,如式(10)。

(10)

4.3 结果分析

为了验证学业状态预警的效果,将BAS-SVM和ELM[13]、SVM[14]和BP[15]经典算法横向对比,选择4.2节基于BAS算法获得参数:最大迭代次数gen=100,步长因子c1=0.997,c2=10,算法横向比对的值,如表3和图1-图4所示。

表3 学业状态预警结果

图1 BAS-SVM学业状态评估结果

图2 ELM学业状态评估结果

图1-图4中,“*”为学业状态的预警类别,“○”为示学业状态的实际类别,结合图1和图4的结果可以发现,通过本文算法的学业预警结果非常的精确的体现了实际的学学业状态,图例使用1代表学业较好、2代表学业一般、3代表学业差。在“*”与“○”重叠时,学业状态的预警分类值与现实的实际值完全相同,代表学业状态预警结果准确;在“*”和“○”不完全重叠时,说明预警状态与实际状态发生偏差,预警出现失误。由表3和图1-图4可知,采用基于BAS-SVM模型做出的学业状态预警结果的准确率高达97.12%,而误判率仅有2.88%,优于ELM的92.28%和7.72%,SVM的90.46%和9.54%和BPNN的86.35%和13.65%。与ELM、SVM和BPNN对比发现,BAS-SVM可以有效提高学业状态预警结果的准确率,为学业状态预警评估提供了新的方法和途径。

图3 SVM学业状态评估结果

图4 BPNN学业状态评估结果

5 总结

为提高大学生学业状态的预警准确度,在经典的SMV模型的基础上,调整核参数以及性能被惩罚的参数值,创建了改进的BAS-SVM的大学生学业状态动态预警模型。将BAS-SVM模型的输入变量为影响学业状态的5个关键KPI值(考勤指数、学习指数、成绩指数、“宅”指数和家境),经过模型运算后输出预警判断结果值。与ELM、SVM和BPNN对比发现,BAS-SVM可以有效提高学业状态预警结果的准确率,为学业状态预警评估提供了新的方法和途径。

猜你喜欢

天牛步长适应度
改进的自适应复制、交叉和突变遗传算法
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
天牛到底有多牛
基于随机森林回归的智能手机用步长估计模型
基于Armijo搜索步长的几种共轭梯度法的分析对比
黑黄花天牛
巨型昆虫——天牛
一种基于改进适应度的多机器人协作策略
基于空调导风板成型工艺的Kriging模型适应度研究
基于动态步长的无人机三维实时航迹规划