基于BP神经网络算法对学生学习行为预测的研究
2021-01-16周喜
周 喜
(集美大学 诚毅学院,福建 厦门 361021)
随着社会的发展,学生的行为越来越受到家庭及学校的重视,BP神经网络算法的出现,能够对学生的学习行为进行预测,在很大程度上减轻了教师的工作量,对于学生学习行为的评定具有十分重要的意义。随着教育改革的深入,人工神经网络被应用于教育领域,例如,学生建模、个性化学习计划及学生特征分组等,充分证明了在当前的教育环境下BP神经网络算法的运用对于学生行为的预测产生较为理想的效果。
1 BP神经网络算法
人工神经网络是自组织能力和初步适应的总称。学生在参与教学活动中,通过方式的改变来突出权重值,以此来适应环境的变化。即使在一个局域内,因为各种因素的影响,所体现的功能也不尽相同。通常其训练学习的方式有如下两种:(1)有教师演示教学的学习,样本通过学习后在给定范围内进行分类和模仿学习。(2)学习者进行自主教学,学习方式需要进行提前设置,具体的学习内容不固定,主要是由输入信号情况来进行决策。系统能够主动总结环境变化规律和特征,运行机制更加接近于人脑的运行机制。与以往采用的学习评价方式相比,BP神经网络算法的运行结构和处理机制更加完善,采用平行结构和并行处理,能够同时确定多个评价项,减少了评价片面性带来的负面影响[1]。在进行远程学习过程中,系统通过学习者的显性行为数据(如等量化数据、浏览、检索、提问、下载、讨论),来完成学习者的隐形数据(如效率、态度、方式、反思、偏好、自控力等数据)的分析,运用BP神经网络算法综合分析和评价学习者学习行为,并将评价结果反馈给学习者。
2 以BP神经网络算法为基础,预测学生学习行为
2.1 BP神经网络结构
BP神经网络结构包含了隐含层、输入层和输出层等。Robert充分证明了任一BP神经网络隐含层数值都能够接近目标函数中所围成的区域内,因此,目前设计的三层BP神经网络能够实现任意n维到m维的完整映射。所以,本文以建立的三层BP神经网络为预测模型。而隐含层神经元数量由公式决定,式中a为调节常数;ni为输入层神经元个数;no为输出层神经元个数。通常情况下,高等院校将学生所处专业某一学习科目10次平时学习行为表现得分作为输入项,期末平均行为成绩作为输出项,网络结构为10—20—1。高考中教师在对学生高考考试行为的预测时,通常以5次月考中学习行为作为输入项,高考考试行为作为输出项,网络结构为5—8—1。
2.2 BP神经网络应用过程
设输入层的输入值为X1,X2,....Xi,Xno,而隐含层的某个神经元的输入公式为式中:
wij:输入层神经元i与隐含层j之间的权值
θj:隐含层神经元j的阈值
g():隐含层神经元的激活函数
本文采用的是tansig函数。
wjo:输入层神经元j与隐含层o之间的权值
θj:输入层神经元o的阈值
g():输入层神经元的激活函数
本文采用的是线性传递purelin函数。
2.3 神经网络训练过程
人工神经网络术语生理学范畴内的脑神经网络,最初的定义是大脑结构中的神经元,主要是控制着人类的活动以及行为,后来随着生理学的发展,开创了仿生生物学,模仿神经元的一些功能构建了人工神经网络模型,该模型主要是对信息进行针对性处理的算法模型。截至目前,各领域专家还未对其形成明确的解释,只是进行概括性的定义,最为权威的定义是:“神经网络是一种并行的分布式信息、处理结构,由处理元件与单向信号通道互连而成,能够处理信息的计算机系统。” 通过神经网络的训练能够实现阀值与权值的反复修正,确保误差函数值E达到理想数值,本次运用的是梯度下降法,通过调整使E减小的速度最快。
人工神经网络结构中包括了Hopfield神经网络、BP神经网络和RBF神经网络等,RBF神经网络无法以具体的数据来体现预测的过程,同时还缺少主要的预测依据,Hopfield神经网络在预测过程中,存在着信息传输速度缓慢现象,其性能也不如另外两种神经网络完善,仅能对直观的行为进行简单预测。而BP神经网络结合了另外两种神经网络的优点,具有较强的映射能力,在结构上可分为三层网络和多层网络。如果结构中神经元数量具备足够的规模,能够使其接近任何非线性函数。
与此同时,BP神经网络具有对输入信息延伸记忆和应对外界环境变化记忆功能,这归功于其在构建的过程中采用了分部并行的处理模式,在信息采集过程中引入了信息联想功能,能够将网络中全部的神经元利用起来。BP神经网络还能通过预先处理的方式进行适应性调整,能够完善采集而来的信息,同时消除干扰信息的影响。
3 预测的流程及模型
在线行为评价的意义在于为教师提供学生行为的预测,同时为学习者下一阶段的学习提供参考。通过系统的测评来对远程学习的学生进行行为指导和提示,以此来提升教学效果。在目前我国开展的网络教育中,学习者在参与远程教学过程中需要登录在线学习平台,在线行为评价系统通过对学习者相关数据的采集来获得学习者的显性数据,例如,作业提交的频率、学习时间、每个页面停留的时间、浏览的媒体类型数目、资源浏览的时间、登陆次数、上传资源的次数、作业的质量等。本文根据我国某院校424名学生C语言课程行为作为学习行为预测的样本数据和某学校868名学生的考试行为作为期末考试行为预测的样本数据。对于学校学生期末考试行为和大学课程行为预测,都需要将样本数量中的70%作为训练样本,剩余的样本作为测试样本,BP神经网络预测结果则是依赖于输出和输入的相关性。期末考试行为预测过程中,输入一般截取的是考试前某段时间内五次模拟考试行为得分,而且选取的五次考试行为考核均属于正式考试,所以模拟考试能够真实地反映学生的实际情况,而且与考试的关联度也较为密切。大学课程行为预测过程中,输入则是选取某学期十次平时作业的上交及质量,由于选取的时段较长,而且学生在完成作业过程中无法判断是否有外界因素影响,因此与期末考试行为的关联度不理想[2]。与此同时,在样本数量上,期末考试行为的预测样本数量要远多于大学课程行为样本数量 。所以,根据BP神经网络算法应用于学习者行为预测的过程中所得到结果的准确度来看,需要大量的样本和训练样本作为保障。为了验证该方法的准确性,可将BP神经网络算法结果与传统最小二乘回归进行对比,根据对比结果来进行误差的预判。根据预判的结果来看,不管是进行哪种行为预测,传统最小二乘回归预测方法的准确度都不如BP神经网络算法预测准确高。
学生学习行为预测研究中,关联度的引入解决了诸多复杂问题。BP神经网络算法中的关联度主要作用是研究学生群体间关系,简单地讲就是“什么与什么相伴”。例如,喜欢做应用题的学生更倾向于喜欢学习物理学中物体运动的知识,这即是关联。这种方法在BP神经网络算法中称为购物篮分析,随着学习平台的建立,使得教育者在数据传输中断存储大量有关学生的行为信息,这为预测学生学习行为提供了数据参考。关联度是在学生大量的学习数据中总结其关联关系,关联度最终表示的是数据集中体现与其他行为关联的规律。例如,80%的语文成绩好的同学英语成绩也十分优秀,根据关联度能够使学生学习行为预测提供准确参考。目前,世界各国学者已经总结了多种关联度数据挖掘的方法,公认最为准确的是Agrawal和Srikant提出的Apriori关联规则算法,这种方法主要是关于对商场数据库中挖掘顾客行为关联的问题。我国学者对其进行了深入研究,同时还在教育领域进行的应用。例如对该方法进行了优化,应用领域也在不断扩大,这其中包括金融、教育、民生等领域,针对研究的课题也进行了分类。关联度主要是根据变量的种类进行划分,主要分为量化型和布尔型。布尔型的属性是离散化的形式。例如,某学科考试行为只有存在不合格与合格两种,代表选项间是否存在关联。具体预测程序:{语文考试行为不合格)=>{离散语文行为不合格}。量化型表示量化的项或者称为数值型的关联度。例如,{学习行为成绩:85-100,性别:女}=>{优秀学生}。与此同时还可建立多维关联关系。Aprior算法由于其他算法主要是其具备了简单理解、算法简单和推导步骤不繁琐等特性。
本文进行行为预测的具体方式有如下几种:(1)如果以班级为单位,一部分学生的预测行为不理想,教师在通过与该部分学生交流的方式获取学生学习行为的动态变化,通过引导和举例子的方法来激发其转变学习思路进而实现学习成绩的提高。(2)在进行学习行为预测时,预测结果未达到预期,教师应从自身出发转变教学思路,激发学生学习兴趣。(3)该方法不仅可以预测学生学习行为,也可用于总结学生行为的结果,通过预测与实际结果的对比,来分析学生的实际学习情况。例如,是否存在作业抄袭、考试过程中学生心态发生变化,以及教学方法的是否存在漏洞。
4 BP神经网络算法的应用
根据BP神经网络算法存在的问题,重点对最优案例进行论证,根据应用的实践来使预测结果的准确度得到有效提高。在日常应用的过程中,利用BP神经网络算法建立人脑活动模型,确保其具有自训练学习能力和大规模处理信息的能力,进而实现其应用于股市预测、舆情预测和销售预测等。与此同时,在应用于实践过程中,由于我国网络舆情危机构成的预警研究初具雏形,可通过与BP神经网路算法融合,构建完善的预警指标体系,进而突出该体系的防范功效,进而转入到非线性关系演算程序,打破局部的最小值误区(选择全局搜索、优化算法),最终实现其具有联想和样本记忆的功能。
以2018年河南省文化领域网络舆情处理为参考案例,通过媒体进行数据整合,将教育、媒体和文体作为该次事件的重点分析对象,通过BP神经网络算法来对民众行为进行预测。在这一过程中,经过网络预测的云联,根据网络舆情传播阶段与网络舆情危机等级结合的趋势,不断对BP神经网络算法的阀值和初始权值进行调整,同时结合预警模型所占据的数据比例和MATLAB工具箱,实现预测方法精准度的提高,减少真实结果与预测结果的偏离程度,使其更具普适性。
以2010年影响大学生心理健康的各个因素为例。在同一标准层次下,根据BP神经网络模型预测出的2010年影响大学生心理健康的各个因素可见,对个人前途的担忧和情感经历是影响大学生学习行为的重要因素,与此同时,父母的过高期望也导致了学生对前途的担忧进而影响到了大学生的学习行为,对于高考成绩感到不理想以及家庭收入低等其他因素对学生的学习行为影响较小。
在此过程中需要对数据展开分析,目前我国已进入信息化社会,信息革命浪潮不断充斥着整个中国社会,同时民众的工作、学习和生活也都离不开信息技术。与此同时,各领域的发展也愈加重视信息技术,信息化已经成为社会发展的主旋律,尤其是在教育领域,大量教学软件的出现,极大提升了学校的教学效率,数字化平台的建立已经成为教育改革的主要方向,目前建立的教学平台中都存有学习者学习行为的痕迹,其中包括学习时间、学习任务及考核成绩等。但这些数据却未受到校方的重视,造成数据无法发挥其作用。因此,需要运用数学统计等方法对这部分数据进行整理,将转化成提升教育工作者开展教学工作和学习者学习效率的信息。教育数据研究已受到社会各界的广泛关注,这为BP神经网络算法的发展提供了机遇。总体来讲,开展数据挖掘工作的主要目的是对学习者学习数据进行分析和挖掘,根据分析结果来预测学生的行为。能够根据学习者过往的行为规律来预测接下来学习行为趋势。总而言之,其出现使学习行为预测更加智能,为教学者下一步开展教学工作提供借鉴,并且将其反馈给学习者。
在此之前,数据挖掘工作还不够完善,只是通过学习者近期表现来进行学习行为预测。例如,病人去医院看病,诊断时医生会说“你可能患有什么样的疾病”,其实这就是预测,无法完全确诊。医生主要是根据患者的症状进行预测,这其中还涵盖了提炼、总结和分析等过程,这也充分表明了人类能够根据事物规律进行相关性的预测。BP神经网络算法是集合了心理学、教育学、统计学和计算机科学的一门综合性学科,通过这些技术的综合应用来实现对学习者行为的预测。
5 结语
BP神经网络算法的出现,对学生行为预测的意义十分重大,但该预测方法也存在问题,例如,下降梯度机制的存在导致了收敛速度缓慢,存在着局部预测不准确的现象。在学习者日常学习过程中,可通过改变学习率、新增动量项、结合遗传算法、退火算法和采用其他梯度优化算法等方式来进行优化。除此之外,该方法已经应用于各个领域,尤其是网络舆情危机演示,为学生的学习行为进行预测提供了值得借鉴的经验。