基于人工神经网络技术的药学专业学生考研成绩预测探究
2023-03-31李思鲁澄宇
李思,鲁澄宇
(广东医科大学,广东湛江 523808)
人工神经网络(Artificial Neural Networks,简写为ANNs)是20世纪80年代以来人工智能领域兴起的研究热点。人工神经网络从信息处理角度对人脑神经元网络进行抽象,建立某种简单模型,按不同的连接方式组成不同的网络。人工神经网络是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。人工神经网络模型能使用单元节点模拟神经元,通过调整内部大量节点(神经元)之间相互连接的关系,从而达到处理信息的目的[1-3]。
数据挖掘(Data Mining)能采用数学、统计、人工智能和人工神经网络等领域的科学方法,如记忆推理、聚类分析、关联分析、决策树、神经网络、基因算法等技术,从大量数据中挖掘出隐含的、先前未知的、对决策具有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程[4-5]。数据挖掘是从大量数据中寻找其规律的技术,数据挖掘主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
随着信息技术的发展,探索新的学习方式、教学方法以及建设数字化校园成为当代教学工作的重点。随着无纸化办公的深入,越来越多的数据信息存储在服务器内,如何合理、恰当、有效地运用信息技术,从海量的数据中提取并发现有用的信息,为教育教学提供参考依据,成为当前急需解决的新问题[6]。
考试成绩是对学生学习情况的检查和评定,它从一个侧面反映了学校教育的成功与否。近年来,随着高校学生考研需求的逐年增长,学生考研成绩评估成为评价教学质量的一个重要依据。运用人工神经网络技术能构建学生考研成绩数据库,分析学生的考研成绩,找出对成绩影响较大的因素,对学生的考研成绩作出一定的预测,为学生填报志愿提供指导,提高考研录取率,这将对改进学生的培养方式和提高教学质量带来很大的帮助。
本文基于数据挖掘思想构建学生的考研成绩数据库,通过人工神经网络技术来进行研究分析,探究学生的学习成绩蕴藏的规律。
一、数据的采集
本文的实验数据收集了广东医科大学药学院2015、2016、2017级药学专业学生的考研成绩及相关主干课程的成绩。考研成绩为总分。依据药学专业人才培养方案中的课程设置,笔者参照选取了相关主干课程成绩:药理学、药物化学、药剂学、药物分析、天然药物化学、药用植物学与生药学、生物药剂学与药代动力学专业课成绩和有机化学、分析化学专业基础课成绩(建立模型时统称为专业基础)。本研究建立了药学专业学生的考研成绩数据库和分析数据库,通过人工神经网络技术对学生的成绩进行分析。
二、模型的建立
一个典型的人工神经网络由一个输入层(input layer)、多个隐藏层(hidden layer)和一个输出层(output layer)构成。神经网络的第一层称为输入层,被设计来从外部接收各种输入;神经网络的最后一层称为输出层,输出处理结果;位于输入层和输出层之间有一到多个层称为隐藏层,神经网络大部分由隐藏层构成。
根据药学专业主干课程的设置,模型选取了药理学、药物化学、药剂学、药物分析、生物药剂学与药代动力学、无机化学、有机化学、分析化学8门课程的成绩作为输入,以考研总分和专业基础课成绩作为输出,从159名学生样本中随机抽取109名为训练集,50名为验证集,从而建立人工神经网络模型,如图1所示。模型包括输入层(8个神经元)、隐藏层(6个神经元)和输出层(2个神经元)。8门主干课程的成绩通过输入节点输入之后,再经过隐藏层的数据处理,最后在输出层节点得出输出值。
图1 基于人工神经网络的考研成绩预测模型
三、预测结果分析
药学专业学生的专业基础课程成绩和考研总分成绩预测结果如图2所示。通过图2可以看出,预测值与实际值之间的差异大小可以通过观察预测值与实际值之间的差异来评价模型。由图2可以看出,模型的预测性能能较好地通过检验。
图2 预测-实测图(专业基础)
图3 预测-实测图(总分)
对输入数据正态化可以保证神经网络的输出对各参数的梯度(导数)间不会相差过大,使我们仅用一个学习率的改变就可以满足各参数的更新,达到模型的稳定。正态化是改进模型收敛性的工具。根据自变量重要性(见图4)和正态化重要性(见图5)的分析结果可以看出,模型选取的药物化学等8门课程的正态化重要性较好,基本能保证预测模型的可操性和稳定性。
图4 自变量重要性
图5 正态化重要性
四、结束语
综上所述,人工神经网络模型对考研成绩的预测具有较高的准确性,说明本研究整体的技术路线可行。人工神经网络模型能通过药学专业药物化学、药物分析、药剂学、生物药剂学与药代动力学、有机化学、药理学、分析化学、无机化学等主干课程的成绩去预测考研成绩。人工神经网络模型能找出对学生成绩影响最大的因素,学生可以根据自己主干课程的成绩去预测自己的考研成绩,从而判断自己的考研策略[7]。教师要进一步了解学生的学习情况,及时对主干课程进行调整,对课程教学内容进行优化,对教学方法进行改革,不断提高教学质量,从而满足学生的学习需求和发展需要。教师要对学生的考研成绩作出正确的预测,给学生填报志愿提供指导策略,提高考研录取率。人工神经网络模型能为高校教师管理各项教学工作、指导教育教学实践、更客观地评价教学质量的效果提供依据,也能为职能部门的正确决策提供科学的理论依据。