APP下载

基于关联规则方法的高校学生学业预警研究

2021-11-03余桢伟孙玉珠

电子技术与软件工程 2021年18期
关键词:挂科学业教学管理

余桢伟 孙玉珠

(江苏科技大学苏州理工学院 江苏省张家港市 215600)

随着高等教育普及化,高校教学管理迎来了新问题,大学生因无法完成学业而退学给个人和家庭都造成了很大损失。为了让学生尽早意识并解决学习中存在的问题,各高校建立了学业预警机制,基于教育大数据的学业预警研究成为了当下高等教育研究热点。大部分高校以往届学生的考试成绩作为主要数据来源,通过计算学生挂科门数或取得学分数,对比预警标准,考察学生是否会被预警。这种 “事后预警”无法对学生学业情况有效地跟进和及时反馈。

本文运用Apriori 算法分析数据来研究和构建学生学业预警模型,对学生挂科课程预警展开研究。以教务系统中的真实成绩数据为基础分析课程之间的关联关系。目的在于优化现有的学业预警机制,体现预警的时间预先性,分析课程成绩之间的关联度,辅助高校教学管理部门提高教育教学管理水平,帮助学生更好的规划完成学业。

1 数据预处理

1.1 数据提取

本文所使用的原始数据来自江苏某独立学院教务系统2016年以来所有学生的学业成绩数据。根据高校学生手册,将预警生定义为:学生每学期必修课程挂科数量在2 到4 门之间的学生定义为预警警示的学生;一学年必修课程挂科数量在4 门及以上的学生视为退学预警的学生。为便于探究,选取该校2017 级船舶与海洋专业(以下简称船海专业)学生学业成绩进行挖掘分析。在数据选取时除去学生补考和重修的成绩,只保留学生初修成绩。

1.2 数据标准化

在学生成绩表里,大部分课程是百分制形式(0-100 分),少数课程采用五级制(优秀、良好、中等、及格、不及格)。为方便数据标准化,将百分制统一转换成五级制。优秀、良好、中等、及格、不及格分别设定为:成绩大于90,成绩介于80 到90,成绩介于70 到80,成绩介于60 到70,成绩小于60。再将成绩数据基于学号进行行列互换。

1.3 成绩数据离散化

为方便后续分析,对转换后的成绩数据进行离散化处理。课程只列举10 门,课程与代码之间的对应关系如表1 所示。分别用A、B、C、D 和E 来代表课程成绩中的优秀、良好、中等、及格、不及格。

表1:课程与代码对应关系表

表2:离散化后的学生成绩数据

表3:船海专业预警学生成绩数据

并且为了简化表格,把表中列出的全部的课程用代码来表示,离散化后的数据表如表2 所示,以下为部分样本。

2 学生挂科课程关联规则挖掘

根据本文对学业预警的界定,在第一学期挂科两门及以上的情况需要予以关注。基于预处理后的学生学业成绩数据,得到预警警示学生的名单。将上述转换后的学生学业成绩表与预警警示学生名单关联,得到预警学生的成绩数据。对2017 级船海专业学生一学年里预警学生成绩数据进行代码化和离散化处理,取其中部分学生的13 门课程数据如表3 所示。

挖掘学生课程成绩为“E”(“不及格”)的课程之间的关系。设置最小支持度大小为50%,最小置信度大小为70%。因为这些数据是预警学生的成绩数据,所以挂科课程会很多,由表里面课程成绩为不及格的数据进行变换后得到事务数据库,再用Apriori 关联规则算法依次求出候选项集、频繁项集等。这里在课程之间先后关系限制和最小支持度与最小置信度的规则限制下,从这些频繁项集中得出对应的规则共14 条,抽选出若干条强关联规则来作以下分析。

规则1:{船舶流体力学1}→{船舶阻力与推进},该规则的支持度为100%,置信度为76.92%。支持度越大,说明在预警学生中该两门课程同时不及格非常普遍,且前置课程不及格导致后置课程不及格可能性比较大,为76.92%。

规则2:{船舶结构力学1} →{船舶阻力与推进}的置信度为76.92%,支持度为100%。说明当预警学生的船舶结构力学1 不及格时,该生的船舶阻力与推进也极有可能不及格。

规则3:{ 船舶流体力学1,船舶结构力学1 }→{船舶阻力与推进}的置信度大小为76.92%,支持度为100%。在预警警示学生里面,当船舶流体力学1 和船舶结构力学1 课程都挂科的时候,该生的船舶阻力与推进课程也极有可能会不及格。

由以上结果可知,在学生第一学期挂科的情况下,需要警示学生下一学期极大概率会不及格的课程,用以提醒教学管理部门要充分考虑好课程的先修与后继关系来调整安排授课计划,减少学生后继课程挂科的概率。

结合学生日常学业情况分析,一部分原因是部分课程作为先修课程难度较大,二是学生学习态度不认真,松懈了自己所修课程,老师需要及时地督促学生吸收理解所学知识,同时重视学生对基础知识的掌握。学校教学管理部门可以探索修订教学计划安排,加强学生理解专业知识的能力,强调基础知识的巩固。教师在教学上,学生在学习中都要高度重视先修课程的教学与学习。

3 Weka实验验证

在Weka 中运用关联规则算法对前面整理好的学生离散化成绩数据进行关联规则挖掘,找出学生被预警情况和挂科之间的关系,对前期样本挖掘结果进行验证。

将船海专业预警学生成绩离散化后的数据表导入Weka 后,在分类面板里面选择Associate 子面板,选择其中的Apriori 算法,修改属性设置,将其中的选项“output itemsets”选择为“True”,其他保留默认设置,执行数据挖掘。通过该实验挖掘出的相关规则如下:

对比分析以上结果,表示前面得出的学业成绩预警是有效的,样本挖掘结果可靠。在船海专业课程关系里,课程船舶流体力学1,船舶结构力学1 和船舶阻力与推进仍然是强关联规则。

4 结论

本文研究发现,教学管理部门和任课教师要高度重视先修课程的教学,尤其要注意有先修课程挂科两门及以上情况的学生,激励学生努力赶上,先修课程没有学好的情况下,虽然会加大后继课程的学习难度,但学生如能及时努力,也有机会达到学业合格要求。教学管理部门要在重视先修和后继课程之间关联关系的基础上制定教学计划,修订人才培养方案,更加科学合理的编排课程教学顺序。

猜你喜欢

挂科学业教学管理
艰苦的学业
教学管理信息化问题研究
音乐提升学生学业表现
树起学业担当之心
超级秀场 挂科
高职院校学生体育课程挂科原因分析与对策研究
基于校园卡消费预测学生挂科情况
35
小学体育教学管理七要点