大数据挖掘班级薄弱点的软件实现
2020-08-31严剑陈粤晖韩建保姚颖筠
严剑 陈粤晖 韩建保 姚颖筠
一、大数据数据挖掘班级薄弱点的可行性和必要性
我市10多年来在高三模拟考试运用网络化阅卷,大大提高了阅卷效率。但针对海量的阅卷数据还处于粗略统计层面,每次考后很少有针对班级甚至个人进行精准诊断分析,数据利用率比较低,非常可惜,为此我们课题组对此进行深入研究。
尤其是针对高三学生考试存在的薄弱点进行针对性的教学,的确能快速有效地提高学生的学习效率和学习成绩。而如何快速精准地找到班級学生的薄弱点,则成为我们普通教师教学工作中的一个难题。
我们已经有了海量的阅卷数据,通过对每一位学生、每一学科、甚至于每一道考题进行挖掘,可以对全市每一个班级(学校)的成绩数据进行精准分析量化诊断出每个班级乃至每位学生的薄弱点,供各科任课教师有针对性地查漏补缺、因材施教。因此,我市开发出一个有针对学生知识薄弱点的分析系统势在必行。
二、“网络阅卷知识薄弱点分析系统”开发环境及系统功能介绍
考虑到目前大多数教育工作者已经能够较熟练运用Excel。因此,本系统的开发选用了Excel+VBA环境开发,目前已完成以班级(学校)为单位进行诊断,其针对性较强,功能相对简洁。其Excel界面结构如图1所示:
三、算法原理
“薄弱点”并不是指班级(学校)的学生得分率低的知识点,因为得分率低未必是学生水平低,很有可能是题目难度大。因此,我们在所有知识点中找出“应该得分而未能得到”或者“应该得到某个分数但明显低于该得分”的部分,这就是薄弱点。按照该班级(学校)、学生能力水平(可简化为“总分”)对应全部学生应该获取的得分率明显低于其总体水平,这说明它的出现与该学生的实际水平有较大差距,属于可纠正的范畴。经过长期大量的探讨研究和数据分析,初步确定了各校各班薄弱点数据的计算方法如下:以某校某次生物考试成绩为例,其公式引用4个数据,a是该校生物的平均分,b 是全市生物的平均分,a/b表示该校生物在全市中的占比;c是该校生物第1题的平均分,d 是全市生物第1 题的平均分,c/d表示该校生物第1题 在全市中的占比;再比较a/b和 c/d,如果(a/b)/(c/d)<=80%就说明第1题是该校明显薄弱环节。
四、系统实现
(一)原始表格结构
为使系统能满足各科各类考试成绩的录入需求,经过调查研究,将原始表格表头设计为“学校”“班级”“题号”“总分”共四大字段。其中“题号”部分统一采用“T1”“T2”…等标号来表示各题。具体状况如图2所示:
(二)以“班级情况分析”为例具体代码实现
(1)为提高程序运行效率,将原始数据导入数组处理。如图3所示:
(2)先求出全体学生各题总平均分并输出,如图4所示:
(3)以学校为单位分类统计各校各题平均分并输出,如图5所示:
(4)根据公式以学校为单位计算各校薄弱点数据,具体代码如图6所示:
将薄弱点数据以红色加粗字体显示,代码如图7所示:
最终结果如图8所示:
同样的原理,可以实现“班级情况分析”,最终效果如图9所示:
五、结束语
至此,基本完成了预订目标,经过多个学科、多次考试试运行,效果良好。满足了在大数据环境背景下,利用本系统快捷、高效、智能地分析各班各校各科薄弱点的基本要求。解决了一线教育工作者因进行大量而繁重的数据分析处理而带来的巨大工作负担和困扰。有效地各科查漏补缺、二次复习做了充分的准备。
参考文献:
[1]基于大数据与云计算技术的精准教学平台实践应用,李岸,谢松兴,盘俊春,中国信息技术教育,2019.8
★ 基金项目:江西省教育科学“十三五”规划课题《基于大数据挖掘的高中学科知识薄弱点诊断分析的应用研究》,课题编号:18ZXZD008