APP下载

聚类算法在学生成绩分析中的应用

2019-07-21夏雪龙志雄

活力 2019年10期
关键词:聚类算法教学改革

夏雪 龙志雄

[摘要]学生的成绩以分数的形式体现,对学生的评价也主要依据成绩分为优、良、中、差四类,但这四类的区分为人的主观定义,不能准确的区分学生之间的差异。本文使用k-m eans聚类算法对学生的学习成绩进行分类,得到合理的学生分类方式以对差别化教学提供基础支持。以信息与计算科学专业某班学生的成绩为蓝本,使用聚类算法对成绩进行分类研究,并根据研究结果提出教学改革方案。

[关键词]聚类算法;学生成绩;教学改革

引言

大学生的学习成绩是评判其学习好坏的一个重要指标,尤其是没有工作经验的应届毕业生,学习成绩是求职的敲门砖,直接影响着学生能否通过企业的初步筛选。如何提高大学生的学习成绩是众多教育工作者研究目标,对于教师而言,提高学生的整体成绩最为主要的是是因材施教,因材施教的前提是对学生成绩有一个准确的分类。传统分类方法是主观设定一个区段将学生的成绩单纯地分为优、良、中、差四类,这种分类方法并没有考虑学生成绩的聚集性,无法准确地区分学生之间的差异,进而根据这种分类而进行因材施教并不一定具有良好的效果。

本文使用K-means聚类算法对学生成绩进行划分与评价,充分考虑学生成绩的区域相似性,按照特定的规则将学生成绩区分为样本区间,同区间的学生更具备相似性,进而根据该区间学生的特性进行教学,此分类方法将在一定程度上弥补了传统方法的缺陷,有助于教学人员更好地进行教学优化,以提高学生整体成绩。

一、聚类思想

聚类是将一组个体根据相似性归成若干个类别,使得同一个群组的个体样本相似度尽可能小,而不同群组内的个体样本尽可能大的分类方法。聚类分析是通过聚类算法来发现有意义的聚类,主要依据是将相似的样本归为一个类,而把差别大的样本区分开,这样尝试的簇是一组数据对象集合,这些对象与在同一个簇中的对象相似,与其他簇中的对象相异。聚类的三个要素是:相似性测量、聚类准则与聚类算法。

二聚类算法对学生成绩的处理

(一)数据预处理

论文中的数据来源于以文理系2015级信息与计算科学大二学期的期末考试为例,数据以Excel表格形式存在。学生的成绩每学期都有8~10门专业课需要进行考查,成绩都是百分制。然后进行数据集成,是把多数据库运行环境中的异样数据进行合并处理,解决语言意思的模糊性。再进行数据清洗,除去数据中的无关数据,处理遗漏的数据和清洗脏数据,去除空白数据,考虑数据变化。将清理过的数值转化为有用值,大多数课程都是百分制的,如果成绩不是百分制,就把它转换为百分制相对应的数值或其他的分数值。

(二)聚类处理

把处理后的数据导人SPSS软件,利用K-means聚类算法,首先把学生的成绩进行分析,初始的聚類中心随机产生,K-means聚类算法首先要确定聚类数目,分别将聚类数目定为4,5,6。分别求出在不同聚类数目下,各组全部数据与聚类中心的平均分如表1所示。

在各聚类数目下,各类中各个成绩与聚类中心的方差以及方差均值如表2所示。

(三)聚类结果分析

利用聚类分析对学生成绩进行处理之后,发现将学生分为4类最合适。将聚类数目定为4时的最终聚类中心为表3

根据聚类算法将学生分为4类时,平均方差最小,根据聚类算法结果可以得出第一类别的学生属于较低水平,分数刚好在及格线左右徘徊,针对这类学生需要的就是对基本知识的掌握不够,需要多做一些练习。第二类学生成绩属于中等水平,成绩都能及格,对于这类掌握了基本的知识但是需要进一步的提升,需要增加知识面,掌握整个知识结构与脉络,可以让这类学生跟其他学生讲课,促进对知识的理解。第三类学生是有些偏科的学生,某些课程少于60分,这类学生需要教师在课堂上给予一些关注与帮助。第四类学生是各科都比较优秀的学生,对于这样的学生,老师可以给予一些课堂的自由,让他们自己可以专研自己感兴趣的知识点。

猜你喜欢

聚类算法教学改革
数据挖掘算法性能优化的研究与应用
K—Means聚类算法在MapReduce框架下的实现
基于K?均值与AGNES聚类算法的校园网行为分析系统研究
中职学校“生本课堂”的调查研究与实践
高校三维动画课程教学方法研究
基于人才培养的技工学校德育实效性研究
现代信息技术在高职数学教学改革中的应用研究
以职业技能竞赛为导向的高职单片机实践教学改革研究
微课时代高等数学教学改革的实践与探索
基于改进的K_means算法在图像分割中的应用