APP下载

基于K-Means的社会扩招学生在线学习行为分析

2022-12-09阮进军汪祥舜

产业与科技论坛 2022年1期
关键词:聚类算法高职

□阮进军 慈 尚 汪祥舜

一、研究背景

国家从2019年开始实施高职院校扩招计划,越来越多的退役军人、新型职业农民、高中毕业同等学历背景的学生进入高职院校学习,相对于高职院校传统生源而言,他们的年龄跨度,教育背景、学习方式和学习能力等方面的差异性更加突出。在线教学平台由于具有课程教学资源丰富、学习时间和学习方式灵活等特点,能较好地适应高职院校扩招学生的学习需求,因此众多高职院校将在线教学平台运用到社会扩招学生的教育教学过程中。但是在线教学平台在实际应用中,存在着一些共性的问题,例如教师和学生缺乏互动,教师无法准确掌握学生的学习状态,不能对学生进行个性化辅导;宽松的学习环境容易导致部分学生不能规律性地完成课程学习,存在突击学习的情况,学习效果不好。因此,对在线教学平台中大量学生在线学习行为数据进行挖掘和分析,可以促进教师优化在线教学资源的设置,改进在线教学方法,提升学生在线学习的效率和效果。本文将构建基于K-Means算法的学生在线学习行为分析模型,通过分析在线教学平台中的学生学习行为数据,建立学生学习行为与学习状态之间的关系模型,帮助教师更好地掌握学生在线学习的状况,提高学生在线学习的效率。

二、K-Means聚类算法

K-Means聚类算法具有简单易行、可扩展等特点,是聚类分析中较为常用的一种算法[1]。它利用迭代求解的方式,通过计算每个对象和各聚类中心距离的方法,将对象划归到与之距离最短的聚类中心,每次迭代结束后,聚类中心都会根据当前聚类中的所有对象被重新计算,直到所有对象中没有被再次重新分配到不同聚类的对象(或小于指定的阈值),聚类中心无变化(或小于指定的阈值)。K-Means算法的流程[2]如表1所示。

表1K-Means算法流程

三、基于K-Means的在线学习行为分析方法与步骤

(一)社会扩招学生在线学习行为数据采集及预处理。通过某职业技术学院在线教学平台为2019级社会扩招学生开设的教学课程,对学生的在线学习行为数据进行采集,获得了学生学习各门线上课程时的所有访问与操作信息以及课程的考核成绩信息。学生在线学习行为的具体属性比较多,包括学员课时学习记录、观看视频记录、作业完成情况、查询搜索课程资料、查询话题列表、发布话题、回答话题、笔记记录、浏览课程公告等,每个具体的学习行为属性字段结构都比较复杂,例如学生的课时学习记录的数据表结构如表2所示,因此首先要对每个学习行为数据进行第一步分析和筛选,去除不需要的字段,保留必要字段。上述学员课时学习记录行为数据可以只留下userId、courseId和learnTime,即学员ID、课程ID和学习时间。最后为了确保数据的完整性、一致性,再使用自然语言处理技术来对原始数据进行预处理,

将经过文本预处理后的数据,以结构化的形式存储在数据库中,便于后续的分析和处理[3]。

表2 学员课时学习记录字段

(二)社会扩招学生在线学习行为分析。基于K-Means的社会扩招学生在线学习行为分析过程分为分析聚类阶段和行为类别判断阶段,分析过程如图1所示。

图1 基于K-Means的社会扩招学生在线学习行为分析过程

1.分析聚类阶段。本次研究抽取了某职业技术学院2019级887名社会扩招学生1个完整学期的在线教学平台《计算机应用基础》课程学习行为数据,首先经过初步预处理后存储在数据库中,利用数据挖掘技术与学生的成绩关系进行相关性分析,从而发现并选取与成绩正相关较大的属性特征。经过分析,我们保留了课时学习记录、观看视频记录、作业完成情况、发布话题、回答话题、查询话题列表6个特征属性,作为社会扩招学生在线学习行为特征的研究属性,形成了待评价的学生学习行为特征数据集,然后再选取不同的K值,利用K-Means聚类算法对学生的学习行为特征数据进行多次聚类分析,本例中当K=4时聚类效果较好,最终将2019级在线学习《计算机应用基础》这门课程的社会扩招学生划分为4种类型的学习群体,我们分别用ABCD进行表示。具体情况如下:

A类学生人数最多(517人),占总体学员总数的58.29%,这部分学生基本都能完成课程学时学习,作业完成度较高,但是互动环节比较欠缺,尤其是主动发布话题和回答话题的积极性不高,学习成绩大部分处于中等水平,我们把他们标注为被动学习型。

B类学生有115人,占比仅次于A类学生,标注为主动学习型。这个类型的学生不仅能完成课程学习和作业,同时会经常浏览和查询论坛中的各类话题,但是主动发布话题的积极性不高,学习成绩大部分处于中等偏上水平。

C类学生标注为学习落后型,他们的特点是能勉强完成基本的课程学时学习,观看视频记录较差,作业完成度较低,几乎不参与任何互动环节,学习成绩基本上都比较差。

D类学生人数最少,我们标注为学习积极型,这一类学生大部分能做到反复观看教学视频,高质量完成作业,积极参与话题的互动,尤其是能主动发布话题,积极回答其他同学提出的各类问题,他们的学习成绩大都能达到优秀等级。

2.行为类别判断阶段。首先提取需要判断的某个学生《计算机应用基础》课程近一个学习周期的学习行为数据,经过初步预处理后选取和上一步分析聚类阶段相同6个特征属性,再计算该学生的学习行为特征数据与上一步得到的4个聚类中心的距离,将与之最近的聚类类型定义为该学生当前的学习行为类型。根据这个学习行为类别的判断结果,教师可以掌握学生的在线学习状况,对于B和D类型的学生,他们的学习习惯和学习状态只需要继续保持即可,对于A类学生教师要加强与他们的互动,提升他们主动学习的积极性,对于C类学生,教师则需要经常提醒他们增加在线学习时间、提升学习效率,必要时要对他们进行学情预警,防止这部分学生不能按时、按要求完成课程学习。

四、结语

为了帮助教师更好地掌握高职院校社会扩招学生在线学习行为状态,本文提出了基于K-Means的社会扩招学生在线学习行为分析模型,该模型能根据学生在线学习的历史数据,帮助教师分析和掌握学生的学习行为状态,以便及时调整课程在线教学方法,提升学生的在线学习效率。

猜你喜欢

聚类算法高职
战“疫”期间基于高职线上教学的分析与思考
基于K-means聚类的车-地无线通信场强研究
Travellng thg World Full—time for Rree
高职应用文写作教学改革与创新
进位加法的两种算法
基于高斯混合聚类的阵列干涉SAR三维成像
一种改进的整周模糊度去相关算法
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
一种基于L-M算法的RANSAC图像拼接算法