APP下载

网络教学平台学生学习数据分析

2019-07-31程泽凯佘星星谢宁宇

常州工学院学报 2019年2期
关键词:卷面学年聚类

程泽凯,佘星星,谢宁宇

(安徽工业大学计算机科学与技术学院,安徽马鞍山243032)

0 引言

网络教学平台是高校基于互联网构建的学习管理平台,丰富多彩的教学资源是网络教学平台的有力支撑。通过平台学生可以打破时间、地点的限制,随时随地获取知识。功能全面的网络学习平台不仅为学生学习带来方便,同时有利于教学人员和管理人员对学生进行教学与管理。随着网络教学平台的智能化发展,平台上的数据爆发式增长[1-2]。可以通过数据分析技术精确获取学生的学习情况,归纳学习风格[3-4],以利于教师适时调整教学方案,这对教学有着重要的意义。

数据分析是用适当的方法对收集来的大量数据进行分析,从中提取有用信息并且形成结论,从而达到对数据详细研究和准确总结的过程。早在20世纪就已确立数据分析的数学基础,而数据分析的实际操作直到计算机出现才成为可能,并得以推广。数据分析可帮助人们在实际应用中作出判断,以便采取适当行动[5]。k-means聚类算法就是数据分析的一种方法,其算法简单、收敛速度快、聚类效果好,加之网络教学平台有学生观看视频、访问、作业得分作为“基础分数”,没有明显的噪声点的影响,因此k-means聚类算法适用于学生学习风格分类的分析。

1 k-means聚类算法

k-means聚类算法采用分裂方法对数据集合进行分类,分类后同类元素之间的相似性高,异类元素之间相似性低,并且保证每一类中都包含一个或多个数据元素,每个数据元素只属于一个类。算法思想为:给定包含n个d维数据的数据集M={m1,m2,m3,…,mn}(M∈Rd),需要生成的簇数目为K,簇可表示为S={Si}(i=1,2,3,…,K),每个簇Si都有一个簇中心ui,以欧式距离作为判断标准,公式如下:

式中xj为每个簇中的数据对象。

k-means聚类算法是一个迭代过程,目标是使上述公式中的V值达到最小。其过程如下:

1) 从n个数据对象任意选择K个对象作为初始聚类中心;

2) 根据每个聚类对象的均值,计算每个对象与这些cluster的距离,并根据最小距离重新对相应对象进行划分;

3) 重新计算每个有变化聚类的均值;

4) 循环步骤2和3,直到每个聚类不再发生变化为止[6]。

2 学习风格设计

原始数据通过网络教学平台采集而来,分为静态数据和动态数据。静态数据为学生基本信息,包括学生姓名、学号等,动态数据则为学生的视频观看信息、课程访问信息、作业提交信息以及卷面成绩信息。

对获取的动态数据进行统计分析,归纳出事实标签:视频观看时长、访问时间及次数、作业完成质量、卷面成绩。然后对标签进行数值化处理,给出对应得分。最后将数值化后的标签应用于k-means算法模型中,得出相关分析结果,由此归纳出学生学习风格[7]。

3 学生学习数据分析

3.1 数据预处理

采集2017—2018学年网络教学平台120名学生“数据结构”课程的学习数据,选取视频得分(满分75分)、作业得分(满分15分)、访问得分(满分10分)、卷面成绩(满分100分)4个属性数据,去除异常数据(如缺考),预处理结果(节选)见表1。

3.2 聚类结果分析

对预处理后的数据用k-means聚类算法进行分析,随机产生初始聚类中心,聚类数设为5,当迭代次数为6后,所有中心的最大绝对坐标不再发生变化,初始中心间的最小距离为25.752[8]。

最终聚类中心与每个聚类中的案例数见表2。

分析表2,可将学生归纳为以下5类学习风格。第一类有43人,占总学生人数的39.5%,总体学习情况良好,学习态度端正,网络平台学习效果显著。第二类有1人,占学生总人数的0.9%,这类学生学习能力强,思维活跃,培养周期短,教师可邀请其加入科研竞赛团队。第三类共37人,占总学生人数的33.9%,这类学生成绩处于中间水平,需加强平台访问,提高作业完成率,教师可在平台多发布问题、作业,并发起讨论。第四类共19人,占学生总人数的17.4%,这类学生成绩处于中下水平,应加强视频学习、课题训练,教师应注重激发其学习兴趣。第五类共9人,占学生总人数的8.3%,这类学生相比前几类学生,视频得分处于中间水平,但卷面成绩最低,是“挂科”重点对象,他们没有重视课程学习,放松对自己的约束,教师应对其进行学业预警,加强正面引导[9]。

表1 数据结构课程学习数据预处理结果(节选)

表2 2017—2018学年最终聚类中心表

除第二类学生外,其他类学生的视频得分区别甚微,因为视频得分在平时分的占比最大,要求较高,大部分学生会按时完成视频观看要求,所以分值相近;相对于视频,作业和访问在平时分的占比偏小,而作业、访问得分与卷面成绩正相关,因此这类要求更能体现学生的学习态度,是决定卷面成绩的重要因素。

3.3 由聚类结果改进教学方案

从上述分析结果可见,对于中等学生,课程参与度是决定其成绩的重要因素。另外,判定学生平时成绩的指标应适当增加,以全面多维衡量每一位学生。为提高学生成绩,教师对2018—2019学年“数据结构”课程的教学方案实施了如下改进。

1)增设课程讨论、签到、测试作为评定平时成绩的指标,课堂签到有效节省了教学的时间成本,课程讨论计分则鼓励大家积极参与到课程的讨论学习当中,调动了学生学习积极性。

2)将平时成绩组成由上学年的视频(75分)、作业(15分)、访问(10分)改进为视频(50分)、作业(20分)、访问(10分)、签到(5分)、讨论(10分)、测试(5分),以重视对学生学习态度的评价。

3)设置课程积分,课程积分由分组任务、课堂测验、问卷调查及抢答4个模块组成。分组任务即教师布置任务,学生自愿分组合作完成,以培养学生分工协作能力,教师根据每组任务完成情况打分。课堂测验即教师在课堂上发布小测验,根据测验的实际情况打分。问卷调查即调查学生关于课程学习相关困难、感受等问题,参与调查的学生可以获得相应积分。抢答即教师在平台发起问题,学生在规定时间抢答,抢答名次靠前且作答正确的学生才能获得相应的积分。

2018—2019学年“数据结构”课程结束后,统计卷面成绩,结合网络教学平台下的课程学习数据,得出新一轮的聚类结果,见表3。

2018—2019学年聚类结果与2017—2018学年对比可知,实施新的教学方案后,第一类学生占比增加,且卷面分值有所上升,说明这类学生通过“数据结构”慕课的学习以及线下实际课堂的学习,取得了优异的卷面成绩。2018—2019学年,第二类学生占比较大,后三类学生占比很少,说明多数学生成绩是较好的,新教学方案使得更多学生参与到学习中,解决了学生视频观看不足、访问少、讨论少等常见问题,提高了学习成绩。

表3 2018—2019学年最终聚类中心表

4 结语

“互联网+教育”的深化发展,使得网络教学平台愈发彰显活力,为学生提供了丰富的学习资源与自由的学习空间。与此同时,网络教学平台产生的学习数据与日俱增。文章应用聚类分析方法对网络教学平台的学习数据进行分析,归纳出5类学生学习风格,完成了对学生学习风格的初步探索。后期将进一步利用学习数据刻画更为详细的学习画像,让网络教学平台产生的数据为教师改进教学方案等提供更多的参考。

猜你喜欢

卷面学年聚类
大学专业课平时成绩评定的创新模式
——以卷面加分为例
“全国第17届可拓学年会”征文启事
第二届星火学年
基于K-means聚类的车-地无线通信场强研究
考试分
基于高斯混合聚类的阵列干涉SAR三维成像
杨浦区老年大学举办2015
——2016学年期末汇报演出
卷面
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法