基于K-means聚类分析的在线教学评价指标体系研究

2021-07-29李成友李德奎冯兴无

绿色科技 2021年13期

李成友，李德奎，冯兴无

(1.聊城大学计算机学院，山东聊城 252000;2.聊城市教育和体育局，山东聊城 252000)

1 引言

随着新的教学技术的不断涌现，出现了很多新的教学形式，但是课堂教学依然在教学形式中占有基础地位，对高校教学工作有重要意义。同时，线下线上融合教学已经成为课堂教学的一种新趋势，作为教学活动的重要组成部分，教学评价受到学校以及教师的重视。教学评价有利于教师对教学思想以及教学内容的重新认知，教师能够根据评价的结果来改变自身的教学方法以及教学内容，鼓励教师使用新的教学理论，激发教师在课堂教学中的积极性和创新性。而且教学评价能够使教师认识到自身在教学工作中的成效和失误，总结经验，有利于教师之间进行交流学习，提升自身教学能力。

因此，高校教学评价体系建设是当前教育教学改革发展的趋势，科学的评价体系对提高教学质量、促进教学管理具有极其重要的意义。但是，传统的教学评价大多都采用了问卷调查以及质性调查方法，带有很强的主观性，使得评价的主题以及主体较为单一、评价内容不能及时反应教学内容等问题[1]。因此需要建立可以随着教学变化而变化的动态评价体系。

随着线上教学的不断深入发展，线上辅助教学已经成为教学环节中不可或缺的重要内容，线上教学中的所有内容以及教师和学生的所有行为都存储在数据库中，有必要挖掘这些数据库中的知识，使其应用于实际教学中[2]。但是线上教学平台在设计之初基本沿用了传统的教学评价方法，仅仅在最后的教学结束后使用问卷调查的方法来对教学进行评价，没有建立基于教学数据的评价体系。

本研究基于此，在收集了超星泛雅在线教学平台的教学统计数据后，通过对数据的分析以及教学评价指标的文献研究，得出基于在线教学统计数据的教学评价指标体系建设流程，通过数据挖掘中比较成熟的K-means聚类算法对数据进行体系化建模，建立了可实际操作的、可解释的在线教学评价指标体系。

2 文献研究

2.1 教学评价

教学评价是教学活动的必要环节，教师能够从教学评价中发现自身教学活动中的问题，可以判断教学方法是否合理、教学策略是否科学，通过教学评价的结果探讨现行的教学理论能否支撑起课堂教学，有助于促进教学理论的发展，完善和健全教育体系。

教学评价的实施对教学改革和教学管理等一系列教学工作都有一定的指导作用，选择合适的评价方法对教学评价工作的实施非常重要。传统的教学评价多采用定量与定性分析相结合的方法，如基于学生问卷的统计分析法、基于专家意见的层次分析以及模糊综合评判法、以及在学期中对学生的访谈法等方法[3]。虽然现有的评价方法形式多样，但是学生的问卷以及专家的意见带有一定的主观性，而且由于传统的评价大都只能在学期结束后进行，这就存在评价内容不能真实体现教学内容、评价反馈不及时等缺点，得到的结果也不够科学准确[4]。因此，需要建立一套客观的,可以随着课堂的进展而动态变化的真实反应教学行为的评价体系及流程。

2.2 在线教学评价

在线学习平台记录了大量教师与学生的学习行为数据，其中包含教师与学生的教学和学习投入、教学与学习和认知过程等信息。这些数据反映了教师在在线教学中为了实现教学目标而进行的备课、课堂进行以及监督等行为，是教师为了实现教学所付出的努力，这与教学过程、绩效等直接相关，是教师的整体教学经历，这些数据为优化教学过程、提高学生学习体验提供了重要依据[5]。因此可以将这些行为数据进行分析、挖掘，得出一定的对教学有用的信息。

Chen等[6]融合灰关联理论(GRA)、模糊关联规则、K-Means聚类算法和模糊推理四种计算智能理论，得出了一种学习绩效评估系统。利用这个系统，教师能够了解影响学生学习成绩的根本原因。Talavera和Gaudioso[7]运用聚类分析挖掘学习者信息用来找到可以体现用户行为的有效模式，并且基于协同管理方案提出了模型，可以在非结构化的合作空间中表现相似行为群体的特性。

目前，有些高校已经运用数据挖掘的方法去分析数据库里的各种数据，期望寻找出一些影响学校发展的相关因素，认识如何评价整体教学以及学校发展之间所存在的关系。本研究使用比较成熟的K-means聚类算法对超星平台统计数据进行聚类，得出可以解释的在线教学评价指标体系。

2.3 超星平台后台数据

超星泛雅平台的智慧课堂系统可以将教师的PPT、作业、MOOC、视频、文档等资料存储在云端，教师可以通过系统向学生发送各种信息，系统以课程为中心、教师为主导、学生为主体，充分关联教室已有硬件，可以覆盖多种教学模式。教师可以进行签到、选人、抢答、分组教学、主题讨论等教学活动。

超星泛雅平台有自己的大数据分析系统，包括大数据屏、大数据移动端以及大数据PC端，但是大数据分析系统主要的目的在于对教学内容与活动的统计与分析，帮助管理者了解学校的情况，并没有针对教学评价的模块。

本研究所提取的超星平台数据统计了所有的有关教学的指标，总指标数有93个，排除与课堂行为信息无关的指标后，与课堂相关指标有80个。为综合评价教师的教学，需要对这些指标进行分解或是合并。同时教师在使用平台时，并不是所有的指标都用到，但是也不能说这个指标以后用不到，因此需要建立一个动态的可以调整的评价指标体系模型。

3 K-means算法介绍

3.1 K-means算法

K-means算法也称之为均值算法，是聚类分析中比较成熟的方法，其中心思想是在欧几里得空间中划分个数据对象，通过初始中心策略实现对象选择，使其成为聚类中心。再对其他对象计算和每个质心距离，使用最近的归类，再次对每个簇数据平均值进行计算，能够得到全新聚类中心，对此过程反复进行迭代计算，直到全部聚类收敛，具体算法流程如表1所示。

表1 K-means算法流程

一般来说，聚类数的确定是K-means算法的重要部分，很多研究根据行业的经验来确定聚类数，但是这种方法带有主观性，结果不一定是数据的真实聚类数，因此研究领域会使用数据自身来确定真实的聚类数。通过数据自身来确定聚类数的方法有2种，一种是误差平方和(SSE)方法，另一种是轮廓系数法。

3.2 误差平方和(SSE)方法

SSE方法的原理是，随着聚类数的增大，每个簇的聚合程度会逐渐提高，误差平方和SSE自然会逐渐变小。由于k的增大会增加已经发现的簇的聚合程度，当k小于可能的真实聚类数时，SSE的下降幅度会相应变大，而当到达理论可以到达的聚类数时，再增加k的化，所得到的聚合程度的回报会相应变小，进而的下降幅度会发生很大的下降变化，然后随着值的继续增大而趋于平缓，SSE公式如式(1)。

(1)

式(1)中,ρ是Ci中的样本点，ci是第i个簇，mi是的Ci中所有样本的均值。

3.3 轮廓系数法

该方法是以确定样本的轮廓系数S为目标，某个样本点Xi的轮廓系数S定义如式(2)：

(2)

式(2)中，α是Xi与相同簇的其他样本的平均距离，称为凝聚度，b是Xi与最近簇中所有样本的平均距离，称为分离度。

求出所有样本的轮廓系数后再求平均值就得到了平均轮廓系数。平均轮廓系数的取值范围为[-1,1]，且簇内样本的距离越近，簇间样本距离越远，平均轮廓系数越大，聚类效果越好。这样平均轮廓系数最大的便是最佳聚类数。本研究同时使用2种聚类数的标准，并选取其中较为合适的为聚类标准。

4 数据分析流程及结果

4.1 数据分析流程

由于一次聚类的结果不一定可以被解释，因此本研究使用了循环分析的流程，首先确定聚类数后进行K-means聚类分析，得出结果后再与现实情况相比较，如果得出的簇过小或是不能被解释，将其删除后重新进行聚类分析，直到得出可以接受的解释结果的最终指标后停止分析。具体流程如图1所示。

图1 数据分析流程

4.2 数据分析结果

首先对超星平台统计数据进行预处理后，确定聚类数。由于教师使用超星平台的方法不一，平台的很多功能部分教师没有使用，因此为保证聚类的结果，本研究比较了和轮廓系数法对聚类数的不同结果。第一次全部数据的聚类数分析结果如图2和图3所示。结果显示，方法仅仅将聚类数分成了2类，而轮廓系数法分类的结果为11个类别，轮廓系数更能体现数据之间的关系。因此第一次的数据聚类K值的确定使用11。

图2 SSE方法簇的个数结果

图3 轮廓系数法的簇的个数结果

图4为第一次K-means的结果，结果显示第一次聚类结果仅仅将一些奇异值区分开来，没有真正意义上将结果聚类，因此将奇异值放入未解释结果中，将剩余变量继续进行聚类分析。

图4 第一次聚类结果

经过3次聚类分析后，80个指标被缩减成了31个，共提取了5个维度作为最终在线教学指标体系，结果如表2所示。

表2 聚类分析最终结果

课堂教学离不开教和学两部分，一部分是教师对课堂以及课程的建设，另一部分是课堂中的与学生的互动以及对学生的监督，本研究的结果验证了这一点。通过3轮K-means聚类分析，将80个指标减少到31个，并且聚类成5个可解释的维度。其中课堂整体建设为教师在线对课堂的整体规划设计与建设，可以用设置了多少章节、上传了多少资源(特别是视频资源)、章节的资源数是否合理、发放了多少通知来具体测量。课程的整体建设可以解释为对课程的章节内容、PPT文档数以及作业的数量。教师的主动性可以解释为教师在在线教学中控制授课的能力，主要表现在主动发帖、章节测验、考试次数、问卷回收率、课堂互动的活动数以及提供其他课堂资料的数量上。教师在线互动是教师与学生的互动情况，主要解释为讨论、回帖、抢答数量等。最后是学生的互动，可以解释为学生参与在线授课的主动性，可以用课程互动活动数、总讨论数、总回帖数、学生讨论数、学生回帖数来测量。