基于伴随式数据收集的多维教学数据挖掘研究
2020-09-14陆芸婷张德芬
陆芸婷 张德芬
(深圳信息职业技术学院 广东·深圳 518000)
教育大数据伴随式收集模式是指在教育教学活动中,当教师、学生等教育关联方由于教育活动产生教育数据时,借助全面、优质的教育管理信息系统,实时、动态地将各种教育数据收集并整理的特殊模式。在教育领域数据利用中,存在数据收集、数据处理以及数据挖掘方面的问题,通过较为简单的统计方式已经很难满足当前教育管理发展的实际情况和需要,和其他部门一样,教育部门也需要认真的分析这些数据,将其中蕴含的教育教学规律更好的挖掘出来,从而给教育教学策略的调整提供帮助,切实提高教学的实际质量。具体而言,本文着重于建立以“伴随式数据收集”为数据获取手段,以“多维图数据映射”为数据降维处理过程以及以“子空间数据聚类”为数据挖掘方法的教学分析。
1 多维度图数据模型
教育数据往往比较多,并且不同对象之间的联系往往是多个维度的,能够将对象交互多样性很好的体现出来。例如学生与老师之间的交互往往是多种维度的,如日常授课、课后辅导、电话沟通等。如图1 所示,(a)是真实世界中教师和学生之间的交互关系,其中五个对象之间存在的交互表示是通过虚线。以往的聚类算法会抽取不同分类的特征,并映射成为图的数据来进行挖掘,即将图1(a)中的交互区分为三类,分别是日常授课( 代表),课后辅导(——代表)以及电话沟通( 代表),映射成为图1(b)中的三个子图后分别进行单维度的聚类分析。
若是仅仅以聚类挖掘反应某种特定教育交互中存在的亲疏关系,那么这种较为简单的维度关系分析的时候,很难将对象之间的真实社会关系显示出来,我们应该在进行聚类挖掘的时候将更多维护交互引入进来,更有可能体现师生之间的亲疏关系。
图1 现实教育关系与复杂关系图数据的映射
本文将图中边类型称为维度,如图1(c)中有三个维度。不同维度的组合称为子空间,子空间共有2^d-1 种组合(d 为维度),如图1(c)中的子空间包括课堂授课、课后辅导、电话沟通、课堂授课+课后辅导、课堂授课+电话沟通、课后辅导+电话沟通、课堂授课+课后辅导+电话沟通共7 种组合。
图2 现实教育关系与复杂关系图数据的映射
图3 SCA 算法聚类示意图
2 伴随式数据收集的架构研究(见图2)
3 多维度数据挖掘
采用子空间聚类算法(Subspace Cluster Algorithm, SCA)对多维数据进行聚类,SCA 对子空间的图聚类过程如图3 所示,设聚类师生社交图数据中包含三种类型的边(课堂授课、课后辅导、电话沟通),即图数据维度为3。算法需要在三个维度上,自底向上分别对7 个子空间进行运算。即算法首先进行一维聚类(课堂授课、课后辅导、电话沟通),其次为二维聚类(课堂授课+课后辅导、课堂授课+电话沟通、课后辅导+电话沟通),最后是三维聚类(课堂授课+课后辅导+电话沟通)(见图3)。
4 教育数据的多维度聚类
对教育数据的聚类往往可以发现学习行为、能力相同的学生。党的十九大报告中也指出 “努力让每个孩子都能享有公平而有质量的教育”,这也就要求我们全面实施“因材施教”,为不同学生提供个性化教育,促进每名学生个性化成长。那么如何将学习能力相似的个体聚类到一起,或者说如何通过数据挖掘得到学习行为、能力相近的个体,即如何对这些多维度特征数据进行聚类就显得特别重要。通过挖掘可以更好的实现“因材施教”的目的,即针对能力相似的聚类提出特定的学习方案。