APP下载

基于Apriori算法的教师教学评估关联性分析

2019-02-04吴肖肖

新教育时代·教师版 2019年40期
关键词:Apriori算法关联规则数据挖掘

吴肖肖

摘 要:本文主要基于关联规则的性质属性,选用Apriori算法,针对教师教学评估进行分析,挖掘教师的职称、学历与评估结果之间的关联性,然后以此挖掘出隐含规律和潜在价值。

关键词:数据挖掘 关联规则 Apriori算法 教师教学评估

关联规则实际上是基于频繁模式的挖掘,其中比较经典的一个案例就是有关啤酒和尿不湿的关联性分析。

“啤酒”和“尿布”两个看上去没有联系的商品摆放在一起销售、并获得很好的收益,这种现象就是商品之间的关联性分析。那么推及高校的教学管理,这种关联的发现同样也起到四两拨千斤的作用,特别是针对于教师教学评估的关联性分析,挖掘出隐含规律和潜在价值,为提高教师教学水平提供参考建议。

因此,本文通过针对教师教学评估分析来挖掘教师职称、学历与评估结果之间的关联性,找出学生更喜欢哪类教师,是学历高的还是职称高的。

一、数据采集

数据采集就是根据用户的需要,从原始数据里面抽取相应的数据建立数据挖掘库,作为挖掘任务的操作对象。本案例的数据采集对象是2015-2016第一学期的教师评价表作为原始数据。所以选取了全校现任专兼职教师84名,107门课程,145条记录的教师评价表。通过学校的吉利教育中心信息化平台,进入评教模块,导出教师信息表和学生评教表2个Excel文件。

二、数据预处理

数据预处理主要是针对原始数据中存在的噪声、重复等记录以及复杂的结构等情况来进行噪声消除、重复删除、类型转换等初步的整理,主要包括数据集成、数据清洗、数据选择三个方面。

数据集成:本案例的教师信息表和学生评教表是分别导出,因为要用到教师的职称、课程评分、学历等字段,所以需要将两个表合并到一起。

数据清洗:通过排序的方式,将本案例的原始数据中不完整的教师信息剔除。

数据选择:因为是针对学历、职称和课程评分等信息挖掘,其他字段没有意义,所以将教教师信息表中的性别、部门、出生年月等字段以及学生评教表的部门等字段删除。

三、数据转换

数据变换主要包括数据维数的降低,离散型与连续型数据之间的转换,以及将数据进行分类分组来寻找数据特征等。本案例的教师课程评分是连续型的数据,而Apriori算法只支持离散型数据,所以需要将连续型数据转换成离散型数据。本例采取的办法是分为四档,大于等于90分的为“优秀”;大于等于85分的为“良好”;大于等于80分的为“中等”;小于80分的为“一般”。以平均分为界,高于平均分的成绩标记为1;低于平均分的成绩记为0。

四、数据挖掘

确定算法是整个数据挖掘中最重要、最核心的一个步骤,其工作是根据挖掘任务寻找合适的算法,然后寻找合适的模式,最后给出这些模式合适的表示方式。本案例在SPSS Clementine工具里选用Apriori算法来建立模型。首先根据挖掘任务设计挖掘模型,简称“流1”。在“流1”中,首先,选取“教师评分汇总-转换后”Excel表作为源文件节点;其次,选取“类型”为中间节点,以便与数据库与模型之间建立连接;再次,选取“Apriori”算法为模型,与“类型”建立连接,其中由于用到了3个属性,所以命名为“职称&课程评分&学历字段”,另外,选取“网络”为模型,与“类型”建立连接,也命名为“职称&课程评分&学历字段”;最后选取“执行”分别得到“Apriori”算法模型和“网络”图形,通过模型评估与图形表示来进行结果分析。

五、模型评估与图形表示

1.模型评估

根据程序,点击“执行”选项,在右上方“模型”界面中生成挖掘结果“职称&课程评分&学历字段”,将其拖入“流1”界面,点击“类型”图标,右击选取“连接”出现连接箭头图标,然后点击“职称&课程评分&学历字段”Apriori图标,使得“类型”和“职称&课程评分&学历字段”建立连接。点击“职称&课程评分&学历字段”Apriori图标,得出挖掘结果一。

2.图形表示

单击“执行”按钮,生成挖掘结果二。

六、结果分析

1.由挖掘结果一可知

(1)课程评分优秀的教师,职称是讲师,学历是本科。

(2)课程评分优秀的教师,职称是教授,学历是本科。

(3)课程评分优秀的教师,学历是硕士。

(4)课程评分优秀的教师,学历是本科。

(5)课程评分优秀的教师,职称是讲师。

(6)课程评分优秀的教师,职称是讲师。

(7)课程评分优秀的教师,职称是教授。

(8)课程评分优秀的教师,职称是讲师,学历是硕士。

(9)课程评分优秀的教师,职称是副教授。

(10)课程评分良好的教师,职称是助教,学历是本科。

另外,对于中等、一般等课程评分情况的挖掘结果没有很好的展现,说明有些统计结果还是存在不小的误差,可能的原因,比如有的学生打分不够认真仔细。

2.由挖掘结果二可知

相互之间关联越紧密,频次越高,线条也就越粗,归纳起来有以下三个:

(1)讲师、本科和优秀

(2)讲师、硕士和优秀

(3)教授、本科和优秀

这个结果与前面规则生成的结论是完全相符的。

3.误差分析

(1)原始数据不够大。由于本案例只是针对2015-2016第一学期的教师评价数据挖掘,共涉及到84名教师,107门课程,145条记录,规模不是很大。

(2)资料更新不及时。有些教师的资料不是最新的,比如职称、学历的变动还没有及时更新,造成了挖掘结果的偏差。

(3)人为操作的失误。由于对数据挖掘的理解不够深入,在对原始数据的采集、预处理及转换环节中容易产生误差。

七、结论

1.从前项来看,职称以讲师为主,教授为辅;学历以本科为主,硕士为辅。这个师资结构说明浙江汽车职业技术学院的骨干教师是以本科起点的讲师为主,本科起点的教授和硕士起点的讲师为辅。

2.从后项来看,评分结果以优秀居多,这个评价结果说明整体的教学效果还是可圈可点的。也从侧面说明,不一定就是职称高、学识深、教龄长的教师受欢迎,相比之下,年轻肯干接地气的青年教师,更具活力,更受学生欢迎。从职称是讲师,学历是本科或硕士来看,这个群体教师的特点主要一是年龄相近,缩短了和学生之间的差距和代沟,沟通方面没有障碍;二是有些教师虽然职称还不够,但是在岗位上已经工作多年,积累了很多教学经验,工作能力比较强。

本章基于关联规则的性质属性,选用Apriori算法,针对教师教学评估进行分析,挖掘教师的职称、学历与评估结果之间的关联性。通过针对教師教学评估分析来挖掘教师学历、职称和评价结果之间的关联性,找出深受学生欢迎的教师有哪些共同特点。

猜你喜欢

Apriori算法关联规则数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于云平台MapReduce的Apriori算法研究
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究