APP下载

基于Clementine的数据挖掘在高职教学评价中的应用研究

2018-03-30马静

电子技术与软件工程 2017年16期
关键词:评价模型数据挖掘高职

马静

摘要

本文阐述了利用数据挖掘软件clementine将数据挖掘技术引入到教学管理工作之中,从教学评价的数据中提取出隐藏在数据中的有用信息,探讨影响教学质量的关键因素,从而为教学主管部门的管理工作提供决策性参考。

【关键词】数据挖掘 高职 评价模型

随着“教育信息化”的发展,教务管理的相关数据越来越多,但这些数据除了作为历史数据外,其有用信息的价值并未充分挖掘和利用,并使其转化为有用的知识,实现真正的教育信息化。教务管理中的教学评价对于教育质量的提高起着十分重要的作用,而利用数据挖掘技术从教学评价数据中提取出隐藏在数据之中的有用信息可为教务管理工作提供决策性参考。数据挖掘技术是利用数据库、数据仓库技术存储管理数据,利用机器学习和统计方法分析数据的一项跨学科技术。通过数据挖掘技术我们可以完成数据总结、分类、关联、聚类等若干主要任务。为了提高数据挖掘工作效率,常借用一些工具软件,clementine是众多数据挖掘软件之一,它拥有丰富的数据挖掘算法,支持与数据库之间的数据和模型交换;同时,具有可视化操作界面,简单易用,分析结果直观易懂,图形功能强大等特点。

1 教学评价模型及挖掘算法的选择

教学评价是学校和教师、教师和学生相互联系的一个纽带。为了更好的完成教学评价,各院校会认真制定学生教学评价指标体系。本文研究的指标体系主要包括教学态度,基本素质,教学内容,教学方法,教学效果,教学特色六项指标。为了研究六项指标之间,六项指标与评价结果之间的关联,本文选择clementine的关联分析技术进行数据挖掘。

数据挖掘中,关联分析的主要技术是关联规则(Association Rule),clementine提供了Apriori、GRI、Carma等多种经典关联规则算法。本次研究选择Apriori算法,其主要原因是:研究所涉及数据量较大,Apriori算法在提高关联规则分析效率的同时,还能有效揭示数据中隐含的关联特征。基于Apriori算法模型是无指导学习方法,本次研究采用web网状图分析报告与模型比较的方式来评价模型。

2 利用clementine对教学评价进行数据挖掘

数据挖掘的过程主要包括五个阶段:

(1)数据准备;

(2)数据选择;

(3)数据预处理;

(4)数据挖掘;

(5)转换模型及模式评价,本文研究严格按照上述步骤进行。

2.1 数据准备及数据选择

数据准备主要包含两点:一是要根据挖掘对象收集原始数据,即确立数据源,第二是整合数据。本文数据源来源于教务系统3个学期39位教师的教学评价信息表666078条数据,其表结构如表1所示,经过数据表的联接与筛选生成了表结构如表2所示的训练样本集。

2.2 数据预处理

数据预处理在数据挖掘过程中是很重要的一个环节,它可以保证数挖掘所需数据集的质量。数据预处理工作主要是对收集的数据进行清理,针对教学评价信息特点,数据预处理主要分两步进行:

2.2.1 数据清理

数据清理工作主要是对于空缺的属性,使用数据清理技术来填充,当记录有多个属性缺少属性值时,将这些记录将视为无效记录并删除。

2.2.2 属性归约

样本集中用于数据挖掘的字段都是连续型属性,由于Apriori算法及web网状图分析需要离散性属性数据值,本文研究将各项评分和最后得分做了离散性的属性划分,其划分规则如表3所示。

2.3 关联规则挖掘

(1)本文利用clementine的Apriori算法和web网状图对教学评价信息进行了挖掘,创建数据流如图1所示,其中partion结点的Trainingpartionsize和Testing partion size都设置为50%,Apriori算法设置其minmum antecedent support为10%,minimum rule confidence为80%。Apriori算法执行结果如图2所示。

2.4 挖掘結果分析

(1)假设关联规则的最小支持度为10%,最小置信度为80%,进行关联规则挖掘产生3条强关联规则:shuizi=“优秀”→zhongping=“优秀”(s=l1.256%c=86.519%);taidu=“优秀”→zhongping=“优秀”(s=l1.256%c=86.519%);fangfa=“优秀”→zhongping=”优秀”(s=12.1210/0c=85.579%);同时三条规则的提升值分别为1.319,1.319,1.305都可以接受。因此,基本素质,教学态度,教学方法三个指标是最直接影响最后得分评优的主要因素。

(2)教学评价的web网状图如图3所示,移动下方滑块后的网状图如图4所示。可见,关联规则和图形展示的结论一致。

3 小结

本文主要介绍了基于学生评教信息,如何利用clementine数据挖掘工具采用Apriori算法进行建模,再利用Web网状图分析进行模型评价的数据挖掘过程,探索学生评价各指标与评价结果关联性知识的方法。本文的研究只是数据挖掘应用与教学领域的初级阶段,旨在为后续的深入研究做铺垫。

参考文献

[1]常军林,张真.数据挖掘在高校教学评价中的应用[J].中州大学学报,2016,33(02):105—107.

[2]张超.基于关联规则的数据挖掘在高校教学评价中的应用研究[D].安徽:安徽大学,2011.

[3]薛薇,陈欢歌.Clementine数据挖掘方法及应用[M].北京:电子工业出版社,2010:14-14.

[4]郑静静.高校教学评价体系中关于学生评教的思考[J].文教资料,2013(15):162-163.

[5]纪希禹.数据挖掘技术应用实例[M].北京:机械工业出版社,2009:7-8.

[6]邹立娣.数据挖掘技术在教学评价系统中的应用研究[D].安徽:合肥工业大学,2009:24-25.

猜你喜欢

评价模型数据挖掘高职
高职应用文写作教学改革与创新
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
高职人才培养模式创新探讨
基于GPGPU的离散数据挖掘研究
关于提高高职人才培养质量的思考