APP下载

应用关联规则算法对高校教师测评数据进行分析

2016-05-30张砚雪

科技创新导报 2016年1期
关键词:Apriori算法关联规则

张砚雪

摘 要:引进高校教师测评系统是学校加强教学管理必要手段,通过每个学期的测评系统可以反应出学生对任课教师的满意程度和教师在授课过程中的一些不规范行为。该论文首先介绍数据挖掘经典算法中的关联规划算法,然后分析高校教师测评系统的数据库,利用分层次法对教师测评系统数据库中的大量数据进行分析,找出教师自身属性和授课情况之间的相关性。最后对该方法总结不足并做出展望。

关键词:关联规则 教师测评 Apriori算法

中图分类号:G647 文献标识码:A 文章编号:1674-098X(2016)01(a)-0105-03

Abstract:the introduction of university teachers evaluation system is necessary to strengthen teaching management,school each semester by the measurement system can reflect studentssatisfaction in classroom teachers and teachers in some irregularities in the process of teaching. This paper first introduces the relevant planning algorithm of classic data mining algorithm, and then analysis and evaluation system of college teachers of database,using the method of hierarchical analysis of teacher evaluation system of large amounts of data in the database, find out the correlation between teachersown attribute and teaching conditions. Finally this method and total lack of and make a prospect.

Key Words:Association rules;Teacher evaluation;Apriori algorithm

随着高等教育的逐渐普及,普通高校的在生源竞争上越来越激烈,优质的教学质量是竞争的核心,是高校赖以生存的生命线。对高校教师进行测评是每学期教学管理的必不可少的一项工作,涉及所有任课教师,所有课程。

目前大部分高校都引进了教学管理系统,其中包括教师网上测评模块,在校学生可以随时随地对本学期课程教师进行测评。但高校教学质量测评环节基本上用的是一套固定模式:由教务部门确定一个测评指标体系,制作出一套测评表,由部分特定学生群体对某个教师进行测评,最后综合统计,得出每个教师的总分,做出学期末考核的一个重要因素。然而实际上高校教学质量测评是一个复杂的教育和教学问题,涉及到各方面的因素,只是一味的追求结果已不能适应现代的多元化的教学。我们应该充分利用系统所收集的各项数据,寻找各项数据之间的关联,以及同一门课程不同班级所提交数据之间的内在联系。分析出每位教师所讲授课程的特点,针对得出的结论,作为系部教学整改的重要依据。

1 数据挖掘中关联规则算法概述

1.1 关联规划算法的概念

所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance;第二个是关联性association,两者都可以用来描述事件之间的关联程度。

关联算法是数据挖掘中的一类重要算法。1993年,R.Agrawal等人首次提出了挖掘顾客交易数据中项目集间的关联规则问题,其核心是基于两阶段频繁集思想的递推算法。该关联规则在分类上属于单维、单层及布尔关联规则,典型的算法是Apriori算法。

1.2 Apriori算法概述

Apriori算法将发现关联规则的过程分为两个步骤:第一步通过迭代,检索出事务数据库1中的所有频繁项集,即支持度不低于用户设定的阈值的项集;第二步利用频繁项集构造出满足用户最小信任度的规则。其中,挖掘或识别出所有频繁项集是该算法的核心,占整个计算量的大部分。层次分析法的步骤。

2 利用Apriori算法对教师测评数据进行分析

2.1 数据准备

下面以某高职院校计算机应用技术专业教师测评数据集和教师自身一些特征数据为训练样本。教师测评数据包括讲课教学内容、教学态度、教学方法和按时批改作业。这四个方面分别为30、20、30、20。用符号A表示教学内容,符号概化为A1(25~30分),A2(20~24分),A3(19分以下),用符号B表示教学方法,B1(18~20分),B2(15~17分),B3(14分以下)。以此类似方法将教学态度和批发作业等数据离散化。将测评结果的四个属性作为决策属性,成绩大于90分的为“D1”,大于80分小于90分的为“D2”,大于60分小于80分的为“D3”,小于60分的为“D4”。学历项数据博士、研究生、本科分别离散为X1,X2,X3。职称教授、副教授、讲师、助教表示为Z1,Z2,Z3,Z4。将这些数据集显示在表1中。

2.2 Apriori算法的应用

在本论文中,挖掘的目标是教师授课情况和教师自身条件与测评结果之间的关联,因此使用如下形式的规则模板:

P1∧P2∧P3…=>Q1∧Q2…

其中P表示各项教师的指标情况,Q为测评结果。设关联规则最小支持度为20%,最小置信度为70%,用VC++进行编程运算。

第一,找出所有的频繁项集伪代码如下:

procedureFP_growth(Tree,a)

ifTree含单个路径Pthen{

for路径P中结点的每个组合(记作b)

产生模式bUa,其支持度support=b中结点的最小支持度;

} else {

for eachai在Tree的头部(按照支持度由低到高顺序进行扫描){

产生一个模式b=aiUa,其支持度support=ai.support;

构造b的条件模式基,然后构造b的条件FP-树Treeb;

ifTreeb 不为空 then

调用 FP_growth (Treeb,b);

}

}

2.3 由频繁项集产生强规则

表2为由所有频繁项集所导出的有价值的关联规则生成表。

2.4 结果分析

具有较副高职称和研究生学历的教师,教学态度较好,而且精力充沛,课堂教学经验丰富,评价分数较高。而本科学历同样是副高职称的老教师,在教学内容上能得到学生认可,教学态度严谨,学生评价分数也很高。一些刚走上讲台不久,助教职称的教师,在教学方法和教学内容上还有所欠缺,没有得到学生的认可。由此可见,学校应该加大年轻教师的培养,多给他们外出学习和培训的机会,另外有经验的教师也应该担负起培养年轻教师的责任。

3 结语

该文以数据挖掘中关联规则算法对教师教学质量测评数据进行分析,找出大量数据的关联性。为学校以后对教师的培养提供了可以参考的方向。不足之处是,样本数据不多,规则生成的不明显。高校教师教学质量测评数据的挖掘可以更加深入,可以以某一位老师为例纵向分析近几年的采集数据,为其做出曲线图,可以作为系部评价教师的教学工作的依据。

参考文献

[1] 叶若芬,孙书明.基于数据挖掘技术的教学测评[J].河北工业学报,2001(6):383-386.

[2] 宋晓梅.数据挖掘技术在高校教师教学质量测评中的应用[J].赤峰学院学报:自然科学版,2013(2):180-184.

[3] 卢雪燕.关联规则挖掘在高校计算机类教师教学质量测评中的应用[J].科教导刊,2014(2):82-83.

[4] 王晓艳,高云辉.数据挖掘技术在教学评价系统中的应用[J].计算机光盘软件与应用,2013(4):211-212.

猜你喜欢

Apriori算法关联规则
基于Hadoop平台的并行DHP数据分析方法