数据挖掘技术在高校教师教学质量测评中的应用
2013-08-06宋晓梅
宋晓梅
(赤峰学院 教育科学学院,内蒙古 赤峰 024000)
高等教育已经国际化,高校的生存竞争越来越激烈,核心竞争力是高校教学质量,优质的教学质量是高等院校的生命线,是高校进行动态管理的首要条件,也是实现科学管理的重要保证.我国目前的高校教学质量测评基本上用的是一套模式:确定一个测评指标体系,制定一套测评量表,由特定的个人或群体对某教师的教学情况进行打分,然后综合统计,计算出总分,取得一个测评结果.但高校教学质量测评是一个复杂的教育问题,涉及到诸多因素,这一追求客观化、数量化的测评模式已不能适应现代多元化的教学.为了解决传统教学质量测评中存在的不足,我们将数据挖掘这一现代分析技术引入到教学质量测评中,运用数据挖掘中的相关技术对教学质量进行评价,通过公正客观的统计和分析,作出归纳性推理,从中挖掘出潜在的模式,从而帮助决策者调整策略.
1 高校教师教学质量测评的过程和方法
1.1 评价过程
目前我院的具体做法是对每名从事教学工作的教师打分:此分数由三部分组成:学院聘请的各学科专家安排随堂听课计划,听过教师的一堂课后,对这名教师的授课情况进行综合打分;教师所在的教研室安排教师相互听课计划,对教师授课的各方面情况打分;学生对教师的授课情况进行打分.分数收集上来后,需要录入到计算机中,再对每名教师的各方面打分加权合并汇总,形成一个最终得分.这个分数即是该教师教学质量测评得分,此分数作为评价教师该门课程教学质量优劣的主要依据.
1.2 评价内容及指标
为使教师教学质量测评结果准确可靠,选取能反映教学质量最本质的指标体系.每一评价指标分A、B、C、D、E五个等级.按一定方法分别计算出三个部分相应的平均得分,对不同部分的评价结果赋以不同的权重后再计算出综合评价得分.
1.3 结果计算
1.3.1 评价权重
评价标准包含教学态度、教学内容、教学方法、教学基本功、教学效果等方面,其中包括定性成绩两项、定量成绩三项.定量成绩按照权重计算之后和定性成绩相加得出课堂教学质量最后评定等级,即优秀(≥90)、良好(80—89)、中等(70—79)、合格(60—69)、不合格(<60).
1.3.2 计算方法
教学领导组评价成绩(x1)的权重系数为0.2.同行教师评价成绩(x2)的权重系数为0.2.学生评价成绩(x3)的权重系数为0.6.
课堂教学质量综合评定成绩为y=0.2x1+0.2x2+0.6x3
X1、X2、X3 的计算方法:
Xi=∑(H×S)(H:为权重;S:等级对应分数;i=1,2,3)
2 高校教师教学质量测评中存在的问题
一些高校目前还没有建立起一套科学的绩效考核体系,很多高校还是采用年度总结、民主评议等方式对教师进行绩效考核.这种考核方法存在的问题主要表现在:测评指标不全面;指标权重分配不合理;测评方法和手段单一、陈旧;评价对象不明确;后期的数据分析与应用欠缺等问题,不能反映出真实的成绩,失去了应有的激励价值.
3 数据挖掘技术应用于高校教师教学质量测评的必要性
数据挖掘(Data Mining)也叫“数据开采“或“数据库知识发现”,就是从存放在数据库、数据仓库或其他信息库中的大量不完全、有噪声、模糊、随机的实际应用数据中提取隐含的、人们事先未知的但又是潜在有用的并且最终可理解的信息和知识的过程[1].
教师测评结果数据主要是为各级管理部门提供以简单统计报表和信息查询,其实在这些数据中还隐含着更加有价值的信息,比如:教师的职称,学历对于教学质量的关系;教师的进修是否对教学质量有所促进等等.这些数据所隐含的价值如果能够充分利用,将会进一步提高教学质量.数据挖掘是知识发现过程中的一个关键步骤,也是当前知识发现领域中的一个研究热点.利用数据挖掘技术对集成处理后的数据进行数据挖掘,发现潜在数据模式,它可以全面地分析测试评价结果与各种因素之间隐藏的内在联系,从中提取具有应用价值的规则,从而对教师的教学质量进行客观的、公正的评价.另外数据挖掘整个分析过程是自动的,具有良好的开放式结构,友好的用户接口,能为教师质量测评提供强有力的技术支持.将数据挖掘技术运用到高校教师质量测评中,对于实现高校教师教学质量测评的科学化和有效化,进而全面提高高校教学质量,具有十分重要的理论价值和实践意义.
4 数据挖掘技术在教学质量测评中的应用
4.1 教育数据挖掘过程
数据挖掘是一个利用各种分析方法和分析工具,在大规模海量数据中建立模型和发现数据间关系的过程,这些模型和关系可以用来作出决策和预测[2].具体的挖掘过程包括:对原始数据进行选择、清理后,加载到数据仓库;将加载的数据转换成适合规则挖掘的形式;运用规则挖掘算法挖掘出用户感兴趣的规则;将产生的规则通过可视化界面展示给用户.
4.2 关联规则
关联规则是数据挖掘的重要概念,关联规则挖掘就是在海量的数据中发现数据项之间的关系,它是目前数据挖掘中最重要的理论之一.Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法.是1994年Agrawal等人在项目集格空间理论的基础上提出的.Apriori作为经典的频繁项目集生成算法,在数据挖掘中具有里程碑的作用.Apriori算法的优点是结构简单,易于理解,没有复杂的推导.但是随着研究的深入,它的缺点也暴露出来.为了提高Apriori算法的有效性,本文将应用于教师质量测评中的Apriori算法进行了改进.
4.3 改进的Apriori算法分析
改进的Apriori算法如下:
4.4 改进的Apriori算法在教师教学质量测评中的应用
4.4.1 原始数据准备
随机抽取学校教师教学质量测评表300份,将编号、年龄、性别、职称、学历和评定分数六项输入数据库,忽略其它信息.我们通过对数据库中的数据进行挖掘,找出性别、年龄、职称、学历与评定分数之间的关系.表1给出了部分教学测评信息数据,共有300条记录.
表1 教学测评信息表
通过对数据库的300条记录进行扫描可以得到相关统计信息如表2所示.
表2 原始300条数据综合统计信息
4.4.2 数据预处理
是指在主要的处理以前对数据进行的一些处理.数据预处理主要有:数据集成,数据清理,数据转换,数据消减等.通过数据预处理,可以提高数据挖掘的质量,降低实际挖掘所需要的时间.
4.4.2.1 数据集成
就是将来自多个数据源的数据合并到一起.本研究中,将数据采集得到的多个数据库文件,利用数据库技术生成高校教师教学质量测评基本数据库.
4.4.2.2 数据清理
数据清理的主要工作就是填补遗漏的数据值.
在高校教师教学质量测评分析基本数据库中我们看到,有一些我们感兴趣的属性缺少属性值,如在抽取的教师基本情况数据表中,可能该教师是教务管理人员或行政人员,并不承担教学任务,所以教师测评数据中并无学生对该教师的评价,该部分的记录应予以删除.而我们是对部分学生进行调查,所以有些教师可能未有学生对他们的教学做评价,对于这些空缺,可以使用数据清理技术来填补.
在本例中,采用忽略元组的方法删除没有学生填写的评价结果的教师的记录.对于其他个别空缺,因为总的记录数不算太多,而空缺值较少,
4.4.2.3 数据转换
数据转换主要是对数据进行规格化操作.由于大多数属性属于离散值属性,但也有连续值属性(如年龄,教龄,测评成绩属性),需将连续值属性离散化处理.
为了离散化数据,对年龄进行分组;年龄分为:A1[24,30],A2[31,35],A3[36,49],A4[50,60]四个组.评定分数分为:G1[90,100],G2[80,90],G3[60,80],G4[0,60]四个组.根据计算所需的实际情况,对性别、职称、学历的表示加以规定.性别分别用:M表示男,W表示女;职称分别表示为:Z1助讲,Z2讲师,Z3副教授,Z4教授;学历分别表示为:El本科,E2硕士.
4.4.2.4 数据消减
数据消减的目的是缩小所挖掘数据的规模,在这里,采用消减维数的方法,即从初始特征属性中找出真正有用的特征属性以减少数据挖掘时要考虑的特征属性或变量个数.
由于教师基本信息表中的属性字段很多,本文为了便于模型的建立,选择其中与测评成绩属性相关性较多的属性,如年龄,学历,职称,形成新的高校教师教学质量测评基本数据表.
4.4.3 应用关联规则进行数据挖掘
后台采用Oracle数据库,前台使用Java实现.
以下是对教学人员的性别、年龄、职称、学历和评定分数进行的数据挖掘.以教学测评分数G1,即教学测评分数在90至100分之间,课堂教学效果较好的情况为例,利用挖掘技术和前面所研究的关联规则,挖掘一下具有较好课堂效果的教师的状态特征.首先,通过编写程序对原始数据库进行搜索,得到满足条件的记录共60条,把这60条记录做为讨论数据集,记为D1.对D1进行扫描和统计得到基本信息如表3所示.
表3 测评成绩90分以上的数据统计信息
对D1进行扫描和统计程序如下:
最终得出的关联规则表明:年龄在36至49岁、职称为副教授、具有研究生学历的教师教学效果好,具有8%的支持度和45.7%的置信度.
4.4.5 挖掘过程实现
为了将数据挖掘的结果以直观的方式显示出来,采用了直观的可视化结果输出.具体程序如下:
4.4.6 挖掘结果分析
4.4.6.1 年龄在36-49岁的中青年教师具有较高职称和学历,而且精力充沛,课堂教学经验丰富,评定分数高,具有高的支持度和置信度.由此可见,我校一批中青年教师已经成为学校教学工作的骨干,教师队伍结构趋于合理.我校近些年重视学科建设,坚持实施人才战略,重视高学历中青年骨干教师的引进和培养,已经初见成效.
4.4.6.2 50-60岁以上年龄层的骨干教师置信度较高,说明大多数老教师讲课较受欢迎,而这些教师现在即将退休或己经退休,他们留下的空缺必须马上填补,因而还要重视对于30岁以下青年教师的培养,采取“老帮青”、青年教师主动听课学习等措施,帮助青年教师提高业务能力和职业道德水平.
4.4.6.3 30岁以下年轻教师,由于刚走上讲台不久,教学经验和教学方法有待进一步提高.由于大学教学内容专业化程度高,科学性强,信息量大,具有一定的宽广度和深度,有的涉及科研领域还未解决的问题,即学科前沿问题,所以还应加强专业知识的学习,不断提高自己.
运用数据挖掘中的关联规则对教学质量进行评价,利用所建的基于数据挖掘的教学评价系统对高校多年来积累的教学评价数据进行挖掘、评价,评价结果给高等学校教学管理、教育行政部门的决策提供了帮助,尤其是给老师的教学工作提供了有益的参考[6][7].高校教师教学质量测评是一项非常复杂的工作,这项工作涉及的问题多,涉及的面广.本文仅对测评数据中的性别、年龄、职称、学历与评定分数之间的关系进行了挖掘,随着世界各国对高校教育水平的不断重视,各种科学技术在教育领域中的应用会越来越受到关注,通过人们对数据挖掘技术的深入研究,这些技术的应用将越来越广泛.随着数据挖掘技术的研究成果在教育领域中的广泛应用,必将推动高校教育管理的改革与发展.
〔1〕Hongjun Lu.Seamless integration of Data Mining with DBMS and APPlieations[M].Leeture Notes in ComPuter Seienee.2003,7:78-136.
〔2〕(加)JiaweiHan, MiehelineKalnber.数据挖掘概念与技术阅.北京:机械工业出版社,2001.
〔3〕张震.胡学钢,张亚萍.数据挖掘在高校课堂教学质量评价体系中的应用[J].电脑开发与应用,2007,20(2):41-42.
〔4〕李红艳.数据挖掘及其运用于教学质量测评的设想[J].襄樊职业技术学院学报,2003,2(3):52-56.
〔5〕伍坷霞.高校教师教学质量测评的问题及对策研究[D].长沙:湖南师范大学,2007.5-7.
〔6〕董彩云,等.数据挖掘及其在高校教学系统中的应用[J].济南大学学报(自然科学版),2004,18(l):65-68.
〔7〕彭玉青,等.数据挖掘技术及其在教学中的应用[J].河北科技大学学报,2001,22(4):21-24.
〔8〕陶兰,王保迎.数据挖掘技术在高等学校决策支持中的应用[J].中国农业大学学报,2003,8(2):39-41.
〔9〕罗少茜.英语教学形成性评价研究[M].北京:外语教学与研究出版社,2003.