数据挖掘技术在高校教学质量评估中的应用
2012-08-15李旭军
李旭军
数据挖掘技术在高校教学质量评估中的应用
李旭军
所谓数据挖掘,即从海量的、不完全的、存在一定噪声的、随机的数据中提取潜在有用的知识信息的过程,这些知识信息人们事先并不知道,可以说它是一种更深层意义的数据分析方法,其与多门学科互相交叉,比如数量统计、模式识别、数据库、神经网络以及数量统计与模糊学等。在教学评价中应用数据挖掘技术可以对教学评价结果与其它因素间所隐藏的内在联系进行全面分析,从而促进教育体制的改革、发展与完善。讨论了数据挖掘技术在高校教学质量评估中的应用方法与步骤。
数据挖掘;教学质量;评估方法
一、数据挖掘的方法与流程
(一)数据挖掘的方法
常用的数据挖掘的方法包括关联分析、分类、预测、时序模式、聚类分析以及偏差分析等等。下面逐一来看:第一,关联分析。所谓关联,即两个或以上的变量取值间存在一定的规律性,即为关联。而数据关联是数据库存中一种重要的、可被发现的知识。进行关联分析的主要目的是挖掘出隐藏在数据库中的关联网。通常用支持度、可信度两个阈值来度量关联规则的相关性,还可以将兴趣度、相关性等其它参数引入其中,以保证挖掘的规则与实际需求更相符。第二,聚类分析。是把相似性较高的数据归纳为几个类别,类别相同其数据之间就相似,反之,类别不同其数据也存在差异。聚类分析从宏观的角度建立概念,挖掘数据属性间的相互关系,找出数据的分布模式。第三,分类。将一个类别的概念描述找出来,它可以代表同一类别数据的整体信息,也就是这种类别的内涵描述,其模型的构造也可以通过这种描述来完成,通常用决策树或者规则的模式来表示。分类是训练数据集按照相应的算法求出的分类规则,规则描述或者预测等均可采用这种方法。第四,预测。这种方法是在分析历史数据的基础上挖掘出数据的变化规则并建立模型,再由该模型来预测未来数据的种类与特征。预测所关注的是不确定性与精度,其度量指标通常是预测方差。第五,时序模式。这种方法是利用时间序列把一些有较高发生概率的模式挖掘出来,利用已知的数据对未来的值作出预测,不过这些数据最大的区别即为变量的时间有所区别。第六,偏差分析。其实偏差中有很多有用的知识,数据库的数据往往也会存在一些异常,找出这些异常情况也是非常有必要的,因此,偏差分析方法就是挖掘出观察结果和参照之间的差异之处。
(二)数据挖掘的一般流程
通常数据挖掘的一般流程包括以下几个步骤:第一,定义问题。即将业务问题做出清晰的定义,以确定出挖掘的目标;第二,数据准备。主要包括数据选择、数据预处理两项内容,其中:数据选择是在数据库与数据仓库目标中将所要挖掘的数据的目标数据集提取出来;而数据预处理是对数据的再加工,主要是对数据的完整性、一致性做出检查,去噪声,将丢失的域做填补,将无效数据删除等等;第三,数据挖掘。即按照数据功能的类型、特点选择适用的计算方法,数据集经过净化与转换后即可进行数据挖掘;第四,结果分析。即对挖掘所得的结果做出评价解释,并将其转换为用户可以理解的知识;第五,运用知识。把挖掘出来经过转换的知识集成到业务信息系统组织中去。
二、高校教学质量评价体系的构建方法
通常构建教学质量的评价体系包括两个方面,即确定指标与权值。其中,指标是可测量的行为化、操作化的、具体的目标在某个方面的规定,即它所反映出的不是所有的目标,而是整体目标其中的一个方面。相关的一组指标构成一个系统,可以将目标整体全面地反映出来,即为指标体系。常用确定指标的方法包括穷举法、专家经验编制法、主成分分析法以及问卷调查法等等。而权值是指标影响目标程度的尺度,人们对其价值的认识通过其大小反映出来,即权值越大,其所对应的指标影响目标的程度就越高,大家对其重视度就越高。常用确定权值的方法包括比较平均法、对偶比较法、层次分析法以及专家咨询法等等。本文所采用的是层次分析法,将数据挖掘技术应用其中进行扩展研究。
三、基于数据挖掘的教学质量评价体系的构建模型
建立科学、高效的教学质量评价体系,不仅提高了高校管理的有效性,而且也为采集、分析、处理教学信息提供了良好的平台。一个科学、合理的教学质量评价体系所反映的问题,可以帮助教学管理人员做出更加合理的决策,比如教学的改革或者师资的调整等。通常评价体系是一个多层次的、多目标的、复杂的系统,建立这种评价体系可以采用层次分析法。所谓的层次分析法是结合了定性、定量分析的多目标决策分析法,而AHP可以很好地解决多指标权值分配的问题。层次分析法会将指标体系进行分层分解,将总目标、各个指标的隶属关系、准则由上到下确定下来,建立起多级指标,并在后续的教学发展过程中不断地完善。
(一)层次分析法
层次分析法是一种比较常用的进行科学决策的技术。决策是人们对行为所做出的选择和判断,不管决策活动是简单还是复杂,都是基于系统观点的综合判断过程。人们做出决策前要对会影响到结果的各方面因素进行比较、判断以及评价,不过有些指标是可以定量的,有些则无法定量,所以需要一种既可以适应大系统规模的庞大性、状态多变性以及影响的广泛性、又能够综合分析定性、定量问题的决策工具,而层次分析法就是一种构建多层次评价体系的方法。
(二)层次分析法的基本步骤
第一,建立起层次结构的模型。按照相关因素的属性由上到下将其分解为数个层次,同一个层次的各个因素均从属于上层因素,或者会对上层因素产生影响,又会同时对下层因素进行支配,或者受下层因素的影响。第二,构造为对比较矩阵。从层次结构模型第二层开始,采用成对比较法与成对比较标度,构建成对比较矩阵直至最底层。第三,对每个成对比较矩阵的权向量进行计算。第四,检验一致性。即对成对比较矩阵的一致性进行测量,如果其一致性程度与要求不相符,则专家组要对矩阵进行重新审核与判断,必要时进行修改。层次分析法可以将思维过程加以系统化、数学化,并非一味地追求高深的数学运算方法,但是,又不会片面地侧重于定性问题的逻辑推理。这种方法最大的特点是将定性与定量的方法进行有机的结合,将复杂的系统分解为清晰的、多层次的、多目标的决策体系。其最关键的步骤就是递阶层次结构的建立以及通过成对比较标度建构比较矩阵。
(三)基于数据挖掘的AHP扩展模型
AHP扩展模型是以AHP基础思想为基础,并将数据挖掘技术中的关联规则技术引入其中,以提高评价指标的科学性、正确性为主要目的,从而将具有多目标、多层次的相同结构的评价体系构建问题动态的解决。在结束了一致性检验后需要做关联规则的验证,如果挖掘出的规则与评价体系的要求相符,即可将评价体系输出,将知识存储于知识库;反之,挖掘出的规则与评价体系要求不符,同样也要将相关知识存储于知识库,然后再回到建立递阶层结构的步骤,对评价体系的结构进行重新调整,将对应的指标内容做出相应的修改,或者回到建立判断矩阵的步骤将比较标度进行重新的调整。其具体过程如下:
1.建立递阶层次结构
通过专家智能建立起一个递阶层次结构模型,它可以对系统的功能或特征加以描述。基于系统层次性的角度,将系统和环境区分开来,从高层到低层逐级分解,整个系统可以被分解为树状的或者金字塔状的层次结构。通常结构中层次有三类:第一类,目标层,也是最高层。通常是数据挖掘的预定目标,只包含一个元素;第二类,准则层,即中间层。通常由若干个层次共同组成,其包括目标实现过程中所涉及的各种中间环节,需要考虑的准则与子准则;第三层即为方案层,也是最底层。它包括在目标实现过程中所需的各种决策方案或者措施等。需挖掘的问题的复杂度、需要分析的详尽度会对递阶层次结构的层次数产生决定性作用,通常层次数是没有限制的,每个层次中每个目标可以支配的准则通常要小于9个,因为支配准则太多,会导致两两比较的困难度上升。层次结构的好坏是解决问题的关键所在,所以专家组要与最新的领域知识库相结合,将各层次间的指标支配关系确定出来,以保证层次结构的合理性。知识库是一个动态的、不断扩展的数据库,知识的来源均为相关领域、相关理论、经验以及AHP扩展模型内部产生的部分规则。
2.构造两两比较判断矩阵
在递阶层次结构中,已经确定了上、下层因素之间的隶属关系。假设目标层次u为准则,受其支配的下层因素则为u1、u2、……un,这些因素对u的相对重要性不同,因此赋予其权值也各不相同。如果各因素对于u的重要性能够采用定量的方法来表示,比如发表论文的数量、工作的时间等等,则可以直接确定出相应的权值,不过,如果一些因素的决策涉及到经济、人文、社会等,无法通过定量的方法获得,则其权值的计算就要采用相适当的方法。可以采用专家组评价的方法将所有因素进行两两比较,再与专家组意见相结合,从而构造出比较判断矩阵。
3.关联规则验证
以准评价体系为基础面向测试用户采集的评价数据,对评价结果进行处理,采用Apriori算法挖掘评价数据和评价结果关系的关联规则,将有兴趣的信息提取出来,并输入知识库,同时对评价体系的正确性加以验证。求解其置信度,将各指标对评价结果的影响程度分析出来,对权值分配的合理性加以验证;求解作用度,对各指标、评价目标的相关程度进行分析,对指标选择的正确性加以证明。最后再把通过Apriori算法获取的分析结果存储于知识库,对其加以完善,并对专家决策做出相应的指导。按照分析结果对递阶层次结构进行实时的调整,提高评价体系结构的合理性。
总之,基于数据挖掘的AHP扩展模型一般适用于可行方案、单位人员的决策等领域。教学质量评价内容是对老师整个教学工作的质量监控点。教学过程需要师生的相互合作、共同完成。在该过程中,学生对老师的了解从某种程度而言是最全面、最深刻的,因此学生评价结果的优势非常突出,学生对老师教学质量评价的稳定性、可靠性得到国内外广大教育学家认可。此外,同行评价、老师自我评价以及专家评价等,均可为教育管理者决策提供信息。
[1]张兴科.数据挖掘技术在提高教学质量中的应用研究[J].黑龙江科技,2010(11).
[2]董军凯.数据挖掘技术在教学质量评价中的应用[J].大众科技,2009(8).
[3]章丽芳.数据挖掘技术在高校教学质量评估中的应用[J].计算机应用教学研究,2008(1).
[4]高晓.数据挖掘技术在高校教学质量评估中的应用研究[J].福建质量管理,2010(3).
[5]段小斌.基于数据挖掘技术的教学质量评价模型研究[J].职业教育,2009(5).
[6]刘华,李瑗.基于高校课堂教学质量评价系统的数据挖掘方法与应用[J].石家庄学院学报,2011(3).
[7]岳麓,潘郁.动态层次分析法在客户关系管理系统中的应用[J].南京工业大学学报:自然科学版,2009(6).
[8]袁继东,郭有全.层次分析法在地空导弹团战斗力评估中的应用[J].空军工程大学学报:自然科学版,2007(5).
G642.0
A
1673-1999(2012)01-0177-03
李旭军(1976-),男,安徽巢湖人,硕士,安徽经济管理学院(安徽合肥230051)计算机工程系讲师。
2011-09-28
安徽经济管理学院教学研究项目(yjjyxm201105)。