利用学科成绩数据挖掘提升高校教务管理水平的路径探索
2017-01-11林月娇
林月娇
随着信息化和网络化进程的不断演进,人类由于生活和生产作业所形成的数据信息量正以几何级的增长速度不断产生。目前,我国许多高校都开展了以校园网为平台的“数字化”校园建设,大量与学生成长相关的学科成绩和其他评价分析数据被储存记录下来。本文主要研究利用知识发现的理论方法对这些数据做深度的研究分析,挖掘出数据间隐含的关联关系,以便更好地应用管理创新理论,提高学生管理的信息化水平,提升高校教务管理水平。
一、知识发现与数据挖掘的理论基础
(一)知识发现的研究综述
知识发现(Knowledge Discovery in Databases,KDD)一词最早出现在1989年8月美国底特律召开的第11届国际联合人工智能学术会议上[1]。1996年,知识发现被Fayyad U,Piatetsky,Shapiro G和Smyth P定义为:知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程[2]。对KDD的研究主要包括从数据库的角度进行研究以强调知识发现的效率,从机器学习的角度进行研究以强调知识发现的有效性,从统计分析的角度进行研究以强调知识发现的正确性,从微观经济学的角度进行研究以强调知识发现的最大效用。KDD过程是多个步骤交互螺旋式上升的学习和总结过程[3],基本流程包括:
(1)限定学习领域,储备预先知识、确定学习目标;
(2)聚焦目标数据集,选择一个数据集或在多数据集的子集上聚焦;
(3)数据预处理,数据降噪或数据清洗;
(4)数据转换;
(5)确定数据挖掘功能法则;
(6)获得知识信息、运用知识成果并重新选定学习目标。
在创新的过程中,单单依靠显性知识已经不足以支撑整个思维求异和技术创新的全流程。随着数据量的爆炸式增长,传统数据库的检索查询已不能满足信息社会的深层次需求,再加上传统分析手段的落后,大量数据来不及整理、分析或利用就已“时过境迁”成为无效信息,而且被长期积压在数据库中浪费存储资源。为了及时消解数据产生和数据理解之间的矛盾,还必须定期对数据进行深度挖掘,使得大量被隐藏的、有价值的信息得到有效利用。
(二)数据挖掘的理论探索
数据挖掘(Data Mining)是指使用算法来抽取信息和模式,通常是知识发现过程的一个重要步骤。数据挖掘融合了机器学习、模式识别、数据库技术、统计学理论、人工智能及信息管理系统等多门学科的最新成果。应用数据挖掘技术从大型数据库中发现隐藏在其中的规律和有用信息,为管理层决策提供事实型数据和研究模式。
根据KDD的目标任务,数据挖掘任务可分为:分类或预测模型发现、数据总结与聚类发现、关联规则发现、序列模式发现、相似模式发现、混沌模式发现、依赖关系或依赖模型发现、异常和趋势发现等。而所要挖掘的对象则可以分为:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及web等对象的挖掘。从方法论讲,其挖掘方法一般分为:聚类分析、探索性分析、机器、统计、神经网络(Neural Network)、遗传算法(Genetic Algorithm)、数据库、近似推理和不确定性推理、基于证据理论和元模式、现代数学分析、粗糙集(Rough Set)、集成方法等方法[4]。
(三)小结
综上,知识发现用于从大量数据中抽取规律信息,发现非预期或潜在的价值量,而数据挖掘作为知识发现的重要一环是与实践应用紧密相连的,两者不仅仅是对数据的简单检索调用,而是从数据集合中自动提取出隐含在数据中的关系和模式,进而对未来可能发生的行为进行预测,为决策者提供有力支持。
二、高校成绩管理与学科建设
成绩是学生在校学习期间对所学知识理解掌握情况和教师教学质量评价的原始记录,对学校的教学管理和教学改革措施评价具有重要的参考价值[5]。成绩管理是高校教学管理中的最为基础性的一个环节,是根据教学目的和教学任务,
通过学生的实际量化考核分数来进行统计、查阅和分析的综合性数据处理过程。该过程的科学与否,直接关系到教务管理的实际质量和教学工作的可持续发展,特别是在网络化和信息化的新形势下,该项工作被素质教育赋予更加深远的现实意义。本文所指学科成绩不仅限于学生的笔试成绩,还包括了学生参加各种校内外实习和培训,以及其他形式素质教育的量化数据。
(一)高校成绩管理所面临的新形势
从宏观上讲,随着国家高等教育普及工作的不断推进,以及教育战线“以人为本”理念的逐步深入,高校教务在成绩管理这一环节上所面临的任务显得比以往任何时刻都更加繁重。
首先,院校扩建和学生扩招为学科成绩管理模块在数据容量上增加了压力。近几年,随着一些高校教学资源的整合和扩充,许多高校设立了新校区、设置了新专业,反映在学生成绩管理上则是成绩数据的时空容量同时增长。每多出一个学生,从学籍材料到各年度学科数据再到图形化成绩资料都会相应增加,教师教务管理系统所要处理的信息量也会相应增加,这首先在量上增加了数据压力。
同时,素质教育为学科成绩管理如何更好地服务教师施教和学生学习提出了新的课题。素质教育是我国长期以来所推行的一项基本国策。学科成绩是高校学生在校的唯一量化评价指标,如何通过这些数据来及时反映出学生的学习效果和心理需求、反映出教师队伍的教学质量和教学改革进度,已经成为教务管理系统化的一个重要课题。
其次,教学管理模式改革为建立规范化的成绩管理系统并进行深度信息挖掘提出迫切需求。当前许多高校都在积极推进教学管理制度改革,逐步以学分制和选课制替代原有的学年制和班级授课制度,这种模式的改革在提高学生的学习积极性的同时,无形之中也为成绩管理工作带来了一定难度,比如增加了课程设置的不确定性,成绩管理不能再以自然班级为单位,而是必须以单个的学生或者学生组合为单位,使得成绩管理更加复杂。
最后,网络化和信息化的需求为传统成绩管理模式的转型升级提出新的任务和方向。随着学分制等改革进程的推进,学生成绩管理系统的表单链路和字段设置都与传统的数据库有较大差异,如何及时处理这些数据并实现与其他系统的无缝链接,也是新时期高校成绩管理的一大难题。