利用学科成绩数据挖掘提升高校教务管理水平的路径探索
2017-03-31林月娇
林月娇
随着信息化和网络化进程的不断演进,人类由于生活和生产作业所形成的数据信息量正以几何级的增长速度不断产生。目前,我国许多高校都开展了以校园网为平台的“数字化”校园建设,大量与学生成长相关的学科成绩和其他评价分析数据被储存记录下来。本文主要研究利用知识发现的理论方法对这些数据做深度的研究分析,挖掘出数据间隐含的关联关系,以便更好地应用管理创新理论,提高学生管理的信息化水平,提升高校教务管理水平。
一、知识发现与数据挖掘的理论基础
(一)知识发现的研究综述
知识发现(Knowledge Discovery in Databases,KDD)一词最早出现在1989年8月美国底特律召开的第11届国际联合人工智能学术会议上[1]。1996年,知识发现被Fayyad U,Piatetsky,Shapiro G和Smyth P定义为:知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程[2]。对KDD的研究主要包括从数据库的角度进行研究以强调知识发现的效率,从机器学习的角度进行研究以强调知识发现的有效性,从统计分析的角度进行研究以强调知识发现的正确性,从微观经济学的角度进行研究以强调知识发现的最大效用。KDD过程是多个步骤交互螺旋式上升的学习和总结过程[3],基本流程包括:
(1)限定学习领域,储备预先知识、确定学习目标;
(2)聚焦目标数据集,选择一个数据集或在多数据集的子集上聚焦;
(3)数据预处理,数据降噪或数据清洗;
(4)数据转换;
(5)确定数据挖掘功能法则;
(6)获得知识信息、运用知识成果并重新选定学习目标。
在创新的过程中,单单依靠显性知识已经不足以支撑整个思维求异和技术创新的全流程。随着数据量的爆炸式增长,传统数据库的检索查询已不能满足信息社会的深层次需求,再加上传统分析手段的落后,大量数据来不及整理、分析或利用就已“时过境迁”成为无效信息,而且被长期积压在数据库中浪费存储资源。为了及时消解数据产生和数据理解之间的矛盾,还必须定期对数据进行深度挖掘,使得大量被隐藏的、有价值的信息得到有效利用。
(二)数据挖掘的理论探索
数据挖掘(Data Mining)是指使用算法来抽取信息和模式,通常是知识发现过程的一个重要步骤。数据挖掘融合了机器学习、模式识别、数据库技术、统计学理论、人工智能及信息管理系统等多门学科的最新成果。应用数据挖掘技术从大型数据库中發现隐藏在其中的规律和有用信息,为管理层决策提供事实型数据和研究模式。
根据KDD的目标任务,数据挖掘任务可分为:分类或预测模型发现、数据总结与聚类发现、关联规则发现、序列模式发现、相似模式发现、混沌模式发现、依赖关系或依赖模型发现、异常和趋势发现等。而所要挖掘的对象则可以分为:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及web等对象的挖掘。从方法论讲,其挖掘方法一般分为:聚类分析、探索性分析、机器、统计、神经网络(Neural Network)、遗传算法(Genetic Algorithm)、数据库、近似推理和不确定性推理、基于证据理论和元模式、现代数学分析、粗糙集(Rough Set)、集成方法等方法[4]。
(三)小结
综上,知识发现用于从大量数据中抽取规律信息,发现非预期或潜在的价值量,而数据挖掘作为知识发现的重要一环是与实践应用紧密相连的,两者不仅仅是对数据的简单检索调用,而是从数据集合中自动提取出隐含在数据中的关系和模式,进而对未来可能发生的行为进行预测,为决策者提供有力支持。
二、高校成绩管理与学科建设
成绩是学生在校学习期间对所学知识理解掌握情况和教师教学质量评价的原始记录,对学校的教学管理和教学改革措施评价具有重要的参考价值[5]。成绩管理是高校教学管理中的最为基础性的一个环节,是根据教学目的和教学任务,
通过学生的实际量化考核分数来进行统计、查阅和分析的综合性数据处理过程。该过程的科学与否,直接关系到教务管理的实际质量和教学工作的可持续发展,特别是在网络化和信息化的新形势下,该项工作被素质教育赋予更加深远的现实意义。本文所指学科成绩不仅限于学生的笔试成绩,还包括了学生参加各种校内外实习和培训,以及其他形式素质教育的量化数据。
(一)高校成绩管理所面临的新形势
从宏观上讲,随着国家高等教育普及工作的不断推进,以及教育战线“以人为本”理念的逐步深入,高校教务在成绩管理这一环节上所面临的任务显得比以往任何时刻都更加繁重。
首先,院校扩建和学生扩招为学科成绩管理模块在数据容量上增加了压力。近几年,随着一些高校教学资源的整合和扩充,许多高校设立了新校区、设置了新专业,反映在学生成绩管理上则是成绩数据的时空容量同时增长。每多出一个学生,从学籍材料到各年度学科数据再到图形化成绩资料都会相应增加,教师教务管理系统所要处理的信息量也会相应增加,这首先在量上增加了数据压力。
同时,素质教育为学科成绩管理如何更好地服务教师施教和学生学习提出了新的课题。素质教育是我国长期以来所推行的一项基本国策。学科成绩是高校学生在校的唯一量化评价指标,如何通过这些数据来及时反映出学生的学习效果和心理需求、反映出教师队伍的教学质量和教学改革进度,已经成为教务管理系统化的一个重要课题。
其次,教学管理模式改革为建立规范化的成绩管理系统并进行深度信息挖掘提出迫切需求。当前许多高校都在积极推进教学管理制度改革,逐步以学分制和选课制替代原有的学年制和班级授课制度,这种模式的改革在提高学生的学习积极性的同时,无形之中也为成绩管理工作带来了一定难度,比如增加了课程设置的不确定性,成绩管理不能再以自然班级为单位,而是必须以单个的学生或者学生组合为单位,使得成绩管理更加复杂。
最后,网络化和信息化的需求为传统成绩管理模式的转型升级提出新的任务和方向。随着学分制等改革进程的推进,学生成绩管理系统的表单链路和字段设置都与传统的数据库有较大差异,如何及时处理这些数据并实现与其他系统的无缝链接,也是新时期高校成绩管理的一大难题。
利用学科成绩数据挖掘提升高校教务管理水平的路径探索
(二)应用知识发现提高教务管理水平的路径探索
根据上述知识发现理论,首先将本系统研究的“学习”目标确定为“提取学生信息、提升教学质量、完善学科设置”三大定位。而研究所涉及的目标数据集则包括学生从高考到进入高校期间的与学习考核或实习成绩相关的所有数据记录。
在数据挖掘功能法则方面,采用“全流程式”和“切片式”挖掘方式,确保对每个学生入校后各个时期的成绩数据都能监控和分析,而且能够实现“点面结合”的分析模式。拟通过以下三个路径达到上述目标:
1.绘制学生学习成长路线图
高等教育阶段是学生从接受知识到迈入社会工作的重要转折点,也是学生个人性格形成和转变的重要节点。这个过程中,学生的大部分时间在校内度过,此间学生的学习兴趣转移和情感波动情况,都会在学科成绩上反映出来,学科成绩不可替代地成为完整记录和反映学生特长和成长情况的重要量化数据。从培养学生综合能力的角度出发,学校要及时掌握学生成绩出现明显波动,或持续偏科等现象,利用学科成绩等数据以连续的时间序列绘制出学生的学习成长路线图。成长路线图不单单可以供学校使用,也可以供学生家长全面了解学生在校的学习情况,还可以在学生毕业时候,形成一张富有多维度信息量的“立体成绩单”供企业参考,以便企业更加全面地了解毕业生的特长和综合素质。
2.构建教师教学质量评估体系
传统的教师教学质量一般通过课堂授课和调查问卷的评价形式进行,这种方式会因为选取样本的时间采样点较少而无法对某个教师在较长时间周期内的教学质量进行全面评估,也不利于对教师的教学质量形成量化的评估数据。因此,可以通过借助考察学生成绩的方式,从学生的学习成果反推得到教师的授课效果,从侧面得到教学水平的衡量效果。这种方式尤其适用于高校公开课等参与学生较多的课程评价,而且能够形成实时的直观结果。
3.完善学校学科课程设置方案
高等教育的学科划分和高等学校主要以学科为基础的专业设置,是现代大学的立学之本,教学之范。它關系着人才培养的规划和目标、教育资源的配置和协调、教育的质量和效益、学术的繁荣和发展以及高等教育与社会发展的协调与和谐等一系列重要方面[6]。在学分制和选修教育改革后,高校的课程设置变得更加灵活,设置方案也变得更加复杂。如何与时俱进来调整课程设置,也成为高校教务管理的一大课题。教学管理系统应该根据特定时期内学生的课程选修变化态势和成绩数据的变化情况,相应调整部分选修课程的设置,以满足学生的兴趣培养和社会需求。
三、高校学科成绩数据挖掘系统的具体实现
知识发现的过程就是数据处理和分析应用的过程,本节将就如何进行学科成绩数据挖掘的宏观框架设计和软件实现进行探讨。
(一)利用知识发现理论进行学科成绩数据挖掘的顶层设计
如图1所示,首先对整个学校学科成绩的不同数据源进行整合,包括对字段、内容的格式化,合并为单个的目标数据库。再根据本次知识发现的主要目的,选择核心数据源提取作为分析重点,根据不同的挖掘法则建立模型,并对隐含在数据中的信息进行分析预测,为供教务管理决策提供理论依据。
C/S的软件架构实现信息查询系统。基于网页的B/S架构可以方便校外用户或企业通过电信网访问系统,基于C/S架构的查询系统可以用于校内管理用户实现对数据的快速查询操作,并实现数据的备份等操作。具体的实现路线如图2所示:
图2学科信息挖掘系统的软件实现
四、研究结论与展望
综上所述,随着高校管理和决策者对信息质量的要求不断提升,传统的静态统计分析法已经难以适应需求,面对海量、多维而宝贵的学科成绩如何做到去粗取精、充分利用已经成为高校教务管理朝着智能化、信息化发展的大方向。本文期望从知识发现和数据挖掘的基本理论出发,构建起一套能够充分利用学科成绩等数据的分析和处理系统,解决目前高校普遍存在的“信息数量与信息质量不对等”情况,并从系统的宏观设计到软件的框架搭建给出建议和意见,期望能对高校管理人员,特别是教务管理人员起到启示作用。
[基金项目:天津农学院2014年度本科教育教学研究与改革项目“我校实施创新学分过程中的问题及对策的研究”(2014-B-18)。]
参考文献:
[1] GRIGORIS ANTONIOU(希).语义网基础教程[M].北京:机械工业出版社, 2008.
[2]Fayyad U.From Data Mining to Knowledge Discovery in Databases[J].Ai Magazine, 1996, 17(3):37-54.
[3]邱晓辉.知识发现与数据挖掘分析[J].情报探索, 2011(1):99-101.
[4]毛国君.数据挖掘技术与关联规则挖掘算法研究[D].北京工业大学, 2003.
[5]李丹, 许鑫, 董亚楠.高校成绩管理存在的问题及改革措施[J].河北联合大学学报:医学版, 2013, 15(1):126-127.
[6]纪宝成.中国大学学科专业设置研究[M].北京:中国人民大学出版社, 2006.
责任编辑朱守锂