基于Data Mining技术的高职院校人才培养工作状态数据平台建设的思考
2017-01-16李福胜高文天
魏 威,李福胜 ,高文天
(郑州铁路职业技术学院,河南 郑州 450052)
基于Data Mining技术的高职院校人才培养工作状态数据平台建设的思考
魏 威,李福胜 ,高文天
(郑州铁路职业技术学院,河南 郑州 450052)
高等职业院校人才培养工作状态数据采集与管理平台,是教育部推出的一个让各级教育管理者了解院校发展的信息窗口,在高职院校教育管理工作中发挥着越来越重要的作用。基于Data Mining技术,就分析、使用好平台数据提出了相应方法和实施路径,同时也列举了应用实例。
数据挖掘; 高职院校; 数据平台;建设
近年来,随着互联网、云计算等技术的迅猛发展,“互联网+”行动计划已应用在大数据时代的多个领域。数据挖掘(Data Mining,简称“DM”)是一个多学科交叉融合的新兴计算机技术,在互联网方面使用广泛。为贯彻《国务院关于加快发展现代职业教育的决定》,建立常态化的职业院校自主保证人才培养质量的机制,教育部印发了《关于建立职业院校教学工作诊断与改进制度的通知》,强调职业院校要充分利用信息技术,建立校本人才培养工作状态数据管理系统,及时掌握和分析人才培养工作状况,依法依规发布社会关注的人才培养核心数据。因此,高职院校要积极推进“高等职业院校人才培养工作状态数据采集与管理平台”(简称“状态数据平台”)的建设和运用,应用DM技术,发挥其在宏观管理、行政决策、院校治理、教学改革、年度报告中的基础性作用,为学校管理决策服务,实现教学管理的制度化、规范化和标准化,不断提升人才培养质量。
一、状态数据平台建设现状
(一)平台功能
状态数据平台是教育部推出的一个能全面了解各院校状态的重要信息窗口,从2008年开始实施,其数据覆盖了学校人才培养的各个方面,具有独立、原始、真实、公开的特点,反映了学校的办学状态。经过8年的填报、反馈、改进和完善,主要包含有院校基本信息,院校领导,基本办学条件,实践教学条件,办学经费,师资队伍,专业,教学管理与教学研究,社会评价,学生信息(扩展),补充数据,补充和案例分析共13个模块,每个模块又包含若干子功能。
通过“高职数据中心”入口进入到学校的数据库中,可以了解本校现状与省内、全国中位数相对比的情况(如表1所示)。通过表1可以看到该校12项核心指标数据,以及全国示范,国家骨干及省示范,省与全国中位数和评估标准,这些数据对高职院校分析现状,调整管理策略具有重要意义。
表1 基本办学条件
(二)存在问题
随着信息技术的发展,以及高职院校数字化校园的建设,教育部越来越重视数据平台的填报和使用,已在全国各高职院校推进网络版数据采集与管理平台的使用。目前,状态数据平台已被教育部纳入“金教工程”,作为项目评审、人才培养状态监测等日常管理工作中的数据支撑。状态数据平台的数据资料是宝贵资源,是决策的基础,将其加以收集、分析后的相关信息,可支持决策的形成。但从教育部反馈的数据采集情况来看,部分高职院校的状态数据采集出现格式不规范、单位被忽略、关联不一致等问题,为决策管理提供了失真的参考信息,不利于全面掌握院校办学水平。
状态数据平台不只是为了反映教学运行现状而进行统计汇总数据,更重要的是要通过数据分析,把有价值的数据转化成对院校管理监控有用的信息,进一步完善高职院校内部质量保证体系,促进院校规范化管理。但目前状态数据平台是一个由海量数据构成的数据仓库,每个院校的数据量可达到数十万条,而且大多是绝对数据,即为自然数据。高职院校要对自然数据进行分析,聚合和关联数据仓库中的各类绝对数据,生成有用的相对数据。由于数据采集字段的逐年增加,数据间的关联度越来越复杂,因此需要借助DM技术对状态数据平台进行数据分析。
二、DM技术及实施步骤
(一) DM技术的概念
DM技术是计算机学习技术的一种,它可从数据库大量的数据中分析、挖掘并提取隐含在其中对用户有用的信息和知识。即它是一个从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取人们事先不知道的信息,并进行整理、归纳与分析的过程,把这些较为隐蔽的有意义、有价值的信息,以人们容易接受的模式,为管理人员提供参考依据。
(二) DM技术的实施步骤
目前,有影响力的DM过程标准是CRISP-DM(cross-industry standard process for data mining),它已得到如IBM、SPSS、SGI、NCR等多家公司和企业的认可。CRISP-DM把数据挖掘分成6个步骤,这6个步骤顺序不是一定的,经常要根据实际情况进行调整:
1.业务理解(Busingess Understanding)。理解项目目标和业务需求,提出数据挖掘问题,对目标有明确的定义并建立项目计划。
2.数据理解(Data Understanding)。收集原始数据,熟悉数据,检查和确认数据的质量,发现数据的内部属性。
3.数据准备(Data Preparation)。对数据进行初步的整理,剔除不完全数据,把未处理的数据集转化为模型算法可以处理的规范数据集,建立数据挖掘库。
4.建模(Modeling)。选择建模算法,产生测试模型,建立模型和评估模型。
5.评估(Evaluation)。检查并评估已经建立好的数据挖掘模型,验证数据挖掘结果,监视数据挖掘过程并确定下一步工作。
6.布署(Deployment)。制定数据挖掘实施计划,制定监控该计划实施的方法,完成评价报告。
以上步骤不是一次全部完成,在实施过程中个别步骤或所有步骤要反复进行。
三、 状态数据平台数据分析
(一)利用数据关联规则
关联分为简单关联、时序关联、因果关联,关联分析的目的是找出数据库中隐藏的关联网。状态数据平台中的数据以一种结构化数据组织形式存在,利用其依附的数据模型可刻画数据间的关联。但数据之间的关联是复杂的,除了依附在数据模型中的关联,绝大部分是隐藏的。对于高职院校而言,使用数据关联规则关键在于能否在数据平台确定核心要素,根据核心要素所反映的人才培养工作状态,分析其存在的问题,围绕核心要素到数据平台挖掘与其关联的数据进行分析。如:把核心要素确定为生师比,将某校的状态数据平台中“6.1.1校内专任教师基本情况”“6.1.2校内专任教师授课及教学工作量情况”“6.2.2校内兼课老师授课及教学工作量情况”“6.3.2校外兼职教师授课及教学工作量情况”与“7.2课程设置”一起进行数据挖掘,把分散于多个数据表中的关联数据集中起来进行分析,可以解析出该校各专业的折合教师数。再与“7.1.1开设专业”相关联(如表2所示),可分析出该校各专业的生师比情况。
表2 各专业的生师比情况
该校的整体生师比是16.35,满足办学基本条件。但通过表1可以看出:护理专业生师比明显偏高,师资严重不足;物流管理专业生师比偏小,师资过剩。该分析可为学校师资队伍建设决策提供参考依据。
(二)利用聚类理论分析
聚类分析是将集中的数据进行分组,使得每一组内的数据尽可能相似而不同组间的数据尽可能不同。在状态数据平台中,可将当年填报的状态数据与历年来的状态数据进行聚类分析,从中得到学校的发展趋势。如通过“生均实践场所面积”这个项目进行聚类分析,可以反映出高职院校实训条件的发展状态。表3为某校2011年至2015年的生均实践场所面积。
表3 2011年至2015年生均实践场所面积
从表3可以看出,该校在2014年之前实训条件建设力度不足,在2014年加大了实训条件建设,生均实践场所面积有较大增加。
(三) 利用可视化方法
可视化方法是最为简单实用的分析方法,通过图表等直观形式,可以就一个或多个项目进行数据分析。在状态数据平台中,可以广泛使用此方法,为决策提供数据参考。表4和图1采用了列表和饼形图的形式表示了某校的专业建设与课程开设情况。
表4 专业建设情况
图1 课程开设情况
从表4可以看出:该校共设置了61个专业,全国示范是47,国家骨干及省示范是36,同类院校是30,全省是30,全国是28,说明该校专业设置较多,可以作为专业结构调整的数据参考。从图1可以看出,该校纯理论(A类)课程占26%,理论+实践(B类)课程占53%,纯实践(C类)课程占21%,说明实践教学还有待进一步加强。
四、结束语
实践表明,科学利用DM技术,充分挖掘状态数据平台中的各类数据,并转化成有用信息,能更好地为高职院校的人才培养工作服务,实现“让平台数据为我所用,让平台数据为管理决策所用,让平台数据为学校的发展建设所用”。随着状态数据平台建设的不断深入,积累的数据越来越多,进一步基于DM技术分析好平台数据,可适时调整学校发展路径,为深化人才培养模式改革,完善教学质量保证体系,提高人才培养质量提供可靠保证。
[1]卞昭玲,张艳欣.大数据时代档案信息服务课程建设初探——以河北大学档案学专业教学为例[J].档案学通讯, 2015(1): 78-81.
[2]汪刚,朱琳.网络教学平台下的数据挖掘技术探讨[J].电子测试,2016(7): 57-58.
[3]江苏省教育厅.高等职业院校人才培养工作评估实务与点评[M].北京:高等教育出版社,2011.
[责任编辑:赵 伟]
Consideration on the Data Platform Construction of Talents Training Work Status in Higher Vocational Colleges Based on Data Mining Technlogy
WEI Wei,LI Fusheng,GAO Wentian
(ZhengZhou Railway Vocation and Technical College, ZhengZhou 450052, China)
The data acquisition and management platform of personnel training work status in higher vocational colleges, is an information resource which was introduced by the ministry of education to all levels of educational administrators to understand the development of colleges and universities. It plays an increasingly important role in higher vocational education management. Based on the data mining technology, this paper puts forward the analysis method and the implementation path for analyzing and using the data of the platform, and also enumerates the application examples.
data mining; higher vocational college; data platform; construction
2016 - 04 - 23
郑州铁路职业技术学院教科研课题(2016JKY008)
魏威(1960—),女,河南郑州人,郑州铁路职业技术学院高级实验师,研究方向为计算机技术。
TP317
A
1008-6811(2016)-04-0043-04