APP下载

数据挖掘在高职学生职业能力发展定位中的应用

2014-11-10李松涛

科技资讯 2014年6期
关键词:高职生数据挖掘

李松涛

摘 要:随着高职生教育不断地发展扩大,如何提高职学生能力发展定位已经成为社会的一个热点话题。学生的能力定位和规划决定着学生的未来和发展,但现如今学生能力分析不能很完全的提供有效信息,本文通过总结归纳数据挖掘的相关技术,探索数据挖掘技术如何应用于高职生能力发展定位与预测。

关键词:数据挖掘 高职生 能力发展定位

中图分类号:G641 文献标识码:A 文章编号:1672-3791(2014)02(c)-0183-01

1 数据挖掘的内涵

广义上说的数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用、可信新颖的信息和知识的过程。即数据挖掘从数据库的相关数据集合中抽取有价值的知识、规则或深层次的信息。狭义上的数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据之间关系的过程,是知识发现过程中的一个关键步骤。数据挖掘是一门广义的交叉学科,它的发展和应用涉及到不同的领域,尤其是数据库、人工智能、数理统计、可视化、并行计算等。数据挖掘的使用极大地提高了信息的利用率,使用有效信息更高效,为社会与人类的发展提供了方便的实用工具。

2 应用于学生能力信息的数据挖掘技术方法

根据不同的问题及数据类型,存在相对应的数据挖掘技术方法,方法如下。

第一,分类与预测:分类是根据问题情况事先分好类别,利用某个分类器一一划分数据库中的数据对象,并分配到相对应的类别中。分类方法在学习过程中提供了指导性作用。预测是为了预测未知类别的数据对象,通过之前学习归纳的方法模型预测未知数据对象。其中分类模型可应用于预测。

操作步骤为:(1)构造对数据进行分类的分类器。例如运动员体能数据库中,根据学体能测试成绩,将运动员的成绩分类为:优、良、可、差四个等级。(2)精确分析分类规则,即是通过总结分析运动员成绩数据,对成绩分类等级做出更加具体的分类规则描述,如“体能测试科目总分高于85分的运动员分为等级优”。(3)最后是利用制定完备的分类规则来分析数据库中的相应数据。

第二,聚类:聚类是将数据全部输入数据库中,然后对数据进行分析,其方法步骤正好与分类是相反的。其内容是根据数据的相似性,相似度高的划分到同一组。聚类是一种无指导性的学习过程,也可以说聚类与分类是一个互逆的过程。

第三,决策树:主要应用原理是利用概率论分析事例的概率数,在此基础上划分数据到不同的类别,并以树的分支形式表示。根据数据的分类情况也可以预测数据的发展趋势,这是这种方法的一个优点,优点还有数据表达直观,并且应用便捷快速,易于理解,但是不适合于复杂量大的数据,由于分支太多会埋没了优点,不利于使用。

第四,遗传算法:这种方法适用于结算最优数据,其内容是利用概率计算,直接计算出最有数据结果的方法。遗传算法模拟了自然界优胜劣汰、适者生存的自然进化规则,生成的用于数据选择的随机搜索算法。其优点是在对数据进行操作过程中,不需要制定规则,直接用于数据对象,直接快捷的得倒最优化搜索。缺点是应用比较单一化,可以配合其他方法使用。

3 数据挖掘技术应用于高职学生职业能力发展定位

如何开发优质课程,提高课程对就业和能力这两个要素的针对性;如何提出以“提高学生能力”为教学本位的教育方案,是目前各大职业院校所面对的重要问题。要想归纳出教育教学方案中所必不可少的、课程中应该重点传授的知识点和能力培养方向,就需要对学生们的招生信息、在校表现情况和就业信息等等的相关信息进行挖掘,从而获得对校方来说了解学生的有用信息,并把这些信息同企业对学生需求的信息结合起来。

高校储存着大量学生数据,包括教育信息和就业信息。教育信息同样分为两部分,一部分是教学直接相关的,如学业成绩、学绩点、获奖情况等等;一另部分则是与非智力因素有关,包括学生的性别、身体状况、心理健康情况等等。就业信息、顾名思义,可能包括学生就业所在的企业地域、企业性质、所处职位、行业、薪资待遇等。近年来,信息化应用与存储规范化的推进使得高校的学生个人信息库越来越丰富。但与信息高度丰富不同的是,这些数据和信息都没有被充分利用。高校在制定学生们的培养计划时很少注意到这类信息,这些宝贵并且具有指导性的信息被遗忘了。但培养计划的制定者如果整合学生信息并从中总结出规律,那么这种规律能很好的启发教育者应该重视培养学生的哪种方面素养。本课题就是从这个角度出发,总和并研究学生信息和最终就业的信息,挖掘出其中包含的规律,为培养计划的制定和设计提供相关的理论支持。数年以来,高职院校在其教学和管理工作,积累了大量的学生信息数据,这些信息已具备了形成一个信息库的基本条件。而目前需要做的,是将这些数据库进行开发,通过对这些教学信息进行有针对性和关联性的分析和挖掘,总结出课程的效果与其他因素的关联,为培养计划的决策者支持信息,以便教学工作能更有计划和效果的进行,课程安排能更加合理的开展,教学质量进一步提高,学生相关能力也进一步提升。

4 结语

将学生的个人信息,包括教育信息和就业信息等挖掘出来,整合成对校方设计培养学生、了解学生的有用信息,并把这些信息用于在分析企业对学生能力的需求上,从而进一步归纳出课程设计和能力培养的侧重点。把新兴的数据挖掘技术应用到学生管理工作中,这在大力提倡科教兴国的今天,对于提高教学质量,培养全方位人才无疑具有十分重大的现实意义。

参考文献

[1] 安淑芝.数据仓库与数据挖掘[M].清华大学出版社,2005.

[2] 于立红,张建伟.基于数据挖掘的高职生成绩分析与预测[J].郑州轻工业学院学报:自然科学版,2006(3):77-79.

[3] 慕春棣,戴剑彬,叶俊,等.用于数据挖掘的贝叶斯网络[J].软件学报,2000(11):660-666.endprint

猜你喜欢

高职生数据挖掘
积极心理学视域下高职生就业观教育研究
数据挖掘技术在内河航道维护管理中的应用研究
高职生开展电子竞技运动的现状调查与分析
高职生的学习现状与改善措施
关于高职生换元积分法教学的探索
高职生自我容纳与容纳他人调查研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书