高职教育数据挖掘探讨与实践研究
2017-12-26杨灵芝刘海明袁也婷
杨灵芝,刘海明,袁也婷
(沧州职业技术学院,河北 沧州 061001)
高职教育数据挖掘探讨与实践研究
杨灵芝,刘海明,袁也婷
(沧州职业技术学院,河北 沧州 061001)
结合高职院校教育大数据,分析并探索适合教育数据挖掘的工具和算法,对学生成绩数据进行简单挖掘,发现适合学生学习规律的课程体系,为教育管理者和教师提供良好的指导措施。
数据挖掘;大数据;实践
1 数据挖掘概述
随着信息化时代的到来,云计算、大数据、物联网、移动互联网等新技术已经慢慢渗透到人们生活的各个方面,这些新技术极大改变了信息技术的体系架构和应用模式,大数据是当今信息互联时代的最重要特点。越来越多不同领域的专业人士发现,投入大量的资金、技术和人才,充分发掘大数据中隐藏的有价值的信息,能够进一步推动信息社会的快速发展。
2 教育数据挖掘的必要性
所谓数据挖掘,是从巨量数据中发现并找出有使用价值的知识。使用灵活的挖掘工具,借助成熟的发掘模型,采用数据挖掘相关规则,参照挖掘流程,最终发现一些有价值有意义的规律,了解各种数据之间的联系或模式。传统的数据挖掘与大数据时代数据挖掘的本质是相同的,不同在于数据的结构发生变化,数据量由海量变为巨量,结果分析由因果性变为相关性分析。随着学校教育信息智能化管理的实施,教育数据呈明显增长趋势,学生学习情况、教师授课情况、教师考核情况、学生就业信息等越来越多的数据充斥在学校信息化管理中。要在巨量教育数据中寻找影响学生学习主动性的因素,发掘影响教师教学积极性和执教能力的原因,就需要采用专门的数据挖掘工具,选取适当的挖掘算法,进行多种挖掘,以便从中发现隐藏规律,从而为提升学校人才培养质量、培养骨干教师和深化教学改革提供有力依据。
3 教育数据挖掘的条件
现有的信息资源包含学生管理系统中学生基本信息、成绩信息,考勤管理系统中学生上课出勤情况,教师管理系统中授课情况、教师个人基本信息、职称信息、科研情况,就业管理系统中学生就业情况、就业区域,在线学习系统中学生学习情况、提交作业,等等,所有这些数据信息都将作为教育数据挖掘的基础数据源。决策树分类方法,能够将影响教师测评结果的各种因素以树形显示出来,并发现学生是影响教师测评的至关重要因素。关联规则方法,能够寻找出影响教师教学质量的一些规律,比如参加培训、参加比赛等,从而提升教师执业能力水平。聚类分析方法,将学生学习、出勤、考试、课程、作业等情况相似的归为一组,从中找出共性规则。预测方法,对学生整体学习行为或个人学习发展趋势作出合理预测,等等。对于一些非结构数据,可以使用R语言数据挖掘工具架构。
4 使用Weka进行教育数据挖掘实践
在高职院校学生信息管理系统中,学生的学习情况是由多方面因素(成绩、学习态度、考勤、课程设计成绩、参加比赛情况、课前预习情况、作业提交情况)综合评定的。从学生管理系统、考勤管理系统中抽取出学生基本信息、专业课成绩信息、学生出勤信息、学生参加比赛信息等相关数据,去掉无关信息,构建学生学习情况信息表。
以通信技术专业学生数据为例,选取该专业核心课程数据,从系统中导出所需要的数据并进行抽取,得到最终的学生学习情况信息表,如表1所示。
表1 学生评价挖掘信息表Tab.1 Student evaluation mining information form
通过分析发现每项指标都是连续数值,结合关联算法要求,需要将上表信息离散化,同时转化为Weka能够识别的字段名称。具体过程如下:第一,7项相关联因素分别用peacetime,attendance,mobile communication,microwave measurement,RF optimization, graduation design,skills contest来表示,其中前6项均将成绩分为优、良、中、及格、不及格5个等级,优为90分以上,良为80~90分,中为70~80分,及格为60~70分,不及格为60分以下,分别用A、B、C、D、E来表示。第二,参加比赛情况按照比赛级别分为国家级、省级、市级、校级和无参赛,分别用A、B、C、D、E来表示。将上述信息表进行预处理,转换得到表2。
表2 离散化后学生评价挖掘信息表Tab.2 Discretized student evaluation mining information form
经过数据预处理后,进行学生评价信息的数据挖掘实验。启动Weka软件,进入Explorer界面,选择preprocess选项卡,打开离散化后的数据表格,其中表格格式要求是.csv或者.arff,观察数据表中数据情况,包含7个属性1 896条数据信息。选择Associate选项卡中的最常用的Apriori算法,设定最小支持度阈值0.1,最小置信度阈值0.8,在挖掘结果界面中生成了3个频繁项集,20条规则。然后改变Apriori算法的最小支持度、最小置信度和生成规则条数3个参数,继续进行挖掘实验,通过多次修改参数设置,从最终多次挖掘结果中选出几条对学生学习行为习惯中有价值的规则进行分析,进一步提出整改措施,辅助教师更好的投入到教学工作。挖掘结果分析如下:第一,attendance=B Microwave measurement=B 17 ==> Graduation design=B 15
5 小结
文章使用Weka中Apriori算法对学生的学习行为习惯进行挖掘分析,从学生学习角度找出影响学生毕设及技能的几点规则,包含学习习惯的养成、技能大赛的参与情况及专业核心课程的引导等。这些挖掘结果为教育管理者和教师提供了良好的指导措施,对学生的培养和教师素质的提升给出了明确的建议。
[1] 魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J].现代教育技术,2013,23(02):5-11.
[2] 牟智佳,俞显,武法提.国际教育数据挖掘研究现状的可视化分析:热点与趋势[J].电化教育研究,2017,38(04):108-114.
Discussionandpracticeresearchofdatamininginhighervocationaleducation
YANG Ling-zhi, LIU Hai-ming, YUAN Ye-ting
(Cangzhou Vocational and Technical College, Cangzhou 061001, China)
This paper analyzes tools and algorithms suitable for educational data mining in combination with the big data of education in higher vocational colleges. It makes a simple excavation of the students’ grade data and finds a curriculum system that suits students’ learning rules and provides good guidance for education managers and teachers.
Data mining; Big data; Practice
2017-10-15
杨灵芝(1982-),女,研究生,讲师;
刘海明(1982-),男,本科,讲师;
袁也婷(1983-),女,本科,讲师。
TP311.13
B
1674-8646(2017)23-0062-02