数据挖掘在教育大数据中的应用研究
2018-12-22王晓妮韩建刚
王晓妮,韩建刚
(1.咸阳师范学院 信息中心,陕西 咸阳 712000;2.西北机电工程研究所 生产部电调室,陕西 咸阳 712000)
随着网络通信和计算机信息技术的发展与应用,人类社会已经进入大数据时代。人们可以感知记录种类繁多和规模超大的网络信息数据,同时通过分析和处理这些海量数据,能够对蕴含其内的核心信息进行深度挖掘,得到更多的价值信息。这些知识已被应用于交通运输、银行保险、科技医疗等各个行业,能够很好地指导和促进企事业的管理与发展。目前信息化技术的迅猛发展使教育信息化进入一个新阶段,随着网络学习和各种应用系统的普及推广,教育领域的关于教师和学生的各类相关数据量增长速度很快,这些教育大数据直接影响学校的日常管理、教学效果和师生的工作学习生活。智慧校园使大数据、云计算、物联网和数据挖掘等网络技术与学校教育深度融合,特别是数据挖掘技术在教育领域的广泛应用,便于从海量教育大数据中获取有利用价值的隐藏信息。通过分析研究这些来自于教师(科研能力、授课情况、个人信息等)和学生(基本资料、学习行为、课外活动、消费记录和社交圈子等)各个方面的有用的知识,将其合理应用到教育教学的多个环节,能够支持领导决策、改善教育质量、促进教育公平、指导学校的日常管理和教学活动等;同时也能够弥补数据挖掘在教育大数据领域中的应用研究这一空白。
1 相关概念
1.1 大数据
大数据(Big data)又称巨量资料,指在一定时间范围内无法通过常规软件工具进行采集存储和分析研究的数据集合[1],只有利用新的处理模式才能够挖掘出其更强的决策力、流程优化能力和洞察发现力的多样化、高增长率的海量信息资产,能指导企事业单位管理决策。
1.2 教育大数据
教育大数据(Educational big data)是指根据教育研究的需要从整个教育教学活动过程中采集而来的,能够创造和发挥其潜在科学实用价值,以此来促进教育事业的发展。它主要来自于政策制度、教学计划、培养方案、学籍状态等教学管理实践;学习行为、课堂视频、师生互动等教学活动;参考资料、MOOC、教学课件、试题库和Q&A教学资源;个人信息、成长发展、工作或学习记录等师生的各类基础信息资料[2]。
1.3 数据挖掘
数据挖掘(Data mining)是从大量不规则和结构复杂的数据中,获取隐藏的有用信息或知识的过程[3]。它以数据为基础,通过各种挖掘算法获取海量数据中所包含的有利用价值的知识,故数据挖掘包括数据、算法和知识这3个基本要素。
2 数据挖掘技术在教育大数据中的应用现状及意义
目前我们所谓的关于学生的基本信息、课堂记录、科研信息、课堂实践这些数据只是教育大数据的冰山一角,还有大量与教学有关的大数据没有被采集,例如学生的家庭状况、课外活动、学习行为、经济状况、消费习惯、社会关系、微信朋友圈、QQ好友、博客、论坛社交圈等数据同样对我们判断和研究学生的学习动机和兴趣爱好等作用很大。但是因为我们以前的数据挖掘技术还不够成熟,因此教育大数据已经浮现出来,而且利用目前的技术手段收集到的只是一部分,这就需要利用数据挖掘对教育大数据进一步地挖掘研究。例如哈佛大学从幼儿园就录制和保存孩子成长视频,通过长时间仔细观察和研究孩子的表情和兴趣点,然后从中挖掘出孩子的兴趣爱好、性格特点和将来可能从事的职业及研究方向。数据挖掘被合理应用于教育大数据中,不仅能够了解学习的课堂表现、学习兴趣和生活习惯,还能够深度管理老师的教学状态和科研活动,这就让教育管理部门能够科学动态评估教学质量。改变了以往仅能利用分析学校资产、财务账目、师生比例、图书资料的册书和人均查阅量等这些基础报表来了解办学状态,通过这类缺乏实时性的静态报表数据很难反映总体教学质量,局限性很大。通过对教育大数据的分析挖掘,可以合理有效地配置教育资源,实时监测教育网路舆情,合理科学的评价教育质量,分析学生个性特点和兴趣爱好因材施教,提供个性化的导学帮助和学习状态的干预警告促进社会公平,指导未来社会人才培养机制,能够提升教学管理精细化和现代化。
3 挖掘技术应用于教育大数据
3.1 应用于学校的日常管理
教育数据的挖掘,对管理部门、教师、学生和技术研发人员具有重要的意义。学校的教学管理数据库中记录着所有教师和学生的工作学习、科研活动、社会实践、处罚奖励等相关情况,领导利用数据挖掘技术对教学资源和管理数据进行深入的关联分析,找出师生各种常见行为或活动之间的内在隐蔽联系。并在管理中采取过程监控、风险预警、分类管理、趋势预测等措施,改变了以前定性和模糊的分析和评价老师课堂教学质量的不科学现象,能够改善学校目前的考核管理方式,实现智能准确、高效管理学校的各项工作,为教学应用和学校发展提供有效科学的决策依据。
3.2 应用于教师教学,推动教学改革
在通常情况下,在教师平时的教学过程中采用讲授法、调查法、参观法、实验法、实习法、分组讨论法、计算机辅助教学法等多种教学方法来完成自己的教学任务。由此通过运用关联规则或回归线性分析数据挖掘等方法来分析研究相关的教育大数据,选择有利于学生知识吸收和教学需要的最佳授课方式。又如采用数据挖掘技术通过智慧校园跨平台了解学习其他老师的优秀课程和教学方法,研究学生个性化学习工具、网络学习过程、兴趣爱好和学习行为,有利于掌握其学习规律和特点,能够为其推荐合适的学习资源,优化学习方法和改善开展自我导向的适应性学习和提高课堂教学质量。它为教育教学活动提供实时科学的信息数据,有助于形成关于教育教学的智慧决策,提供客观依据有利于教育教学活动的有效实施,尽可能地实现和完善教育教学活动的价值与功能。
3.3 应用于学生学习,增强自主学习意识
通过挖掘教育大数据,可以对学生的学习成绩、兴趣爱好、消费轨迹、行为记录及奖励处罚数据库等相关信息进行分析研究和处理,能够快速获取学生的鉴定结果,便于及时禁止和指正学生不良学习行为。这样既能减轻教师的工作量,又能够避免教师对学生先入为主的缺乏客观和公正的主观武断性评价。利用教育大数据的挖掘结果来科学评定学生的学习行为,其优点是合理地反馈学生信息、激发学生学习兴趣、发现学生的个性需求和实现因材施教。根据学生的个人信息、学习成绩、网上学习轨迹、性格特点、知识结构等相关信息,挖掘出学生的基本特征,宏观指导和微观帮助学生不断修正其学习行为。学生不再局限于本校的某位老师的课堂教学,可以自主选择全球范围内的相关课程的著名学者的优秀课件,根据自己的时间和需求来自由学习,这样不但提高了学习效率,而且培养了学习兴趣。有利于教师通过比较事先制定的学生行为标准和实际通过数据挖掘技术对学生个性特征的分析结果,可以指导学生完善人格、修正自己的学习行为和提高学习能力,有利于学生综合素质的全面发展。
3.4 应用于专业技术人员的研发,为教育提供新技术与新模式
在教育大数据中借助数据挖掘研发人员发现智慧校园中各应用系统的使用频率和相关内容,然后根据师生需求优化系统的操作方式和用户界面,不断完善系统以便提高服务质量。挖掘结构化和系统化的教育大数据,将MOOC,游戏学习等新模式和云计算、虚拟技术、3D 打印、网络计算、引擎开发等新技术应用于智慧校园建设中,对教学过程的实时监控和分析研究来保障教学质量。
3.5 为教育资源建设、运用和共享提供了新思路
教师的教学和学生的学习活动能够实现的基础就是教学资源,以前通过教师的自主研发和教育主管部门的配发来建设教学资源,而教师的自主研发极易出现资源技术含量低、可用性差和重复率高的弊端,政府配发的资源只能满足大部分师生的需要,无法满足个性化需求。挖掘教育大数据为教育资源的建设提供了新的思路,为教学资源库的构建提供技术支持,让优质资源的判定有据可依。它使广大师生能够方便地使用和共享存储在云端的教育资源数据,还能对大量非结构化的数据资源进行分析,挖掘出隐藏的有用信息,享受满足自身个性需求的数据资源,能够避免教学资源的重复建设和优质资源的浪费。
3.6 应用于设置课程和试卷分析,使其更加合理化
学生在校学习的过程中,课程合理安排的先后顺序非常重要,因为基础课程没有学的话,那么后继课程的学习就无法进行。即使是同一个年级的学生学习同一门课程,但由于授课老师、班级学习风气和自身的基础等原因,导致最终的学习成绩差别很大。通过数据挖掘的时间序列和关联分析等方法,仔细分析存放学校教学数据库中的往届学生各个学科的试卷和考试成绩,挖掘出这些海量教育数据的有价值的信息并分析这些数据的回归性和相关性性质,寻找其中的有用规律和影响学生学习成绩的重要因素,以此合理安排新生的课程。考试是教学活动的一个重要环节,能够检验教学效果。虽然考试成绩能够反映教学效果,但无法说明影响成绩的具体因素和影响教学的直接原因,不能促进教学发展。加之试题的质量也能影响学生考试分数的高低,探索有效评价试题覆盖知识点全面度和难易度等质量的方法非常重要。如果在试卷分析过程中采用数据挖掘的关联规则,教师通过学生每道试题的实际得分情况便能分析出试题难易度、相关度和区分度等技术指标,就能较为合理地评价试题质量,实事求是地检查其的教学效果和学生对知识的掌握的具体情况,便能指导其今后的教学活动。
4 结语
随着教育信息化的推广应用,使学校多年的教学管理活动积累了大量的非结构化数据。
为了合理有效地充分利用这些教育大数据,本文通过数据挖掘技术对教育大数据进行深度的分析研究,并将其应用到了教学管理、教师授课、学生学习等教育教学的各个环节,有利于优化教学管理、提高教学质量和推动教学改革。但是此类研究国内还不成熟,需要研究者投入更多的精力,突破技术瓶颈和应用限制。