基于大数据技术的在线教学系统探析
2020-01-08李娜娜任芝军闫运忠
李娜娜 万 青 任芝军 闫运忠
(河北工业大学 天津 300401)
1 大数据技术
McKinsey定义大数据技术[1]为一种在获取、存储、管理、分析等方面规模远超传统数据库软件工具处理数据能力范围的数据集合,具有海量数据信息、快速的数据流转、多样化的数据类型以及价值密度低四大特征。大数据的意义不在于获取庞大复杂海量数据信息,而在于对看似无关联数据进行专业化、定制化处理,以达到挖掘数据背后隐藏关联信息,获取数据增值的能力。舍恩伯格和库克耶在《大数据时代》[2]指出大数据不采用抽样调查的随机分析法,而是对全部海量数据进行分析处理。IBM 提出大数据具有海量、高速、多样性、可变性、低价值密度、复杂性、真实性[3]7V 特征。
2 在线教学
在线教学不受时间空间限制,以自己喜欢的学习模式开展自主学习。《教育信息化十年发展规划(2011-2020)》中提出,学校在教育教学方面的变革要以学习者采取多样化、个性化学习方法改革上取得突破进展。[4]在线学习已成为混合式教育、差异性教育、终身学习型教育领域主要研究热点。[5]
今年新冠病毒肆虐,全球绝大多数学习者采用了在线教方式学习,在线教育的用户渗透率得到空前提高,各层次用户群体对在线教育持续关注度热情不减。但是,由于在线教学对学习者自主学习能力提出较高的要求,学习过程状态无法得到实时评估,学习效果参差不齐。在缺乏授课者实时随堂监管情况下,部分学习者会出现因缺乏自我有效管控而导致专注力不够、学习状态涣散等效率低下行为。因此需要建立一种在线教学监督系统,通过收集在线学习全流程中学习者的学习效率反馈数据,对采集的各类型数据进行处理分析,得出学习者的学习效果分析结果,根据反馈推断出知识掌握情况,同时给出指导性的改进意见,提升学习全过程的知识认知水平。
3 大数据在教育领域的应用
如何利用大数据,最大程度挖掘在线教育教学潜在价值,成为各研究所重点研究内容。美国2005 年DQC[6]建议教育决策者大量收集高质量教育教学数据,为更好提升学习效果给出策略性可行建议。2009 年在全美开展的SO1[7]项目,希望利用数据分析技术对学校每个学习者的特点、学习进度开展针对性的分析与未来学习能力预测。同时为每一位学习者提供个性化的学习任务清单,来适应不同教学进度。在《教育数据挖掘分析提升教学概述》[8]中明确表示在教育教学领域中结合教育大数据运用数据挖掘和分析数据技术提升教学水平。近年我国也陆续出台《促进大数据发展行动纲要》《“互联网+”行动计划》《新一代人工智能发展规划》等文件,明确发展教育文化系统大数据。[9-10]
4 教育数据分析过程
教育数据分析是利用相关数据分析手段对采集到的数据进行归纳、分析、解读的过程。根据分析结果判断采取不同干预措施以及学习改进计划,提升学习者的学习成效。
(1)数据采集:包括数据库采集中ETL和Sqoop,关系型数据库MySQL 和Oracle 等;网络数据采集中借助于网络爬虫或网站公开的API;文件采集中实时文件采集和处理技术flume、基于ELK 的日志采集和增量采集等。
(2)大数据预处理:数据分析前为提高数据质量,将采集到的原始数据“清洗、填补、平滑、合并、规格化、一致性检验”操作,为后期分析奠定基础。
(3)大数据存储:用存储器以数据库的形式,存储采集到数据的过程,包含三种典型路线:基于MPP架构的新型数据库集群;基于Hadoop 的技术扩展和封装;大数据一体机。
(4)大数据分析挖掘:数据挖掘算法、可视化分析、语义引擎、预测性分析、数据质量管理等方面,对复杂无规律的数据进行萃取、提炼、分析、整合的过程。
(5)数据反馈:以可视化方式将分析结果数据呈现给学习者,以此作为制定教学效果判别依据。
(6)可行性建议:根据可视化反馈结果结合可行性建议进行有针对性的学习方式改进。
5 结论
综上所述,当今教育现代化背景下,利用大数据分析技术,通过对在线学习过程中产生的结构化、半结构化、非结构化数据进行采集挖掘分析,可以得出不同学科背景、不同学习能力等学习者的学习差异、了解不同学习者的行为学习特征。以此为据,制定出可视性、差异化、定制性学习策略,为学习者在线学习的效率提升提供可行的方案。