APP下载

互联网+教育大数据分析平台构建研究

2019-12-12王小伟

中国管理信息化 2019年21期
关键词:教育大数据深度融合互联网

王小伟

[摘    要] “互联网+”给教育领域带来的不仅有海量的开放性学习资源,在促进传统课堂和在线教育的深度融合过程中,还产生了大量的行为数据。如何全面采集教与学全过程数据,并对这些数据进行挖掘分析,实现教育决策的科学化是个值得深入研究的课题。本研究从功能需求出发,通过分析教育大数据平台的使用场景,设计构建了教育大数据平台的基本架构,并对平台建设过程中的关键问题进行了阐述,以期为后续教育大数据平台的具体实现奠定基础。

[关键词] 互联网+;教育大数据;深度融合;信息化

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 21. 079

[中图分类号] G710    [文献标识码]  A      [文章编号]  1673 - 0194(2019)21- 0198- 02

1      引    言

高校的信息化建设起步较早,通过各类信息系统的使用,给工作带来了巨大的便利,在使用过程中积累了大量的数据资源[1]。随着学校信息化应用程度的不断提高,数据量越来越大,数据种类也越来越多,不仅包括结构化数据,还包括大量半结构化、非结构化数据。在数字校园1.0时代,虽然完成了基本的数据同步和交换,但是大多数交换仅限于基础数据,大量的业务数据依然尘封在各个业务系统,没有发挥数据之间的关联作用,依然存在着信息孤岛[2]。

“互联网+”概念的提出,给各行各业都带来了巨大的变革。“互联网+”即“互联网+各个传统行业”,但它不只是简单的两者相加,而是将信息技术与传统行业进行深度融合,创造新的发展生态。对于教育领域[3]来说,互联网带来的不只是海量的开放性学习资源,还有传统课堂教学与学习方式的变革。近几年,随着网络学习空间、MOOC、微课等的大量应用,不仅颠覆了传统的授课模式,而且促进了传统课堂和在线教育的深度融合[4],在此过程中,产生了大量的行为数据。面对这些海量的数据,如何全面采集教与学全过程数据,并对这些数据进行挖掘分析,以此来真正促进学生的个性化学习, 实现教育决策的科学化[5]是个值得深入研究的课题。

本研究对教育大数据平台的架构及其关键技术进行研究,希望能为后期建设提供参考。

2      教育大数据平台的构建

2.1   功能需求

教育大数据平台的核心功能是从各个相关业务系统进行数据采集,通过整合、分析,深入挖掘数据之间的关系,进而为各类决策提供数据支撑。基本功能需求:

(1)全量数据交换中心,应具备从各个业务系统采集各类结构化和非结构化数据的能力,提供各种标准化数据接口,以满足不同数据源的采集需求。

(2)中心数据库,应具备针对海量数据的高效计算能力,因此高可用、低成本、高容错、可扩展的分布式存储是必要的。

(3)应用中心:采集数据的最终目的是为了应用,这是我们的终极目标,因此应提供各类跨系统跨部门的查询、统计功能;提供面向教育领域的分析挖掘模型及其相应的算法,提供各类交叉数据挖掘功能,使得数据挖掘信息更全面,结果更可靠。

(4)用户中心:面向各类人群,提供各类服务。

2.2   教育大数据平台的使用场景

学生用户:通过采集学生的学习、生活等行为数据,进行数据分析和挖掘,可以对学生做出学习效果评估、学习成绩预警、心理健康预警、就业前景预测等,进而为学生提供个性化学习路线建议,找到最适合学生的学习方式。

教师用户:通过采集教育环境数据,一方面可以对教师的教学行为进行诊断,方便教师适时调整教学模式、教学计划进度等。另一方面可为任课老师或管理老师提供精确的学生画像,让教师能准确掌握每个学生的学习和生活情况,进而为学生提供个性化管理和授课,适时地进行人工干预,实现真正的因材施教。

教学管理者:通过大数据技术在教学过程中可以更加准确地分析评价课堂教学的质量和效果。以往对课堂、教师的评价体系是定性和模糊的,无法做定量的判断,大数据平台下,可以通过采集各类教学过程数据,高效地获得教学的真實情况,从而得到真实的教学评价。

行政管理者:通过将教育环境中的数据利用起来,从中挖掘出潜在的有价值信息,为各类管理决策提供有效依据,从而使得高校的管理更加具有目的性和高效性。

3      架构设计

结合前面的功能需求,设计了教育大数据平台的基本架构,如图1所示:

数据源:包括现有正在运行的各个业务系统数据(含结构化数据和非结构化数据)。

数据交换中心:主要负责采集各个业务系统数据,通过数据清洗、转换、整合,形成规范的标准化数据,进入中心数据库;同时当数据源数据发生变化时,负责同步数据到相应业务系统。

中心数据库:承载着非常重要的功能,数据的准确性、规范性非常重要。因此各业务数据在进入中心数据库之前一定要进行清洗、比对、过滤,形成比较准确全面的数据,才有可能提供给业务系统共享并支持下一步的大数据分析等应用。

应用层:基于中心数据库,对各类数据进行数据分析和数据挖掘,并进行可视化展示,为各类人群提供各类服务。

4      教育大数据平台建设过程中的关键问题

教育大数据平台能够提供海量数据的高效计算,能够为学校管理者提供有价值的数据支撑和价值挖掘。但在实际建设过程中,往往存在着数据类型多样、数据来源众多、数据质量低下等问题。因此,在构建教育大数据平台之前,需要进行大量的数据准备工作。

(1)建立数据标准:参照国家的信息管理规范,与各业务部门共同研究制定校级数据标准;在集成过程中,辅助各种业务检验规则进行验证,根据结果反馈并修改数据规则及质量问题,逐步提升数据质量;同时,总结和形成数据集成流程标准、转换规则标准、流程变更标准等数据管理标准,制定数据使用和管理等相关规章制度。

(2)數据采集:是教育大数据平台建设过程中的重点和难点。只有保证数据的准确性、及时性和有效性,才能最大程度地发挥数据的作用。数据来源通常有两种方式:自动获取、手工导入。通过与现有业务系统数据库对接可实现数据的自动获取,手工导入由数据提供部门进行手工导入,可能存在时效性问题。在实际集成过程中,应尽可能准确地确定数据的源头,尽可能自动获取数据,以保证数据采集的时效性和准确性。

(3)数据交换中心:主要是对收集到的数据进行存储、清洗、过滤,将数据转换成标准化数据。不同类型的数据可以通过多种方法采集到,而这些数据想要用于数据挖掘,必须要经过数据处理,因为采集到的数据往往是不完善的,可能存在各种各样的问题,必须通过技术手段来处理这些采集到的原始数据,即通过数据清洗、数据变换、数据提取这一过程来处理原始数据。

(4)应用中心:主要是基于中心数据库,对数据进行深度挖掘,并通过可视化方式进行展示,从而为各类人群提供各类服务。因此该部分的重点是各类数据模型的建立,使得针对教育领域的数据挖掘更丰富、更可靠。

(5)计算能力:由于要进行大量的运算,因此需要分布式计算框架,并且要有很好的扩展性、容错能力和高效可靠的输入输出,以满足大数据处理的需求。

5      结    语

教育大数据平台最核心的应用就是对数据的分析,其目标是发现数据内在的规律,挖掘数据中隐藏的信息,从而辅助制定决策。因此,全样本分析是大数据分析的关键,我们需要尽可能多而且全面地收集学生、教师、管理机构的相关信息,才能为我们进一步的分析提供数据支撑。

本研究从功能需求出发,通过分析教育大数据平台的使用场景,设计构建了教育大数据平台的基本架构,并对平台建设过程中的关键问题进行了阐述,为后续教育大数据平台的具体实现奠定基础。

主要参考文献

[1]李建.大数据时代高校数据中心的建设构想[J].信息通信,2018(1):197-198.

[2]束乾倩,涂庆华,崔聪.教育信息化2.0视域下的大数据分析平台建设思路[J].教育现代化,2018,5(41):314-315.

[3]李振,周东岱,刘娜,等.教育大数据的平台构建与关键实现技术[J].现代教育技术,2018,28(1):100-106.

[4]李书钦.面向智慧决策的高校大数据平台的设计与实现[C]//中国计算机用户协会网络应用分会2018年第二十二届网络新技术与应用年会论文集,2018:4.

[5]杨竞尧.面向教育的大数据平台设计[J].中国战略新兴产业,2017(44):19-20.

[6]唐燕,刘仁权,王苹.基于Hadoop的高校大数据平台的设计与实现[J].信息技术,2017(12):105-109.

[7]龙虎,李娜.大数据分析处理与平台架构技术研究[J].电脑编程技巧与维护,2019(3):88-90.

猜你喜欢

教育大数据深度融合互联网
教育大数据在教育管理中的运用分析
教育大数据研究综述
信息技术与教学难以深度融合的成因及解决途径探析
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施
“互联网+教育”变革路径研究进展