APP下载

构建教育大数据治理框架探析

2022-03-24陈迎春

中国信息技术教育 2022年6期
关键词:教育大数据数据治理

摘要:教育信息化建设日新月异,产生的数据愈发庞大复杂,由此催生出教育大数据管理与应用方面的诸多问题,数据治理势在必行。本文针对当前教育大数据普遍存在的问题,提出教育大数据治理的参考框架,以期能够为教育数大据治理的研究者和实践工作者提供参考。

关键词:教育大数据;数据治理;构建框架

中图分类号:TP309  文献标识码:A  论文编号:1674-2117(2022)06-0000-03

● 引言

2021年9月,习近平总书记在世界互联网大会乌镇峰会的贺信中强调“增强数字政府效能,优化数字社会环境,构建數字合作格局,筑牢数字安全屏障”。教育部《教育信息化2.0行动计划》“智慧教育创新发展行动”的推进,明确了数字资源服务普及行动要引领智慧校园资源的建设、应用与共享。在充分运用云计算、数据挖掘、人工智能等计算机技术的基础上,校园信息化应用更是趋向数据化、服务化、智慧化,全面助力提升教育信息化发展水平,真正实现“互联网+信息技术”与教育创新发展的深度融合。教育信息化建设日新月异,产生的数据愈发庞大复杂,由此催生出教育大数据管理与应用方面的诸多问题,因此数据治理势在必行。

● 科学内涵

何谓数据治理,国内外的研究机构或专家学者说法不一。国际数据管理协会(DMA)提出,数据治理是通过梳理、控制和应用数据以实现顶层设计目标并提供决策支持,是数据管理中最重要的部分;国际标准化组织IT服务管理与IT治理分技术委员会认为,数据治理是指建立在数据采集、存储、交换和应用之上的一系列程序、标准、评估等,确保数据能够被高效有序利用,实现其最大商业价值。国内对数据治理的概念也众说纷纭,中国在2014年6月的ISO/IEC JTC1/SC40(IT治理和IT服务管理分技术委员会)第一次全会上首次提出“数据治理”的概念,引起国际同行很大兴趣,在2015年5月召开的SC40/WG1(IT工作治理组)会议上提交了《数据治理白皮书》,这份标准研究报告认为,数据治理是数据在产生使用价值的活动中,对其进行清理、评估和控制的一系列过程。

● 治理目标

数据治理的目标是通过数据治理框架对教育大数据进行清洗过滤,为教育应用平台应用提供合规完整、准确及时、正确唯一和风险可控的大数据,实现数据价值最大化。有效的大数据治理能够实现大数据与应用的深入融合,提升服务效能,避免决策失误,降低安全风险。

● 构建教育大数据治理框架

教育大数据治理要求数据应用的各个层面都具备治理意识,并根据校园数据应用的差异性逐渐形成个性化的数据治理氛围和实践。一般情况下,数据治理层框架主要包含数据标准化、数据管理、安全技术和治理保障四个方面(如下页图)。数据标准化是基础部分,其他三个方面贯穿数据治理全程。

1.数据标准化

在数据治理的初期首先要建立一套依据学校实际的统一数据标准,在数据采集、传输和使用过程中必须遵循这个标准,才有可能建立开放共享的高质量数据仓库。数据标准可分为基础层标准和应用层标准两种。基础层标准主要是基础性的数据约束规范,如在编制数据字典、数据编码及数据分类等过程中必须严格遵守统一的基础层标准,目的是要保证不同系统中对同一数据的理解无歧义,也为不同应用平台之间数据交换打下良好基础;应用层标准主要是作用于系统功能开发所涉及的全部数据的标准规范,如元数据标准、主数据标准和数据交换标准等,其目的是确保数据在其生命周期中的使用效率和质量,它也是保持数据完整性、规范性和一致性的基础。

2.数据管理

(1)数据质量管理。教育大数据的数据质量管理对象是核心业务系统中的全部数据,包括结构化数据、非结构化和半结构化数据等,其内涵包含两个层面:一是数据本身的质量管理;二是数据使用过程中的质量管理。数据治理能否有效推进很大程度上取决于高效的数据质量管理,完善的数据质量管理能为学校提供高效的增值服务。

(2)数据安全管理。教育大数据应用系统中汇集了大量重要且敏感的信息,对数据安全使用提出了很高的要求,尤其是数据信息的隐私性、访问权限和安全审计等方面的管理是极其重要的。在大数据治理框架中,有必要通过完善安全策略、建立安全措施等多种手段保障数据在存储、传输、使用过程中的安全性。要真正实现全方位的安全管控,必须做到事前预判、事中管控和事后溯源。

(3)数据生命周期管理。数据生命周期指的是数据从识别、采集、存储到传输、整合、处理、应用、归档销毁的整个过程。数据治理是基于数据全生命周期的持续的安全的优化管理,主要体现在高效使用数据、优化数据质量和实现数据应用自治三方面。

(4)交换接口管理。实现基于元数据、主数据和数据交换等数据标准的不同应用平台之间的数据交换管理。良好的数据标准可以保证基础数据和应用数据的统一管理,结合数据质量管理和数据安全管理较好地解决了目前应用平台中普遍存在的数据重复分散、理解歧义、口径模糊、安全隐患等问题,便于实现数据的开放共享。

3.数据安全技术

安全保障在数据治理框架中占有不可或缺的地位,从技术上做好防护是教育大数据开放共享、消除信息孤岛的重要保证。需要重点关注的安全技术主要包括安全态势感知、数据脱敏、访问策略、溯源管理等,最终实现对生命周期内的数据安全感知、管控、追溯。

(1)安全态势感知。鉴于教育大数据集中化程度高、数据量级庞大,在跨校园跨平台的数据开放共享过程中,数据和服务平台极易受到网络黑客的攻击,尤其是有些APT攻击的潜伏期很长。因此,需要针对异构大数据的融合、存储和运维构建安全态势感知系统,实时监测网络流量、安全日志等,采取有效的技术手段预测、评估当前网络数据安全状况,对安全事件和安全隐患进行预警与防御处置,提高对数据整体安全风险的感知和决策能力。

(2)数据脱敏。教育大数据中存在大量的敏感信息,如个人信息、资产数据等。对于这些敏感数据,数据治理过程中需要进行脱敏。建立数据脱敏的方法和标准需依据国家相关法律法规、数据分类分级标准和数据开放共享的安全级别。

(3)访问策略。防止数据被非法访问的关键是建立有效的统一认证系统和完善合理的访问策略。所有用户都必须通過统一账号、唯一入口进入应用平台,依据访问策略实现分级访问数据资源,并记录用户访问情况。

(4)数据溯源。数据溯源是在结果发生后对历史痕迹进行分析、溯源。例如,发生网络安全攻击后,可以对网络流量、日志和警告信息等进行综合分析,可以追溯攻击行为类型,通过关联的IP地址等信息,可以追溯到实施者所在地。在共享数据全生命周期中对数据的流转过程要加强监控、记录,全程透明可见。为提升对安全事故的追责能力,所有的留痕记录必须具备唯一性并不可修改。

4.治理保障

在大数据治理实施的过程中,仅依赖数据标准化、数据管控以及安全技术等技术来支撑是不够的,还必须通过组织、制度、优化流程等保障机制来提高数据治理的效率,降低数据治理运维成本,并保证数据治理风险可控。

(1)组织保障。立足学校的实际情况,建立合理的数据治理组织架构和责任体系,明确数据生命周期中所涉及的部门及人员的职权责。组织负责全面统筹协调,整体解决数据治理中出现的问题,是实现成功治理的重要保障。

(2)法规制度。数据治理从总体规划到落地实施,内容覆盖广泛,涉及大量的人物财,为保障治理工程的顺利推进,方方面面都需要制度加以规范和明确。治理的制度要基于国家法律法规制定,类型大致可分为章程(确立数据治理目标)、管控办法(数据治理实施保障制度)、考核办法(建立激励机制)等。

(3)标准流程。流程是项目实施的落地步骤,大数据治理流程的建立需立足学校实际、依据规章制度建立可操作的标准流程。在数据实施的过程中结合数据治理的技术和管理工具,建立符合学校需求的标准流程管理系统。

● 结语

在数据即服务(DAAS)的时代,教育大数据应用系统是一项复杂庞大的工程,每天都有海量的大数据流动于各应用中,有效的大数据治理方案能够优化和提升数据的质量、安全和价值等,从而高效驱动校园实践应用,提高教育管理效率,增强决策科学性,达到提升社会教育质量的目的。本文针对当前教育大数据普遍存在的问题,提出教育大数据治理的参考框架,从技术层面、管理层面和保障层面阐述了教育大数据治理的可行性操作和实施步骤,旨在帮助教育数据治理研究者能够更加客观深入地分析和解决面临的数据问题,使教育大数据在不同应用平台间高效流转、良性循环。

参考文献:

[1]张绍华,潘蓉,宗宇伟.大数据治理与服务[M].上海:上海科学技术出版社,2016.

[2]王永颜.大数据时代教育治理能力现代化构建与路径选择[J].电化教育研究,2017(08):44-49.

[3]贾童舒,刘叶婷.数据治理——提升城市现代化治理能力的新视角[J].领导科学,2014(35):4-7.

作者简介:陈迎春(1971.01—),女,汉族,四川省遂宁市人,高级工程师,学士,研究方向为大数据治理。

猜你喜欢

教育大数据数据治理
基于云计算的高校大学生信息平台的研究
“教育大数据”视角下的精准教学的研究
高校数据融合路径及其治理框架的探讨
狭义教育大数据在英语教学中的应用模式
教育大数据在教育管理中的运用分析
基于本体的企业运营数据治理
云端数据治理初探
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理