APP下载

高职院校校本数据中心的构建与应用

2021-04-05何磊庞钦万畅

现代信息科技 2021年17期
关键词:数字化转型智慧校园高职院校

何磊 庞钦 万畅

摘  要:高职教育信息化要求高职院校系统构建校本数据中心,开展以数据为驱动的智慧校园建设并加强数据应用。为实现数据交换、数据处理和数据服务等功能,需要构建包括数据源、数据基础架构、数据资源体系、数据管理软件体系、数据管理规范制度体系在内的完整架构,并按照筹划准备、建设执行、问题检查和反馈优化的流程分步实施。围绕个人数据管理、部门资源管理、校级决策支撑等体系开展数据应用和服务。

关键词:高职院校;数字化转型;智慧校园;校本数据中心

中图分类号:TP311    文献标识码:A 文章编号:2096-4706(2021)17-0059-06

Abstract: Higher vocational education informatization requires higher vocational colleges to systematically build school-based data center, carry out data-driven smart campus construction and strengthen data application. In order to realize the functions of data exchange, data processing and data service, it is necessary to construct a complete framework, including data source, data infrastructure, data resource system, data management software system, data management standard system, which should be implemented step by step according to the process of planning preparation, construction implementation, problem checking and feedback optimization. Carry out data application and services around personal data management, department resource management, school level decision support and other systems.

Keywords: vocational college; digital transformation; smart campus; school-based data center

0  引  言

校本數据中心是高等职业院校智慧校园建设的核心组成部分,是提升学校治理能力、深化教育大数据应用、实施教育大资源共享的关键平台,是开展智慧教育创新、构建智慧学习支持环境、推动高职院校数字化转型的重要基础设施。2020年9月,教育部等九部门联合印发《职业教育提质培优行动计划(2020—2023年)》,明确提出,要“推动各地研制校本数据中心建设指南,指导职业学校系统设计学校信息化整体解决方案”[1]。系统构建支撑智慧校园长期演进的校本数据中心,全面开展由数据驱动的智慧校园建设,加强数据应用和服务,已成为高职教育信息化和高职院校数字化转型的重要任务。

1  校本数据中心的建设要求、目标与原则

在不同的领域和场景中,数据中心有着不同的定义和内涵。本文所指的校本数据中心是指在高职院校学校管理范围内,由一系列软件、服务和管理体系构成的,实现智慧校园总体框架中支撑平台层数据交换、数据处理、数据服务等模块功能[2],通过统一接口对外提供各类数据资源服务,并具备数据资源相关信息安全体系、技术规范与保障体系的数据支撑平台。

1.1  建设要求

目前,高职院校信息化建设从功能驱动向数据驱动转换、从数字校园向智慧校园演进,在应用系统形态上也发生了架构性的变化。主要表现在:从大型复杂的MIS系统向流程化、移动化、平台化的服务体系转变;从面向部门管理的应用系统向面向师生提供高质量、高体验的流程化服务转变;从主要面向部门内部事务处理向实现跨部门综合服务转变;从线下非实时审批流转为主向高效、线上、近实时的审批流转转变;从事务性管理为主向包含态势感知、大数据分析和辅助决策的综合管理转变。

应用系统形态上改变对校本数据体系提出了更高的要求,主要表现在:数据标准要格式规范、代码标准、全局一致;数据维度要全、信息覆盖面要广;数据内容要质量高、内容完整准确;数据服务要具备多种手段、适应多种应用体系;数据服务过程中要满足信息安全的要求,做到事前可管、事中可控、事后可查;数据管理要做到“一数一源”,满足数据资源可视可查可管的要求。

1.2  建设目标

为实现以上要求,校本数据中心应以建成体系健全、内容和维度完整、数据规范可信、平台安全可靠的新一代数据支撑平台为目标,采用完善的支撑软件、数据治理服务和数据管理体系对学校拥有的数据资源进行有效管理、维护、更新和服务,打破数据孤岛,实现校本数据的一数一源、伴随式数据采集和分级分层有效共享[3],从而增强学校治理能力、优化教学实训管理,提升校园师生服务,促进科学决策支持。具体目标包括:

(1)建成全域数据中心。通过全维度的数据采集、集中和治理,使校本数据满足表达规范、内容准确、维度完整的要求,形成标准统一、分类清晰、质量可信的数据仓库和数据集市。

(2)建成全生命周期管理数据软件体系。通过软件体系实现对校本数据资源的全生命周期管理,涵盖数据采集、数据仓库管理、数据接口开放、数据资源发布、服务状态呈现等功能。

(3)为全业务场景提供数据服务。提供多类型的统一数据接口,为学校教学实训、管理与服务的全业务场景,和面向国家管理平台的数据上报提供数据服务。

1.3  建设原则

校本数据中心的建设应遵循以下原则:

(1)统筹规划,分步实施。应遵循国家有关数据管理的法律法规和技术规范,在学校信息化建设顶层设计和总体框架下,兼顾已有信息系统和数据平台现状,统筹规划开展校本数据中心的建设、使用和管理。建设应以规划目标为导向、以业务需求为驱动,按照“基础先行、急用先行”的策略,制定科学合理的实现路径和建设计划,分步骤实施。

(2)平台开放、适度超前。应充分考虑校本数据中心平台的开放性,保证多系统、多厂家环境下的系统对接和数据共享。应选择成熟主流的体系架构和技术路线,适度超前,保证良好的可演进性和可扩展性。同等功能条件下,优先选择国产技术或开源技术构建校本数据中心。

(3)分权使用,确保安全。应按照“谁产生、谁管理、谁负责”的数据管理原则,在数据物理集中和逻辑聚合的基础上,对数据的敏感性、机密性进行分级管理。对于公共数据的使用,由数据管理部门根据业务和软件功能需求进行常规管理;对于涉及个人隐私、管理秘密的数据使用,由数据源头部门授权,并设置健全的审核确认流程,保障数据调用过程的信息安全。

2  校本数据中心的构成

2.1  总体架构

校本数据中心具体包括数据源、数据基础架构、数据资源体系、数据管理软件体系、数据管理规范制度体系等组成部分,总体架构详如图1所示。

在总体架构中,数据资源体系是校本数据中心的核心,由数据源通过数据采集提供数据供给,由数据基础架构提供数据资源的承载。在数据资源体系中,采集的数据进入数据湖,通过清洗集成,根据校级数据标准建模形成标准化数据仓库,再通过关联、聚合和计算形成各类数据集市。数据管理软件体系和数据管理规范制度体系分别为校本数据中心提供管理运维的支撑和制度保障。校本数据中心通过统一数据接口为智慧校园应用体系提供数据服务。

2.2  各部分构成

2.2.1  数据源

数据源指数据的来源,包括管理信息系统、电子表格文件、一般文档、IT设备、物联网系统、互联网等。

2.2.2  数据基础架构

数据基础架构指承载数据资源的底层技术,包括关系型数据库、大数据集群、非关系型数据库等。

关系型数据库承载着目前核心的数据资源。数据内容主要包括:来自管理信息系统的结构化数据、来自线下电子表格的结构化数据、标准化数据仓库中各主题下的数据、基于海量日志计算结果集生成的小体量数据、统计计算生成的汇总聚合数据和指标数据、以拉链表形式存储的历史数据等。

大数据集群承载着用于大量可用于辅助决策分析的数据,其数据量正在迅速增长。数据内容主要包括:来自管理信息系统的大体量结构化数据、来自物联网系统的大体量数据、来自IT設备的网络日志、来自互联网的WEB捕获数据等。

非关系型数据库的数据内容主要是互联网爬取的数据,如论文、科研成果、专业文献等。

2.2.3  数据资源体系

数据资源与各个智慧校园应用系统对接,支持各种数据应用和分析的运行,通常以数据仓库的形式实现。数据资源体系一般包括数据湖层、标准化数据仓库层和数据集市层。

数据湖层实现在数据基础架构中各数据源原始数据的全量副本集中。通过将所有异构、不同实例的原始数据存储到同一架构、同一实例的数据库中,并进行集中治理,实现数据的同构化、同实例化操作。

标准化数据仓库层以校本数据标准作为数据模型定义,以范式建模为主,实现对数据湖层原始数据副本的清洗、整合和转换,实现与数据模型匹配的标准化数据的形成,实现按照主题进行分类、分子类的存储操作。

数据集市层实现与应用系统的数据对接,支持从标准化数据仓库中摘选合适的数据内容,在必要的预处理后,形成针对特定应用系统的数据资源集合,并以适当的接口形式向应用系统供应数据。根据数据结构特征和服务场景的不同,可分成3种数据集市:面向OLTP业务的数据集市,为事务类软件服务提供数据支持;面向OLAP的数据集市,为分析类软件服务提供数据支持;面向统计的数据集市,为报表类软件服务提供数据支持。

2.2.4  数据管理软件体系

数据管理软件一般包括:

(1)数据采集工具:支持业务数据集成、离线数据集成、机器数据集成等功能,实现数据采集管理。

(2)数据开发工具:提供计算任务管理和调度管理,支持数据建模、数据集成、脚本开发、工作流编排等功能,实现数据开发管理。

(3)元数据管理软件:支持元数据采集、元数据识别、元数据分类、元数据展示、元数据应用、元数据搜索等功能,实现元数据管理。

(4)主数据管理软件:支持主数据存储与整合、主数据管理、主数据分析、主数据分发与共享等功能,实现主数据管理。

(5)数据质量管理软件:支持质量需求管理、规则设置、规则校验、任务管理、监控分析、质量报警、报告生成等功能,实现数据质量管理。

(6)数据标准管理软件:支持标准生成、标准映射、变更查询、映射查询、维护标准、标准版本查询、标准导出、标准文档管理等功能,实现数据标准管理。

(7)数据模型管理软件:支持数据模型设计、模型差异稽核、数据模型变更管控、模型可视化等功能,实现数据模型管理。

(8)数据开放管理软件:支持API接口服务、数据库连接服务、离线数据下载服务、数据安全管控等功能,实现数据开放管理。

(9)数据运维监控软件:支持数据使用审计、任务监控、告警管理等功能,实现数据运维监控。

(10)数据可视化软件:支持图表管理、看板管理、用户设置等功能,实现数据可视化管理。

(11)报表生成和管理工具:支持表单设计、权限管理等功能,实现报表生成和管理。

2.2.5  数据管理规范制度体系

数据管理规范制度体系一般包括:

(1)数据安全管理规范:保证数据被合法合规、安全可靠地采集、传输、存储和使用。

(2)数据质量管理规范:保证校本数据表达的一致性、有效性和适用性。

(3)数据共享管理规范:规范数据资源的交换与共享,实现数据资源优化配置和增值利用。

(4)数据采集与存储管理规范:实现管理信息系统数据的规范采集、公共数据资源的集中存储和统一管理。

3  校本数据中心的建设流程

3.1  總体建设流程

校本数据中心的总体建设流程包括筹划准备阶段、建设执行阶段、问题检查阶段和反馈优化阶段,形成建设闭环实现分期实施和迭代优化。建设流程和各阶段主要工作任务如图2所示。

各阶段应针对每个单独的数据内容进行微循环。针对每个数据项,从采集阶段即关注其来源的合理性、内容的完整性、质量的规范性、与数据标准的匹配性,并按计划进行指标的试算,发现问题时快速反馈、快速整改、快速解决。

3.2  筹划准备阶段

该阶段的主要工作有:

(1)工作目标确定。从需支持的数据报表、应用、流程和用户角色等多维度细化工作目标,并针对每种目标进行分解,确定对应的数据内容。

(2)工作边界确定。以匹配目标为原则确定数据采集范围,根据数据采集的内容和类型确定采集工具,根据数据管理的要求确定数据管理软件,基于数据采集的类型和体量确定数据基础架构。

(3)工作计划确定。根据项目工作量和重难点,结合学校全局工作规划和资源保障情况,设置科学合理的建设周期和阶段划分,并完成详细的工作计划分解。

(4)资源准备。根据数据软件和数据基础架构的运行需求,准备项目所需IT类资源和数据治理相关知识性资源。

(5)组织机构准备。根据工作边界、工作难度、专业性要求、职能边界等因素,明确建设责任部门和负责人,并组建跨部门的建设团队。根据数据的归属或来源明确部门分工,建立沟通协调机制。

(6)制度准备。逐步建立数据资源管理相关制度,为校本数据中心的长期可持续运营提供制度保障。

3.3  建设执行阶段

该阶段的主要工作有:

(1)组织管理与数据调研。学校层面开展以组织管理为主的调研。业务部门层面开展以业务逻辑、数据供需关系和交换共享要求为主的调研。业务系统层面开展以原始数据来源、质量和结构,及业务系统功能和使用情况为主的调研。

(2)数据标准制定。依据上级标准,结合学校已有合格标准,考虑兼容性、一致性和可扩展性,以匹配本校业务管理特性为原则制定校本数据标准。确定数据子集分类方式和编码规范,落实数据和编码权威来源,明确业务边界与数据标准范围对应关系。

(3)软件工具部署。根据不同项目的需求配置,部署相关软件及功能模块。原则上应尽量配置完整的数据管理软件体系。

(4)数据识别、采集与质量检查。从数据源中识别目标数据所在的库、表、字段、格式等,利用数据采集软件进行采集。制定数据质量规则并绑定到每个字段,识别不符合质量规则的数据,形成数据质量报告用于评估数据质量状况、定位有问题的数据指导数据质量提升。

(5)数据质量提升。对于代码集定义、表达格式、数据单位不一致等结构性质量问题,通过批量、规则化处理转换成符合标准的数据。对于数据缺失、内容错误等难以通过简单批量转换修复的内容性质量问题,由数据对应的责任部门进行核实、采集、重新填报后形成有效数据。

(6)数据仓库建模、数据生成与封装发布。根据校本数据标准对标准化数据仓库进行分类、建模,形成表结构。将各种清洗转换完成、符合数据标准的数据导入到表结构中,形成质量达标的成果数据,即可用的数据仓库。成果数据由数据仓库管理系统进行存储,并通过API接口、数据库访问、表格文件、ETL接口等方式向各应用系统、数据使用部门提供数据调用和数据共享交换服务。

(7)数据集定制。在深度理解校本业务数据逻辑的基础上,定制数据集作为支撑全校流程服务,数据调用、交换和共享,大数据分析辅助决策等事务的基础集。

3.4  问题检查阶段

该阶段的主要工作有:

(1)数据内容缺失检查。数据采集治理过程中动态检查数据内容。包括计划采集数据是否入库、已采集数据内容与计划是否一致、数据内容是否有效完整等。

(2)数据一致性检查。数据采集治理过程中动态检查数据集(尤其是来自不同部门的数据)间的内容一致性。如不同系统中学号与姓名的对应关系是否一致等。

(3)数据质量问题检查。数据采集治理过程中动态检查数据集质量。常见问题有重要数据缺失、数据表达错误等。

(4)数据指标准确性检查。数据内容基本齐备后,应设置数据指标并进行计算,计算结果与其他途径的指标结果(如部门的手工统计结果等)进行比对,验证指标计算的正确性和精确度。

(5)数据标准有效性检查。数据采集治理过程中动态检查校本数据标准的有效性。常见问题有标准元数据中存在“同名不同义”“同义不同名”的元数据定义;数据模型中存在标准元数据集合之外的“游离”元数据项;数据模型与实际业务逻辑不兼容,无法正确或完整反映业务过程等。

3.5  反馈优化阶段

该阶段的主要工作有:

(1)补充调整数据采集范围。当出现重要数据内容批量缺失、重要数据间一致性问题严重等情况时,应对数据进行溯源,落实数据采集的来源是否合理,必要时补充采集新的数据,或调整采集的来源部门、系统替换原有数据。

(2)数据质量反馈和提升。数据产生时就存在较大质量问题时,应由数据来源部门负责解决。常见问题及解决方案有:

1)业务系统功能未启动导致数据线下保存而未记录到系统数据库。可将电子表格数据或纸质文件数据补采进数据湖中作为补充数据资源。

2)数据录入格式不规范导致难以识别;业务系统设计不完善导致无法记录必要数据项;组织架构或工作流程衔接不合理,导致业务流转不正常或相关业务未能正常开展。可完善、升级信息系统,优化调整工作流程、组织架构。

3)指标数据计算准确性问题。分析业务部门線下指标与校本数据中心设定指标在计算方式、统计口径、筛选条件等的一致性,确定正确的参数和计算逻辑。

4)数据质量导致的指标计算出错问题,如重要字段无有效数据、数据中存在非法字符、数据表达不一致。应对相应工作模块返工重新开展数据治理。

(3)根据数据治理的问题分析,对业务系统升级优化替换、工作流程优化、组织架构优化等提出优化建议。

4  校本数据中心的基础应用

4.1  数据应用体系

校本数据中心实现数据的集中治理、管理和共享,并通过与智慧校园应用体系的对接充分发挥数据价值。按照数据服务对象主体的不同,可将数据应用分为个人数据管理、部门资源管理和校级决策支撑等三类。

个人数据管理主要包括个人数据汇总展示、个人数据纠错补录、面向个人的数据报告等。

部门资源管理主要包括面向职能部门和二级学院的各种应用,包括数据填报、部门和学院专题数据分析、数据报表,以及各种智慧校园应用等。

校级决策支撑主要面向领导层和发展规划部门提供大数据辅助决策,包括内部质量管理、校级综合报表、领导驾驶舱、综合校情分析等。

校本数据中心常用的基础数据应用包括一表通数据填报、智慧校园应用开发数据服务和大数据辅助决策等。

4.2  基础数据应用

4.2.1  一表通数据填报

解决学校各类数据重复填报、内容不一致的问题,实现 “一次填报、全网共享”的一表通数据填报[4]。通过基础数据自动补全和模板化、定制化、自动化的表单功能,实现快速便捷的多业务场景表单填报和信息收集。通过为广大师生提供数据自动纠错、填补和补录通知等功能逐步提高数据质量。系统界面如图3所示。

4.2.2  智慧校园应用开发数据服务

为办公办事、教学实训、校园服务、管理应用和便捷工具等各类业务系统、微应用和微服务提供统一的应用开发数据服务。明确校本数据的资源目录、共享规范和审核制度,明确信息系统的技术框架、数据规范和接口标准,推动智慧校园的统一开发管理。典型应用包括部门数据中心、个人数据中心,如图4、图5所示。

4.2.3  大数据辅助决策

开展大数据分析和挖掘提供大数据辅助决策。通过学校、专业(群)、课程、教师和学生等五个层面的数据画像和对比分析,围绕学校内部质量体系进行指标的多维度动态量化跟踪和评估,实现各层面的“一页纸”诊断报告和指标预警[5]。针对不同专题开展大数据应用,实现学生安全、学生就业、学校发展等大数据综合分析和预警。内部质量体系管理系统界面如图6所示。

5  结  论

校本数据中心建设的重点在于形成合理、稳定的体系架构,按照规范流程定期开展数据治理持续提升数据质量,通过丰富的数据应用提升学校教学、管理和服务的效能。通过逐步完善、长期演进,依托校本数据中心形成“数据驱动”的智慧校园建设模式和决策机制。

参考文献:

[1] 中华人民共和国教育部.教育部等九部门关于印发《职业教育提质培优行动计划(2020—2023年)》的通知(教职成〔2020〕7号) [EB/OL].(2020-9-23).http://www.moe.gov.cn/srcsite/A07/zcs_zhgg/202009/t20200929_492299.html?from= timeline.

[2]. 全国信息技术标准化技术委员会(SAC/TC 28).智慧校园总体框架:GB/T-36342-2018 [S].北京:中国标准出版社,2018.

[3] 中华人民共和国教育部.教育部关于印发《教育信息化2.0行动计划》的通知(教技〔2018〕6号) [R/OL].(2018-4-18).http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.

[4] 李引,陈敏锋.高校数据中心生态的研究与应用 [J].现代信息科技,2020,4(19):99-103+108.

[5] 王爱红.高职院校质量保证体系诊改数据平台建设的探索 [J].现代职业教育,2019(20):64-65.

作者简介:何磊(1978—),男,汉族,河南驻马店人,高级工程师,硕士,研究方向:教育信息化;庞钦(1987—),男,汉族,广西钦州人,高级工程师,本科,研究方向:大数据技术;万畅(1976—),女,汉族,四川渠县人,副教授,硕士,研究方向:大数据技术。

猜你喜欢

数字化转型智慧校园高职院校
试论融合创新思想对新时期图书策划和营销的指导作用
基于B/S结构的学生公寓管理信息系统的设计与实现
“智慧校园”浪潮下大学课堂教学改革与设计
智慧校园关键技术分析与研究
《华盛顿邮报》转型的实践与借鉴
我国出版上市公司数字化转型的困境与对策
高职院校创新创业教育初探
全球化背景下高职院校韩语专业毕业生就业现状分析
多元智能理论视角下高职院校体育课程评价体系的研究
浅谈财务管理存在的问题及完善措施