高职院校“供需自洽”数据治理模式探索与实践
2023-11-17李法平陈海珠
朱 强,李法平,胡 幻,陈海珠
(重庆电子工程职业学院1.后勤保障处;2.图文信息中心;3.人工智能与大数据学院,重庆 401331)
1 高职院校数据治理的意义
2023年2月,中共中央、国务院印发的《数字中国建设整体布局规划》指出,到2025年数字基础设施高效联通,数据资源规模和质量加快提升,数据要素价值有效释放,数字经济发展质量效益大幅增强[1]。对于教育行业来说,需要强化数据赋能,提升教书育人效力。推动教学评价科学化、个性化,运用海量数据形成学习者画像和教育知识图谱,更好地实现因材施教。推动教育教学多元化、多样化,加强数字教育环境下的教学研究,有针对性地帮助教师提高数字化教学能力,更好地创新教育教学模式和测评方式,助推教学质量提升。
当前,通过数字校园和智慧校园的建设,大部分职业院校建设了多场景的业务系统,搭建了统一认证、服务门户等基础平台,对系统进行了不同程度的连接和交换,替代了一部分管理服务功能,为教学、科研、管理的运行提供了一定的支撑[2]。但共享交换的数据目前仅限于身份数据和少量的业务数据,许多跨部门协同处理的流程数据无法流转[3]。
随着智慧校园“一站式”服务等理念的提出,特别是“碎片化”流程服务的应用,职业院校信息化已经从信息技术自身应用问题,转向了如何利用信息技术和大数据来促进院校教学、科研和管理方式变革等深层次应用问题[4]。
国内职业院校或多或少都进行着大数据研究和应用工作,通过数据共享、数据分析、数据挖掘等技术,获取数据深层次价值[5]。但纵观职业院校教育信息化的发展现状,大部分院校的数据处理工作仍需要人工操作,数据采集及分析技术薄弱,各业务部门在开发或选用应用系统时都局限于自我业务实现,没有从全局视角进行业务数据流分析,缺乏统一的数据标准和规范,各部门都按照“自产自用”的模式管理业务数据,导致数据生命周期管理不完整。
2019年2月发布的《中国教育现代化2035》《加快推进教育现代化实施方案(2018—2022年)》将有大数据支撑的“创新信息时代教育治理新模式”作为高等教育信息化建设的重要工作目标,数据治理为我国高等教育治理提供了新的选择和可能,也为治理范式的变革提供了工具基础,数据治理已成为高校信息化建设中的一项重要工作[6]。
2 高职院校数据治理的研究现状
数据治理是教育治理的重要内容之一,是提升教育教学质量的必要需求。许晓东等学者提出了以数据的获取与抽取、数据整合与分析、数据解释和预测三个阶段构成的高等教育数据治理分析框架[5]。从数据融合的角度,赵安新探讨了高校数据融合的路径及其治理框架[7]。聚焦业务范围,韩俊红[8]、庞飞[9]、申华强[10]、刘桂峰[11]等对教育教学质量、科研、教师、学生等数据治理进行了研究。此外,彭雪涛[5]、旦金凤[12]分析了国外教育数据治理体系架构,姜大庆结合高职院校学生规模小、人员缺乏、技术力量相对薄弱等特点,从管理和技术两大核心要素出发,提出大数据背景下高职院校数据治理框架体系[13]。
在当前大多高职院校信息化建设中,数据治理还存在标准统一不够、安全保障不全及供需流通平衡不能自洽等问题。
缺乏统一数据标准,“数据孤岛”问题严重。虽然“数据孤岛”问题早已存在多时,但部分职业院校缺乏信息化顶层设计与规划,标准建设滞后,导致数据整合难。即使数据标准统一,但数据来源众多且分散,数据利用率低,导致“数据孤岛”问题悬而未决,久治不愈[14]。
缺乏数据安全机制,难以保障隐私数据。大数据犹如一把双刃剑,在给各单位带来便利的同时,数据安全和隐私保护等问题也日益凸显[15]。学校数据治理涉及在校师生个人信息,学校业务数据等,这些数据可能是个人隐私或具有机密性,急需合理恰当的保护机制,在支撑学校信息化发展同时保障数据安全[16]。
共治格局尚未形成,供需难以平衡。共享是数据治理的直接目的,但数据收集形式僵化、实时性不高,缺乏对数据科学整理、分析与清洗等问题,导致数据的完备性、及时性、有效性、一致性和完整性无法满足数据使用者(需方)要求,数据得不到有效共享,导致供需难以平衡。信息中心等数据统筹管理部门成为数据共享与应用矛盾的焦点。
3 高职院校数据治理体系构建
为了破解职业院校数据孤岛、数据安全隐患、数据供需两难等难题,可通过全校性数据治理解决数据困境,提升职业院校信息化应用水平。通过探索职业院校合理的数据治理模式,建立行之有效的数据治理体系,能够支撑各业务领域高效运行,支持学校方便、安全、快速、可靠地利用数据进行决策[17]。
当前,数据已成为职业院校的重要资源资产,在职业院校信息化发展战略指引下,开展数据治理工作势在必行[18]。通过数据治理顶层设计,明确数据治理发展规划,梳理数据源头,重构数据治理组织、建立规章制度及流程,细化数据管理技术标准体系,搭建数据治理技术工具环境,赋能数据创新应用[19]。
在数据治理活动中,学校所属二级单位、业务系统、教师、学生、软件开发者等均是数据治理的多元主体,各主体既是数据的供给方,也是数据的需求方。重庆电子工程职业学院(以下简称重电)在建设数据治理体系时,以构建供需双方深度融合、理顺供需关系为基础,形成“供方自治、需方自助”的“供需自洽”式数据治理新范式,改革信息中心管理职能,简化数据供需流程,提高数据流通效率,健全数据治理体系,充分调动院校各主体在治理活动中的主观能动性,推动职业院校校园内部治理体系及治理能力现代化。
3.1 以治理规划为蓝图,落实供需新组织
数据治理是自上而下指导和自下而上推进相结合的系统性工作。其数据治理战略是院校发展战略中的重要组成部分,是数据管理计划的战略,是保持和提高数据质量、完整性、安全性和存取的计划,是指导数据治理的最高原则[20]。同时,数据治理的战略目标体现了学校高层领导对数据治理的重视程度,决定了治理活动供需双方资源配备和治理协调能力。在进行数据治理顶层规划时,重电将数据治理的组织架构优化作为首要任务,因数据时常需跨部门多领域协同流通,故以供需数据流通视角,重新梳理内部数据治理和管理职能职责,形成适应于供需双方的跨领域组织架构。
3.2 以治理章程为准绳,做实供需新制度
校本数据流通是校园数字化转型的关键,基于数据供需平衡而建立的数据治理体系是职业院校实现数据治理常态化的核心任务。在治理过程中,因数据供需双方治理活动变化较快且呈现多元主体,需对数据管理制度不断修正、完善,以促进数据治理供需多元主体广泛关注和共同参与[21]。重电按照数据“谁产生、谁管理、谁负责”的原则,以多元主体供需自洽出发,不断健全院校数据治理管控制度和数据标准体系,确保数据治理活动始终围绕数据流通服务。
3.3 以治理工具为支撑,创新供需新范式
技术工具是数据治理的环境要素,不可缺少。在数据中台战略的背景下,数据治理工具要解决数据深度融合、安全合规、高度共享和数据创新等问题,关键在于供需双方在数据平台上具有安全可信的开发、开放、共享能力,具体表现为在职业院校教学、教研、科研、管理及生活等数据综合应用上提供供需自主治理能力。重电以中台模式构建校本数据中心工具,以数据安全保障为前提,开放数据全生命周期服务,将数据治理活动分解到院校各大业务职能领域的多元主体,改革信息中心“一包到底”数据治理方法,加速数据要素快速流通,创新校本数据价值。
4 数据治理实践路径
4.1 加强数据治理顶层设计,统揽数据治理实施
第一,制定数据战略目标。重电以数据治理推动学校治理现代化,促进学校高质量发展为目标,着重打破数据孤岛、应用孤岛,不断健全校本数据中心,加强数据安全共享流通,以数据驱动创新校园数字化应用场景,不断推动教育技术与信息技术深入融合,提升师生数字化获得感。
第二,建立数据治理组织体系。重电从数据治理能力建设、组织成熟度和过往实践三个维度进行组织体系建设,依托现有网络安全与信息化组织体系,推行CIO 制度(首席信息官,Chief Information Officer),构建决策、统筹和执行三层级的数据治理组织框架。其中,决策层为学校网络安全与信息化领导小组,由校级领导、数据治理相关技术和业务专家组成。统筹层为网络安全与信息化办公室,由信息中心和各二级单位信息化负责人组成。执行层为数据治理工作组,由数据供需双方多元主体和信息中心的数据管理人员构成。
第三,明确数据治理职责。重电从供需流通关系出发,理顺数据治理组织三层级的治理职责。其中网络安全与信息化领导小组为学校数据治理工作决策层,负责决策数据战略规划制度章程、岗位设置、专项预算和数据治理文化宣导等;网络安全与信息化办公室则是负责统筹数据治理实施计划的制定、审核,指导以及监督执行,统筹数据治理活动的开展。数据治理工作组则是完成数据治理实施计划的落实执行,需要完成数据管理指令的落实、数据的生命周期管理等具体工作。同时,进一步梳理院校行政组织架构供需工作领域,明确各二级单位和信息中心在数据治理活动中的工作职责,保障数据治理活动按照学校规划的路线不断向前推进。
3.2 理清数据资产与流程,健全管理制度和标准
第一,健全数据治理制度体系。数据治理制度体系由数据治理政策、制度、规范及实施细则构成。重电采取管理制度和标准规范建设双头并进方式建设数据治理制度体系。其中,规章制度明确了数据治理的目标、人员、职责、权利和度量标准。技术规范保障了校本数据中心可持续稳定的数据管理,促进数据高质量流通。数据治理制度体系如图1所示。
图1 数据治理制度体系图
第二,理清数据资产与流程。校本数据资产化管理是发挥数据要素价值的基本路径。通过对业务流程进行梳理,重点包括对数据建模、数据分类和数据实体属性等要素进行整理、识别、归纳;明确数据涉及的业务系统,规范数据在业务系统间流转的供需关系,理清数据源头确权,形成数据资源目录。如图2所示,重电在梳理学生数据的流转中,针对招生录取、学工、财务、教务及一卡通等学生数据进行梳理确权,明确数据从录取、迎新到学籍确认的流转过程,确定学生学籍数据为唯一源头数据,形成学生基础信息,共享支撑作用于学工、财务、教务及一卡通等校内学生活动系统。
图2 学生主数据图
第三,重构学校数据标准。校本数据标准是构建数据资源目录的主要依据。重电在全面覆盖国家标准、教育信息化行业标准的基础上,借鉴行业数据标准,对学校基础数据标准和数据质量进行重新梳理和规划,以服务化和开放性视角重新定义基础数据标准,并加强基础数据标准的数据分级分类管理,使之具有安全性、可扩展性和可持续性。数据标准分类示例如图3所示。
图3 数据标准图
4.3 创设“供需自洽”新环境,形成数据治理新范式
第一,搭建灵活开放新工具。数据治理活动必定离不开数据治理工具的高效支撑。重电采取大数据及人工智能等前沿技术,以数据中台战略为架构理念,建设涵盖职业院校数据业务的全链服务平台。该平台建设支撑数据治理章程制度的落实执行,严格管控数据标准体系,支撑数据治理活动智能化。平台需支撑数据全生命周期管控,满足信息中心数据标准化管理服务及数据治理管控服务,满足数据从采集到发布共享的全栈式供给自主服务,满足灵活多样的数据需求自助,从而实现数据供需自洽。
第二,形成“供需自洽”新范式。如图4所示,在数据供给过程中,重电数据供应方可在治理平台的统一管理下,从业务系统将数据同步到ODS 层。依据校本数据标准进行数据从ODS 层到DWD 的自主转换,根据数据安全管理规范,进行数据分级分类安全控制,注册发布数据资源目录,动态供给数据。通过数据服务平台,需方可通过文件、接口、共享库等方式灵活自助地获取供给数据,创新数据应用,形成新的数据供给,螺旋提升数据价值。在数据供需流通中,信息中心承担数据整体运营,负责数据治理体系和数据治理支撑环境建设,为供需双方提供高质量的校本数据治理服务。数据供需关系如图5所示。
图4 数据架构图
图5 数据供需示意图
5 数据治理成效与创新
重电经过几年的数据治理实践取得了一定的成果,完成了多类型、多维度数据治理,支撑教学、科研及管理服务,助力校园管理态势感知;实现了基于“供需自洽”的数据治理体系建设,形成信息化与教学科研互哺新业态。
5.1 数据治理成效
5.1.1 梳理分类数据资产,保障数据多维运用
按业务域划分重电主数据的主题域如图6所示,涉及数十个业务应用系统建设主体在数据采集、数据标准化、数据治理、质量管理、安全管理、数据建模、数据集市、主题库、专题库、数据共享、数据分发、数据分析挖掘、数据可视化等数据管理环节的工作领域划分,为构建高质量的主题数据提供工作支撑。
图6 主数据管理分工界面示意图
5.1.2 最大化校园数据共享能效,支撑数据创新应用
针对师生及前端应用平台对数据的需求,建立数据的供需生态,实现资源目录及展现、数据标准展现、数据申请、数据获取等功能。
加强数据资源目录分级分类及一数一源工作,并采用动态脱敏和静态脱敏两种方式,对数据中的常规敏感信息在数据源处就进行替换、覆盖或隐藏等脱敏处理。根据不同的应用需求,对数据中的敏感信息进行不同的界定,通过制定相应的脱敏规则对被界定为敏感信息的数据进行屏蔽。最大化展示数据,保证隐私数据安全。
截至2022年底,重电已完成45 个系统集成,共享数据集合279 个,共享数据8 300 余万条,并以数据为驱动,再造优化办事流程达205项,涵盖教、学、研、管各方面校内网办事服务。
5.1.3 AI+大数据支撑学生评价,实现态势感知
以贯彻落实国家“三全育人”和《深化新时代教育评价改革总体方案》为指导思想,基于AI+大数据技术,针对学生五育综合素质评价,在校本数据中心基础上,重点对学生学习、科研、学生管理及校园活动等数据进行建模分析,再结合实时的校园舆情、视频、上网等数据,构建学生精准画像系统(如图7所示),达成学生在校服务的目标实时监测—预警—分析—应急的全过程数字化闭环,形成学生评价态势感知,实现学生教育生涯智能导航,助力学生全面成长成才。
图7 学生综合画像图
5.2 “供需自洽”助推“教、学、研”共生型建设
重电以数据自主服务为核心和关键,从理顺数据供需双方关系出发,为学校各主体提供数据治理自主活动,以“供需自洽”的新范式探索职业院校数据治理,改变了职业院校信息中心数据管理难、供需难和共享难的现状,调动了供需双方数据治理活动的积极性,盘活了学校数据资产,助推了“教、学、研”共生型自主建设模式。
在信息化建设过程中,重电充分发挥学校电子信息类院校特色。在数据治理体系建设过程中,为师生建立数据开发者平台,提供脱敏的数据仓库服务教学、科研。同时数据创新应用开发成功后,在安全可控范围内同步到生产环境中进行应用,真正践行了“做中学,学中做”的现代教学理念,形成了信息化与教学科研互哺新业态。