高校教育数据治理的内涵、问题及对策
2023-12-26贺泽龙刘上力
贺泽龙,刘上力
(湖南科技大学 a.党办校办;b.数据处/网络信息中心,湖南 湘潭 411201)
党的二十大报告指出,要加快建设网络强国、数字中国。建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。中共中央、国务院先后印发《关于构建数据基础制度更好发挥数据要素作用的意见》《数字中国建设整体布局规划》等文件,将数据要素放到一个更为宏大的“数字中国”图景中。就高校而言,随着教育信息化建设的推进,各类信息化平台累计的数据呈指数级增长,对有效获取、存储、分析和利用数据的需求越来越强烈。教育部先后出台相关政策文件,如《教育信息化2.0行动计划》《关于加强新时代教育管理信息化工作的通知》,对高校教育数据的规范管理、开放共享、质量保障、管理效能等方面进行了顶层设计。“用数据说话、用数据决策、用数据管理、用数据创新”的数据治理工作已成为高校教育数字化转型工作的重要驱动力,取得了大量工作成果,但也暴露出一些短板问题。以笔者所在学校——湖南科技大学为例,学校党委高度重视数据工作,在国内高校率先设立数据处,成立数据治理专项建设组及专题调研组,用半年多的时间对高校数据共享、服务、应用、管理等方面开展系列调研以及信息化立项建设。结合此次调研成果,笔者就高校教育数据治理的内涵、主要问题及工作对策谈谈以下看法。
1 教育数据治理的内涵
数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。经过数十年的教育信息化建设,我国教育数据达到了相当规模,数据治理已成为各高校的共性需求。开展数据治理工作不仅是高校对数据时代的积极回应,也是高校推进教育治理现代化的必然选择。就湖南科技大学而言,数据治理包含双重内涵。
首先,以治理为手段,提高教育数据质量及教育数据管理水平。教育数据与企业数据、政府数据对比,有其特定的覆盖范围,它既是面向特定教育主题的多类型、多维度、多形态的数据集合,也是面向教育全过程的数据。就高校而言,主要分为三类:一是高校内设机构、教学科研单位在管理及服务过程中所需或产生的数据;二是师生员工在教学、学习、校园生活中产生的数据;三是校园网、物联网等设备设施产生的数据。随着教育信息化的飞速发展,教育数据已成海量之势,其治理也有多个维度之分:(1)从管理角度看,涉及数据治理战略方针、组织架构、规则规范、权利责任、数据标准、数据质量、数据安全等内容;(2)从生命周期角度看,数据治理覆盖采集、传输、存储、共享、应用、开放、销毁等全流程管控活动;(3)从技术服务平台看,数据治理包括采集系统、存储系统、交换系统、数据标准系统、质量管理系统、共享开放系统的规划设计及运营。
其次,以数据为抓手,推动高校教育治理体系和治理能力现代化。2022年4月19日,习近平总书记在主持召开中央全面深化改革委员会第二十五次会议时强调,“要全面贯彻网络强国战略,把数字技术广泛应用于政府管理服务,推动政府数字化、智能化运行,为推进国家治理体系和治理能力现代化提供有力支撑”。在教育领域,数据治理在融入教育治理现代化进程中,也在不断创新和拓展教育治理现代化的内涵。(1)从治理内容来看,以数据为核心的数字技术,将高校教育教学核心业务、管理理念、育人模式进行数字化重构,实现教育治理范式的创变,形成开放性、适应性、可持续性的良好教育治理新生态。(2)从治理方法来看,依托大数据、人工智能、云计算等数字技术,通过深入挖掘教育教学大数据,进而增强教育管理、动态预测、感知诊断、辅助决策能力,实现治理主体多元化、治理方式科学化、教育流程可视化、治理决策精准化。(3)从治理评价来看,建立量化的评价指标体系,采用伴随式的数据采集方法,对多模态的海量数据进行全过程梳理、关联及分析,实现教育评价过程及结果的数字化、可视化及智能化。
2 高校教育数据治理存在的主要问题
近年来,在政策引导、产业助力、技术发展等多种因素推动下,高校教育数字化转型已呈加速之势。如何利用已积淀的教育大数据资源,助推高校教育治理现代化进程,全面服务教育教学流程再造、教学与评价模式改革、智能化的校园综合治理、个性化的师生成长空间,逐步构建“校务运行智能化、校园治理网格化、师生服务智慧化”的一体化智慧体系,已成为高校教育信息化发展的重要任务。目前,国内众多高校已开展一轮甚至多轮数据治理工作,取得了一定的工作成效。但与中共中央、国务院印发的《中国教育现代化2035》所部署的战略任务即“推进教育治理方式变革,加快形成现代化的教育管理与监测体系,推进管理精准化和决策科学化”的整体要求还存在较大差距。其问题主要体现在以下三个方面:
(1)制度供给相对滞后,意识不到位。一是制度不健全,缺乏约束力。关于数据产权界定、数据流通、数据授权使用、资源管理、安全管控、奖惩机制的规章制度、工作规程较为缺乏,即便制定了制度,对实际工作的开展缺乏指导性,容易出现僵化、失灵等问题。二是职责不明确,认知有偏差。数据生产人、数据所有人、数据使用人的职责不明确,横向的部门壁垒和纵向的层级壁垒依旧存在。对数据治理认知有偏差,把数据治理单纯看成技术性工作。三是队伍没保障,经费不够用。专业人员配备不足,既懂技术又懂治理还懂业务的复合型人才匮乏。除了数据治理平台需要投入建设运维经费外,数据治理本身需要大量人力资源投入,学校能投入该项工作的人员非常有限,必须外购数据治理服务,这部分资金缺口较大。四是理念未转变,部门难协调。以“管理为中心”向“服务为中心”“数据驱动服务”的思维待转变。“共治共享”的理念未能形成,“数据私有”的狭隘思想依旧存在,进而导致机构之间协调难度大,数据治理工作难以整体推进。
(2)运行机制相对落后,体系待完善。一是缺乏顶层设计,标准不一致。缺乏按照“一体化”理念对智慧校园的整体设计,业务系统、数据中台、业务中台、数据库层级不清晰,技术架构、数据存储和数据调用方式没有统一标准。没有形成一套完善的、可通用的校级数据标准体系,即便有标准,对各机构所采购软件难有约束力。二是管理不够规范,落实不到位。缺乏对数据采集、加工、入库、传输、共享、应用、销毁全生命周期管控机制。数据管理权限混乱,数据归口管理部门不明确、职责未落实、更新不及时、数据集成与共享的粗放管理与监督的情况较为严重。三是质量缺乏管控,体系待完善。缺少数据质量考核体系,质量评价指标不健全,缺乏有效的质量检测技术手段,质量改进及质量问题反馈机制有待健全。数据质量参差不齐,数据源头管理不善,数据字典不明晰、数据库及系统规划或数据标准设计不当。四是资产意识淡薄,安全风险高。数据资产归集意识、产权意识较为薄弱,数据产权制度、数据资产管理制度及数据资产计价方法尚不健全。利用大数据平台对数据资产进行归集管理还需进一步规范。数据生命周期管理缺失,数据质量问题出现后,溯源困难,数据安全面临数据滥用风险。五是缺乏考核体系,评估手段少。缺乏系统化的数据治理考核体系,配套制度建设不完善,数据治理考核闭环管理机制(问题定义、发现、整改、跟踪、效果评估)不健全,技术手段匮乏,监管无法落实到位。
(3)信息孤岛问题严重,应用未深入。一是孤岛问题严重,共享不全面。普遍存在“条块分割、烟囱林立、信息孤岛”等问题,数据重复、碎片化、不一致、冗余多、数据聚合难、数据流转不畅、历史数据缺失等问题比较严重。跨层级、跨平台的校务数据整合共享不充分,数据更新不及时、数据标准不统一、数据交换不实时。二是数据应用缺乏,便捷性不足。没有充分利用大数据、云计算、人工智能等新型技术去开发应用,使得数据的服务价值未得到很好的体现,数据分析结果支撑决策力度不够。数据应用的缺乏,造成师生在校园的生活、学习和工作不便捷。三是创新能力不足,开放度较低。数据应用接口缺失,数据开放制度未建立,数据服务平台未建立,数据分析模型、算法与计算工具等不合适,管理人员数据创新重视程度或创新意识不够。四是隐私保护监管不善,安全漏洞多。数据隐私保密机制未建立,业务日志存储与管理不完善,数据管理员保密意识不强,业务系统对数据加密、数据脱敏功能不完善。五是缺乏对数据价值的深度挖掘。缺乏数据为业务服务的理念,许多数据处于“休眠”状态,职能部门没能深刻思考如何运用数据来推动业务工作开展,对有效数据的深度加工与综合运用不够科学,数据价值得不到有效体现。
3 提升高校教育数据治理工作实效的对策
教育数据治理是一项系统工程,任务庞杂,挑战巨大,能否取得好的工作成效,取决于各级管理机构的重视程度、顶层设计、实践路径、技术平台选型、工作队伍以及资金投入等众多因素,也与领导的决心、师生的意识、治理的时机不无关系。笔者就所调研的湖南科技大学的实际需求及问题,提出以下工作对策:
(1)多元共治,完善高校教育数据治理运行机制。一是加强组织管理,强调多元协同。建立健全决策组织及职能部门,统筹全校数据治理工作,推动教育数据资源共享与开放,促进数据资源的应用。建立常态化工作机制,明确包括组织、业务、职责在内的全生命周期管理规范,形成各数据源头管理部门齐抓共管的工作合力。加强信息化项目归口管理,重点把关项目建设可行性论证、建设方案、项目验收等关键环节。建立校、院、科三级协同联动机制,协商解决跨部门、跨系统的数据互联互通、应用建设等问题。建立数据治理考核评价体系,鼓励各机构积极参与大数据治理。二是完善制度规程,强调数据标准。设计并落实一整套数据治理制度及规范,主要包括:数据治理顶层设计及管理制度、数据访问安全规范、数据采集规范、数据集成共享规范、数据质量保障规范、数据接口调用规范、数据存档操作规范、数据开发设计规范、软件操作流程规范等。综合考虑国家和行业标准代码以及学校现有事实标准,建立数据标准体系,规范数据采集、存储传输、使用处理、开放共享等全生命周期的数据活动。三是强化数据质量,强调一数一源。建立数据质量评估制度,保障数据的真实性、准确性、合规性、一致性。鼓励数据伴随式采集,建立各数据源管理机构定期比对的数据纠错机制,鼓励在应用中提高数据质量。明确各类数据的数据源,形成数据溯源图谱,推动教育统计数据和业务数据的协同联动。按照“一数一源”原则,规范数据收集使用范围,优先通过共享获取数据,避免重复采集。四是夯牢安全屏障,强调隐私保护。健全数据安全技术保障。统筹数据开发利用、个人信息保护和公共安全,加强涉及国家利益、公共利益、商业秘密、个人信息保护的数据保护,加快隐私保护技术、国产密码等技术的推广和应用。健全安全管理组织机构和安全管理制度。强化涉密数据的安全管控,建立数据安全分级分类管理制度,健全大数据安全标准和制度。建设稳定可信的数据安全保障平台。加强数据加密、数据保护、身份认证、分布式计算安全、分布式存储安全、细粒度安全审计等数据安全技术的应用。五是做好宣传推广,强调专业培训。充分利用网络媒体等宣传工具,及时宣传数据治理新成果、新成绩、新成就,与全校师生达成数据“共建共享”共识。总结和挖掘典型做法和先进经验,加强学校间横向联系,交流经验,提升影响。定期开展面向全校师生的数据专题讲座和培训,强化数据意识,提高数据素养。加强对数据源单位管理人员的技术指导,定期举办数据治理专业培训,提升学校数据治理整体水平。
(2)技术善治,构建高校教育数据治理服务平台。遵循“统一规划、分布实施、融合共享、优质供给、重在治理、应用为王”的实施原则,推动数据治理服务平台建设。按照“摸家底、搭平台、定标准、理数据、建应用、促开放”的全生命周期治理流程开展项目实施工作,解决数据“聚、管、用”三类核心问题,实现整个数据治理过程信息化、可视化及智能化。该平台包括以下关键单元。一是数据采集单元。全面梳理全校数据,进行全维度数据的采集,实现线下数据的在线采集、编辑等功能,解决应用系统数据多源异构问题。为各业务系统提供数据接入接口,以统一的数据模型、数据质量标准和接口规范实现数据自动提取、数据转换、数据发送、数据校验、数据审核等。二是数据标准单元。实现数据标准体系的在线管理,实现数据标准、代码标准在线新增、维护、拆分、合并、变更、启停用、智能映射及转标。实现业务标准实时监控和提醒、采标率分析、编码可视化编排、数据质量检测与问题分析预警。实现数据UC确权中的数据预分配、数据认领流程管理及多级审核。三是数据质量单元。数据质量单元的建设与管理,贯穿于数据治理全生命周期过程。通过开展数据质量问题的跟踪及处理、资产稽核、资产评估、数据质量测试与验证、数据质量性能测量与监控、数据质量服务水平评估、数据质量体验与改善等在线服务,促进数据管理及使用部门对所提供或消费的数据进行便捷化、可视化的数据质量管控。四是数据资产单元。建立包括组织、制度、标准、流程、安全、技术等内容的数据资产在线管理长效机制,实现学校数据资产全生命周期的高效管理、质量检测和数据的深度共享。基于数据资源和共享,建立数据资源目录及数据资源共享目录的动态更新机制,全面掌握教育数据使用情况。五是数据安全单元。制定科学的数据安全管理体制及策略,为高校教育数据资产的使用提供可靠的认证、授权、访问与审计功能。实现对敏感数据的脱敏,实现“事前可管、事中可控、事后可查”的全过程管理,实现安全策略的集中管理,实现安全角色的分级管理,实现测试与生产环境的分离,实现操作行为的事后审计。六是数据开放单元。在确保安全前提下,提供数据开放服务。实现数据订阅服务的自动推送、一站式数据服务申请及多部门联合审批,实现包含授权管理、鉴权密钥、使用限制、超限预警在内的安全管控灵活配置。七是数据共享单元。建立统一的数据交换体系,规范信息从采集、处理、交换到综合利用的全过程,实现全校共享数据的有效存储与管理,为学校教学、科研、管理和服务师生提供全面、及时、准确、可用、安全的数据共享服务。八是数据存储单元。建设两类数据库,夯实数字资源管理基础设施。建设共享数据库,通过梳理各类数据资源产生和使用的UC矩阵,制定数据共享与交换标准以及数据共享目录,科学推动各类信息系统数据的共享集成工作。以二级单位每年上报的各类高基报表、调研统计表为基础,形成指标数据目录,再以此进行数据溯源,实现数据的动态更新,最终形成全面涵盖学校概况、学生、教学、教职工、科研、财务、资产与设备、办公、档案在内的校情知识库。
(3)数据赋能,全面服务高校教育治理能力现代化。一是畅通共享通道,全面消除信息孤岛。按照“统一目录、全量汇集、按需申请、安全使用”的原则,构建统一的数据共享体系,积极推进跨部门数据共享、实现数据动态汇聚和实时更新,最大程度消除信息孤岛。按照一体化建设理念,统筹推进融合门户、一网通办、数据中台、业务中台建设,联通分散建设的业务系统,整合各种服务方式和访问渠道,不断增强人民群众的获得感。二是盘活数据资产,提升管理服务效能。善用数据治理的成果,深挖师生需求,快速上线智能填报、综合查询、智能推荐、智能审批等教育数据应用,全面提升教育管理信息化支撑教育业务管理、政务服务、教学管理等工作的能力。探索基于大数据的用户行为分析,为广大师生提供个性化的教育服务,促进学生的个性化成长。三是发挥数据效能,提升科学决策能力。全面聚合数据,构建大数据分析模型,全面、实时、精准地掌握学校和师生情况,为三全育人、教育评价、教学评估、“双一流”建设等核心工作提供数据支撑。建立健全大数据辅助决策机制,依托数据治理所汇聚的高质量数据,综合运用大数据、人工智能等数字技术手段,深度开发数据应用,为学校招生计划、预算编制、学生资助、安全防控等重大问题的决策研判、教育教学的监测预测预警,提供科学可信的数据辅助决策支持,提升智慧化管理水平。