基于PDCA理论的高校数据治理优化路径研究
2023-04-27邹凌君李伟斌张利峰
邹凌君 李伟斌 张利峰
关键词:数据治理;PDCA;数据质量;数据标准;优化
1 引言
经过多年信息化建设,高校已经建设了实现各项业务的系统和服务应用,搭建了数据共享交换平台,但是对数据层面的建设还很薄弱,在数据的采集、存储、管理等方面还存在一些需解决的共性问题。
1)数据标准不统一。在数字化校园建设初期,学校建设了多个业务系统如人事管理、科研管理、学生管理系统等。这些业务系统在建设时多从自身的业务需求出发,缺乏统一的数据标准和规范。
2)数据质量参差不齐。业务系统的数据库中存储着未经审核的“不权威”的数据,还存在着数据不完整、不准确、重要数据项缺失等现象。另外多源异构的数据源在集成过程中,也会产生许多质量问题。无法为后续数据分析提供有效数据支撑。
3)数据权属不清。由于缺乏顶层设计,各业务部门使用的数据存在重叠,以致多个业务系统同时具备数据源头的管理与操作权限。数据权威源头不清晰。
4)数据的生命周期管理缺失。各业务系统的数据从产生、清洗、存储、管理、应用到归档等整个流程不完整。业务系统缺乏科学的数据生命周期管理规范。
本文结合戴明环(PDCA) 循环理论基础,将全面质量管理体系和数据治理重点工作相结合,协同计划阶段、实施阶段、检查阶段和处理阶段等相互促进的过程,提出了高校数据治理的优化路径,为高校数据治理建设提供思路和借鉴。
2 数据治理概述及研究现状
2.1 相关概念
由于研究角度的多样性,学者们从不同的研究视角定义数据治理。国际著名数据治理专家桑尼尔·索雷斯認为数据治理是“协调多个职能部门的目标来制定与大数据相关的数据优化、隐私保护与数据变现的政策”[1]。Fernandes等认为数据治理是集中人、过程和信息技术的数据管护过程或方法,能够确保组织数据资产得到合理的使用[2]。国际数据管理协会( DAMA)提出,数据治理是对数据资产管理和控制的活动集合,包括计划、监控和执行等[3]。刘金松基于概念合成理论视角,利用教育数据的广泛分散性,将多元化利益群体纳入治理过程中,多方协同参与推进高等教育的善治。结合学者的相关研究和学校建设实践可以看出,高校数据治理是围绕学校数据资产全生命周期开展的各项活动。数据治理的开展需要从认识上重构数据思维,认识数据价值;从制度上加强顶层设计,设计业务流程、划分数据权责;从技术上搭建平台,强化治理的深度和广度,将数据治理落到实处。通过制度、理念、技术的结合,通过多元主体协同参与实现高校数据治理的成功。
2.2 高校数据治理的研究动态
当前,有关数据治理的研究成果比较丰硕,许多学者围绕数据质量、数据管理、体制机制等从不同的层面和角度进行了研究和总结。安小米[4]等从方法论概念入手,结合戴明环(PDCA) 的理论基础,对当前大数据治理体系构建方法进行了修正补充,提出了更具通用性的大数据治理体系构建方法论框架。余鹏等[5]在探究了高教数据治理必要性的基础上,提出了高教大数据治理三层次模型,构建了一套完整的数据生态治理体系参考架构。董晓辉[6]等基于高教大数据实践困境,采用西方组织管理学中的权变理论,提出数据治理框架的设计既要从组织的全局出发,又要结合特定的组织环境和变化的现实情境不断调整以适应组织战略目标。南旭光[7]提出了从培养理念认知、加强平台建设、完善制度设计、优化决策路径、整合人力资源等方面实现高等教育循数治理。周炜[8]从数据生命周期的角度提出了高等学校数据治理框架,构建了实施数据治理的四要素模型。
数据治理已成为当前的研究热点,这些研究为高校进行数据治理提供了丰富的理论基础和实践经验[9]。
3 高校数据治理优化路径
3.1 PDCA 循环理论与数据治理
PDCA循环理论(俗称戴明环)由美国治理管理专家戴明在休哈特的构想基础上进行挖掘并完善的一种科学工作程序,起初应用于企业质量管理,现逐渐被其他管理领域所采纳。PDCA循环理论是质量管理的依据,它将治理管理分为四个阶段,即计划阶段(Plan) 、实施阶段(Do) 、检查阶段(Check) 、处理阶段(Action) 。
高校的数据治理工作是一项迭代循环、不断修正的过程。因而在治理过程中,结合PDCA循环理论,将数据治理过程分成计划、实施、检查、处理的四个阶段,从机制上确保对治理过程中的每一环节实行动态的质量监控管理,推动数据质量持续提升。该数据治理的PDCA管理模型如图1所示。
在计划阶段,从宏观的视角定义数据质量的需求和数据治理目标,分析数据治理过程中涉及的治理目标、治理主体、治理客体、治理方式等要素,构建数据治理框架,制定数据治理全过程的相关制度和行为规范,明确数据权属关系,充分考虑利益相关者的权益,构建相互促进的良性互动的生态系统。在实施阶段,围绕计划阶段制定的工作计划,开展具体的数据治理工作。采集业务系统的数据,进行清洗、交换、治理等。定义数据质量规则,根据规则进行数据质量评估和治理。采用整体治理与局部治理结合、系统治理和碎片化治理相结合方式,协同多元主体共同开展数据治理工作。检查阶段,对实施阶段的成果进行分析和检查,生成数据质量报告。对质量问题进行个别和整体分析。处理阶段主要是根据检查结果,逐一排查数据问题,由相关系统或人员进行处理。总结经验,将未解决的问题转入下一个PDCA循环。
3.2 高校数据治理实践优化路径
3.2.1 计划阶段
1)健全数据治理组织架构和制度体系。依据信息化建设中的职能,构建校级数据治理组织架构,如表1所示。数据治理委员会是学校数据治理的领导机构,从顶层对数据治理进行统筹决策和规划布局。信息化建设领导小组负责对学校信息化建设进行长期规划和重大问题决策。全校各职能部门负责实施管理范围内的数据治理。信息化部门是学校信息系统数据资产的统筹管理部门,负责全校信息系统数据管理的总体规划和技术平台支撑,制定学校的信息化管理制度等工作。老师和学生是信息活动的参与者、实践者,也是数据的生产者和使用者。
围绕数据的生命周期,建立完善的数据管理制度是一项至关重要的工作。通过制定数据采集、运维管理、数据存储、数据质量、数据申请、数据共享、数据安全等方面的制度体系,建立数据治理制度体系。如数据的收集和利用制度,制定了数据在采集、开发和利用等过程中的规范;数据的权属及边界规范,明确了数据的归属和权责。制度体系的建立从宏观和微观层面形成科学的治理秩序,确保了数据治理的各项工作有章可循。
2)制定校本数据标准。数据标准是高校智慧校园建设的重要基石,为全校的业务系统提供统一的數据理解和坐标。信息化部门和业务部门一起参照国家标准、教育部标准,制定一套符合学校实际情况的校级数据标准,首先要明确和理清数据的来源和权责,真正落实“一数一源”,在此基础上,梳理各业务系统的数据标准。此外,制定代码标准、编码标准、安全标准、质量标准和管理标准。规范好的数据标准以教学、科研、服务为核心,形成了人事管理、教务管理、学工管理、科研管理等主题的数据标准集。
3.2.2 实施阶段
1)构建多元主体协同的数据资源管理架构。数据治理的主要任务是综合管理学校数据资产,实现数据资源的标准化定义和管理。由于数据资源的分散性要求,多元化利益群体需要参与到数据治理的过程中。为此基于不同的视角构建一个如图2所示的多元主体协同参与的数据资源管理架构。
信息化部门以学校需求为驱动,采集全业务、多形态、多终端的数据,进行有效的存储和管理,采用批流一体的数据集成方式,实现闭环的数据集成管理。对采集后的全量数据进行清洗、治理,进行业务域划分。数据资源管理层主要面向于信息化部门和业务部门。信息化部门对全域数据进行标准管理、质量管理、安全管理等。业务部门对应于数据资产的梳理、一数一源权责认领、数据资源申请和审核等需求。在数据资源服务层,结合师生信息化需求,构建业务流程和上层应用,通过集中化的数据呈现和分析,提供对学校的整体洞察和感知。多元主体的参与使数据资源管理体系化、流程化,提高了数据服务效率,降低数据使用难度和管理成本。
2)开展以信息化部门为主导的整体性数据治理。提高数据质量是数据治理的重要环节。数据质量的问题分为结构性问题和内容性问题。结构性问题主要指代码标准不一致、数据内容不规范等。内容性问题主要指数据缺失、数值有误等。由信息化部门根据数据的完整性、准确性、正确性、一致性、唯一性和及时性等质量维度来描述和量化数据的质量,定义数据质量检测规则,结合数据质量维度和具体业务需求,检测数据和业务规则的符合度。通过设定具体的数据字段质量检测规则对全域数据进行集中质量检测,将分析结果进行可视化呈现,明确问题所在。
3)开展以业务部门为辅助的局部化数据治理。业务系统根据数据标准对业务数据进行规范。由于早期的业务系统在建设时数据标准缺失,系统中存在很多非标数据。若此标准是业务系统必须的,且短期内难以改正,可以通过建立对照表的方式,将数据同步到数据中心,这样数据中心存储的数据是符合学校标准的数据。数据中心再将标准数据共享给其他业务系统。随着业务系统不断地升级和迭代,各个业务系统会逐步使用新的数据标准,达到最终统一的目的。除此之外,业务系统应根据数据标准要求将不规范的数据按照学校标准进行转换、修正,逐步将学校数据标准落实到位。
3.2.3 检查阶段
检查阶段是对实施阶段发现的问题分析评估。由信息化部门和业务部门进行针对性的检查,可采用案例验证法对治理体系进行评估,通过可视化的方式将数据问题以《部门数据质量报告》形式呈现,让质量治理变得清晰、简单。通过系统和人工方式对数据进行检验,是主动式地提升数据质量的关键环节,可以发现普遍的数据结构性问题,显著提升数据质量。
另一方面,通过营造数据治理文化氛围,创建多元主体参与的数据治理生态体系,发挥教师和学生的数据治理主体成员作用。如面向教师、学生、领导提供集成统一的数据综合服务中心,展示全面综合的数据。老师和学生可以查看个人的基本信息、学习情况、财务信息、科研信息等。数据综合服务中心提供数据纠错、数据反馈和综合校情分析等服务。师生根据平台中展示的个人数据,可以反馈平台中不准确、不完善的问题。发现数据质量的内容性问题。
3.2.4 处理阶段
这一阶段是根据检查阶段的结果进行分析处理,追根溯源,探究成因,及时分类处理,并结合实际情况提出科学的解决方案或形成标准的解决流程。若是数据源头问题,督促部门信息员进行修正,若是在数据流转、转换的过程中发生的故障,由信息化部门检查转换机制和规则,并做好后续跟踪和检测工作。通过技术手段和制度规范解决问题,为下一个数据治理循环推进提供借鉴参考。
4 总结
数据治理工作不是一蹴而就的事情,是需通过制度、理念、技术的结合,全校多元力量共同参与的一项长期工作。需要自顶向下的顶层设计、健全的数据管理机制、完善的管理运行机制。本文将数据治理和PDCA理论相结合,形成具有生命力、可不断迭代优化的高校数据生态,实现数据串联下的,多元主体参与的数据链管理闭环,让数据治理为校务治理提供更好的支撑,为学校业务管理、教学创新跨越式发展提供信息化深度支撑,进一步推动学校的信息化建设。