系统动力学视域下高校教育数据治理影响因素探究
2022-08-14宋瑶瑶周益名李洋
宋瑶瑶 周益名 李洋
海军航空大学 山东 烟台 264001
引言
《中国教育现代化2035》提出要开展大数据支撑下的数据治理能力优化行动,推动以互联网等信息化手段服务教育教学全过程[1]。高等教育院校作为立德树人的重要基地,科学有效开展数据治理,打通局部系统、整合全部数据,实现校园庞大数据集群的管理与应用,责任重大、任务艰巨。高校教育数据治理是一项系统性工作,涉及数据质量标准、权责部门职能定位、数据价值流动等多个方面,关系到教学、科研和日常管理等各项活动,受到智慧校园等信息技术发展制约,同时还受到数据安全、数据隐私等方面的影响,为此,需要深刻剖析各方面影响因素及其作用机制,为高校数据治理的科学筹划设计、严密过程把控、精准有效预判提供有力支撑。
1 研究现状
数据治理最初起源于“数据仓库治理”在两家公司的应用实践,因其在组织内部和外部管理数据使用上的重要性和独特优势受到越来越多关注。此后数据治理陆续应用于政府、企业、医院等领域,旨在从纷繁复杂的巨量数据中探寻某种相关关系,更快速地完成预期目标。当前,国内外相关行业协会已研究发布了几个具有广泛影响力的数据治理标准规范:国际数据管理协会DAMA发布的《数据管理知识体系指南-DMBOK》,介绍了以数据为中心的10个信息化关键知识领域;卡耐基-梅隆大学CMU软件研究所SEI发布的数据能力成熟度模型DMM,用来评估和提升组织的数据管理水平;中国通信标准化协会发布《数据治理标准化白皮书》,将标准化理念引入数据治理,搭建了数据治理标准体系框架,进一步明确数据治理任务及原则。
教育数据具有全员、全程、全方位等特点,采集呈现高度复杂性、应用需要高度的创造性、研究注重相关关系和因果关系结合。我国最初是许晓东等人提出由数据的获取和抽取、整合和分析、解释和预测几个阶段构成的高等教育数据治理分析框架,拉开了教育数据治理研究的序幕[2]。教育数据治理最初应用于高校图书馆管理领域,包冬梅等人从促成因素、范围、实施与评估三个维度构建了符合我国高校图书馆实际的数据治理框架——CALib数据治理框架,全方位描述了数据治理工作的必备要素、重点关注领域及具体实施方法[3]。大数据时代的到来,教育系统内各类信息平台增多,信息孤岛普遍存在,缺乏协同和整合机制,广大学者围绕体系架构、治理方案、运行机制等展开探讨,如余鹏通过归纳不同规模、类别、等次的高校样本,提出了基于智慧校园良性发展的教育大数据生态体系架构[4];赵安新从数据融合的技术层面出发,将数据治理划分为数据层、交换层、平台层、展示层[5];董晓辉基于活动理论视角,从治理主体、治理客体、治理方式、治理目标四个方面,剖析高校教育数据治理体系构成要素及其内容[6];周炜归纳总结了四类数据治理牵头部门——综合协调部门、发展规划部门、信息技术部门、大数据中心的职能定位,并从体制机制、统一数据平台、数据标准、队伍建设四个维度构建优化数据治理实施路径四要素模型[7]随着人工智能、云计算等技术的成熟,被广泛应用与数据治理过程中,运用技术手段提高数据治理绩效,如彭雪涛借鉴美国高校数据治理策略,提出我国院校应从顶层规划入手,划分权责体系,用信息技术保障数据治理,以分析应用推进数据治理[8]。巫莉莉提出数据治理的核心在于提升数据质量,其关键技术在于数据集成、数据剖析及数据清洗[9]。赵磊磊提出人工智能时代高校数据治理要致力于创设智能共管的数据管理职能优化机制、高效数据挖掘与共享质量标准、职权厘定的智能化数据决策、指向数据价值释放的智能数据服务体系[10]。但与此同时,海量数据汇集带来的数据隐私和安全问题也进入研究视野,陈桂香基于整体性治理理论视角,提出从制度、运行、观念三个维度解决高校大数据治理制度“碎片化”问题,从而防范高校大数据社会风险的产生[11];王国贻认为大数据时代背景下,应从安全管理制度制定、应用系统保护水平升级、信息存储传输几倍提升等方面,确保数据在安全可控情况下发挥效用[12]。
总体来看,众多研究者围绕高校数据治理思想与理念、逻辑与框架、功能与职能等方面已开展了比较深入和细致的研究,但对于数据治理的影响因素以及相互的影响关系,相关研究和探索还比较薄弱;同时,目前各项研究整体上偏重于静止态和初始态,而从运动态、发展态的角度解析和探讨高校数据治理各影响因素状态变化,基本处于空白。对此,亟待运用系统论、关系论的有关方法手段,全面解构高校教育数据治理的影响因素,并通过构建科学合理的数学模型进行演绎的分析,从而深刻把握高校教育数据治理的运作机理。
2 高校教育数据治理的主要影响因素
高校教育数据治理点多、线长、面广,涉及管理方法与技术工具的综合运用,更涉及众多的利益相关方和众多的环节要素,应当说数据治理是一项复杂活动,遵循社会活动的一般性特点规律。为此,按照社会活动理论的有关原理,围绕治理主体、治理客体、治理目标、治理方式四个方面,深入分析高校教育数据治理的主要影响因素;而针对数据治理的影响因素具有多层次、多要素特点,运用原因分析法,进行系统全面的、逐级分解的溯因分析,对数据治理成效显现的过程和机理进行“白盒”式的解构,形成高校教育数据影响因素因果图(见图1)。
图1 高校数据治理因果图
2.1 治理主体的影响
治理主体是指数据治理过程中涉及的关键主体,主要包括生产者、消费者、管理者,是数据治理过程中涉及的关键性参与者与实施者,起主导作用。一是生产者的影响。生产者既是院校处理日常事务和履行职责的各运行单位,又是参与院校活动形成海量数据的广大教师和学生,是数据之源,从根本上决定数据治理水平。二是消费者的影响。消费者是在数据治理过程中获取信息的主体,是数据利益的直接相关者,是数据的最终用户和需求方,为数据治理成效提供需求牵引、做出用户评判。三是管理者的影响。管理者不仅包括监督管理数据治理过程的管理人员,还包括使得信息条理有序并且将数据价值挖掘出来的专业技术工作人员,存在于数据治理全流程,发挥主导作用,是数据治理成效提升的直接推动力量。四是组织结构的影响。各数据治理主体协同参与,形成合理组织结构,保证生产者、消费者、管理者各司其职,从而规范和约束数据治理机构与职能。此外,值得一提的是,治理主体虽然被划分为三种角色,但实际数据治理过程中往往某类人员兼具多种角色的情形,如高校教师既是数据生产者,也是数据消费者。在本研究中,为便于全面系统地开展分析,逻辑上仍划分为生产者、消费者、管理者,分别解析其影响。
2.2 治理客体的影响
治理客体是指存在于教育教学、管理、科研等活动中,围绕高校的人、事、物等采集和存储的数据集合,主要集中在数据集成、数据分析、数据开放与数据运用四个方面[13]。治理客体是数据治理中主体作用的对象,对数据治理主体起到重要的反作用。一是数据集成的影响。数据集成是要将互相关联的分布式异构数据源集成到一起,使用户能够以透明的方式访问这些数据源,是数据治理体现质量、凸显价值的前提和基础。二是数据开放与共享的影响。数据开放主要是指面高校向社会公开发布数据,而数据共享主要是指院校内部各部门之前共同使用相关数据。数据开放与共享直接推动打破信息孤岛现象、提升数据利用率、满足数据治理需求。三是数据运用的影响。数据运用是持续不断地应用数据并创新服务、为院校创造价值的过程,强调数据的准确性、完整性等基本特征,是数据治理的出发点和落脚点。
2.3 治理目标的影响
治理目标是数据治理系统的顶层设计,体现于支持实施数据治理的环境水平,服务于如何实现数据价值和风险管控,主要围绕包括决策水平、管理效率、数据隐私和安全等方面展开,在整个数据治理过程中起牵引作用[14]。一是决策水平的影响。决策水平决定着高校建设发展的全局性、根本性、方向性问题,对数据治理重要性必要性的认识、对数据治理项目的支持和推动力度、对数据治理工作的领导和指导水平,无疑都对数据治理成效起到根本性的影响。二是管理效率的影响。高校的管理运行效率一方面是数据治理水平程度和成果成效的重要体现,另一方面也是开展数据治理的现实条件基础,决定着数据治理的起点。三是数据隐私和安全的影响。数据隐私和安全问题是数据治理过程中的主要风险点,是数据治理的底线和红线,既容易成为数据治理中的疏失环节,又容易被当成消极推动或配合数据治理的挡箭牌,因而成为数据治理的瓶颈性堵点以及机制性阻碍。此外,在研究中,为实现对“治理目标”的可理解、可测量,用“治理环境”这一变量来表征“治理目标”的动态变化。
2.4 治理方式的影响
治理方式是指对数据全流程处理与分析时所采用的方法和技术,主要包括数据治理的技术架构与制度保障。治理方式是数据治理主体作用于客体的方式或措施,起支撑作用。一是技术平台的影响。技术平台是指数据治理相关的技术方法、设施平台,包括数据处理技术、数据治理平台等,直接决定着数据治理的科学性先进性水平,以及实施和推进效率。二是制度保障的影响。制度保障包括政策制度、法律法规等,具体指激励机制、保障机制、监管机制、数据标准与规范、数据开放共享机制,其中保障机制是数据治理的前提条件,监管机制是数据治理的必要条件,激励机制是数据治理的辅助条件。
3 高校教育数据治理影响因素的SD模型构建
系统动力学被称为“社会政策实验室”,提供了一种结构化、动态反馈的建模技术,在研究复杂反馈系统动态行为方面具有独特的优势:决策者在制定政策的同时,总是期望了解其政策实施的可行性及其结果,若直接通过系统的实际运行来达到这一目的,不仅代价高昂,而且即使发现错误,也难以逆转;系统动力学不注重大系统中每一个子系统的细微小节,其仿真结果的绝对数值用于研究系统之间相互关系以及系统整体的变化趋势,处理行为随时间变化的系统问题,适用于宏观的、模糊的、长期的趋势预测。由此,教育数据治理影响因素的复杂性及其交互的动态性特征符合系统动力学强调结构关系、时间因素等对系统细微的影响,借助Vensim PLE系统动力学软件构建教育数据治理模型,并对其重要变量进行具体分析。
3.1 系统模型搭建
基于上文中对主要影响因素的分析,根据系统动力学理论,运用Vensim PLE软件,进一步解析各影响因素之间的关系,系统构建高校数据治理各影响因素的关系模型。为了使关系模型更加合理和完整,体现系统的动态性与反馈性,引入调控率和影响率,凸显治理绩效变化的反馈结果随实验阶段不断发展及治理因素对治理绩效的动态影响,最终的系统存流量图如图2所示。
图2 数据治理水平和治理绩效
图2 高校教育数据治理各因素影响关系模型
本文在构建系统动力学模型的过程中力求基本符合院校教育数据治理实际情况,结合笔者所在院校数据治理项目实际施工时间周期,确定系统的仿真周期为24个月,步长为1个月。治理调控率随着项目的开展不断增加,定义使用斜坡函数,其函数定义参考以往研究设定。模型参数初始数据采用问卷调查和算术平均法,调查对象为院校教师、教学管理人员以及一定量的在校生,影响因素的权重采用层次分析法,邀请院校数据治理相关领域专家对指标的重要程度进行评分,得到各影响因素的权重系数,形成各项数据治理SD模型方程,详见表1。
表1 数据治理SD模型方程
续表
3.2 模型仿真分析
数据治理主体仿真结果图2(a)所示,在数据治理开始前,院校各部门、教师、学生等面对庞大、复杂的数据治理项目,忙于完成日常事务,难以投入精力完成数据的填报、使用等。随着项目的继续推进,数据治理体系的各项机制作用逐渐凸显,信息化带来的便捷促进生产者、消费者、管理者的加入。而在项目后期,项目基本完成的同时,系统实现数据的实时、无感采集,数据治理主体的作用不再明显。
数据治理客体仿真结果图2(b)所示,在项目开展前期,数据治理系统采集和存储的数据量较少,数据利用率低,但随着项目推进,系统数据累积量充足,满足数据消费者所需,图中曲线前中期斜率越来越大,加速项目建设。而在项目后期,数据治理平台平稳运行,实现数据的自动抓取、分析、可视化等功能。
数据治理方式仿真结果图2(c)所示,在项目开展前期,面对众多的软硬件,尚未找到完全贴合院校数据治理系统实际需求的技术手段,处在不断磨合阶段,但随着项目推进,数据处理平台功能不断完善,数据处理技术满足日常所需,达到巅峰。而步入后期,项目逐渐完善,平台和技术趋于成熟,作用逐渐减弱。
数据治理环境仿真结果图2(d)所示,与数据治理方式相似,项目开展前,各因素之间的关系较为薄弱,数据治理涉及的利益、关系复杂,院校领导者决策监督在前期占有重要地位,需做好各方协调。而随着项目的推进,涉及层面渐广,复杂性增加,项目推进愈发复杂困难,领导层的作用愈发明显,水平达到巅峰。项目后期,数据治理体系逐渐完善,复杂性降低,作用逐渐减弱。
数据治理主体、数据治理客体、数据治理方式、数据治理环境在数据治理过程中变化趋势如图2(e)所示。整体上随着项目的开展呈现出先上升后下降的趋势,前期到中期不断上升且斜率逐渐增大,并在中后期达到顶峰,后期开始下降。在前期过程中,由于院校管理者决策、政策制度、数据治理技术等具有外部强制性,治理四要素中数据治理方式、数据治理环境对治理绩效的作用占主导地位。随着治理项目的开展,数据治理参与者之间的信任、共享、合作等互动增多,使得数据治理体系的构建向既定目标不断完善,斜率越来越大。在后期数据治理体系逐渐成熟,数据治理环境、数据治理方式等外在强制作用减弱,数据治理主体的参与处于相对稳定的状态,而系统数据累积量逐渐增多,数据增值价值凸显,数据客体的作用逐渐增强。
数据治理绩效动态变化图2(f)所示。整体来看,在数据治理主体、数据治理客体、数据治理方式、数据治理环境的共同作用下,曲线是不断上升的,在前期阶段变化比较平稳,曲线的斜率先减小后增大,表明治理绩效在周期内先稳步增长,在中后期逐渐增速。前期项目开展时,由于主体之间的合作生疏、关系联系不强,资源调动等存在不足,加上项目复杂性较高,数据治理绩效不明显。而项目后期随着数据治理主体之间信息的共享以及共同解决问题的频率增加,技术手段的成熟,加上政策制度的约束以及院校管理层的协调调动,数据价值凸显,治理绩效加速提升。
4 结束语
当今正处在一个信息量爆炸的时代,院校在这一环境下不仅要准确定位角色,赶上时代发展变化,还要把握契机提升自身的治理能力,本文从治理过程的四要素出发,采用系统动力学方法探讨其在院校数据治理各个阶段作用的动态变化。结合仿真分析结论,提出以下数据治理绩效提升对策建议。
4.1 治理前期阶段注重数据治理主体的作用
前期阶段,主体的参与对治理绩效提升具有显著作用。在此阶段,院校应加强各部门之间的交流,了解数据消费者需求,建立合理的绩效评估手段,调动数据生产者、管理者积极性,从自身需求实际出发,搭建数据治理平台。注重大数据专业人才的培育,一批教育专业知识过硬、数据分析能力强的队伍,是实现数据价值最大化、提升数据治理成效的重要推动力量。
4.2 治理中后期阶段注重数据治理客体的作用
数据治理的中后期阶段,多源数据融合共享是数据治理的关键,针对院校产生数据的采集、加工、存储,促进数据治理绩效。因此,在此阶段,院校应加强对各部门数据的整合,注重数据量的积累和存储。开展数据摸底调研,对现有数据情况进行梳理,初步了解各部门数据信息及重要数据的真实性和可靠性,打通数据链路,同时摸清现有的使用规则、数据收集目的、方式、范围、类型等数据活动情况,使数据达到质量与数量的双重保证。
4.3 优化数据治理顶层设计,加强一体化数据平台建设
数据治理所产生的效果、效益并非立竿见影的,而是需要长期的实践检验。院校数据治理环境及数据治理方式,包括领导者决策管理、数据安全、政策制度、治理软硬件等,影响着治理的整体发展方向,伴随数据治理项目的各个环节,应立足实际、实事求是,对自身条件进行清晰的认识和客观的评价,满足数据治理的现实条件。同时明确战略重点、阶段及对策,促进对数据治理成果的有效利用。