基于DCMM的高校数据治理能力评估应用与研究*
2022-11-15张国宝
张国宝
(河海大学,江苏 南京210098)
0 引言
2021年12月中央网络安全和信息化委员会印发《“十四五”国家信息化规划》,提出“建立高效利用的数据要素资源体系”“加强数据治理,提升数据资源开发利用水平”。这些政策都对高校的数据治理和管理的建设提出了明确要求。
数据管理和治理能力评估是数字校园建设水平的重要衡量方面。数据管理能力成熟度评估模型[1](Data Management Capability Maturity Assessment Model,DCMM)是我国首个数据管理领域国家标准,将组织内部数据治理管理能力划分为八个能力域。
数据治理模型研究为数据治理实践活动提供理论依据,高校数字校园建设在数据治理理论、框架与模型等方面的研究与实践主要有:许晓东等人[2]从战略高度提出对高等教育的数据治理,应且必将成为高等教育治理的一个重要组成部分;刘桂锋等人[3]对国内外数据治理的要素、模型、框架等研究归纳,分析数据治理模型的类型、特点、问题、挑战与机遇;余鹏等人[4]提出设计教育大数据平台与数据治理框架;董晓辉等人[5]设计了一个高校教育大数据治理的参考框架,刻画高校教育大数据治理的主要内容,并从活动视角提出高校教育数据治理体系构成要素[6];如孙嘉睿等人[7]对数据治理的体系架构、数据治理保障梳理分析基础上分析具体业务领域的实践。
除高校数据治理之外,还有其他行业基于DCMM或其他模型的治理评估研究,万方等人[8]在警务领域依据DCMM进行了数据治理评估的研究探索;胡成等人[9]在电力行业基于“AHP+熵权”耦合构建供电企业数据治理成效评价模型。然而高校开展数据治理如何进行有效治理水平的量化评估,推动针对贯彻DCMM模型的数据治理,目前可获知的研究还较少,构成本文研究的问题背景。
1 数据治理评估的理论依据
在已有的数据治理模型中,研究关注较多的是五种数据治理模型,即IBM数据治理委员会提出的四层要素(核心要素、促成要素、支撑要素、成效)治理能力成熟度模型、国际数据管理协会(DAMA)提出的DAMA-DMBOK2数据治理体系模型、国际数据治理研究所(DGI)提出的十大关键要素的ORF(组织、规则、流程)流程化模型、企业数据管理协会(EDM Council)发布的DCAM模型以及中国电子技术标准化研究院(CESI)牵头制定的DCMM(数据管理能力成熟度评估)模型(GB/T 36073-2018),如表1所示。
根据表1所示,五种主流数据治理模型都有涉及对数据治理能力和水平的评估,其中具有量化评估评估参考性的模型中,以DCMM较为符合高校的特点。DCMM从制度设计、组织和人员、技术与服务、标准与规范的维度对数据管理能力进行解构,分解为具体的过程能力项,各个能力项对应划分不同等级。DCMM能力成熟度模型对高校的数据治理水平评估更具参考性。文献[12]在数据治理的成熟度模型比较方面进行了模型内容的差异比较研究。
表1 数据治理模型的评估内容比较
2 高校数据治理评估的问卷设计
为了进行高校的数据治理水平的调查采样,开展高校数据治理评估问卷设计。通过调查采样把高校的数据管理和数据治理的实际现状与数据治理评估模型相结合,以实现对高校的数据治理的建设水平予以量化评估。
DCMM(GB/T 36073-2018)是国家标准化管理委员会于2018年发布的现行国家标准,它给出了数据管理能力成熟度评估模型以及相应的成熟度等级,定义了数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准和数据生存周期8个能力域。它适用于组织和机构对数据管理能力成熟度进行评估。通过图1所示的成熟度能力指标模型可更直观地看到,8个不同的能力域可大致划分为三类指标项,即从目标和职责、评估检查、实施应用三个方面进行衡量。衡量数据管理成熟度水平通过指标项的建设实施情况对照评估,建设情况覆盖指标项越多总体的成熟度水平越高,反之建设情况覆盖能力指标项越少则总体的成熟度水平越低,总体可划分为1至5个等级。
图1 数据管理成熟度能力指标模型
问卷基于DCMM并参考全国DCMM符合性公共服务平台(http://www.dcmm.org.cn/)的数据治理宣贯要求,设计面向高校数据治理水平的评估指标体系问卷,共8个方面28项能力指标。面向教育部直属高校和江苏省内高校进行问卷调研,并采用AHP方法进行调研数据分析。
3 数据治理评估调研与结果分析
3.1 面向高校的数据治理水平调研
依据DCMM设计数据治理水平调研问卷。按照DCMM分为8个一级指标、28个二级能力指标,对每个能力指标进行指标权重重要性(Weight)以及该指标的本校建设情况自评评估(Evaluation)两个维度的调研。课题组选择调研样本为教育部直属高校和省内高校共计116所,通过问卷星平台进行问卷发布和调研,回收有效问卷并统计分析,结果如表2、表3所示。
表2 调研问卷结果——按学校统计
表3 调研问卷结果——按指标统计
为简易比较分析,按照一级指标的维度初始化判断矩阵M,如下。
3.2 数据治理评估结果计算
把每个调研学校看作不同的评估方案,汇总每个学校评估方案的数据作如下分析:
利用和积法计算判断矩阵M的最大特征向量为特征向量近似解:
矩阵的最大特征根为:
判断矩阵的一致性指标和随机一致性比率:
通过分析U1~U39的结果得分验证可知,AHP方法分析结果和初始的治理水平评估得分(自评结果)存在差异,结果比较如式(5)所示。由于AHP的分析结果结合了其他学校建设情况的因素,学校U1较U39的数据管理和治理水平更高,结果更具相对合理性。
另外从调查收集的指标数据分析,在28项指标中数据战略制定、数据管理职责明确、数据集成共享架构建设、制定数据服务的标准规范并实施、统一数据分析平台建设分别获得调查高校的更高权重,得分分别为170、173、170、170和167。从高校的自评估的数据分析,数据战略制定、数据战略目标实施、数据集成共享架构建设、统一数据分析平台建设、制定数据服务的标准规范并实施的建设得分最高,分别为0.65、0.625、0.67、0.675、0.625。分析可知,被调查高校认为数据管理职责明确是数据治理最重要的方面,而在实际建设情况中未能很好地实现职责明确,数据集成平台及数据分析实施普遍更好。
4 提升数据治理的建议策略
从调查评估数据看,高校的数据管理治理职责需进一步明确,如责任到人的数据管理机制、跨部门数据治理的协同机制等。从数据治理体系、治理实施工程的视角看,数据治理工作需要系统化和整体性的构建和实施,不仅包括治理的核心要素(质量管理、安全与隐私管理、生命周期管理)、支撑要素(数据架构、元数据与分类、数据日志和审计),还要包括外围促进要素(组织架构、政策、数据权属)等方面。文献[13][14]对高校的数据治理的策略也在具体分析基础上给出了数据治理的参考经验。结合具体治理实践,本文认为应坚持“流通为用,权责匹配,突出成效”的思路,加强以下3方面建设,不失为提高数据治理水平的策略选择。
4.1 构建数据治理的协同模式
基于数据实现开放和规范化的共享方式,建立形成数据源头部门、数据管理部门、数据使用部门三方协同参与的数据治理的机制,是实现数据“流通为用”“权责匹配”的重要保证。明确全生命周期下的数据权属与责任匹配,实现数据提供者负责数据的质量、数据管理者负责数据的共享策略与安全、数据使用者明确数据的使用需求与反馈,三方协同使得数据的治理更加高效、数据的责任更为明确、数据的质量更有保证,从而实现更大程度数据挖掘和发挥数据效用。
4.2 建立数据要素的治理规范
数据列为与土地、劳动力、资本、技术同样重要的第五生产要素。2019年4月国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》,提出加快培育数据要素市场,探索建立统一规范的数据管理制度。需要建立围绕数据资产的管理规范制度体系,加强其权属、流通、交易、销毁等全生命周期的规范管理。从技术、制度、法理等不同层面落实数据安全责任、防范数据安全风险,形成权属明确、安全规范的数据制度和管理规范并有效施行,保障数据治理成效的最大发挥。
4.3 深入推进数据治理场景化
场景化治理即围绕数据应用的场景实现精细化数据治理。精细化过程是不断地对数据提出“质疑”和需求确认的过程,最终能够使得数据技术、管理与业务场景需求完全融合、无缝衔接,避免形式化的治理、概念上的治理,最终达到通过数据治理“精准”满足业务需求。
从高校的实践来看,更多呈现数据价值的业务场景需求按用户对象可划分为三类:一是直接面向师生个人的数据应用需求,如个人数据查询、个人画像等;二是面向各个业务部门维度的数据使用需求,如部门数据统计、部门数据共享等;三是面向学校全域的数据统计与决策分析需求,如数据统计报表、校情概览、绩效评价等。这些应用场景需要结合实际数据治理的实施深入实践,通过数据应用的成效实现治理的目的。
5 结论
本文基于DCMM进行高校数据治理水平的量化评估,具有较为明确的标准性、指导性和可操作性。对高校的数据治理进行了实践探索与理论补充,为推进高校实施DCMM的标准,提升高校数据治理水平提供了一定借鉴与参考。不足之处在于:一是数据治理是一项长期的系统工程,因校因地差异较大,用一个具体标准衡量不同高校的水平高低,有“削足适履”之嫌;二是问卷采样的样本数量还较少,指标权重不能完全反映高校整体的数据治理的现状水平,更科学合理地设定评价指标的权重是下一步需要研究的内容之一。