政务数据治理框架的探索与实践研究
2022-11-22徐建荣韩骉杨坤康海燕陆剑飞秦敬松
徐建荣 韩骉 杨坤 康海燕 陆剑飞 秦敬松
(1.江苏省大数据管理中心,江苏南京 210036;2.中国联合网络通信有限公司江苏省公司,江苏南京 210019;3.联通(江苏)产业互联网有限公司,江苏南京 210019;4.中国联合网络通信有限公司江苏省公司,江苏南京 210019)
0.引言
数据治理是指数据治理主体在数据产生价值的过程中,对数据资产行使权力和管控的活动集合。在数字政府加快建设的历史背景下,数据的战略资源和核心要素地位日益凸显,加大数据资源共享开放,深化数据应用创新,释放数据要素价值,为数字政府发展提供动力。当前,政务数据治理处于探索深化过程中,面临着治理框架不完善的困境,探讨政务数据治理的框架具有重要的理论和实践意义,通过分析归纳总结政务数据治理的实施路径,并以此为政府大数据治理提供实践工作的理论基础。
1.国际数据治理框架
纵观近40年数据治理在学术界和业界的发展,各个组织、机构通过对数据管理的概念探索和实践总结,从对数据能力功能域的认定出发,划分数据治理标准边界,定义数据治理标准内容,归纳形成了多个多体系、多维度的数据管理框架。其中大多数的数据治理标准涵盖数据战略、数据治理、数据质量、数据架构和数据周期管理。
但同时不同的数据治理框架之间也会存在一些差异,比如国际标准化组织发的ISO/IEC TR38505-2制定的数据治理框架同时从管理学方法论出发,以建立组织、制度、流程、监督机制入手,定义了数据治理操作层面应包含的内容,如政策、标准、职责、流程、方法等工作机制。此外,对于数据治理框架的构建也有一些差别,例如:DGI数据治理框架定义了商业智能和管理协调领域;Gartner发布的EIM模型定义了基础设施;DAMA发布的DMBOK数据管理知识体系指南指出了数据安全、文件和内容管理要求;IBM数据管理能力成熟度评级模型还包括了数据风险管理和合规、数据照管、审计信息日志和报告;EDM数据管理能力成熟度模型提出了技术架构要求[1]。
2.国内数据治理现状
为实现对政务数据资源的有效管理和应用,党和国家的政策文件中陆续对政务数据治理工作提出了一系列相关要求,如图1所示。
我国大部分地区也已着手布局大数据战略和产业,旨在充分发挥数据资源的价值,各地政府对政务数据治理的重视程度越来越高。全国整体横向对比东部地区出台的政务数据治理相关政策文件最多,平均每省为5.55份,而中西部地区出台的政策文件较少。
“数据共享”“互联互通”“协同整合”等主题是各省在推动政务数据治理工作上的重要着力点。除共享协同之外,北京、广东和江苏等部分省份出台的政策文件也着重关注了信息公开、数据开放、安全管控等问题[2]。
3.政务数据治理的总体框架
基于政务数据全生命周期视角开展数据治理,参照国内DCMM的数据全生命周期的评估模型,将政务数据治理的各阶段划分为5个阶段,以数据的汇、通、管、用、评5个阶段进行总体框架设计[3]。
政务数据治理整体逻辑框架以业务应用为起点,面向供需双方提出的数据整体需求,将来自不同中心库和省市主体的与业务实现相关联的数据纳入整体生命周期模型当中,在全局范围内开展数据治理,如图2所示。
3.1 汇
数据汇聚阶段作为数据治理的开端,为后期业务应用提供原始数据,对数据进行质量控制是本阶段治理的重心。
汇聚政务内外部全量数据,从分布、异构和自治的数据源中集成数据,统一数据归口,从源头管控数据质量,从根本解决数据质量问题,同时,解决对使用方隐藏数据的差异性的问题,为使用方提供统一的数据接口,用于查询、获取和分析。
3.2 通
此阶段核心任务是打通数据间关系,使其由简单的物理聚合转向数据关联,构建完整数据映射,为数据应用支持业务做好准备。在实现数据联通的过程中,原本由独立主体分别加以治理的数据之间产生关联,数据的更新与变化将对外部主体产生影响。必须明确联通数据的责任主体,落实数据所有者对数据的权责,确保数据动态更新、全局一致。
3.3 管
数据管理不是一堆规范文档的堆砌,而是需要将管理过程中所产生的规范、流程、标准落地到IT平台上,在数据生产过程中通过“以终为始”前向的方式进行数据治理,避免事后稽核带来各种被动和运维成本的增加。数据管理的核心首先加强元数据管理,从源头治理数据,补齐数据的相关属性和信息,比如元数据、质量、安全、业务逻辑、血缘等,通过元数据驱动的方式管理数据生产、加工和使用。
3.4 用
此阶段应该是以业务需求为导向,主要任务是实现数据对业务活动的支持,体现的是数据治理最核心的目标。建设具备通用性基础的数据服务能力,以业务为导向,通过数据加工为使用方交付标准化、结构化的可用数据,建设相应的基础库、主题库、专题库并支撑上层应用。
3.5 评
建立健全政务数据治理管理办法,完善数据质量管理支撑平台,提高原始数据质量和数据加工结果质量,提升数据使用方对数据应用的使用评价。
数据评价维度可参考以下表1。
表1 数据评价维度
以实际应用效果为牵引,坚持数据需求导向,按照数据标准规范开展数据治理工作,明确数据采集、汇聚、治理、存储、共享、开发利用等各环节管理和职责要求。建立在采集、汇聚、治理、存储、共享、开发利用等各环节发现、反馈、修正、共享问题数据的闭环流程。形成从应用中来、到应用中去、不断试错纠偏实现螺旋式质量提升的治理生态。
4.政务数据治理工作开展的对策建议
数据治理工作分阶段可按照“顶层规划→专项实施→稽核检查→长效运营”4个阶段的方法策略执行,每个阶段横向贯穿“汇、通、管、用、评”,各阶段对应的管理职能如图3所示[4]。
4.1 顶层规划
第一阶段是顶层设计,总体规划的过程,制订政务数据战略规划,明确政务数据治理目标,重点在于对政务数据治理的定义、规划和梳理,以健全、统一的数据治理组织和制度作为保障措施,横向贯通“汇、通、管、用、评”,盘点数据资产、制订数据标准及管理规范,以该阶段成果为基础,开展后续阶段工作。
首先,建立数据权责体系,结合自身情况制订数据治理制度规范。其次,数据资源盘点是开展数据治理工作的重要前提之一,结合政务业务现状盘点政务数据资产,并以DCMM评估模型为标准,评估政务数据管理能力。最后,制订数据资产相关标准和管理规范。在政府组织架构、管理制度和数据资产盘点的基础上,结合国际标准、国家标准和行业标准,以数据安全为基础准则,以数据全生命周期为管理路径,制订相关的数据标准规范体系。
4.2 专项实施
第二阶段是对第一阶段成果的落地实施,结合政务业务现状和痛点开展专项数据治理活动实施工作。主要目标是为政务打造核心的数据治理能力,同时为数据治理部门形成数据治理的工作环境,保障政务数据可汇聚、可拉通、可管理、可使用、可评估。
在第二阶段,以政务业务为导向,逐步提升数据管控能力,以数据治理工具辅助关键性数据治理工作高效实施,规范数据治理管理流程,保证相关事务专人专责,权责清晰。同时,在本阶段应加强数据服务和应用的创新,以降低数据使用难度、扩大数据覆盖范围、提升数据供给能力为开展方向,通过标签化、可视化、产品化、平民化等方式,降低数据应用难度、扩大数据覆盖范围,通过数据拥有者、数据使用者之间灵活的角色转换,提升数据供给效能。
4.3 稽核检查
第三阶段是保障第二阶段成果有效落地的重要一环。这个阶段包括数据全生命周期各环节的具体稽核任务,横向贯穿“汇、通、管、用、评”数据治理框架,这个阶段需要实现4个“常态化”:数据标准和管理规范的实施检查的常态化、数据质量稽核评价的常态化、数据生存策略评估的常态化、数据安全实施检查的常态化。
4.4 长效运营
前3个阶段成果能够帮助建立基本的数据治理能力,以形成数据治理能力为基础,还需建立长期有效的运营管理能力,具备以业务为导向,以用户为中心,以效能提升和数据价值体现为目标的闭环管理机制,保障政务能够持续为内外部各级用户提供数据价值。
4.4.1 建立面向数据应用的质量运营管理体系
数据应用成果是反映政务业务运作状况的重要依据,数据质量成为数据应用成果优劣的重要因素,直接影响政务决策质量、社会治理和民生民情。数据质量管理应采用基础管理和问题导向双轮驱动,以“谁生产,谁维护,谁管理,谁负责”为原则,面向政务核心业务和重点场景,强化分层治理,推进常态化数据质量管理工作。
4.4.2 建立面向数据供需使用的安全保障体系
通过“统筹规划、规范管理、能力创新、协同管理、夯实基础”的数据安全保障体系建设,做到安全规划全覆盖、安全管理上台阶、安全能力见实效、安全运行保稳定、基础设施稳支撑,形成具有主动防御和协同运营管理能力的数据安全保障体系。
4.4.3 建立面向数据应用效能的长效评估评价机制
数据应用效能的长效评价机制是反映政务运作状况的重要保障,是建立数据质量评价体系是长效评价机制的重要手段。数据质量的高低直接影响战略决策质量和数据应用服务质量[5]。
指标体系的建设要满足数据质量基础评价要求,指标体系可以泛指为评估所使用的规则库,由度量指标和检核方法两部分组成。通过将使用规则和经验固化成度量指标,代替原有人工检查的方式对系统数据进行批量评估评价,可以实现数据质量的精确评估和持续监控,也为后续问题分析和提升打下基础。
5.结论
本研究是基于政务数据全生命周期视角开展数据治理框架的探索与研究,参考国内DCMM的数据全生命周期的评估模型,将政务数据治理全过程划分为了5个阶段,分别从数据的汇、通、管、用、评进行数据治理总体框架设计。数据治理工作按照“顶层规划→专项实施→稽核检查→长效运营”4个阶段的方法策略执行,横向贯穿汇、通、管、用、评。本研究对各个阶段数据治理框架内的工作任务做了梳理,这对各层级政府在政务数据治理实践过程当中具有一定的借鉴和参考意义。