APP下载

数据治理标准体系及标准化实施框架研究

2023-03-25王华曹扬张婧慧丁洪鑫

中国标准化 2023年16期
关键词:标准体系数据治理

王华 曹扬 张婧慧 丁洪鑫

摘 要:本文通过收集国际、国内标准化文件中对数据治理的定义,探讨了数据治理的概念,并研究了国际、国内数据治理标准化现状,构建出了数据治理标准体系框架,基于PDCA循环的过程方法,设计了数据治理标准化实施框架。本研究对于我国数据治理标准化具有一定的理论价值和实践意义,为各种类型组织的数据治理标准化实施提供了基础指导和共性参考,有助于完善数据治理标准体系、推动数据治理相关标准落地实施。

关键词:数据治理,标准体系,标准化实施框架

DOI编码:10.3969/j.issn.1002-5944.2023.16.005

0 引言

近年来,数字经济发展速度之快、辐射范围之广、影响程度之深前所未有,正推动生产方式、生活方式和治理方式深刻变革,成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。“十四五”时期,我国数字经济转向深化应用、规范发展、普惠共享的新阶段[1]。与此同时,数据要素对数字经济发展的支撑作用日益壮大,已成长为驱动数字经济深化发展的核心引擎,数据要素市场的培育与开拓已被国务院、各部委及各级地方政府部门列为数字经济发展的重点任务之一。但是,目前我国数据要素探索处于起步阶段,数据要素市场培育的基础尚不坚实[2],需要加快构建数据基础制度,完善数据产权界定、数据流通和交易、数据要素收益分配、公共数据授权使用、数据交易场所建设、数据治理等主要领域关键环节的政策及标准,以激活数据要素潜能,更好发挥数据要素作用,做强做优做大数字经济,增强经济发展新动能,构筑国家竞争新优势[3]。

标准是经济活动和社会发展的技术支撑[4],在数据治理活动中亦发挥着基础性、引领性作用。因此,要提升数据治理水平,除了发展数据治理技术和工具,更要完善数据治理标准体系,推动标准落地应用,更好发挥其作用。而今,数据治理基础共性标准及数据相关标准规范在数量上已经形成一定规模,但在应用方面还未形成规模效应。一方面,是因为现有的数据治理基础共性标准发布和实施时间尚短,还需要更多的时日进行更广泛的宣贯才能实现深远的触达;另一方面,则是由于还未形成普遍适用的数据治理标准化实施框架,组织(企业)需要自行摸索实施,成本高、难度大、周期长,难以实现价值转化,导致标准应用推广速度慢。

本文通过对国际权威标准组织ISO、IEC、ITU-T、IEEE发布的数据治理相关国际标准和我国发布的数据治理相关国家标准的内容进行调查与分析,提出并回答以下研究问题:(1)数据治理的概念是什么?(2)数据治理标准体系由哪些要素组成?(3)数据治理标准化实施过程由哪些要素组成?通过对以上三个主要问题的研究,本文旨在促进我国组织(企业)积极开展标准化的数据治理活动,并为完善我国数据治理标准体系提供参考。

1 数据治理概念

由于标准化背景和适用场景的差异,以及切入视角和侧重点的不同,不同标准化组织对于“数据治理”的定义不同。

1.1 国际层面

在《信息技术 组织的IT治理》(ISO/IEC 38500:2015)中,IT治理被定义为“现在和未来指导与控制IT利用的系统”[5],而《IT治理 数据治理 第1部分:ISO/IEC 38500在数据治理中的应用》(ISO/IEC 38505-1:2017)将数据治理作为IT治理的子集,因此,数据治理就是现在和未来指导与控制数据利用的系统[6]。在《健康信息学 药品识别标识符和术语维护的核心原则》(ISO/ TR 14872:2019)中,数据治理是指“以数据质量、一致性、可用性、安全性与可及性为核心的数据管理过程”,并表明,该过程与数据的权属和管理职责相关[7]。在《数据质量 第2部分:词汇》(ISO 8000-2:2022)中,数据治理被定义为“数据管理政策的制定与执行”,并表明,ISO/IEC 38500: 2015中IT治理的六个原则(责任、战略、获取、绩效、合规、行为)也适用于数据[8]。在《信息技术 大数据参考架构 第3部分:参考架构》(ISO/IEC 20547-3: 2020)中,数据治理是指“以设计、实施、监控数据资产管理的战略计划为目标,协调实施一系列活动的性能或能力”[9]。在《技术规范D0.1 物联网和智慧城市及社区数据处理和管理:词汇》(ITU-T FG-DPM D0.1)中,数据治理被定义为“设计、实施和监控数据资产管理战略计划的一系列活动”[10]。在《透明雇主数据治理标准》(IEEE Std 7005-2021)中,数据治理是指“对数据和数据资产的定义、生产和利用行使权力的一系列活动”[11]。

1.2 国家层面

《信息技术 大数据 术语》(GB / T 35295-2017)将数据治理定义为“对数据进行处置、格式化和规范化的过程”,并明确“数据治理是数据和数据系统管理的基本要素。数据治理涉及数据全生存周期管理,无论数据是处于静态、动态、未完成状态还是交易状态”[12]。《信息技术服务 治理 第 5部分:数据治理规范》(GB/T 34960.5-2018)中将数据治理定义为“数据资源及其应用过程中相关管控活动、绩效和风险管理的集合”[13]。

从以上8个定义来看,数据治理是数据管理的核心,是数据管理的顶层设计,为数据管理活动提供指导和监督,其目的是确保适当的数据管理制度、政策和标准规范等被正确地用于管理数据,最终提升数据的价值。

2 数据治理标准化现状

2.1 国际层面

国际标准化组织/国际电工委员会第一联合技术委员会/数据管理和交换分委会(ISO/IEC JTC 1/SC 32)研制的标准主要包括参考模型和框架,数据域、数据类型和数据结构的定义及相关语义,用于持久存储、并发访问、并发更新和数据交换的语言、服务和协议,用于构造、组织和注冊元数据及与共享和互操作性相关的其他信息资源的方法、语言、服务和协议(包括电子商务)等,其中,ISO/IEC 11179系列元数据标准在数据管理和治理中广为应用[14]。国际标准化组织/国际电工委员会第一联合技术委员会/IT服务管理与IT治理分委会(ISO/IEC JTC 1/SC 40)主要研制与IT治理、数据治理、IT服务管理、IT赋能服务业务过程外包相关的标准,其中,ISO/IEC 38500和ISO/IEC 38505系列标准在IT治理和数据治理项目中发挥着重要的指引作用[15]。国际标准化组织/国际电工委员会第一联合技术委员会/人工智能分委会(ISO/IEC JTC 1/SC 42)正在研制《人工智能 分析和机器学习的数据质量 第5部分:数据质量治理》(ISO/IEC CD 5259-5),旨在为分析和机器学习提供一个数据质量治理框架,使组织的治理主体能够在整个数据生命周期中通过适当的控制来指导和监督数据质量措施、管理和相关流程的实施与运行[16]。国际标准化组织/自动化系统与集成技术委员会/工业数据分委会(ISO/TC 184/SC 4)最近发布了《数据质量 第51部分:数据治理:数据政策条文交换》(ISO 8000-51:2023),旨在明确支撑数据治理政策条文交换及数据集政策条文符合性检测自动化的核心要求[17]。国际标准化组织/智能运输系统技术委员会(ISO/TC 204)致力于城乡地面运输领域的信息、通信和控制系统的标准化,在数据相关治理方面,发布的标准有《智能运输系统ITS中央数据字典 第2部分:中央ITS数据概念登记簿的治理》(ISO 14817-2:2015),在研标准有《智能运输系统 安全接口治理 第 4 部分:安全ITS数据管理的治理流程》(ISO/CD TS 5616-4)和《智能运输系统 安全接口治理 第5部分:ITS数据管理架构的治理》(ISO/CD TS 5616-5)[18]。

IEEE计算机协会/软件和系统工程标准委员会(C/S2ESC)下设的雇主数据治理工作组(EDGWG)发布了《透明雇主数据治理标准》(IEEE Std 7005-2021),旨在提供帮助雇主访问、收集、存储、利用、共享和销毁员工数据的具体方法[19]。IEEE计算机协会/教育技术标准委员会(C/LT)下设的儿童和学生数据治理工作组(WG-CSDG)正在研制《儿童和学生数据治理标准》(P7004),旨在为利益相关者提供可验证、负责任的儿童和学生数据治理方法[20]。由IEEE大数据倡议(IEEE BDI)和IEEE标准协会(IEEE SA)联合创建的IEEE大數据治理和元数据管理工作组(IEEE BDGMM)于2020年立项研制《大数据治理和元数据管理参考架构标准》(P2957),旨在制定机器可读的大数据治理和元数据管理参考架构,以支持异构和跨域存储库之间的数据集的可伸缩性、可查找性、可访问性、互操作性和可复用性[21]。此外,IEEE最近成立了大数据治理焦点小组,主要探索数据治理的标准、原则、最佳实践、国际法律文件(倡议)的总体情况和趋势,重点探讨现有倡议及其范围、开放程度和采用规模,并在适当时确定可能需要创建标准以支持数据互操作性的用例。这项工作将为下一步标准化数据治理方法奠定基础,以提高数据的信任度和互操作性[22]。

2.2 国家层面

全国信息技术标准化技术委员会(SAC / TC 28,简称信标委)提出并归口的国家标准《数据管理能力成熟度评估模型》(GB/ T 36073-2018)和《信息技术服务 治理 第5部分:数据治理规范》(GB/T 34960.5-2018)对国内数据管理和治理具有针对性很强的指导作用,并在全国范围内进行了推广、试点示范和认证工作。此外,信标委正在组织研制《城市数据治理能力成熟度模型》(20213297-T-469)和《信息技术 大数据 数据治理实施指南》(20213308-T-469),为相应的数据治理实施过程提供更加详细的指导。

3 数据治理标准体系框架

以数据治理为主题的现行标准大多从顶层设计的视角出发,为通用领域或特定领域的数据治理活动提供框架、流程和方法,属于数据治理标准体系中的基础共性标准。根据国家标准《标准体系构建原则和要求》(GB/T 13016-2018),标准体系是由一定范围内的标准按其内在联系形成的科学的有机整体,应全面成套体现体系的整体性[23]。而根据上文所述,数据治理的目的是确保适当的数据管理制度、政策和标准规范等被正确地用于管理数据,最终提升数据的价值,因此,为实现上述目的,数据治理标准体系除了包含基础共性标准之外,还应包含为数据管理活动提供支撑的所有标准,以组成一套完整的体系。经过综合考虑数据治理的概念、目标、边界、范围和标准化需求,并以《数据治理标准化白皮书(2021年)》中的数据治理标准体系为参考[24],构建出数据治理标准体系框架,如图1所示。

数据治理标准体系包括基础共性、数据基础设施、数据内容管理、数据生存周期管理、数据价值管理、数据安全6个方面的标准。

基础共性标准主要针对数据治理基础进行规范,为标准体系其他部分的建设提供支撑和参考,包括术语、参考架构、通用要求、测试评估等。数据基础设施标准主要用于规范数据相关的软硬件设施系统、技术工具和组织,包括支撑数据“采-存-算-管-用”全流程的数据库、大数据平台、技术工具、组织机制等。数据内容管理标准主要规范数据内容标准化过程涉及的方方面面,包括数据标准、数据目录、元数据、数据质量等。数据生存周期管理标准主要规范数据生存周期各个阶段的管理活动,包括数据获取、数据存储、数据处理、数据传输、数据应用、数据归档和数据销毁等。数据价值管理标准主要规范数据资产化、价值化过程涉及的方方面面,包括数据流通、数据服务和数据洞察等。数据安全标准主要用于规范数据全生存周期各环节的安全保护,始终确保数据处于有效保护和合法利用的状态,包括数据安全、隐私保护等。

4 数据治理标准化实施过程

数据治理离不开标准化,而标准化实施过程中,由于数据治理的目标、范围和主体等不同,考虑因素有所不同,所采取的标准文件有所不同,实施过程也相应会有所差异。但总体来看,数据治理标准化实施过程与PDCA循环一致,即策划—实施—检查—处置(Plan-Do-Check-Act)[25]。鉴于数据治理过程的复杂性,本文将标准化实施过程分解为准备、设计、计划、实施、检查、处置六个阶段,并将数据治理的关键活动“评估、指导、监督”(参见ISO/IEC 38505-1:2017,GB/T 34960.5-2018)贯穿全过程。

5 数据治理标准化实施框架

通过将数据治理标准化实施过程的各个阶段进一步分解,明确各个阶段所涉及的主要内容及活动,得出数据治理标准化实施框架,如图2所示。

组织应建立数据治理委员会,并任命数据治理标准化负责人。数据治理标准化各阶段的活动应在委员会的评估、指导和监督下进行。

5.1 准备阶段

在准备阶段,数据治理标准化负责人需要:

(1)明确法律法规、监管、行业惯例、强制性标准规范、已采纳(或拟采纳)的推荐性标准规范等各方面的数据合规要求;

(2)要厘清数据需求方、提供方、服务方、应用方、监管方等各方的数据业务需求;

(3)根据合规要求和业务需求预算成本,预测效益;

(4)获取领导支持,通过审批程序,取得组织保障;

(5)与人力、财务、技术、业务等相关部门沟通,履行相关程序,取得资源保障。

5.2 设计阶段

在设计方案阶段,数据治理标准化负责人需要:

(1)根据准备阶段明确的合规要求、业务需求和预测的效益,设定实施目标;

(2)根據合规要求和业务需求,确定哪些部门或业务领域的数据应纳入治理范围;

(3)根据实施目标、范围和资源现状,确定实施主体——可以是内部或外部组织;

(4)根据实施目标、范围及主体情况,设计实施团队架构;

(5)根据实施目标、范围和预算成本,确定人力、物力、财力等具体资源需求;

(6)根据标准研制和应用的实践惯例,设计详细的标准化实施流程。

5.3 计划阶段

在制定计划阶段,数据治理标准化负责人需要:

(1)根据实施目标、范围及数据治理标准体系,细分实施任务目标和要求,如数据目录编制任务、数据质量提升任务、数据资产价值评估任务、数据安全整改任务等;

(2)根据细分任务,确定每项任务的实施负责人,并明确其角色和职责;

(3)根据资源需求,制定资源分配和使用计划;

(4)指导每项任务实施负责人,根据细分任务要求,制定每项任务的进度计划,包括里程碑事件、时间节点等;

(5)联合每项任务实施负责人,根据细分任务内容和角色职责,制定内部和外部沟通计划,包括沟通方式、频率等;

(6)联合每项任务实施负责人,根据实施目标、细分任务和进度计划,制定验收计划,包括可交付成果、交付时间等。

5.4 实施阶段

在实施任务阶段,每项任务的实施负责人需要:

(1)合理部署人力、物力、财力资源,做到权责清晰;

(2)开展动员活动,向所有利益相关者传达任务内容,包括任务目标、范围、进度计划等,并取得一致同意;

(3)根据任务要求,整理任务范围内的现有数据,明确需要解决的标准化问题;

(4)将问题与现行标准文件内容进行匹配,如现行标准适用,则直接进入第7步“标准培训”,如没有可用的现行标准,则进入第5步“需求分析”;

(5)分析标准化问题,明确标准化需求,形成需求明细表;

(6)根据标准化需求明细,组织相关人员按照起草文件、征求意见、技术审查、报批发布等程序研制新的标准文件;

(7)开展培训活动,让所有利益相关者学习拟应用的标准文件内容,了解如何将其应用到数据治理工作中;

(8)按照标准文件要求,对任务范围内的相关工作环节和/或数据内容进行标准化处理或整改,实现标准文件的应用效果。

此外,在本阶段,要建立反馈响应机制,明确反馈和响应的渠道与方式,以便及时反馈和处理实施过程中遇到的问题。并且,要做好每个环节的实施记录,以备事后追溯查证所用。

5.5 检查阶段

在检查阶段,数据治理标准化负责人需要:

(1)检查验证每项任务的实施结果,将结果与目标进行对比;

(2)组织标准化实施团队以外的第三方评价实施效果,总结经验,发现问题。

5.6 处置阶段

在处置阶段,数据治理标准化负责人需要:

(1)联合相关任务实施负责人,对效果评价中发现的问题进行分析,并追溯至问题责任人;

(2)监督相关任务实施负责人解决问题,实现改进优化,并将不能解决的问题转入下一个标准化任务中去解决。

6 结语

本文的创新之处在于,首次将数据内容管理、数据生存周期管理、数据价值管理区分开来,作为数据治理标准体系的独立组成部分,使组织在数据治理过程中更容易确定治理目标、找对治理方向;结合《IT治理 数据治理 第1部分:ISO/IEC 38500在数据治理中的应用》(ISO/IEC 38505-1:2017)和《信息技术服务 治理 第 5 部分:数据治理规范》(GB/T 34960.5-2018)等国际国家标准中的数据治理概念和方法,首次提出了数据治理标准化实施框架,对于组织实施数据治理标准化具有一定的现实价值和实践意义。

未来,将通过数据治理标准化实践,检验本文提出的数据治理标准体系框架和标准化实施框架的应用效果,并总结经验,改进欠缺之处,不断优化两个框架,为国际国内数据治理标准化提供理论参考,贡献案例和用例。

参考文献

[1]国务院关于印发“十四五”数字经济发展规划的通知[EB/OL].(2022-01-12)[2023-04-11].http://www.gov.cn/zhengce/content/2022-01/12/content_5667817.htm.

[2]数据要素白皮书(2022年)[EB/OL].(2023-01-07)[2023-04-11].http://www.caict.ac.cn/kxyj/qwf b/bps/202301/P020230107392254519512.pdf.

[3]中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见[EB/OL].(2022-12-19)[2023-04-11].http://www.gov.cn/zhengce/2022-12/19/content_5732695.htm.

[4]中共中央 国务院印发《国家标准化发展纲要》[EB/OL].(2021-10-10)[2023-04-11].http://www.gov.cn /zhengce/2021-10/10/content_5641727.htm.

[5]ISO, IEC. Information technology: governance of IT for the organization: ISO/IEC 38500:2015[S].Geneva: ISO copyright office, 2015: 2.

[6]ISO, IEC. Information technology-Governance of IT Governance of data-Part 1: Application of ISO/IEC 38500 to the governance of data: ISO/IEC 38505-1:2017[S].Geneva: ISO copyright office, 2017: 1.

[7]ISO. Health informatics—Identification of medicinal products—Core principles for maintenance of identifiers and terms: ISO/TR 14872:2019[S].Geneva: ISO copyright office, 2019: 1.

[8]ISO. Data quality—Part 2: Vocabulary: ISO 8000-2:2022[S].Geneva: ISO copyright office, 2022: 20.

[9]ISO, IEC. Information technology—Big data reference architecture—Part 3: Reference architecture: ISO/IEC20547-3:2020[S].Geneva: ISO copyright office, 2020: 3.

[10]ITU-T. Technical Specification D0.1 Data Processing and Management for IoT and Smart Cities and Communities:Vocabulary: ITU-T FG-DPM technical specification D0.1:2019[S].Geneva: Telecommunication Standardization Sector of ITU, 2019: 8.

[11]IEEE. IEEE Standard for Transparent Employer Data Governance: IEEE Std 7005-2021[S]. USA: IEEE, 2021: 16.

[12]全国信息技术标准化技术委员会.信息技术 大数据 术语:GB/T 35295-2017[S].

[13]全国信息技术标准化技术委员会.信息技术服务 治理 第5部分:数据治理规范:GB∕T 34960.5-2018[S].

[14]ISO/IEC JTC 1/ SC 32 Data management and interchange[EB/OL].[2023-04-12].https://www.iso.org/committee/45342.html.

[15]ISO/IEC JTC 1/SC 40 IT service management and ITgovernance[EB/OL].[2023-04-12].https://www.iso.org/committee/5013818.html.

[16]ISO/IEC CD 5259-5 Artificial intelligence—Data quality for analytics and machine learning (ML)—Part 5: Dataquality governance[EB/OL].[2023-04-12]. https://www.iso.org/standard/84150.html.

[17]ISO 8000-51:2023 Data quality—Part 51: Data governance: Exchange of data policy statements[EB/OL].[2023-04-12].https://www.iso.org/standard/78708.html.

[18]ISO/TC 204 Intelligent transport systems[EB/OL].[2023-04-12].https://www.iso.org/committee/54706.html.

[19]IEEE 7005-2021 IEEE Standard for Transparent Employer Data Governance[EB/OL].[2023-04-12].https://standards.ieee.org/ieee/7005/7014/.

[20]P7004 Standard for Child and Student Data Governance[EB/OL].[2023-04-12].https://standards.ieee.[1]org/ieee/7004/10270/.

[21]P2957 Standard for a Reference Architecture for Big Data Governance and Metadata Management[EB/OL].[2023-04-12].https://standards.ieee.org/ieee/2957/10381/.

[22]Big Data Governance Focus Group[EB/OL].[2023-04-12].https://standards-dev21.ieee.org/industry-connections/big-data-governance-focus-group/.

[23]中国标准化研究院.标准体系构建原则和要求:GB / T 13016-2018[S].

[24]中国通信标准化协会.数据治理标准化白皮书(2021年)[R].2021.

[25]ISO. Quality management systems—Requirements:ISO 9001:2015[S].

作者简介

王华,本科,工程师,研究方向为大数据、数据治理应用技术及标准化。

曹揚,硕士研究生,高级工程师,研究方向为大数据、数据治理应用技术及标准化。

张婧慧,硕士研究生,高级工程师,研究方向为大数据、数据治理应用技术及标准化。

丁洪鑫,硕士研究生,工程师,研究方向为大数据、数据治理应用技术及标准化。

(责任编辑:张瑞洋)

猜你喜欢

标准体系数据治理
高校数据融合路径及其治理框架的探讨
基于本体的企业运营数据治理
云端数据治理初探
河北省旅游标准体系建立研究
烟草标准管理体系的现状分析与应用研究
加强出入境检验检疫局认证审核流程探析
会计信息化标准体系构建研究
运用流程化手段提升资产管理水平
大数据治理模型与治理成熟度评估研究
面向标准全生命周期的企业标准化信息系统研究