APP下载

新形势下数据管理与认责分析

2020-01-20李阿勇张兵税雪郝湛斐

中国设备工程 2020年11期

李阿勇,张兵,税雪,郝湛斐

(1 国家电网有限公司,北京 100031;2 国家电网物资有限公司,北京 100120)

1 研究背景

当今社会正加速走向数字化时代,新一代信息技术创新空前活跃,前沿性技术、颠覆性技术不断涌现,不断催生新技术、新产品、新模式,不断创造出新的产业生态体系,推动互联网、大数据、人工智能等新技术与实体经济不断融合,数据已成为国家基础性战略性资源,对数据的管理与开发应用已成为关系当今社会发展的重大问题,数据是资产的概念已逐渐成为行业共识。

然而,由于数据是对现实世界人、事、物、关系等的抽象表达,具有无形、易变、易传播复制、依附于现实等特征,需要通过科学的管理手段进行保护和利用,由此发展出了数据管理这一学科。自20 世纪80 年代中期,国际数据管理协会(DAMA International)发布数据管理知识体系DAMABOK 以来,数据管理理论体系不断完善,特别是近年来随着全社会对大数据分析、应用的重视,越来越多的机构开始关注数据管理工作的推广实践。

美国卡耐基梅隆软件工程研究所于2014 年8 月正式推出DMM(Data Management Maturity Model)数据能力成熟度模型,帮助企业诊断数据管理整体水平,快速识别自身管理薄弱环节,制定针对性的行动计划;国际数据治理协会提出DGI 数据治理框架,指导企业在实操层面如何开展数据管理工作,致力于促进企业数据管理活动规范有序、高效运营;我国信息技术标准化技术委员会(SAC/TC28)于2018 年3 月正式发布了DCMM(Data management capability maturity assessment model)数据管理能力成熟度评估模型标准,结合我国国情和企业特点提出了企业数据管理能力成熟度评价标准,涵盖数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准和数据生存周期等8 个能力域。

本文在对数据管理体系分析基础上,提出了数据认责是数据管理体系建设运营基础的核心观点,同时论述了数据认责的定义、方法和应用。

2 数据管理体系构成

根据业界一般定义,数据资产是指由组织拥有或控制,能够为其带来直接或间接效益,以物理或电子方式记录的数据资源,而数据管理是指组织为规范和提供数据及信息资产而定义的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序等。对一个组织而言,数据管理是一项跨业务、跨部门的系统性工作,数据管理能够持续并取得成功的基础是建立一个高效协同的运营机制,重点是按业务关联性及数据处理过程明确数据责任,通过数据认责保障数据管理体系高效运营。

3 数据认责研究

3.1 数据认责的概念

数据责任一般是指组织中由哪些角色负责哪些业务实体相关数据的创建、删除、更新和使用,国际数据管理协会在DAMABOK 一书中对其进行了系统化,建议组织使用信息价值链分析数据责任,以在不同层级上理解和记录数据与组织、角色、业务职能、业务目标,以及数据应用间关系,其核心是使用CRUD 矩阵记录数据在组织不同领域的采集、流动、使用情况。

在信息价值链分析法中,组织的数据责任是基于企业数据架构和数据模型定义的,用于映射数据模型元素与其他业务模型间关系。在实际应用中,可依据关注层级的不同定义责任矩阵,例如:组织机构-业务实体矩阵、业务角色-业务实体矩阵、业务能力-业务实体矩阵、业务职能-业务实体矩阵、数据应用-业务实体矩阵等。

3.2 数据认责方法改进

责任矩阵清晰直观反映了数据在不同层面的责任归属,使组织领导、不同专业的业务人员、数据管理人员和IT 技术人员在同一架构下沟通交流,有利于增进共同理解。责任矩阵中的业务实体一般取自企业逻辑数据模型,但在实际的数据管理工作中,数据责任需要进一步细化到具体的物理数据模型,即信息系统数据库表,甚至是物理数据模型的若干属性、子数据集。存在以下几种情况:

(1)由于信息化建设历史原因,或组织内不同业务部门间客观存在的业务交叉,同一业务实体在不同信息系统的数据库中均有定义,且维护主体并不完全相同。例如某企业生产系统、营销系统均有设备信息表,分别由生产部门、营销部门负责维护。

(2)同一业务实体的不同属性由不同责任主体维护,大多数主数据对象均存在此类情况。例如某企业人员信息包括基本信息、党员信息,分别由人资部和党委组织部负责维护。

(3)同一数据库表中的不同数据条目业务来源不同。例如某大型集团公司物资采购需求由各单位分别填报,数据被归集到同一系统的同一数据库表中,分别由数据对应的填报单位负责维护。

为有效解决以上问题,亟需一种更细粒度、更灵活便捷的数据责任定义方式,本文提出两个可能的改进方向,欢迎大家共同探讨、完善。

一是责任矩阵的构建以物理数据模型或物理数据模型的属性为基础单元,依据数据类型决定责任矩阵的粒度,对于主数据的责任认定细化到属性级,其他交易类数据、指标类数据等责任定义到模型级,通过矩阵确定每一数据模型或属性与业务角色的关系、与业务职能的关系、与数据应用的关系,这种方式比较关注底层数据实现方式,不利于在更高层级整体掌握数据情况,同时变更、维护可能会相对频繁,可与信息价值链法配合使用。

二是通过动态业务数据标签从数据表中提取数据子集,确定每一数据子集与业务角色的关系、与业务职能的关系、与数据应用的关系,业务数据标签由业务人员提出并维护,这种方式与传统的数据架构分析方式不同,更关注业务处理逻辑,也更灵活机动,难点在于需要定义和维护大量的业务数据标签,要求相对较高,可作为一个方向进一步研究。

3.3 数据认责应用

数据责任矩阵可在组织、专业、应用等不同维度和层级构建,是数据管理工作开展的重要基础。通过数据认责即能从不同方面掌握组织数据资产状况,也能明确不同业务角色对数据的责任与权利,建立和维系良性工作机制,推动数据管理健康发展。以下是数据认责的几个主要应用方向:

(1)用于业务数据的理解和使用。数据责任矩阵包含了数据与业务角色、业务职能、数据应用间关系,有利于数据使用人员正确理解数据的业务背景和业务涵义,提高数据易用性,促进数据共享应用。

(2)用于数据资产的统计分析。数据责任矩阵从组织、职能、应用等不同维度对业务数据进行精细化划分,即可用于数据模型的统计分析,也可用于数据表、数据条目,甚至可结合数据监控深入到数据质量、安全、共享等领域,灵活满足组织内不同管理层级对数据资产的统计管理需要。

(3)用于数据管理工作协同。通过数据认责可精确定位每一个数据单元(可能是数据模型、数据表、字段或数据子集)对应的责任主体,可作为数据管理工作协同的“枢纽”,在建立数据资产台账、数据质量治理、共享授权、制定安全策略时,均可通过数据认责高效、精准协同。

(4)用于数据业务权限管控。数据责任矩阵记录了数据与组织、业务角色、业务职能、数据应用间映射关系,从不同口径、不同粒度对业务数据进行细分,为业务数据共享权限、共享级别定义提供了更多方式。

(5)用于分析数据质量问题。数据责任矩阵为数据质量问题分析提供了更多维度和更多层级,方便数据管理人员分析数据质量问题源头和产生影响,有力推动数据质量问题解决。

(6)用于分析数据变更影响。数据依附于组织的实际业务,不可避免会发生变更,通过数据认责分析变更数据涉及的组织、角色、业务职能、数据应用等,客观评估变更影响,便于数据管理人员采取主动措施,避免因数据变更带来的不可预料情况发生。

4 研究结论

对一个组织而言,数据管理体系是其科学开发、合理利用数据资产的重要基础,而数据认责是保障数据管理体系持续健康运营的前提。

在进行数据责任定义时,首先是基于数据架构开展信息价值链分析,按业务关联性及数据处理过程完成业务实体级职责划分,再基于物理数据模型、业务数据标签将数据责任细化到具体的数据表、属性、子数据集,建立多维分级的数据责任矩阵,将数据责任矩阵作为业务数据定义、质量治理、安全管控、共享授权、分析应用等工作协同的“中枢”,建立责权清晰、高效协同的数据运营管理机制。