数据认责管理中核心数据的识别初探
2019-10-08缪新萍王鹏宇孔庆波
缪新萍 王鹏宇 孔庆波
摘 要: 数据治理已经成为企业如何充分发挥数据资产价值、全面推动数字化转型所面临的重要课题。然而,面对浩如烟海的数据,从何处着手加以有效治理成为一个棘手问题。本文介绍了贵州电网公司在开展数据认责工作中,就如何确定核心认责数据项使用的以问题为导向的核心数据识别方法。通过对数据问题的归集、分析,从中提取问题分布较集中、业务影响较大的核心数据项,而后借助歸因分析进一步筛选出作为实施认责管理的核心数据项,从而确保突出的痛点数据问题得到有效解决,数据认责管理工作更具针对性和有效性。
关键词: 数据认责;核心数据项;数据治理
中图分类号: TP391 文献标识码: A DOI:10.3969/j.issn.1003-6970.2019.05.029
本文著录格式:缪新萍,王鹏宇,孔庆波. 数据认责管理中核心数据的识别初探[J]. 软件,2019,40(5):154158
【Abstract】: Data governance has become an important issue for enterprises to make full use of the value of data assets and promote digital transformation. However, in the face of vast amounts of data, where to proceed with effective governance has become a thorny issue. This paper introduces the problem-oriented core data identification method used by Guizhou Power Grid Company in data identification for data accreditation implementation. Through the collection and analysis of data problems, the critical data elements with more centralized distribution and greater business impact are extracted. Then, with the help of attribution analysis, data items are further screened out as the implementation of data accountability management, so as to solve the relevant data problems and make the data accountability management more targeted.
【Key words】: Data accountability; Critical data element; Data governance
0 引言
随着近年来大数据技术及应用的迅猛发展,数据之中可能蕴藏着价值信息这一观念早已深入人心,同时也已上升为国家战略而受到高度重视[1]。数据如同生产设备、人才也是一种宝贵的企业资产的理念使得数据资源管理和数据治理成为各行业企业信息化建设者、乃至企业战略制定者所十分关注的领域。而作为构建企业数据治理体系的一项十分重要的基础工作——数据认责管理自然成为企业数据治理“搭框架、夯基础”的焦点。
数据认责管理是要通过梳理数据项与企业组织机构、岗位人员之间的操作和使用关系,明确数据项的定义、录入、审核、改进等各类型的责任者,使得数据责任关系明确化,从而为数据问题的分析和解决、数据管理各项措施、制度的有效落实提供保障[2]。但是在企业雄心勃勃开展数据认责管理之前,一个常常未被深思的问题是:“我们究竟要对哪些数据进行认责?”
本文介绍了一种“问题导向”的核心数据项识别和梳理方法,可以为企业开展数据认责提供目标清晰数据范围,同时帮助有关数据问题得到有效解决,提升数据认责管理的价值。
1 数据认责管理之盲
在这个大数据时代,企业的生产、经营已实现深度的信息化,信息系统为每项业务、每个流程和环节提供着支撑,并因此产生或采集了更多的数据,浩如烟海。然而,当企业回过头开展数据认责管理,亦或数据治理的时候却发现面对成千上万的数据项、TB(Terabyte,太字节)或PB(Petabyte,拍字节)级的数据量无从着手。这时候,一种常见的决定是“全部做”,可是巨大的工作量使其成为难以完成的任务;另一种常见的决定是“分批做”,可是孰前孰后也无从判断;而另一种“更聪明”的决定是“做重点”,即根据业务治理的重点同步开展该领域的数据认责管理,可是目标仍然不够清晰。这便是数据认责管理之盲,即数据认责管理的对象不清晰而带来的盲目性[3]。数据认责管理不可一蹴而就,也不能为了认责而认责。数据认责需要具有自身的价值体现,即通过数据认责,明确了相关人员的责任与要求之后,使数据问题和数据质量得到解决和改善,进而实现业务价值[4]。
这种盲目性同样存在于数据质量治理以及其他数据治理工作中。因此,无论从问题还是价值角度,如何更具导向型地甄别认责管理的数据对象成为一个首要解决的问题。
2 企业的核心数据
企业累积并拥有不同来源、不同领域以及不同类型的数据,但并非所有数据都是平等的!面对日以继夜不断积聚的大量数据,我们所能接触或者使用的部分犹如冰山一角。毋庸置疑,我们已经迈入大数据的时代。但是在我们盘点拥有几个TB、几个PB的数据存量,又计较着数据增长量的时候,事实上我们真正想要并不是拥有更多、更多的数据,而是那些“正确的”数据。