基于数据溯源图的数据资产质量评估研究
2017-08-16周泓陈钊
周泓,陈钊
(国家电网公司西南分部,四川成都610041)
基于数据溯源图的数据资产质量评估研究
周泓,陈钊
(国家电网公司西南分部,四川成都610041)
随着大数据时代的蓬勃发展,企业对数据重要性的认识也达到了一个新的高度,数据资产成为了企业发展的重要战略资源,越来越多的企业已经开展常态化的专业数据管理工作。为了提升公司数据资产的应用价值,数据资产质量成为企业数据资产管理的重要指标之一。通过数据资产溯源管理,确定数据资产形成的全过程模型,对数据资产质量开展多维度评估,量化数据资产质量,为企业数据资产管理提供一个重要参考指标。
大数据;数据资产;常态化;数据资产溯源;数据资产质量
1 概述
信息技术的快速发展使得数据逐渐成为实现企业业务价值最重要的资源之一。然而随着数据量的不断增大,数据质量问题也随之而来。数据缺失、错误、不一致等问题使企业对其的应用受到阻碍,严重的甚至会导致企业做出错误决策,损失重要价值进而引发信任危机。
数据资产的本质是作为一种经济资源参与企业的经营活动,可以减少和消除企业经济活动中的风险,为企业的管理控制和科学决策提供合理依据,并预期给企业带来经济利益。只有经过资产化管理[1]、具有“可信度”[2]的数据才能形成数据资产,并通过数据使用、重新计算、分析模型等实现增值。
2 相关理论
2.1 数据、数据资源、数据资产
数据:以文本、数字、图形、图像、声音和视频等格式对事实进行表现。数据本身是“一个事实”。
数据(信息)资源:企业生产及管理过程中所涉及的一切文件、资料、图表等信息的总称。它涉及企业生产和经营活动过程中所产生、获取、处理、存储、传输和使用的一切数据(信息)资源,贯穿于企业管理的全过程。
数据资产:企业在运营活动中形成的,由企业拥有,在数据的产生、获取、处理、存储、传输和应用全过程可控的,并能够给企业带来价值的数据。
2.2 数据资产化
数据资产化是指针对数据经过分类、描述、加工和计算等途径实现数据的资源化,再对数据资源进行核查梳理、分析、加工、识别等过程,从而实现数据资产化。
2.3 数据资产化溯源
面向结构化数据,以指标数据为基础,以回溯为手段,形成树状的数据溯源视图。数据资产逐步溯源,构建出全局数据溯源视图。
2.4 数据资产质量监测
针对数据资产溯源全过程中的节点进行及时性、完整性、准确性、实效性、一致性和关联核查等多方面的监测,主要方式有技术监测和业务监测两种。
3 数据资产质量评估过程
3.1 构建全景视图
从整体角度对企业数据资源进行的全方位、多层次、动静结合的描述,即以企业数据标准为基础、以各应用系统数据为来源,依据企业业务规划,梳理产生的企业数据资源的管理、业务、技术属性信息,以及相应的信息化描述和展现。以回溯为手段,形成树状结构的溯源视图,从数据资产产生、加工、应用全过程节点实现过程可控。
3.2 溯源过程
数据资产溯源作业标准方法包含业务溯源、物理溯源、结果验证、成果固化四个步骤。
首先,公司业务部门召集业务专家依据运营数据资产的业务涵义,从业务的角度展开溯源,分析运营数据资产的各个业务来源,确定数据资产形成的全过程业务模型,绘制业务溯源图。
然后,业务系统建设厂商充分理解业务溯源图,对业务溯源图中的录入节点、存储节点、处理节点进行规范化描述,填写数据资产溯源的“录入节点描述表”、“存储节点描述表”、“处理节点描述表”。
接着对数据资产全过程业务模型验证和溯源节点描述信息中的物理实现逻辑验证。物理实现逻辑验证是指将溯源节点描述信息中的物理实现逻辑转换为可执行脚本或程序,运行可执行脚本或程序获得溯源节点对应数值;再将溯源节点对应数值与业务系统中的对应数值进行验证对比;业务模型验证是指根据溯源图中的业务逻辑汇总计算溯源节点对应数值,反向验证业务逻辑的完整性。
上述两类验证若是通过,则继续“成果固化”步骤;若是溯源节点描述信息中的物理实现逻辑验证不通过,则需重新进行“物理溯源”步骤,对溯源节点中的物理实现逻辑进行修正完善;若是运营数据资产全过程业务模型验证不通过,则需要回到“业务溯源”步骤,对业务溯源图进行修正完善。
最后,进行成果固化。主要是将溯源的成果固化到数据资产溯源支撑工具中,主要包括数据资产形成的全过程业务模型图、“录入节点描述表”、“存储节点描述表”、“处理节点描述表”、溯源节点可执行脚本或程序。
运营数据资产溯源支撑工具可多视角展示数据资产的全过程业务模型图,双击业务模型图中的溯源节点,实时显示节点规范化描述信息。图1为数据资产溯源示意图。
3.3 数据资产质量分析
数据资产质量主要从数据资产完成率、数据资产可信度等多个维度进行分析。
3.3.1 数据资产完成率
主要包括数据资产台账完成率和数据资产溯源完成率。
首先对数据资产台账根据权重判断方式进行属性分类,主要分为具有一票否决制的权重较大的属性A类和利用层次分析法判断权重的属性B类,然后计算数据资产台账完成率=属性A类*60%+属性B类*40%;
图1 数据资产溯源示意图
数据资产溯源完成率是针对不同类型的节点完成率加权得出,节点类型主要有输入节点、处理节点、传输节点和存储节点四类。单个节点完成率包括手工和自动。若某节点完成率为0,则此节点反推至输入节点路径(含输入节点)内的全部节点完成率重置为0。数据资产溯源完成率=(完成率)/n,n指存在的节点总数;
数据资产完成率=50%*数据资产台账完成率+50%*数据溯源完成率。
3.3.2 数据资产可信度
通过对影响数据资产可信度的关联因素进行分析,并利用层次分析法对评估项目进行权重分析,从而量化数据资产可信度。首先对数据资产的各类节点开展数据来源溯源分析,然后对各节点的权重计算得出数据资产可信度。
4 结束语
在数据资产管理工作中,数据资产质量是一个关键问题,直接影响了企业数据资产管理质量和应用程度。利用数据资产溯源,构建数据资产全景视图,结合数据资产形成过程,定期进行数据资产质量评估,形成量化指标,从数据资产的完整、准确、有效、精度、无重复、冗余、可访问、及时、明确、可用、适用等多种维度为企业数据资产管理提供指导依据。
[1]DAMA International.DAMA数据管理知识体系指南[M].马欢,刘晨,译.北京:清华大学出版社,2012.
[2]West D.Neural Network Credit Scoring Models[J].Computer& Operations Research,2000(27):1131-1152.
[3]王丽云.企业统计数据质量的影响因素研究[J].现代经济信息,2015(12):14-20.
[4]宋丽芳,宋旭东,于学伟,等.社区信息化建设数据质量评估模型的研究[J].微计算机信息,2010,26(4-3):11-12.
[5]黄心宇.数据质量评价模型的建立与实现[J].商场现代化, 2008(8):396-397.
[6]袁满,张雪.一种基于规则的数据质量评价模型[J].计算机技术与发展,2013,23(3):81-89.
[7]李谦,白晓明,张林,等.供电企业数据资产管理与数据化运营[J].华东电力,2014(3):487-490.
[8]黄海潮,陈顺德.电网企业数据资产全寿命周期管理研究[J].管理观察,2015(1):62-66.
Research on Data Asset Quality Evaluation Based on Data Traceability Graph
ZHOU Hong,CHEN Zhao
(Southwest Branch of SGCC,Chengdu 610041,China)
With the vigorous development of large data age,Business awareness of the importance of the data has reached a new height,data assets has become an important strategic resource for enterprise development,more and more enterprises have carried out normalized professional data management.In order to enhance the application value of the company's data assets,the quality of data assets has become one of the important indexes of enterprise data asset management.Through data assets traceability man⁃agement,determine the whole process model of data asset formation,the multi-dimensional assessment of the quality of data as⁃sets,quantify data assets,which provides an important reference index for enterprise data asset management.
Big data,data assets,normalized,data assets traceability,quality of data asset
TP181
A
1009-3044(2017)19-0184-02
2017-05-15
周泓(1981—),高级工程师,工学硕士,从事电网建设运行管理工作;陈钊(1981—),工程师,工学硕士,从事电网建设运行管理工作。