数据资产管理在项目管理实践中的应用
2022-02-19黄敏珍
黄敏珍
(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)
随着大数据技术的应用和企业数字化的发展,数据被认为是企业的资产已经成为一种共识,数据具有巨大潜在价值,要从数据中获取价值,需要企业高度重视并对其进行常态化管理。很多企业都开展了相关资产管理平台的研究,利用大数据技术进行数据汇集、数据治理、数据挖掘分析与可视化展示。在技术支持的同时,如何构建完整并易于实践的数据资产管理体系,如何处理好数据资产管理体系与企业的项目管理体系之间的关系,如何把数据资产管理的理念融入到现有的项目管理体系中等,这些已成为亟待研究的问题,本文结合国际数据管理协会(DAMA,Data Management Association)体系的内容,并融合CMMI、ISO9001 等项目管理体系的理念,阐述项目管理实践中数据资产管理的实践策略。
1 DAMA 体系和数据管理
1.1 DAMA 体系简介
DAMA 是数据管理专业人士组织。DAMA 体系是这个协会对数据管理领域理论和实践的总结。DAMA 体系认为,在大数据时代,数据也是企业的资产,资产通常被认为是财产,可以变现为价值,而要从数据中获取价值,就需要对数据进行常态化管理。在DAMA 体系中,对数据管理的各个知识领域进行了详细的定义和阐述[1-2]。
数据的生命周期包括数据采集、存储、处理、传输、交换共享、销毁等过程,在数据的整个生命周期中,可以通过清理、转换、合并、增强或聚合数据的方式进行处理。
1.2 数据管理和数据资产管理的关系
在大数据时代,数据资产化已经得到广泛认可。在工厂、营销、决策等很多方面,数据已经起到了导向作用[3]。数据资产管理是在数据管理的基础上进一步发展的,既有联系又有区别,具体如下。
(1)体系建设。数据资产管理体系在组织建设上,需要建立更加专业化的管理组织,并且融合资产运营的理念和思路。
(2)管理侧重点。数据管理主要管理数据的质量,避免问题数据带来损失;而数据资产管理把数据的价值管理作为重点关注点。
(3)应用场景。数据资产管理在数据管理的基础上,更加关注大数据场景下数据的共享和汇集管理,增加了数据价值管理。
(4)数据价值。数据资产的价值包括使用价值和变现价值。使用价值是指数据分析共享和使用后所产生的价值,包括企业效益的提升、管理水平的提高等。变现价值是通过出售或者租赁数据的方式获得直接的经济收益。
2 数据资产管理相关体系现状
目前,数据管理主要包括DAMA、数据治理协会(DGI,The Data Governance Institute)和IBM 公司等为代表的理论体系[4],但数据管理体系主要是将数据作为信息进行管理,对数据作为资产和价值方面关注的比较少。在数据资产化背景下,数据资产管理在数据管理的基础上在管理视角、管理职能和组织体系上都进一步发展。
当前,国内外相关学者面向不同场景提出了多种与数据资产管理相关的体系。
(1)数据管理的知识体系(DMBOK1.0)和DAMA-DMBOK2。DAMA 在2009 年发布了数据管理知识体系,即DMBOK 1.0,该体系将数据管理体系分为10 个知识领域[5]。近年来,随着大数据技术的发展,以及数据治理和数据伦理方面的新变化,DAMA 编写了 DAMA-DMBOK2,重新制定了DAMA 数据管理框架(DAMA 车轮图),使得DMBOK 更加深入、丰富。
(2)DMM 和DCMM。在数据能力成熟度方面,在2014 年,卡内基梅隆大学旗下机构以CMMI 为参考,发布了数据能力成熟度(DMM)模型,该模型包括数据管理战略、数据操作、数据治理、数据质量管理、数据平台和体系,以及支撑流程等6 个职能域[4]。在2018 年,全国信息安全标准化技术委员会提出了数据管理能力成熟度模型(DCMM),提出了包括数据标准、数据治理和数据生命周期管理等在内的8 个能力域[4]。
除了如上数据管理方面的体系,国内外在大数据领域开展了很多数据相关的标准化研究工作[6],在铁路领域,部署在中国国家铁路集团有限公司主数据中心的铁路数据服务平台已实现数据登记、数据汇聚、数据质量管控、数据共享等应用[7]。
3 数据资产管理理念在项目管理实践中的应用
在融合CMMI、ISO9001 及DevOps 项目管理理念的基础上[8],本文结合数据管理和数据资产管理的理念,结合10 项知识领域中的关键内容,研究如图1 所示的6 个关键数据资产管理实施策略。
图1 数据资产管理6 个关键方面
3.1 数据架构管理
不管在系统研发的全生命周期过程中,还是在数据资产管理体系中,数据架构管理是其核心。
3.1.1 项目管理过程
(1)项目生命周期的需求分析、设计阶段的管理是非常重要的阶段,对项目的需求分析、概要设计和详细设计文档都有非常明确的要求,并且经过专家的评审后,才进行项目下一步编码。
(2)其中与数据相关的最重要的过程就是数据架构以及数据库的设计,而数据资产管理,从数据架构入手,实现各个独立系统的数据从“黑盒”向“白盒”转化。
(3)研发项目的关系型数据库过程是先通过需求形成概念模型、再形成逻辑模型、最后形成物理模型。
(4)数据资产架构管理是对已经存在的数据架构进行梳理,是先梳理物理模型、逻辑模型,再梳理业务逻辑模型。
3.1.2 项目研发过程
项目研发过程正向的设计,数据资产反向的数据结构梳理,主要都涉及数据架构的梳理,所以在项目实践过程中,要重点加强数据建模管理,进行物理模型、逻辑模型和业务逻辑模型的梳理和管理。
3.1.3 项目管理实践
加强项目的需求管理、设计管理,设计的开始阶段强化数据架构意识,加强变更管理。随着项目研发的进展,系统数据库相关数据表或字段变更后,需要及时更新设计文档。如果各个系统的数据结构设计文档都是齐全和完整的,那么后期在数据资产管理的过程中,对数据架构的分析就会减少工作量。
3.2 数据汇集管理
Malcolm Chisholm 提出了一种6 层的数据分类法,把数据分为元数据、参考数据、企业结构数据、交易活动数据、交易结构数据和交易审计数据6 种类别[2]。主数据包括参考数据、企业结构数据和交换结构数据的聚合。
在项目管理实践中,我们把元数据管理、主数据管理、参考数据管理的理念融合到数据采集、清洗、汇聚过程中,主要包括如下策略。
(1)加强数据目录管理。按照数据分类方法,对数据进行分类管理,形成统一的数据目录,方便数据的检索和获取管理。
(2)加强数据采集和汇集管理。大数据项目中,包括对多个业务系统数据的采集、清洗和汇集等工作,加强各业务系统元数据、参考数据、主数据的梳理。对于不同业务系统中同种类别的元数据和参考数据要统一管理;而对各业务系统的核心的主数据,要加强数据建模管理,在数据汇集过程中加强进行数据清洗等,严格质量管理。
(3)加强安全管理。在数据汇集过程中,对涉及商业秘密、个人隐私数据,要加强安全管理,在数据汇集的过程中进行脱敏或加密处理。
3.3 数据质量管理
在项目管理实践中,管理数据质量的工作不是一次性的。
(1)可对数据质量制定专项管理体系,并且量化评估指标,对数据质量进行阶段检查和审查,及时发现、分析和解决数据质量问题,然后针对问题进行持续改进。在质量评估指标方面,DAMA UK 发布的一份白皮书里对数据质量的6 个维度进行了描述,包括数据完备性、唯一性、及时性、有效性、准确性和一致性等。
(2)数据质量的管理需要融合到项目管理过程中,在系统研发的整个过程中要持续进行质量管理,在数据创建、转换和存储过程中要不断完善数据质量。
(3)可使用数据清理、数据增强、数据解析、格式化、数据转换与标准化等多种方式提升数据质量。
3.4 数据安全管理
数据安全包括安全策略和过程的规划、开发和执行,为数据和信息资产提供正确的身份认证、授权、访问和审计[2]。
数据不仅蕴藏着价值和机会,也存在风险。在项目实践过程中,数据安全管理的实施需要重点考虑如下几个方面。
(1)建立体系化的安全管理规范。企业需要结合自身和系统的实际情况,建立数据安全管理制度,开发规范和相关管理办法。
(2)敏感数据分级分类管理。根据国家、行业、用户和企业对数据安全管控的要求,对现有数据进行敏感分级、分类管理,形成敏感数据目录。在此基础上,对不同敏感等级的数据,识别安全风险,制定响应的安全防范措施和安全管理策略。
(3)识别安全风险。对系统的安全风险进行识别与检查;在滥用特权、滥用合法权限、未经授权的特权升级、共享账号滥用、平台入侵攻击、注入漏洞、默认密码等方面检查;对重大安全风险问题及时整改。
(4)制定安全管理策略。安全管理策略包括数据访问权限控制、数据审计管理、数据迁移策略、数据安全控制和备份策略等。另外,对敏感数据目录和定义策略实行动态管理,持续完善优化策略,以保证数据安全策略的实地落实。
(5)实行安全测试。根据相关安全等级的要求,定期对系统进行安全测试,及时发现安全漏洞,对系统的安全策略进行持续优化。
3.5 数据开发利用
随着大数据、物联网、5G 技术的发展和广泛应用,全球数据呈现爆发增长。每年都产生比以往更大量的结构化和非结构化的海量数据。如何采取更好的数据管理方式,更好地利用数据,构建以数据为关键要素的数字经济,核心就是数据资产管理[9]。在项目管理实践中,在如下方面加强数据的开发利用。
(1)加强数据的分级分类管理。数据的开发利用离不开数据的共享,管晓宏[10]认为数据分类分级管理是实现数据安全有序共享的基础保障。例如,在铁路领域,可按照共享维度、安全维度、时间维度和空间维度将数据分级分类形成数据集[11]。
(2)应用人工智能等各种技术。虽然都说数据是一种资产,但只有被充分开发利用产生价值的数据才是真正的资产。对于数据的应用,需要通过各种统计学算法、建模算法、机器学习,以及数据可视化方面的综合应用,充分挖掘数据对于决策的支持能力。
(3)加强数据的全生命周期管理。对数据的采集、存储、应用等全生命周期进行管理,按照资产管理的理念对数据进行管理,形成数据价值管理和评估体系,更好地服务于数据价值的开发、数据共享和数据流通。
3.6 数据共享管理
在项目管理实践中,数据的共享分为内部共享和外部共享。在数据共享的实施过程中,要加强如下方面的管理。
(1)统一的数据共享体系。建立企业的统一的数据管理规范、共享机制和流程,对数据进行分级分类管理,不同类别实施不同的数据共享方式和流程。
(2)数据共享管理。数据共享包括数据仓库管理和数据共享等方面。在数据仓库管理方面,加强数据的模型管理,并且随着业务系统的变化,要及时进行变更管理,保证共享数据结构和数据的准确性;在数据共享方面,分为内部共享和对外共享,建立统一的数据开放共享平台,对于内部共享和外部共享制定相应的共享策略,进行数据共享应用。
(3)加强数据安全和保密管理。在数据开放共享的同时,加强数据安全管理和保密管理,利用安全技术和保密策略保证数据共享过程中的安全,另外,对于个人隐私或者保密数据,要严格按照相关的保密要求,防止信息的泄露。
4 结束语
随着大数据、物联网、5G 技术的不断应用和数字化、智能化的发展,企业积累的结构化和非结构化数据将呈现爆发式增长,那么如何将数据的安全、数据治理、数据质量和数据共享管理理念融入到日常项目管理实践中,成为我们亟待解决的问题。本文通过对DAMA 体系的研究,对数据的架构、汇集、共享、开发利用,以及质量和安全管理等方面与日常项目管理进行了融合研究,提出了相关实践应用策略,推进数据治理体系和数据资产管理体系的建设和应用。