APP下载

面向烟草企业的数据治理与管控研究

2020-04-08刘云潘峰徐宇

中国管理信息化 2020年24期
关键词:元数据数据治理共享

刘云 潘峰 徐宇

[摘 要]文章依托信息资源规划(Information Resource Planning,IRP)和国际数据管理协会(The Data Management Association,

DAMA)数 据治理理论对安徽中烟工业有限公司的数据资源建立数据资产化的基本标准,形成一套配套的规范制度;建立数据资产管控平台,确保数据标准管理、数据质量管理、元数据管理、数据资源共享等系统落地。通过构建企业的数据治理平台,从数据标准落地、数据质量管控、元数据管理、数据资源共享等方面,全面提升企业数据治理的能力、提高企业数据资产的管理效率和利用效率。

[关键词]数据治理;标准;元数据;共享

doi:10.3969/j.issn.1673 - 0194.2020.24.046

[中图分类号]F426;F270.7[文献标识码]A[文章编号]1673-0194(2020)24-00-02

1     数据治理的理论概述

数据治理最早源于20世纪70年代末期的数据管理。DA(Data Administration,数据管理)的概念在诺兰信息化成熟度模型中有过阐述,自此之后逐渐发展并引入中国,陆续有国内外的学者开始研究数据治理在企业、政府等领域发挥的作用。在国外已有的数据治理模型中,提及较多的是数据治理协会(The Data Governance Institute,DGI)数据治理框架和国际数据管理协会(The Data Management Association,DAMA)数据治理框架。其中,DGI数据治理模型包括规则与协同工作规范、人员与组织架构、过程三大部分及10个子部分。该模型的特点是将治理流程融入模型中,以流程箭头的形式标识出治理顺序。DAMA数据治理的目标是加强信息管理和信息服务,通过数据管理组织架构建设和制度建设、数据标准规范制定和维护、数据质量管理以及数据关系脉络管理,能够从根本上解决信息割裂、不完整、不合规等问题,实现数据流转和血缘分析,增加分析数据的有效工作时间,减少用于在复杂企业数据环境中搜索数据的时间。而国内的数据治理模型要归根到高复先老师在20世纪90年代引进信息工程理论而独创的IRP(Information Resource Planning,信息资源规划)理论模型上,IRP对国内普及数据元、数据标准、元数据的概念起到了很大作用。

2     烟草企业现存的数据治理问题

烟草企业经过多年的信息化建设与应用沉淀,积累了丰富的数据资源,这些资源为企业自身业务提供服务的同时,也成为企业重要的数据资产。但系统间的集成错综复杂,标准各有差别,数据的一致性问题、业务功能共享和流程贯通等都是烟草企业信息化建设需要解决的问题。以安徽中烟工业有限公司为例,该公司在数据管控和应用方面,尤为突出的问题有以下几点。

2.1   系统管理分散,资源缺乏统一管理

企业信息化建设取得了不小的成果,建设了很多高效智能、操作简单的业务系统,包括营销系统、生产执行系统、物流系统等。但系统管理分散,系统资源使用情况获取困难,且故障排查时,时常找不到系统运维人员。业务系统在投入使用后,会产生大量重要的业务数据,而数据存储直接关系到系统的资源使用情况,现在很多时候该公司在系统磁盘空间用尽导致系统运行异常后才进行扩容处理,进而出现系统运行中断和数据丢失等问题,缺乏系统资源使用情况管理功能。

2.2   缺乏对数据标准的管理和检验

企业越来越重视信息标准的建设工作,花费大量人力、时间编制信息标准、规范制度及相关管理办法文件制,结果却装订成册,存入档案库;或者宣贯到各个单位就结束了,没有贯彻落实到实际工作中,更没有在实际管理工作中细化、量化,实践总结的规范缺少统一管理和回归检验工作的实践。

2.3   共享数据的质量不高

业务系统之间的数据交换共享存在数据对接方式混乱、传输效率低、交换数据的质量无从管理等问题,数据交换过程中,数据不同步、共享失败的情况时有发生。例如,缺少对交换服务的监控机制,导致使用数据的系统业务时长受到影响;缺少全流程日志查询功能,导致问题排查定位难度高;缺少数据质量检查工具,人为检查数据的效率及质量低,导致共享数据的质量不高。

2.4   没有有效管理和追溯元数据

信息中心每年投入大量的费用建设业务系统,但对业务系统的内在信息掌握很少,一个业务系统有什么样的数据结构,使用了什么样的元数据,系统相互之间的元数据是否有影响关系,系统使用的元数据是否满足规范要求,是否会发生变更等,没有一个可以集中查看的平台,缺乏对系统资产的管理控制。

3     烟草企业的数据治理实践

根据安徽中烟工业有限公司的实际情况,本文将DAMA模型的优势与IRP理论的精华相结合,在此理论指导下开展了该公司的数据治理工作。依托IRP和DAMA理论对安徽中烟工业有限公司的数据资源建立数据资产化的基本标准,形成配套的规范制度。通过构建企業的数据治理平台,从数据标准落地、数据质量管控、元数据管理、数据资源共享等方面,全面提升企业数据治理能力,提高企业数据资产的管理效率和利用效率。

3.1   数据标准落地

数据标准从字面上理解就是数据既定的“规则”,这个规则一旦定义,就必须执行。数据标准化就是研究、制定和推广应用统一的数据分类分级、记录格式及转换、编码等技术标准的过程。从管理对象上看,数据标准主要包括3个方面的标准:数据模型标准,即元数据的标准化;主数据和参照数据标准;指标数据标准,如指标的统计维度、计算方式、分析规则等。数据标准编制指根据企业业务进行管控数据项划分,确定数据项的名称、编码、类型、长度、业务含义、数据来源、质量规则、安全级别、域值范围等。数据标准参考国际、国家或行业标准的现行标准制定,也可以根据企业业务制定特定的企业级数据标准。数据标准审核是对数据标准初稿进行审查,判断数据标准是否符合企业的应用和管理需求,是否符合企业数据战略要求数据标准发布要求。数据标准一经发布,各部门、各业务系统都需要按相应的标准执行。同时,企业需要评估现有应用系统、数据模型的影响,并提出相应的应对策略:对于新建的系统要求直接应用定义好的数据标准,对于旧系统建议建立相应的数据映射关系,进行数据转换,逐步落实具体的数据标准。数据标准管理工具,从功能层面主要包括:数据标准编制、数据标准审核、数据标准发布、数据标准使用等。

3.2   数据质量管理

数据质量管理指对数据从获取、存储、维护、应用生命周期的每个阶段中可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平进一步提高数据质量。数据质量管理建立在完善的数据治理体系上,通过贯彻数据标准,提高数据质量,建立数据质量监控处理工作机制和技术平台,推进数据资产化管理。数据质量管理主要通过一系列流程和手段,实现对数据质量问题的监控、预警、分析、解决和反馈的闭环管理,以及时发现各类型的数据问题,提升问题处理效率,从而保障数据中心高质量运行。从功能上看,数据质量管理工具主要包括数据质量指标管理、数据质量规则管理、数据质量评估任务、数据质量评估报告等。

3.3   元数据管理

元数据管理统一管控分布在企业各个角落的数据资源,通过制定科学、有效的管理机制进行管理,并面向开发人员、最终用户提供元数据服务。元数据分为业务元数据和技术元数据,业务元数据包括业务归属、指标、度量、业务规则、业务数据字典等;技术元数据包括数据模型、数据结构定义、数据仓库技术ETL过程。对业务人员来说,元数据有利于数据导航、加深数据理解和提高数据信任度。对技术人员来说,通过影响分析,掌握各程序、数据之间的关系,能够更好地明确系统变更涉及的范围,更好地开展重点监控、数据交换、数据迁移及数据归档与清理工作。元数据管理需要构建元数据模型用于存储元数据定义,通过基于元数据采集、管理、分析的元数据管理功能框架的技术工具支撑元数据管理。其中,元数据管理功能主要包括元数据采集服务、应用开发支持服务、元数据访问服务、元数据管理服務和元数据分析服务等。

3.4   数据资源共享

数据资源共享管理主要指开展数据共享和交换,实现数据内外部价值的一系列活动。数据共享管理包括数据内部共享(企业内部跨组织、部门的数据交换)、外部流通(企业之间的数据交换)、对外开放。数据内部共享的关键步骤是打通企业内部各部门间的数据共享瓶颈,建立统一规范的数据标准与数据共享制度,数据外部流通和对外开放可以通过数据直接交易与提供数据分析信息两种方式实现,将数据中符合共享开放层级的信息作为应用商品,以合规安全的形式完成共享交换或开放发布。要做到企业数据资源共享,首先要把企业数据资源按照一定的业务主题进行组织归类,并通过友好的可视化界面展示,使用户清晰地了解企业拥有的数据和提供的服务,并能灵活地申请订阅,使数据资源得到最大化利用。同时,需要把数据服务按照主题和需求进行组件化封装,提供完整统一的、可按需定制的数据服务。在实现数据资源共享的同时,相关机构还要建立明确的数据申请及审批机制,明确各级审批权限,有效地控制数据资源的流向,保证数据安全。数据资源共享通过搭建数据交换共享平台实现,该平台包括模型管理、消息管理、接口管理、服务管理等功能,可以组织、归类企业业务系统中需要共享交换的数据,提供组件化的数据服务,满足灵活、个性化的需求及各业务系统间数据交换的需求,提升企业数据资源的共享和服务水平。

4    结 语

在数据价值越来越重要的时代,企业数据资产的价值逐渐凸显,其中,数据管理和利用水平是企业数字化转型的基础,而数据治理成为企业关注的重点。企业数据管理平台重点提供了数据的“采、管、存、用”4种能力,而数据治理工具是提供最核心的“管”数据的能力和一部分“采、存、用”数据的能力。通过构建数据治理平台,规范组织架构,能够落实现有标准的系统,赋能精细化经营管理的基础工作,全面提升企业数据治理能力,进而提高企业数据资产的管理效率和利用效率。

主要参考文献

[1]李钥.烟草商业企业“双核四维”数据统计治理模型探索[J].中国烟草学报,2015(1):46-52.

[2]郭文卓,王子豪.烟草行业大数据资产管理[J].电子技术与软件工程,2018(20):183.

猜你喜欢

元数据数据治理共享
基于本体的企业运营数据治理
云端数据治理初探
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
挂羊头卖狗肉的“共享”营销
大数据治理模型与治理成熟度评估研究
图书馆与出版企业数字资源共享的环境因素分析
大数据时代城市治理:数据异化与数据治理