APP下载

元数据方法在地质实物全生命周期管理的探索和运用

2021-12-02曾小明

科技资讯 2021年24期
关键词:实物生命周期驱动

摘  要:元数据在数据资产化管理、数据交换、数据共享和数据检索等专业应用中起到了非常重要桥梁和控制作用。针对传统数据管理存在的数据类型复杂多样、数据质量参差不齐、缺乏标准规范、无法便捷有效共享等諸多问题,该文提出了一种目前主流的基于元数据驱动的企业级数据全生命周期管理体系,在地质实物管理中得到了很好的应用,元数据管理体系贯穿了地质实物的钻井取样、入库上架、使用取样、分析化验等全生命周期。系统实现了元数据驱动、数据自动更新和数据高效共享,提升了企业对地质实物数据资产的管控能力和智能化应用水平。

关键词:元数据   地质实物   全生命周期   模型驱动

中图分类号:TP311.52                     文献标识码:A文章编号:1672-3791(2021)08(c)-0007-04

Exploration and Application of Metadata Method in the Whole Life Cycle Management of Geological Objects

ZENG Xiaoming

(Hainan Branch of CNOOC, Haikou, Hainan Province, 570206  China)

Abstract: Metadata plays a very important role as a bridge and control in professional applications such as data asset management, data exchange, data sharing, and data retrieval. Aiming at many problems existing in traditional data management, such as the complex and diverse data types, uneven data quality, lack of standard specifications, and inability to facilitate and effective sharing in traditional data management, etc, this paper proposes a current mainstream metadata-driven enterprise-level data life cycle management system, which has been well applied in geological physical management. The metadata management system runs through the entire life cycle of geological objects such as drilling sampling, warehousing and storage, sampling, analysis and testing. The system realizes metadata-driven, automatic data update and efficient data sharing, which enhances the ability of enterprises to manage and control geological physical data assets and the level of intelligent application.

Key Words: Metadata; Geological objects; Whole life cycle; Model driven

随着物联网技术、大数据和人工智能等信息技术的应用逐渐广泛,高效的数据交换和数据共享需求越来越强烈。同时如何从海量数据进行数据挖掘,提高企业竞争力,实现高质量发展已成为众多企业迫切需要解决的问题。而传统的数据管理平台只关注单一数据表内部,表与表之间关系不严谨,并且缺乏对数据项进行标准和描述,数据可读性差,共享困难,数据质量难以保证,并且数据维护还停留在手工阶段,效率低下。数据作为一种越来越来重要的生产要素,是企业进行数字化转型的基础,如何实践数据资产化管理,最大程度挖掘数据的价值,是目前各企业需要面对的一个重要的问题。而元数据可贯穿整个数据管理体系,是数据管理体系的灵魂和基石,是连接系统各个应用模块的桥梁。针对存在的问题该文主要探索了一种基于元数据驱动的企业级数据管理体系,来实现企业数据全生命周期资产化管理。

1  元数据

1.1 元数据定义

元数据(Metadata),是定义和描述其他数据的数据(data about data),是一种描述信息资源的内容属性和特征的结构化数据[1]。元数据的概念最早在1987年由美国宇航局提出,之后元数据在各行各业中得到了广泛使用,目前都柏林核心集是目前世界上使用范围最广,影响力最大的通用元数据标准,同时我国也颁布了一些地理信息、生态科学数据和标准文献等行业元数据标准[2]。元数据提升了企业共享、获取和理解信息资产的水平,元数据类型可以分为管理元数据和业务元数据,其中业务元数据又分为结构化、文档、图件和体数据元数据。

1.2 元数据作用

元数据通过对数据进行标准化、规范化和有效的描述,可大幅度提高数据可读性和质量,使数据可高效的共享、交换和使用。数据的交换共享是通过读取元数据信息驱动完成,从数据的抽取(Extract)、转换(Transform)到数据的加载(Load)都离不开元数据的支持,元数据控制了整个ETL的过程[3],元数据是ETL的灵魂和控制器,具体如图1所示。只需维护元数据信息,就可以实现ETL的工作任务自动维护。

元数据独立于平台,无论使用什么技术平台,元数据的使用都不受影响,可快速响应用户需求的变化,减少代码开发的工作量,并且具有较强的通用性和移植性。将元数据与数据搜索引擎相结合,可大幅度提高数据搜索的效率和准确度。因此,只需对元数据进行有效的管理和维护,就可支撑用户通过元数据挖掘有价值的信息和专业应用。

1.3 元数据驱动架构

元数据驱动架构是指把系统数据细化到元数据级别,运行时都根据元数据来处理数据,与具体的业务无关,通过元数据来驱动业务。当业务需求、业务流程和数据统计查询方式等发生变更时,只需要修改元数据就可以实现对业务需求等信息的变更,无需在程序当中修改代码,系统会抽取元数据库中定义的相应内容并自动转化为SQL对专业数据库进行相应的操作,使得系统具有较强大的灵活性和适应性,可大幅度减少代码开发工作量,提高开发效率,实现系统的敏捷快速迭代[4-7]。

2  元数据应用于地质实物管理

2.1 对象生命周期编目元数据

对象全生命周期管理是近年来提出来,比较先进的现代化资产管理理念,打破了信息壁垒,实现了跨部门的数据共享,以业务流为中心,提高了资产的管理和使用效率。地质实物主要是指油气勘探开发过程中钻井或者生产过程中获取的岩心、岩屑、壁心和流体[8],是科研生产最基础的资料。地质实物的整个生命周期主要包括了钻井取样、库房接受、入库、上架、观察、化验取样、分析化验、销毁等环节。通过管理地质实物生命周期编目的元数据,可实现地质实物的线上全生命周期动态管理。

2.2 数据集数据项元数据

元数据比较常用于描述关系型数据库中的结构信息,包括了数据库、数据表的名称等相关的描述信息,以及数据表每个字段的属性(数据类型、精度、值域以主外键关系等)。用户或者其他系统需要基于这些元数据才可与系统交互获取所需要的、正确的业务数据。而随着大数据技术等信息技术的发展,诞生了很多非关系型数据库如MongoDB等,但元数据仍然是这些非关系型数据库数据查询和数据处理的依据[9-11]。目前地质实物管理采用关系型数据库oracle来管理,其中地质实物比较重要的4个数据集为岩心信息表、壁心信息表、岩屑信息表和流体信息表。通过对数据项元数据进行标准、描述和定义,极大地提高了数据的质量、便于用户查询数据。以壁心信息表(见图2)为例,规定了井筒、壁心深度、壁心长度、壁心直径、盒号和存放位置等各数据项的代码、数据类型、主键、外键、唯一键、非空、精度、小数、量纲、值域、计算公式、附录和描述等,开发人员通过元数据接口读取这些元数据,就可以获取数据字典,进行数据查询、处理和专业应用开发。后期业务需求有变更,只需要在数据项元数据增加即可,扩展性很强,可快速响应新的业务需求,缩短开发周期。

2.3 管理效果

2.3.1 提高了数据质量

地质实物信息复杂多样,数据类型众多,有结构化、文档、图片、体数据、音视頻等,数据如果没有一个统一的标准和规范,数据交换、传输和共享就会出现问题。元数据对地质实物数据的类型和结构进行了标准、规范和详细的描述,并且元数据存储了数据的类型和值域等约束条件信息,从而可以在源头控制数据准确入库、全局统一。通过元数据标准大幅度提高了数据质量,确保了数据的规范性、准确性、一致性、唯一性、完整性和可读可用性,为系统的专业应用奠定了扎实的数据基础[12]。

2.3.2 地质实物线全生命周期管理

基于元数据驱动技术和地质实物的全生命周期的规范管理,对地质实物从钻井取样、入库、上架、化验取样、分析化验、销毁等全生命周期的规范化采集,利用科学系统的业务分析方法论,各环节按业务活动发生的6W要素进行描述和管理,为后面的线上动态可视化精细管理、勘探开发研究和库房管理提供了夯实的数据基础和支撑,很容易生产业务流、数据流,达到地质实物全生命周期数据闭环数字化管理。研究人员在系统中即可直观获得地质实物现状和取样使用记录等生命历程的综合展示,无需跑去库房实地查看,线下翻阅整理各种资料,极大地减轻了基础科研人员的工作负担,达到了“运筹帷幄之中”。

2.3.3 地质实物线上动态可视化展示

通过实物信息、实物余量、实物照片和实验成果多维可视化展现(见图3),可高效地指导用户取样流程。同时通过把取样申请审批由线下转到线上,系统可在取送样申请审批流程中,自动根据申请内容与数据中心进行全局比对,直观展示实物现状照片和余量等各种综合信息,智能判断和辅助审批,判断出拟分析化验项目是否重复取样、能不能满足取样需求,会不会造成过度取样。使得管理者不再是“盲人摸象,拍脑袋决策”,实现了数据决策,有效控制地质实物重复取送样现象,避免浪费珍贵的地质实物。同时审批流程由线下转到线上,大幅度提高审批效率,缩短审批周期,极大地推进了科研工作进度。

通过元数据可以自由拼接字段,按需生成统计报表。系统实现了按盆地或按油田自动生成地质实物的统计报表,也可按其他不同维度、不同时间段,不同统计方式动态生成统计报表,改变了以往线下统计查询和实地查看费时费力局面。

3  结语

元数据是科学管理数据资源的基础,基于元数据的数据标准管理,为业务实体的定义、关系和业务规则到IT实现之间提供清晰、标准的语义转换和数据字典,搭建了IT和业务之间的桥梁。并为与其他系统的交互,提供了数据标准和数据规则的描述。同时元数据驱动能够对业务新需求做出快速反应,减轻了开发工作量,可实现系统快速迭代。

地质实物元数据的建立加强了数据共享和交换,实现了元数据驱动、数据自动更新和数据高效共享,提升了企业对地质实物数据资产的管控能力,做到了地质实物科学精细化管理,为后续智能化应用水平提供了扎实的数据基础。

参考文献

[1] 张国民.元数据的多角度诠释[J].档案,2019(5):44-48.

[2] 王艳,沈晓晶.基于生命周期模型的海洋元数据研究及应用[J].山东大学学报:工学版,2019,49(3):15-21.

[3] 张忠平,赵瑞珍.基于元数据驱动的ETL架构设计[J].计算机应用与软件,2009,26(6):61-63.

[4] 郁波,戴毅茹,凌卫青.元数据驱动在试验数据管理系统中的应用[J].机电产品开发与创新,2012,25(2):71-73.

[5] 陈星童.元数据驱动的EPDM与E&P数据模型双向映射研究[D].大庆:东北石油大学,2012.

[6] 张帅.元数据驱动的数据管理平台设计与实现[D].南京:东南大学,2019.

[7] 栾晓宇.基于元数据驱动的企业级数据仓库系统[J].计算机系统应用,2015,24(2):99-107.

[8] 曾小明,夏如君,金云智,等.石油地质实物精细管理助力企业高质量发展[J].中国管理信息化,2020,23(23):126-129.

[9] 彭广亮.基于元数据的领域数据编辑模型研究[D].大庆:东北石油大学,2011.

[10] 李梅,邹学森,毛善君,等.互联网+煤层气元数据管理系统关键技术研究[J].煤炭科学技术,2016,44(7):80-85.

[11] 张孟.基于大数据的定标方法研究与初步应用[D].合肥:中国科学技术大学,2019.

[12] 郭绍斌.元数据驱动的数据质量监控实践[J].电脑知识与技术,2019,15(6):3-5.

作者简介:曾小明(1987—),男,硕士,工程师,研究方向为勘探开发信息化系统建设和管理。

猜你喜欢

实物生命周期驱动
基于云制造模式的产品碳足迹生命周期评价
探讨问题驱动教学法在高中数学教学中的应用
关于场与实物关系的一种探索
探索ASP.NET的生命周期
基于生命周期理论的科技型小微企业融资路径选择探析
税收筹划在企业经营管理中的应用探讨
班主任进行实物分析的实践路径
AMD VS微软 SSD的AHCI驱动选哪家