基于油田数字化的异构数据源整合与集成技术分析
2020-05-12王思宇
王思宇
(大庆油田设计院,黑龙江 大庆 163712)
随着数字化技术研究的突飞猛进,让油田数字化建设工作的开展变得可行。对于油田数字化而言,主要针对的为基于数据服务总线技术下,科学运用集成整合异构数据的方式,对于油田勘探和开发的环节,实施异构数据源的整合和交互,将数据源当中的关键信息作为参考,带给决策方案制定工作更多的借鉴。为此,系统思考与分析基于油田数字化的异构数据源整合与集成技术显得尤为必要,拥有一定的研究意义和实践价值。
1 基于油田数字化的异构数据源整合与集成的需求分析
1.1 完整性需求说明
进行油田数字化建设的时候,通过借助异构数据源整合与集成技术,可以结合油田的具体内容情况,完成科学地分析与反馈任务。比如,油田整体性与约束性等方面的内容,均能够依靠异构数据源整合与集成技术予以实现,进而在此过程当中,可以系统了解相应的油田数字化系统和数据库,同时,掌握其和各个子系统、子数据库间的关联情况,真正提高数据交互与处理的效率。
1.2 —致性需求说明
鉴于在油田数字化数据库当中的数据信息均以不同业务系统作为主要的来源,设计各个业务系统的过程中对于各项功能的设置存在差异,并且被运用在各种不一样的语言体系当中,所以使得各个数据间显现出语义方面的不同。正是因为上述不同,将致使相关记录信息缺少真实、完整性,易于产生错误,影响到数据的科学处理与整合,因此,需要事先转换与优化以上数据信息,使相关编码被转换成统一的数据构造,最终实现有效集合与存储。
1.3 安全性需求说明
对于不同的业务系统而言,所储存的相关数据均存在不一样的权限访问要求,因此,进行数据整合的过程当中,应该结合各种权限合理设置相关数据信息,以便有效限制相关数据信息的访问权限,发挥出对其保护的良好作用,由此,要求科学设计一种统一化的用户安全管理方式,以便达到类型化管控的目的。
1.4 集成性需求说明
进行开关与应用油田的时候,对于运用一些数据库的环节,一般凸显出十分独立的特征,为了提高信息查询的效率和准确性,应该合理建设相关数据库与系统。借助异构数据源整合与集成技术的大力推广和运用方式,有利于促进查询工作的实施。以数据信息为对象,实施跨系统、数据库的科学操控,一方面,加快了整合的速度;另一方面,可以增强数据应用的实际效果。
2 基于油田数字化的异构数据源整合与集成技术
2.1 数据整合技术构造的说明
本研究以xx油田数字化建设为例,为了完成xx油田数据整合的目的,首先应该构建与设计数据整合技术构造。一般而言,数据整合技术的收集通常源于各个机构与各类专业软件中的相关数据信息,并为各类用户进行服务。Xx油田根据当前数字化建设的具体状况与特征,最终绘制出数据整合技术构造图,详情见下图1。
图1 数据整合技术构造图
从上图1当中,不难看出,xx油田数据整合技术包含了数据提取功能模块1、数据处理功能模块2及数据输出功能模块3所构成。在这当中,数据提取功能模块1以提取相关数据信息为主,涵盖了测井库和储量库、其他库与相关数据信息、为数据处理功能模块2给予相关数据的借鉴;而数据处理功能模块2则涵盖了数据虚拟化、数据虚拟化所给予的多源、分布型、异构的数据信息虚拟化方面的功能,并且借助数据服务总线技术完成了对相关数据信息的抽取、转换、数据适配以及给予第三方应用功能模块3相应数据接口的任务;至于第三方应用功能模块3,其以接收相关数据信息为主,在这当中,主要涵盖了油田OA系统、油田HR系统以及综合生产管控系统等部分。
2.2 加大主数据库的构建力度
所谓主数据库,也叫做公共数据,其中涵盖了油田的名称、区块的名称、井的名称以及相应测线号等不同的主要实体数据类型。进行油气田主数据库构建的过程当中,应该紧密结合相关勘探与开发的数据信息,以便达到统一化的控制与集成运用的效果。
在数据库当中,包含了很多重要的构成部分。所勘探与开发的数据构造是满足相关数据模型规定的,利用此模型能够包含全部石油上游的业务范围,可以实现井、井筒的全生命周期数据信息的管控,其中又涵盖了众多不同类别的专业领域,比如,常见的钻井、地球物理、井下作业与相关装置、油气输送等,其中所包含的数据信息量显然是非常庞大的。
根据相关数据模型的要求,能够完成对油田数字化主数据库构造的构建任务,同时加快针对当前专业数据库、主数据库接口的开发速度,使得不同专业数据库内的相关数据信息能够被快速迁移到主数据库当中。实施不同专业数据库统一化管控的过程当中,以井号、坐标以及油田区块的统一内容为主。诸如,在常见的钻井数据库、地质综合库 以及录井数据库当中均存在井的相关数据信息,应该明确该数据是否准确且唯一。而进行xx油田井基本实体库的构建过程当中,需要根据相关模型的要求,科学编制井号代码,将其当作井的唯一标识体现,有利于增强数据整合服务的最终效果。所以,加大主数据库的构建力度十分关键。
2.3 注重数据服务总线技术的科学利用
对于数据服务总线而言,属于一种数据信息的集成技术类型,拥有很强的灵活性,并且也便于进行利用。通常情况之下,此项技术会运用到有关数据信息的采集与交换、同步和历史数据迁移以及数据信息质量的管控等方面。该技术以数据整合技术、数据虚拟化技术作为有效的技术支撑,具备了数据信息的集成与实时访问等不同的功能,能够结合不同用户具体业务需要的情况,科学构建相应的数据服务管控平台,以便制定出统一、标准化的数据融合策略。一般而言,数据服务总线技术涵盖了数据连接、逻辑处理、数据处理、数据集成以及数据整合等不同的层级架构体系。
实际上,数据服务总线技术对于不同种类的数据库数据信息、文件数据信息均是适用的,主要运用了全量、增量以及自定义条件等不同的方法,完成了对相关数据信息的加工和运输处理任务。针对各类数据库当中的数据信息来说,一般会先进行抽取处理,接着会进行转换和清洗,最终借助众多的传输形式将其送达相应的目标数据库当中。详情见图2。
图2 多元化的数据信息整合步骤图
3 结语
从此次论文的阐述与分析当中,可以获知,系统分析和思考基于油田数字化的异构数据源整合与集成技术显得尤为必要,具有一定的研究意义与实施价值。进行油田数字化的异构数据源整合与集成处理,可以让众多的业务系统与诸多的异构数据源实现共存,完成对各个数据库中不同类型数据信息的有效整合任务,一方面,对从前的业务系统数据库内的相关数据信息加以保护;另一方面,也使油田开发的过程当中能够形成统一化的数据接口,提高了数据信息的利用效率。本文通过分析基于油田数字化的异构数据源整合与集成的需求情况,说明了基于油田数字化的异构数据源整合与集成技术:数据整合技术构造的说明、加大主数据库的构建力度、注重数据服务总线技术的科学利用。希望此次研究和分析的内容与结果,能够得到有关油田数字化建设工作人员的关注和重视,并且从中获取到相应的启发与帮助,以便充分发挥出基于油田数字化的异构数据源整合与集成技术的良好作用,进而推动我国油田数字化建设工作的可持续发展和进步。