智能油田的数据治理工程及其应用
2018-04-26孙敏
孙敏
[摘 要]数据治理,是油田智能化的基础建设之一,也是最重要的一项工程。本文以油田数据建设为研究对象,基于数据治理工程的思想理念和体系,以数据池技术和数据治理工具技术为基础,建立了油田的数据池平台,促使油田数据链路逐渐趋于正常化,数据存储逐渐趋于标准化,数据应用逐渐趋于智能化,数据管理的效率也得到了明显的提升。
[关键词]数字油田;数据治理;数字化;智能化
doi:10.3969/j.issn.1673 - 0194.2018.06.021
[中图分类号]F270.7 [文献标识码]A [文章编号]1673-0194(2018)06-00-02
0 引 言
庆新油田于2010年开始实施油田数字化管理建设,并取得了良好的成果,目前,运行良好。其虽然具有良好的油田数字化建设系统,但缺少科学的反馈机制、数据管控组织架构及有效的数据管理工具等,从而造成了数据质量控制的很多问题,最为关键的是,“数据鸿沟”与“信息孤岛”的现象比较严重,严重影响智能油田的建设与发展。因此,为了完善油田大数据应用,为现代化油田数据应用奠定基础,为庆新油田从数字油田迈向智能油田提供足够的数据支撑,需要在庆新油田范围内实施全面的数据治理工程。
1 油田数据治理工程
1.1 油田数据治理工程理念
数据治理是指,针对油田现有的数据,因条块分割、“数据鸿沟”和“信息孤岛”而导致的数据混乱状态,实施统一、规范化的整治与合理化、科学化的建设过程。
油田数据治理工程遵循的基本思想理念有以下几方面。
①将数据作为一项工程,加大对数据的科学研究。②油田数据建设是智能油田建设的中心工作,需加快思想及技术转型,要由IT思维转为DT思维。③数据建设的核心是,打开从数据到数据、从数据到应用的通道。④依照数据采、存、管、用规律,完成数据链路上每一个环节的智能化。
依据数据治理的这一理念,本文针对庆新油田数据存在的数据分散与“信息孤岛”现象,使数据共享应用困难;数据多样化,缺少统一标准,数据集成应用困难;数据存在质量问题多,难以支撑精准化、智能化的高级别应用;数据生产部门多、数据使用部门广、数据管理部门因为管理机制等问题互相推脱,导致数据应用不畅,效率低下;油田行业虽形成了大数据,但针对其应用处理非常困难,尤其还存在数据基础工作没有完善、无法支撑高级应用等问题,导致无法开展智能油田建设,因此有必要实施大规模的、全体总动员的数据治理工程。
1.2 油田数据治理工程体系建设
数据治理,需要很强的理论指导,更需要完整的工程体系。庆新油田在数据治理之前,首先完成了数据治理工程体系的建设,包括4大部分:组织体系、管理体系、技术体系和执行体系,如图1所示。
1.2.1 组织体系
由于数据治理是一个巨大的系统工程,所以,必须要具有强有力的组织领导机制。本文依照数据规律,在油田范围内划分出数据生产者、数据使用者和数据管理者,以加强对数据治理的组织与领导。
1.2.2 管理体系
管理体系是进行数据治理的重要基础内容,旨在保障数据治理可以在科学合理的标准和机制下进行,包括制定数据标准、建立数据运行机制、制定数据应用规则、创建数据模型以及制定数据管理与监督制度。
1.2.3 技术体系
技术体系是以数据融合、整合、治理工具为基础,完成数据治理的基本步骤,主要包括数据探查与钻取、数据清洗和整理、数据集成和提升以及数据融合和应用。
1.2.4 执行体系
在全面的数据治理后,将会形成以数据池为核心的数据产生机制、数据管理机制、数据应用规则与数据服务机制。执行体系的建立包括业务梳理、数据分析、考核评估与管控机制等。
1.3 油田数据治理工程解决方案
本文根据庆新油田数据治理思想理念与庆新油田数据治理体系架构,形成了庆新油田数据治理工程解决方案,如图2所示。
图2显示,在数据治理中包含两大核心关键技术:数据治理工具技術与数据池。其中,数据治理工具是整个数据治理工程的技术核心。本文引入长安大学数字油田研究所自主研发的Datist技术,其特点包括强大的数据读取能力,可视化的数据处理过程,丰富的数据处理方法,能够实现数据的提取、清洗、整理、呈现、推送等处理工作,专业的GIS分析功能,实时推送数据功能。
数据池是数据治理的核心部件,主要包括虚拟的大数据库技术与思想。数据库可以存放在云端交织在一起的各类数据,其格式是不同的,可以是Oracle,也可以是MySQL等关系型数据库。数据池兼容多种数据格式,也包含其他非数据文件。各个数据池之间彼此独立,互不影响,无大小、边界限制,扩充能力强。
2 油田数据治理工程实施案例及应用效果
2.1 案列背景分析
本文以开关井日数据台账为例,这是油井动态分析的一项重要工作,主要涉及“开关井日数据表”“单井基础信息表”“油井产量数据表”“关井原因代码表”等多个数据。其中,前三张表存放在A系统库中,这个库的数据量十分庞大,想要查询一条记录往往需要几分钟甚至几十分钟。查询到想要的数据后,还需要对各个表之间的数据进行关联,对关井前的产量进行统计,费时费力,效率低。本文希望通过数据治理,快速而准确地加以解决。
2.2 方法与技术
为了数据的快速、好用,本文需要解决三个问题:查询速度、自动统计、报表呈现。
第一,查询速度。根据管理体系规则,通过数据库技术,定期将“关井日数据表”“单井基础信息表”“油井产量月数据表”中的有效数据同步到数据池中,同步完成后,查询速度从数分钟提高到秒级。
第二,自动统计。依据技术体系的规范,运用Datist数据专家,制作“关井单井日数据台账”的流程。由于Datist强大的数据驱动能力及可视化的处理过程,原本需要掌握复杂数据库知识的数据库开发人员或者编程人员才能完成的复杂程序,现在通过Datist数据专家软件就能快速设计出来。
第三,报表呈现。当数据组织完成后,Datist就可以输出独立的报表。
2.3 数据治理工程效果
实践表明,经过先期数据治理工程的实施和数据池平台的建立,有效解决了一定范围内的数据共享和集成问题,使得数据的录入、转存、同步、查询、过滤等效率成倍提升,取得了显著的效果。例如:完成了包括组织体系、管理体系、技术体系和执行体系的油田数据治理工程体系;形成了以数据治理工具为技术核心、数据池为核心部件的数据治理工程解决方案;数据治理工程也有效解决了一定范围内的数据共享和集成问题;将原来的数据获取时间缩短到秒级,具有速度快、效率高的特点,为开展智能油田建设和油田大数据应用了奠定了良好的数据基础。
主要参考文献
[1]高志亮,梁宝娟.数字油田在中国——油田物联网技术与进展[M].北京:科学出版社,2013
[2]高志亮,高倩.数字油田在中国——油田数据工程与科学[M].北京:科学出版社,2015.
[3]冯莉.数据质量控制体系在油田信息管理中的应用[J].科技创新导报,2012(24).
[4]李清辉,曾颖.油田数据中心建设及发展方向探讨[J].石油工业计算机应用,2005(3).
[5]陈建华.油田中心数据库建设思路与方法[J].中国管理信息化,2014(1).
[6]段鸿杰.油田企业数据中心建设思考[J].数字石油和化工,2007(6).