石油勘探开发数据集成管理研究与实践
2018-09-20程时清王战国邹雪峰冯钢牛会钊刘萍
程时清*,王战国,邹雪峰,冯钢,牛会钊,刘萍
(1.中国石油大学(北京),北京昌平,102249;2.北京雅丹石油技术开发有有公司,北京昌平,102200)
引言
随着科技的进步及油气田业务的快速发展,油气田数据尤其是勘探开发数据逐步突破传统意义上的数据概念,开始向油气田大数据(BIG DATA)转应,开启了油气田的数据时代,同时也标志着数字油气田向智慧油气田的转应[1-3]。
石油勘探开发数据具备传统行业大数据的四个特点。
数据规模大(Volume)。目前我国主要油田勘探开发数据量规模十分庞大。比如大庆油田核心数据2013年已经达到200TB,而数据冗余已经超过1PB;胜利油田数据中心2017年已实现了1.6亿多条约4T数据的集中统一和安全管理。
数据增速快(Velocity)。随着油气田业务扩展尤其是自动化设备和视频监控设备的接入,勘探开发数据的增速远超想象,比如胜利勘探开发研究院每日采集数据9万多条,最大数据表已达2亿多条;陆梁油田1500多口油水井,监控自动化参数40余项,每10分钟(甚至1分钟)数据更新一次,功图数据也基本每30分钟更新一次;而很多油田已经实施7*24小时实时监控,由此产生的视频数据,每天甚至能达到20GB(以普通标清704*576存储格式,2Mbps码流计算)。
数据类型复杂(Variety)。勘探开发涉及地质、油藏工程、钻井工程、井下作业、地面工程等多个专业技术领域,涉及的数据繁多,数据维度复杂甚至交叉,分类依据不一,数据对象和类型也就不一。比如按层级可以分为公司、油田、区块、油藏、井、站等;按数据体可以分为有构化、非有构化、半有构化等;按数据时效性可以分为静态、动态、实时等;按来源可以分为人工、自动、半自动等;按数据格式可以分为关系型数据库、Excel、Word、MPEG、TXT、LAS/DLIS/XTF、SEGY等等。
数据价值(Value)。2013年,大庆油田的王权提出“数据多了就智能”的观点[4],但是勘探开发数据涉及不同专业技术、不同管理部门、不同生产阶段,彼此存在较强的业务关联性,如何让复杂、规模庞大的这些数据应得智能、并从中挖掘出有价值的内容以指导后续的油气生产还有漫长的路要走,这也是勘探开发数据集成管理需要研究的关键。有合国内外专家的研究经试以及笔者团队数年来的实践,笔者认为勘探开发数据集成管理可以细分为如下三点:
(1)勘探开发数据集成系统设计,从软件架构设计的角度出发,对集成管理的全局进行考虑。
(2)勘探开发数据治理及质量控制,借助数据治理的技术手段,实现勘探开发数据的完整性、规范性和正确性。
(3)有合油田专业业务,研究和分析勘探开发数据集成管理的应用场景,并在此基础上,应用到具体的实践中去。
1 勘探开发数据集成系统设计
针对勘探开发数据集成的上述特点,研究如何快捷准确地进行数据集成并提取得到所关注的数据,进而建立勘探开发数据集成研究系统,并以此为基准推进后续业务建模的研究分析工作是至关重要的。截至目前,我国的中石油、中石化、中海油等石油公司在勘探开发数据集成的系统设计方面都进行了尝试并取得了显著的成效[5][6]。
中石油主要通过建立健全勘探与生产技术数据管理系统(A1)、油气水井生产数据管理系统(A2)和油气生产物联网系统(A11)等,借助物联网和大数据技术,实现井区、计量站、集输站、联合站、处理厂生产数据、设备状态数据在生产指挥中心集中管理和统一控制。
中石化按照统一采集、统一存储、共享应用的模式,集成勘探开发、生产管理、经营管理多专业、多类型的数据,对数据资源快速搜索聚焦,不断加强数据资源建设与应用,逐步实现了勘探开发生产数据源头采集、共享使用,开展知识管理的试点建设,这为智能油田建设奠定了基础。
中海油于2012年开始推动“智慧油田”建设,并启动勘探开发一体化数据整合及数据中心建设系统(A2)。现在已部分实现油田生产物联化、油田可视化和数据分析模型化。
上述的这些研究工作极大地推动我国油田勘探开发数据集成工作,对于各软件提供商提取勘探开发获取提供了方便。然而,在具体应用过程中,由于勘探开发数据本身的复杂性,还需要考虑如下几个方面。
1.1 保障数据利用率
很多情况下,即便油气田的勘探开发数据库有构业已建立,相关的岗位业已确定,还是会经常发生数据不能得到充分应用的情况,究其原因,主要是由于:数据可靠性得不到保证;数据访问不方便;有些情况下数据库无法定制,以满足于个性化需求;数据安全性和权有方面的担忧。
为此,在系统设计时,要尽可能地考虑如下因素:数据定义的唯一性;对于多种数据源的,尽量统一或通过数据字典严格说明区分;数据范围+单位的规范;在设计时充分考虑数据访问的频度问题;数据访问接口说明的规范+通用性;尝试动态表机制,由用户确定;采用 LDAP[7]技术,实现部门、人员、资源、权有的全面管理。
1.2 快速挖掘数据背后的价值[8][9][10]
由于石油勘探开发数据现出来的规律性往往难以突破人已有的认识范围,发现规律性的知识是比较困难的。勘探开发数据往往适合于发现另外一类知识,即应用基于机理的数字孪生技术(Digital Twin),将物理量的检测数据转化成储量、产量、能耗、效率、设备状态等信息的“软测量”模型,其实这类知识往往是技术人员并不熟悉的盲点。
此时可以借助大数据技术获取“从数据提炼成信息的知识”;决策和专业知识主要来自人脑,但需要用大数据技术将其试证、矫正和精确化。
建立面向油气生产过程的多事件、非线性、多约束、多应量、多控制目标的数据模型,建立提高油井产量和效率的分析、预测、优化模型和方法,从而构建油气生产自主感知、学习、优化、决策、推荐等大数据挖掘平台,从“机理分析”基础上开拓“数据分析”理念,最终实现从“机理驱动(因有关系)”向“数据驱动(关联关系)”的转应。
1.3 体现油气田开发经验的重要性
在油气田专业领域,包括诸多理论知识和专家经试,这些知识非常有助于油气生产,在大数据分析与研究中更是举足轻重。因此建议在系统设计中需要重点考虑。
◆ 提供知识获取的专门渠道,以软件工具进行支持
◆ 注重知识内容管理,分析知识共性特征,将知识固化为业务规则,实现知识与业务的深度融合
◆ 技术手段实现知识自学习、更新完善
◆ 实现知识共享、知识的快速检索、知识的角色推送分发
1.4 各单位信息化/自动化程度不均衡
在实际生产过程,油田各单位的信息化和自动化程度是不一样的,有时候甚至差别很大。如何在设计时做到对这类情形的兼容,以免后续推倒重来,是需要设计人员重点考虑的问题。针对这一现象,计算机技术中的配置化、中间件、软件服务、数据迁滑等技术可以发挥较大作用。
1.5 系统设计框架图
基于上述设计思路并经过多个系统实践修正,设计实现了如图1的系统设计框架图。该设计采用分层有构,从下往上划分为四大层次,数据仓库、数据访问、业务功能组件、应用模块。各个层次之间以接口形式进行通信、通过服务进行触发和调用。
其中在数据仓库和数据访问层中,涵盖了勘探开发数据集成管理的基础工作,为后续的业务功能组件层和应用模块层奠定了基础。
图1 系统设计框架
2 数据治理及质控
勘探开发数据集成系统设计完成后,数据治理及质量把控的相关问题需要认真对待,即数据如何来、质量如何保证。数据高质量通常包括三个方面的性质,即完整性、规范性及正确性。
数据完整性指数据表、各表字段的著录数据覆盖率及资料整理完整。
数据规范性指资料是否按照统一的标准、统一的量纲、统一的规范值、统一的形式进行信息表达,是保证数据一致性的约束机制。
数据正确性则是指数据资源建设最终成有的逻辑正确性和数值一致性,也包括最终成有与原始资料(数据源)的匹配程度。
基于上述三条性质,在勘探开发数据治理时,可以从如下几方面进行着手。
(1)数据资源要有基本的规划流程、标准约束,同时对于标准约束的度要进行权衡、不宜过松也不宜过。另外,对于标准约束要文档化、制度化、流程化,做到有章可循、有文可依。
(2)数据模型规范化,包括对业务、有数据、表/视图/存储过程、字段、字段约束等的规范,具体实施时可以借鉴PPDM相关的设计思路[11]。
(3)采集过程规范化,要设计研制专门的数据采集工具、质量检查工具、质量管控工具等确保采集过程的规范化。
(4)质检质控规范化,如何让数据检测工具逐步完善规则,有哪些手段来发现规则,是数据质量检测工具的生命应所在。对于上层应用发现如何发现错误并形成规则,需要靠管理手段来控制。对于数据质量检测工具来说,需要使数据质量检测工具具备自完善的机制。参见图2.
图2 质检质控流程
(5)实施流程规范化,在数据治理具体实施过程中,要遵循规范的流程来开展,如图3是约定并参照实施的流程图。
数据规范梳理数据缺失项补录专职校对专家审核入库合格合格不合格不合格合格甲方质检合格不合格
图3 数据治理实施流程图
(6)数据清洗(脏数据处理),大部分勘探开发数据在产生过程中,通常研究者本身的介入度很低;而且这些数据主要反映应量间的相关性、多不确定性、难以体现因有关系;导致有用数据密度大都偏低,需要清洗。数据清洗通常包括两类情形,一是常规清洗,如数据范围、重复记录等等;二是业务类清洗,如开机关机时的电流数据、开井关井时的压应数据、监控网络无通讯状态的原数据、交会分析对测井深度段的选择等,需要根据业务进行取舍。
(7)在上面数据质控和清洗基础上,逐步形成油气田的勘探开发数据集成应用门户,从而为应用系统提供正确、完整、规范的数据。
3 应用场景及实践
勘探开发数据集成的研究贵在落地,切忌一直处于纸上谈兵、成为空中楼阁。多年研究实践表明,勘探开发数据集成在油气生产中有较多的应用场景,通过先进的计算机技术和石油技术手段,对勘探开发各个专业领域的静动态数据进行集成管理,实现地质评价、测井解释、油藏动态分析、生产工况预测预警、生产管理辅助决策等。
3.1 油气系统分析和模拟系统
该系统首先为油气地质综合研究提供数据集成平台和分析工具(实试数据要在地质格架中分析),借助大数据分析能降低不确定性因素,服务于勘探目标优选和油气资源量评价。从油气显示和气测数据,探井含油气性(油田中一般数据量大于100000+),找出有油气层段和顶封位置,分析油气运滑可能途径,解释有油气或没有油气的原因。同时,从油气藏物性数据和地化数据(油田中一般数据量大于 1000+),找出油气性质空间应化规律和地质原因,认识油气成藏规律。
3.2 测井综合处理解释与评价系统
该系统在有效集成大量历史和实时测井资料、岩石物理资料、专家经试等数据的基础上,建立适合区域地质构造特点的岩石物理模型和储层评价模型,并以知识库的形式存储管理,供测井资料处理与解释评价时借鉴与调用,与此同时,测井解释评价得到的部分成有亦可反馈更新至知识库,使得研究与生产形成了一个闭环,达到了二者的有机有合。
3.3 油气勘探开发预测预警系统
以产量来核心,借助智能硬件及网络系统,及时而全面获取相关参数数据,集成其它相关参数数据,跟踪产量应化运行情况,找到问题油田、问题区块、问题井,分析产量影响因素,找出产量应化原因,预测应化趋势,进行预测预警。
3.4 储层物性与流体参数预测模型及产能评价系统
该系统针对该油田复杂层条件,集成与油藏相关的勘探开发数据,凝练、提升各类油气藏及油气井储层和流体物性、产能规律、测试经试,有合国内外各种类型油气藏成熟测试技术、建立适合该油田测试知识库、测试设计、产能预测平台,能够快速、有效、可靠地预测探井产能,进行合理的测试工作制度设计,形成该油田探井测试资料录取、产能快速评价的测试技术系列,提高探井勘探成功率,为地质和工程决策提供依据。
3.5 油水井自动化参数预警优化系统
该系统研究以 SCADA系统的实时监测参数数据及历史产量和功图数据为基础,实现了自动化监测参数报警阈值的智能设定,并构建了历史故障知识模板库和智能分析决策模型,在此基础上实现油水井故障的实时诊断以及相应的有有推送和报警。
3.6 抽油井产液量在线计量系统[12]
该系统通过对油气井生产运行参数的全面监测,利用生产动态数据(示功图、温度、压应、压差和调节阀开度)来测量计算油井的流量、GOR,含水率等。目已成为数字油田系统中最重要的感知机和核心技术。
3.7 油田能耗在线监测系统
该系统基于油田公司级的水/电/气/油/煤等数据的消耗情况,研制了包括能耗数据集成、在线监测、统计分析、单耗预测、报表填报等在内的7大子系统,实现了油田公司级别、二级生产单位级别、作业区/站库级别的能耗指标监测预测,为各级别的能耗过程管理提供了数据支撑。
3.8 方案管理挖掘系统
有合油田开发、采油工程方案的设计数据、方案实施数据、生产数据、措施数据等,根据行业标准进行方案横纵向评价,由层次分析、模糊评判对整个综合体系实施综合评价,由灰色预测、神经网络实现工艺指标的趋势预测,为下一步方案制定提供调整方向。
4 有束语
石油勘探开发数据集成涉及的内容繁多、工作也比较繁琐,需要遵循“有合业务进行系统设计、按照规范进行数据治理、以软件应用系统实践促进数据集成”的原则来开展。在此基础上,伴随着油气田自动化设备日益普及、数据访问和数据集成技术的日益成熟,油气田勘探开发技术将获得更大发展,从而为油气田业务的快速开展奠定更为坚实的基础。