钻井风险动态识别中数据仓库技术的应用研究
2012-11-15刘志坤中国石油大学石油工程教育部重点实验室北京102249西安石油大学石油工程学院陕西西安710065
刘志坤,李 琪 中国石油大学石油工程教育部重点实验室,北京102249 西安石油大学石油工程学院,陕西 西安710065
刘应学(中石化江汉油田分公司清河采油厂,山东 寿光262714)
刘洪山(中国石油天然气管道通信电力工程总公司,河北 廊坊065000)
文 亮(西安石油大学石油工程学院,陕西 西安710065)
钻井风险动态识别中数据仓库技术的应用研究
刘志坤,李 琪 中国石油大学石油工程教育部重点实验室,北京102249 西安石油大学石油工程学院,陕西 西安710065
刘应学(中石化江汉油田分公司清河采油厂,山东 寿光262714)
刘洪山(中国石油天然气管道通信电力工程总公司,河北 廊坊065000)
文 亮(西安石油大学石油工程学院,陕西 西安710065)
为满足钻井施工过程中不同部门、不同层次技术人员钻井风险动态识别的需求,提出应用数据仓库技术构建钻井风险动态识别系统。阐述了钻井风险动态识别系统的总体结构,指明了数据仓库在系统中处于历史数据中心的位置,详细描述了数据仓库的逻辑结构、结构设计与实现。通过建立其数据仓库系统,对有关地质、钻井和录井多领域大量历史数据进行综合管理与应用,为不同领域专家、决策人员进行网络环境下的风险动态识别和控制提供统一、方便的数据平台。
钻井工程;风险识别;数据仓库
石油钻井是一项分布范围非常广泛、连续作业的隐蔽性地下工程,钻井过程中经常会遇到一些预想不到的问题,存在着大量的复杂和不确定性因素[1,2],再加上钻井作业环节多、工种工序多、立体交叉多,受到人员技术水平、作业装备能力以及管理规范等因素的限制[3],使得钻井施工潜在很大的风险,如果能在事故发生之初甚至是事故发生之前就能及时有效地识别出风险,并向现场作业人员发出警告,从而通过采取有效的措施以避免事故的发生,将是从根本上解决钻井事故复杂问题的可能途径之一。但及时有效的风险识别是需要在大量可靠的历史数据和实时测量数据基础上,充分考虑地质、钻井、测井和录井多领域数据的共享,基于一定的专业软件及模型和数据分析结果,由钻井现场和油田基地不同专业领域的专家共同决策来完成。这就对来自这些不同专业数据的一致性和灵活、方便的组织方式提出了更高的要求,传统的数据库及其管理系统由于数据之间的关联程度较低,缺乏有效的集中存储和管理机制[4],不能提供风险动态识别所需要的不同层次综合型的数据。如何在统一的数据平台上综合利用钻井现场和基地的各类数据资源,及时、准确地获取钻井过程中的数据以及来自基地的决策信息,对钻井技术人员进行科学、准确地识别作业过程中的风险至关重要。为此,笔者提出运用数据仓库技术构建分布式钻井风险动态识别系统,为地质、钻井、录井和测井多领域专家、施工人员和决策人员进行钻井风险动态识别和控制提供方便、统一的数据分析处理平台。
1 钻井风险识别中数据仓库系统所处的位置
1.1 分布式钻井风险动态识别系统总体结构
通常情况下,钻井作业风险识别、监控、实时预警分布在远离油田基地的现场,而风险评估及决策通常在油田基地完成,需要利用大量的历史数据、专业软件及模型以及不同领域专家决策的信息共同支撑来完成。从系统的功能、用户级别及用户所处的工作环境考虑,笔者提出利用数据仓库技术构建分布式钻井风险动态识别系统,其体系结构如图1所示,系统总体上分为井场和基地两级系统。
1)井场级钻井风险动态识别系统 主要任务是负责对钻井过程中引发事故的施工状态进行实时监测,并在油田基地的远程协助和决策支持下,及时有效地对钻井过程中发生的风险进行动态识别和预警。通过井场测量系统获取钻井数据、测井数据、录井数据、地层评价数据等实时信息,将这些实时信息存储到井场的实时数据库中,并通过远程通信传输到基地。基于随钻实时信息和来自基地的大量历史数据对钻井过程中的风险因素进行特征提取,由现场技术人员和基地的专家共同据此做出预警分析,使现场技术人员在得到基地专家支持和数据支撑的基础上对现场作业的风险进行动态识别。
2)基地级钻井风险动态识别系统 地处偏远地区(深海、极地、沙漠腹地)、没有直接监控钻井施工过程,它通过网络和井场级风险识别系统对远程的钻井现场作业进行监控。基地级的主要用户是油田基地的领导、专家及技术人员。通过现场传输回来的实时数据和从地质库、钻井库、测井库、录井库等数据库中按照一定规则提取出来的历史数据,在专业软件、专家系统的支持下,实现对远在井场的钻井施工进行特征提取、预警分析和风险评估,并集成各种来源的防范与处理知识,提供多方协同工作环境,使分布在不同地点的多方专家、技术人员能通过网络对现场钻井作业进行指导、协同进行钻井风险动态识别以及随钻实时控制。
1.2 数据仓库所处位置及逻辑结构
由分布式钻井风险动态识别系统的体系结构可以看出,无论是井场级还是基地级,风险的动态识别都需要两类信息的支撑:一类是通过测量系统获取的随钻实时数据;另一类是来自地质、钻井、测井、录井等方面的历史数据以及相应的模型和知识,这些历史数据通常来自不同数据源,需要构建数据仓库系统来实现数据高效、快捷地查询、读取和利用。数据仓库系统在 “分布式钻井风险动态识别系统”中处于 “历史数据中心”位置(如图1所示),通过远程通信为现场和基地技术人员进行协同钻井风险动态识别构建统一的数据平台。
数据仓库系统的逻辑体系如图2所示,依据数据仓库的功能分为基地数据仓库和井场数据仓库两层:基地数据仓库按照一定的规则,根据风险动态识别的具体任务从地质数据库、钻井数据库、录井数据库、测井数据库以及属性库、模型库和知识库中提取、转换和集成相应的历史数据,一方面为基地的领导、专家和专业技术人员进行风险评估和决策提供技术依据,另一方面作为井场级的数据源通过远程通信与井场数据仓库相连;井场数据仓库根据现场技术人员进行风险特征提取和预警分析的实际需求,按照一定的规则从基地数据仓库中提取、转换和集成相应的历史数据、模型、知识和决策信息。每层数据仓库的建设可以分为3步:数据提取、数据管理与数据使用。基地的数据流程为:从地质数据库、钻井数据库、录井数据库和测井数据库等数据源中提取数据,经ETL过程,进入基地数据仓库进行存放,再根据不同的应用主题,借助前端访问和分析工具从数据仓库中获取数据,供基地用户使用。井场的数据流程为:以基地数据仓库作为数据源,从中提取数据,经ETL过程,进入井场数据仓库进行存放,再根据不同的应用主题,借助前端访问和分析工具从数据仓库中获取数据,供井场用户使用。无论基地数据仓库还是井场数据仓库,其管理均以元数据为中心,元数据包括整个数据仓库资源中的对象和数据结构定义、数据源字典、数据仓库模型字典、主题字典、数据转换描述、数据源信息、源数据到目的数据的映射、数据更新规则、访问权限、操作日志等。
图2 钻井风险动态识别数据仓库系统逻辑结构
2 数据仓库系统的结构设计与实现
由于地质、钻井、测井和录井这些专业的数据库以ORACLE居多,考虑到数据仓库与底层数据库的兼容性,钻井风险动态识别数据仓库设计环境和开发工具选择技术上成熟的ORACLE 10g作为支撑。
2.1 主题设计
数据仓库是面向主题的,因此数据仓库设计的第一步就是确定其主题[5]。主题是在较高层次上将数据归类的标准,通常反映设计者最关心的问题,本文根据钻井风险动态识别的实际需求,确定了地层压力风险识别、井壁稳定风险识别、特殊岩性地层风险识别、高压气体地层风险识别、轨道设计风险识别、井身结构设计风险识别、钻进及水力参数设计风险识别、油气井压力控制设计风险识别、钻井井下作业动态风险识别、地面重大事故风险识别、事故复杂统计、区域钻头统计、区域钻井液使用统计等20个主题。
2.2 数据仓库模型设计
钻井风险动态识别数据仓库的结构按照上述主题来分别设计,每个主题的逻辑结构均采用星型模型[6],下面以 “事故复杂统计”主题的设计为例(如图3所示)。
1)设计维度 事故复杂统计主题共有9个维:①油井维;②时间维;③事故复杂类型维;④发生地层维;⑤发生经过维;⑥处理情况维;⑦直接损失维;⑧专家意见维;⑨信息完整度维。
2)设计层次或类别 层次是指在一个维度内为表述不同细节程度而按顺序划分的阶层,如时间维分为年、月、日、小时、分钟5个层次;类别是指按一定标准对一个维全集的分类,如直接损失分为损失时间和损失金额。
3)设计度量指标 事故复杂统计主题的度量指标为损失时间和损失金额。
4)设计模型 事故复杂统计主题采用星型模型。
图3 事故复杂统计的星型模型图
2.3 数据的存储结构设计与实现
钻井动态风险识别数据仓库的实现,主要针对所确定的20个主题,分基地和井场两级,每个主题都以事实表为中心通过每条记录中的指针与维表相联,指针一般是维表的主关键字,每一维建立一个维表、相应的层次或类别表以及详细信息表。维表根据表述的细节程度和类型不同,通过层次或类别表中的指针与详细信息表相联。这样的组织结构便于基地和现场的技术人员从不同角度、不同层次,根据获取数据粒度和详细程度的需求进行数据获取。
2.4 数据呈现
构建钻井风险动态识别数据仓库的目的是为了给基地和现场技术人员进行钻井风险动态识别提供统一的数据平台,各类用户在进行风险动态识别时会根据自身承担的任务和需求从数据仓库中获取数据和查询专家意见。这就要求数据呈现的形式更应该灵活、方便,以满足不同类型数据呈现的要求。数据呈现是通过前端访问和分析工具采用ORACLE的Data Mining,利用Data Mining可方便、灵活地为用户提供一种动态查询方式,满足基地和现场领导、专家和工程技术人员风险动态识别和评估的要求。
3 结 论
石油钻井施工存在很大的作业风险。风险的动态识别需要地质、钻井、测井、录井等多领域随钻数据和大量可靠的历史数据作为数据支撑,由不同专业领域的专家共同决策来完成。而不同专业的历史数据存储形式和位置各不相同,这就需要运用数据仓库技术将这些分布在不同领域的历史数据按照不同层次、不同部门的需求进行抽取、转换与集中,形成不同层次的汇总数据,构建为包含基地数据仓库和井场数据仓库两层的钻井风险动态识别数据仓库系统。数据仓库在钻井风险动态识别系统中处于 “历史数据中心”的位置。笔者根据数据仓库实际的应用对象确定了20个主题,采用星型模型对其进行了设计和实现,克服了传统数据库系统数据利用不足的问题,为实现基地和现场多领域专家、技术人员和决策人员进行钻井风险动态识别和控制提供方便、统一的数据分析处理平台。
[1]李琪,徐英卓.基于知识集成的石油钻井风险管理系统研究 [J].石油学报,2009,30(5):755~759.
[2]李琪,于琳琳,刘志坤,等.钻井风险因素综合评价方法及模型建立 [J].天然气工业,2008,28(5):120~122.
[3]黄仁山,苏勤.钻井工程事故例析与钻进安全对策 [J].石油钻探技术,1998,26(4):54~57.
[4]刘志坤,李琪,高晓荣.导向钻井远程决策指挥中数据仓库技术的应用研究 [J].钻采工艺,2007,30(3):13~15.
[5]Micheal B.Data warehouse and decision support system [J].M Computer,2001,34(12):38~39.
[6]张维明.数据仓库原理与应用 [M].北京:电子工业出版社,2002 .
Research on Influential Factors of Sandstone Reservoirs
LIU Tie-ling(Author's Address:Institute of Geology and Geophysics,Chinese Academy Sciences,Beijing100029,China)
Based on core porosity analysis and logging digitalization data,as well as Time Average Formula in acoustic wave propagation put forward by Willey,the factors affecting sandstone reservoir acoustic interval transit time(AC for short)were studied.And it was pointed out that there was no one-to-one correspondence between AC and porosity of sandstone reservoirs,and the argillaceous interstitial material content in sandstone reservoir,degree of compactness together with fluid components were important factors affecting AC.Moreover,correspondent correcting methods are put forward for different influential factors,after correction and core analysis,porosity and acoustic porosity correlation improve significantly;and the superiority is reflected in the permeability results,explained permeability coefficient of permeability and core related is as high as 0.9597.Because the model refers to many influential factors and specific correcting methods of all influential factors are put forward.Therefore,the method can be widely used and it is of great significance for improving the accuracy of reservoir porosity and permeability interpretation.
argillaceous interstitial material;fluid component;acoustic interval transit time;porosity
TE28
A
1000-9752(2012)04-0106-04
2012-01-10
国家自然科学基金项目(51074125);陕西省重大科技创新项目(2009ZKC02-27)。
刘志坤(1976-),男,2000年大学毕业,讲师,博士生,现主要从事油气井力学与控制工程、钻井信息应用技术等方面的研究工作。
[编辑] 萧 雨