基于油气生产信息化的工况智能诊断技术研究
2020-04-24张继庆
张 继 庆
(石油开发中心有限公司,山东 东营 257000)
石油开发中心有限公司已基本完成了“四化”建设。按照数字化生产现场目前的业务需求,通过系统建设,实现了生产参数的实时采集与存储,为工况的智能诊断提供了数据基础。本文利用数据挖掘、归一化处理和构建BP神经网络的方法来实现,油气生产信息化条件下的工况智能诊断。
1 工况数据挖掘
数据挖掘技术是数据库知识发现的一个步骤,数据挖掘是指通过特定的算法搜索海量数据中所隐藏信息的过程。数据挖掘通过数据库技术、统计分析技术、情报分析技术、机器学习技术等诸多方法来实现目标[1,2]。
在油气生产中大量生产参数存在相关性,但这些相关关系相对隐蔽,通过经验或常规相关性分析难以发现,因而需要借助数据挖掘技术进行进一步分析。
1.1 数据关联分析
关联分析就是发现海量数据的数据关联性或相关性,生产参数根据采集频率分类,可分为日数据、半小时数据和分钟数据,见表1。
表1 生产参数表
但并非所有数据都与工况变化存在关联,因而需要对这些参数进行数据挖掘,在数据挖掘之前需要进行关联分析,对数据进行分类处理。
本文根据经验,总结了与工况存在关联性的参数如表2所示。
表2 工况相关生产参数表
由于最大载荷、最小载荷、功图面积都在示功图中体现,下文数据挖掘中不单独分析。
1.2 数据挖掘方法
参数与工况的改变是同时发生的,研究的依据是进行辅助参数的与工况之间相关性的分析并通过参数变化趋势与工况的变化来判断工况与参数之间的关联性。首先通过对数据库油井对应工况的标记,获得油井在某一时刻、某一天的工况类型,如正常、供液不足、油稠缓下、出砂的标记。第二,比对不同参数在工况变化时的变化情况,通过对线性数据的变化进行归一化处理,得到参数变化的幅度指标,并判断参数变化与工况之间是否存在联系[3]。
在t时刻或t日期前的T时间内该参数存在最大值M1与最小值M2,工况变化前后的参数值为m1(后)和m2(前),M1与M2的差值为ΔM,m1和m2的值为Δm,Δm/ΔM为变化的幅度指标A,本文将A大于0.3或小于-0.3认为是有效关联变化。
变化分类设置三种:基本不变、上升、降低(见表3)。
表3 指标A分类标准表
1.3 数据挖掘应用
参数在采集与存储过程中由于频度的不同,与工况的相关性也需要区别分析,本文分别对日数据、半小时数据及分钟级数据进行相关性分析。
其中,日数据取泵径、日产油量、日产液量、含水率、日耗电量、杆径、沉没度,对于日度数据,T取15 d,即15个数据点。将选取的石油开发中心336口抽油机井2年的历史数据进行运算分析可以得到正常工况与异常工况对比,占比最多的参数变化情况[4,5]。半小时数据是与功图相关的数据,半小时数据取平衡率、上行电流、下行电流、上行功率、下行功率,其中T取7.5 h,即15个数据点。分钟级数据取温度、回压,T取15 min,即15个数据点。
通过对上述分析可以看出,平衡率、上行功率、下行功率三个参数与工况的相关性弱于上行电流、下行电流与工况的相关性,进一步分析可得到参数与工况的关联关系,见表4。
所得关联关系即可用于与传统经验进行对比,并补充完善到传统知识体系中去,同时总结出的强相关参数可以作为智能工况诊断的训练参数。
2 基于BP仿真模型的智能诊断
本文就基于大数据进行参数模拟及预测,通常情况下需要油气生产系统参数的数学模型作为优化的函数基础,由于部分关联数据之间存在非线性关系,故选择使用大数据训练BP神经网络,并使用BP仿真模型代替数学模型[6]。
表4 强相关参数变化与工况对比表
2.1 BP神经网络基本理论
人工神经网络是人类在对自身大脑研究的基础上,使用计算机技术对自身大脑神经结构和运行方式的模拟。基于此方法构造出大量以神经元为单位且相互连接的非线性网络,此网络具有极强的仿真模拟功能,目前在仿真模拟方面较为可靠的网络是BP网络。
BP神经网络意为前反馈型神经网络结构,由输入输出层以及隐层构成[7],其中具有一个隐层的BP神经网络应用最多,神经网络中的同一层之间的神经元之间不连接而层与层之间的神经元相互连接,如图1所示。网络学习训练过程可划分成正向传播和反向传播过程两个部分,经过正向和反向传播过程多次反复传播直至误差函数达到最小值或者计算次数达到设定的最大次数为止,这样经过反复训练过的神经网络就成为具有特定功能的网络模型[8]。
2.2 BP神经网络模型建立
通过数据挖掘确定6个与工况强相关的参数,并与示功图一同用于工况诊断模型的训练中。首先进行数据归一化处理,将功图数据200个点进行横纵坐标的分解,分别获取最大值和最小值,最小值加最大值为上限值,0为下限值。所有数值除以上限值并乘以100,得到归一化数值l和f,归一化数值在归一化坐标中重新形成新的闭合曲线O。
在归一化坐标系中等距设立441个坐标点,并以(0,0)—(20,20)分别命名,通过程序比对,计算出各等距坐标点的被覆盖情况,位于新的闭合曲线O内部的坐标点赋值N为1,新的闭合曲线O外部的坐标点赋值N为0。此时功图归一化完成。
通过归一化处理,分属两井的两个在原坐标中不相重合的同一工况的示功图基本覆盖了相同的坐标点。相同类型的工况功图所覆盖的等距坐标点具有良好的相似性(见图2~图5)。
在本文的工况诊断模型中,油井工况类型X,其主要关联因素有功图覆盖点数据N、油井产液量Q、耗电量E、上行电流IS、下行电流IX、温度T、回压Ph。将选取的石油开发中心336口抽油机井2年的历史数据中的5万组数据对工况诊断神经网络进行训练,经过正向和反向传播过程多次反复传播,直至误差函数达到最小值或者计算次数达到设定的最大次数为止。经过多次训练,选取收敛效果好且误差较小的网络,作为工况模拟网络模型(见图6)。
在BP模型建成之后,选取3 000组未参与训练的数据来检验神经网络的精度,结果显示通过BP模型诊断的总体正确率为96.6%,其他各项正确率均在90%以上,只有结蜡诊断正确率为73.3%,其他各项工况预测均在90%以上,见表5。而结蜡诊断正确率低的原因在于结蜡现象的外部表现较为隐蔽,传统判断方式是难以判断的。综上所述,工况诊断BP模型误差较小,可用于实际生产中辅助决策。
表5 工况诊断BP模型精度分析表
3 结语
本文通过数据挖掘方法对影响工况的诸多参数进行分析,确定与工况有强相关关联的生产参数,并对示功图进行了归一化处理。将示功图数据与强相关参数数据用于训练工况诊断BP神经网络,得到了工况诊断BP神经网络。该网络的诊断正确率达到96.6%,工况诊断误差较小,可用于实际生产中辅助决策。