基于深度学习的电功率转功图模型
2022-11-11张宝王鹏何剑锋王方智孙艺真
张宝 王鹏 何剑锋 王方智 孙艺真
(1.中国石油塔里木油田分公司油气工程研究院 新疆维吾尔自治区塔里木乡 841500)
(2.中国石油勘探开发研究院 北京市 100083)
最近几年来,油田企业将物联网与石油生产过程的深度连接起来,物联网广泛应用于整个产业链,物联网是石油工业数字化、智能化发展的基础[1]。在采油的各个阶段部署传感器,采集到了大量数据,抽油机井的功图是抽油机工作状态的重要表征,它能够很全面地反映出井下的抽油粟的运行情况和油井的工作状况[2]。抽油机的示功图是用来判断抽油机井工作状况的重要手段之一。但是传统的示功图采集方法并不能及时地反映出抽油机的功图,从而影响工作人员对故障做出诊断。
国内外目前得到功图主要分为间接和直接两种方法,直接方法是通过传感器直接测量光杆的载荷。这种方法的缺点是用于测量的传感器价格昂贵,容易损坏,使用寿命短。并且在使用过程中需要停止设备,影响正常生产。同时,这种查看设备功图的方法需要实地采集数据,不能及时处理出现问题的设备,导致原油产量下降,缩短设备使用寿命[3-8]。容易遇见采集的数据漂移和失真、传感器易损坏等问题。因此目前间接采集功图的方法变得非常重要[9]。
至今,在间接预测功图方面,李虎军[10]提出了用电功率曲线计算得到功图的方法,证明了通过功率计算得到功图是可行的。但是需要实际采集的数据复杂,忽略的数据多,导致过程计算复杂且预测功图误差较大。
比较通用的方法是直接用深度学习的方法,建立两个模型,一个模型根据功率预测位移,一个模型根据功率预测载荷,最后画出位移载荷图,即功图,但是无论是根据功率预测位移还是根据功率预测载荷,所处理的问题都是回归问题,而深度学习方法对回归问题的预测能力较差,虽然本方法能够根据功率数据成功预测出示功图,但是预测效果不理想。
针对这个问题,本文提到了新的功率转功图方法,因为深度学习擅长进行0和1的分类问题而不擅长直接预测数值的回归问题,所有本论文将功率预测功图问题设计成一个分类和回归联合预测的问题,分类问题负责得到功图形状,回归负责得到功图的具体位移和载荷,同时引入残差网络,防止由于深度学习层数太深而造成的梯度弥散、特征丢失等问题。
1 相关工作
1.1 特征变换
傅里叶变换是将曲线从时域转换为频域的算法,经过傅里叶变换之后,将数据分为不同频率的部分,可以得到这个数据的更显著的特征。
离散型傅里叶变换公式如下公式(1)所示。
本文采用了一种快速傅里叶变换算法进行特征变换。快速傅里叶变换,即计算机计算的离散傅里叶变换(DFT)。快速傅里叶变换由J.W.Cooley和T.W.Tugey于1965年首次提出。使用此算法可以显著减少计算机计算离散傅里叶变换所需的数字乘法。这种算法对原始曲线的采样的点越多,傅里叶变换得到的结果就越精确。
1.2 深度学习
深度学习(DL,Deep Learning)是机器学习(ML,Machine Learning)领域中一个新的研究方向。近些年来,深度学习在自然语言理解、图像处理、和推荐系统等领域取得了突破性进展[11],已经成为一个比较成熟且使用的数据特征提取工具。深度学习拥有强大的特征提取能力,可通过学习一种深层次非线性网络结构,能够从海量的数据集当中自动提取跟输出值有关的特征。将不同的高维的数据映射到不同维的隐式空间,从而获得数据的统一表征[12],于是本论文设想将深度学习用于功率转功图的领域,利用深度学习对功率数据特征提取从而预测功图。
1.3 残差神经网络
残差网络模型如图1所示,输入数据经过多个隐含层后,与原来的数据进行连接操作。残差网络的作用是,在深度学习的应用中,并不是深度越深学习效果越好,过深的网络结构虽然可以将图片的特征得到更好的拟合,学习到更高层次的特征信息,但同时也可能带来由于深度学习层数太深而造成的梯度弥散、特征丢失等问题[13]。网络表示成:
图1:残差神经网络
1.4 抽油机的功率与功图
原始数据由功率、位移、和载荷数据组成,这些数据来自实际收集的油田数据,包括抽油机功率、载荷、位移、冲刺、冲程、泵效等。功率数据与载荷和载荷数据密切相关。位移载荷图是功图。位移数据可根据冲程数据计算。功图数据非常重要,可以估计油田产量。然而,由于载荷数据不易采集,为了估计油田产量,可以根据容易采集的电力数据预测负荷数据,从而预测示功图。所以得到更精确的计算功图的方法非常重要。
在数据处理过程在我们需要对数据进行归一化处理,归一化处理的公式如公式(3)所示:
2 方法与模型
2.1 朴素的前馈神经网络模型
训练一个五层的深度神经网络,如图2所示,这个模型由两个独立的模型组成,上方的部分负责功率预测载荷,图2的部分负责功率预测位移,为了防止过拟合在输出层之前加入Dropout层,并且在每一层都加入L2正则化项,激活函数是ReLU,作用是加强本模型的非线性拟合能力。ReLU激活函数公式如公式(4)所示。
图2:前馈神经网络模型
2.2 引入残差神经网络的深度学习模型
训练一个五层的深度神经网络,这个神经网络模型在图2模型的基础上引入残差神经网络,如图3所示,隐含层Layer1的输出值不仅输入到隐含层Layer2,并且与隐含层Layer3的输出进行连接处理输入至隐含层Layer4。
图3:引入残差神经网络的模型
2.3 多源特征融合
位移和载荷数据归一化,根据归一化后的位移和载荷数据绘制出位移载荷图,即功图,将功图保存。将功图转化为二维数组,在二维数组中,功图所在的黄色部分的数字设置为1,其他位置的数字设置为0,于是预测功图形状问题转化为一个零一分类问题。取图预测模型Dropout前几层保存为新的模型,将其命名为特征模型,该模型可以提取功率中与功图形状有关的特征,输入是功率,输出是形状特征值。如图4所示。
图4:归一化后功图
融合图片特征和量化特征,将功率经过多个全连接层后得到的特征值和形状特征值连接,将连接值再次经过几个全连接层提取特征,得到位移和载荷,如图5所示,位移和载荷各自独立隐含层,参数不共享。
图5:多源特征联合
2.4 算法描述
算法1:前馈神经网络模型训练方法
算法2:特征联合的残差神经网络模型训练方法
3 实验分析
3.1 实验设置
实验平台为Intel i5-1135G7 2.4GHz,16GB运行内存,1TB固态硬盘,操作系统为Windows11,编程环境为Pycharm,使用的深度学习框架为Tensorflow2.3 版本。
标准差是一种衡量真实位移与实际位移、真实载荷与实际载荷之间的差距的方式。如公式(5)所示,其中x为预测数据y是实际数据。
均方根误差(RMSE):均方根误差是另一种衡量真实位移与实际位移、真实载荷与实际载荷之间的差距的方式。如公式(6)所示,其中x为预测数据y是实际数据。
匹配度:这是衡量两个功图之间相似性的一种新方法。公式如公式(7)所示,其中S1和S2分别为实际功图和预测功图,分别如图红色封闭曲线和蓝色封闭曲线,s1为S1的面积,s2为S2的面积,s3为S1和S2重合的面积。匹配度是判断三种方法的功率预测功图能力好坏的最标准化方法。如图6所示。
图6:预测功图和实际功图匹配度示意图
表1:油田数据集简介
3.2 结果分析
在数据集1中,位移预测结果比较、载荷预测结果比较以及匹配度比较的实验结果分别如图7所示。数据集2的实验结果对比如图8所示
图7:数据集1的实验效果对比
图8:数据集2的实验效果对比
通过油田A的实验结果和油田B的实验结果我们可以看出,随着残差网络的加入和加入形状预测模块,两个数据集中预测的位移和载荷的误差都减小。同时,以匹配度为功图预测标准,随着残差网络的加入,匹配度在两个油田中分别提升0.2%、0.5%,而在功图形状特征加入后,效果比朴素的方法提升0.8%、1.1%,说明我们新提出的特征联合方法,比朴素的深度学习方法的实效果有明显提高。
4 结语
本文提出了一个新的基于深度学习的电功率转功图方法,通过将朴素的功率预测功图模型引入残差神经网络和将这个预测功图数值的回归问题转化为一个分类问题和一个回归问题来改进,分类和回归分别是预测功图形状和预测位移载荷数值。本文在原来回归模型的基础上引入预测功图形状的分类模型来进行电功率转功图。在不同油田的数据集上进行实验,证明了这个改进的电功率预测功图的方法超越了以往的深度学习预测方法。