APP下载

基于长短期记忆神经网络的油田注水预测

2022-01-14于志刚张德政宋文江辛小军

吉林大学学报(信息科学版) 2022年1期
关键词:神经网络时刻油田

于志刚,张德政,宋文江,葛 嵩,辛小军

(1.中海石油(中国)有限公司 湛江分公司,广东 湛江524057;2.中法渤海地质服务有限公司 湛江分公司,广东 湛江524057)

0 引 言

在复杂断块油藏注水开发过程中,由于注水井层间矛盾突出,油水分布、运动规律复杂,会导致油田开发时低渗透层吸水情况差,影响水驱油田的开采率。为改善油田注水开发的效果,对注水指标进行科学可靠的预测,需要一种能提高工作效率和预测精度的预测方法[1]。人工智能算法在工程领域已被广泛应用。BP(Back Propagation)神经网络已经成功应用于棉纱强度[2]和海洋区域经济的预测[3],但其存在收敛速度慢,网络结构选择不统一的缺点。全连接神经网络(FCNN:Fully Connected Neural Network)预测模型,在软件缺陷预测[4]上表现出较好的效果,但其无法考虑到数据在时间上的相关性,难以预测时间序列数据。基于改进循环神经网络(RNN:Recurrent Neural Network),即长短期记忆(LSTM:Long Short-Term Memory)网络预测模型,在交通流量[5]和油田产油量预测[6]上得到了广泛应用。该模型能考虑到数据在时间上的相关性,捕捉到序列的历史信息,并将其运用于当前输出的计算中,可以有效地解决其他神经网络无法适应时间序列数据的问题[7],弥补了RNN神经网络可能存在的梯度消失、梯度爆炸的缺点,以及在长时间序列的处理上存在的记忆力不足问题。

综合考虑油田注水的实际生产情况,结合注水的历史数据和影响因素,笔者选取LSTM神经网络建立注水预测模型,获得一种预测精度高,适应性强的预测方法。在对某油田的未来注水量的预测中,与传统RNN预测模型进行对比,结合评价指标和注水预测曲线对模型的注水效果进行了分析。

1 预测模型的建立

1.1 RNN预测模型

对于油田注水预测模型,其输入输出数据是有关联的。油田注水量除了受到油压、套压和技术因素等影响外,还存在较强的时间相关性,而传统的神经网络输入输出数据相对独立且关联性较差。基于之前信息,引入文献[8]中如图1结构带有记忆性的RNN。x,S,o为3个向量,分别表示输入层、隐藏层和输出层的值。U、V、W分别表示输入层与隐藏层、隐藏层与输出层、隐藏层与隐藏层的权重矩阵。则有

其中st为t时刻的隐藏状态;xt为t时刻的输入;st-1为前一时刻隐藏状态,ot为t时刻的输出;f和g分别为输出层和隐藏层的激励函数,bs、bo为隐藏层和输出层的偏置。

图1给出了RNN在3个相邻时间步的计算逻辑。在st-1时刻,为保存上一时刻的隐藏变量st-1引入的权重参数W,用于描述在当前时刻如何使用前一时刻的隐藏变量。隐藏状态st,是将输入st-1和前一时刻隐藏状态st-1连接后输入一个激活函数为f的全连接层。该全连接层的输出就是当前时刻的隐藏状态,且模型参数为U与W的连结,偏差为bs。当前时刻t的隐藏状态st将参与下一时刻t+1的隐藏状态st+1的计算,并输入到当前时刻的全连接输出层ot。此外,在不同时刻的计算中,网络中的这些参数也始终被RNN使用,所以RNN模型参数的数量不随时间步的增加而增长。

图1 RNN结构Fig.1 RNN structure

给定油田的输入数据x={x1,x2,…,xt,…,xT},根据式(2)计算隐藏层状态s={s1,s2,…,st,…,sT}和输出o={o1,o2,…,ot,…,oT}。T为所采用时间段内根据采样间隔计算的采样点数量。

1.2 LSTM预测模型

在油田注水的预测模型中,若采用的数据为时间间隔持续扩大、周期较长的众多数据,可能会出现梯度爆炸和梯度消失的现象[9]。针对此问题,引入文献[10]中基于传统RNN改进的神经网络如图2所示,即LSTM神经网络。在传统RNN的基础上引入了控制门结构,由记忆单元、输入门、输出门和遗忘门组成。通过控制门机制,可使LSTM神经网络能稳定传递和更新时序信息,有效地将长距离信息保存在隐藏层中。t时刻每个门的输入数据都是上一时刻的输出st-1与当前时刻输入xt构成的向量[st-1,xt]与其权重的点乘。

图2 LSTM结构展开Fig.2 The LSTM structure expansion

LSTM模型的各个控制门的计算公式如下。

1)遗忘门。信息通过遗忘门,控制需舍去的信息,其通过Sigmoid激励函数的输出值([0,1]区间内的值)决定。计算在t时间步记忆单元遗忘层的值,遗忘门计算公式为

其中Δ为Sigmoid激励函数,ft为t时刻Δ函数的输出,Wf为遗忘门的权值向量,st-1为上一时刻的输出,xt为当前时刻输入,bf为遗忘门的偏置向量。

2)输入门。第t时间步输入数据率先通过输入门,第t时间步记忆单元输入层的值和隐藏层状态的候选值分别为

其中tanh为双曲正切激励函数,it为t时刻Δ的输出,为t时刻tanh函数的输出,Wi、Wc为输入门、记忆单元的权值向量,bi、bc为输入门、记忆单元的偏置向量。

3)对记忆单元进行更新,从而得出t时刻的记忆单元更新值

其中ct为t时刻长期记忆,ct-1为上一时刻记忆。

4)输出门。控制决定需要输出的信息,根据计算得到的记忆单元更新值,第t时刻步记忆单元输出层的值以及最终记忆单元的输出值分别为

2 注水预测实现及分析

实验采用某油田任一层位的某一时间段的注水数据,综合考虑油压、套压等影响因素,建立LSTM神经网络模型,通过网络训练,预测未来的注水量,并与传统RNN预测模型进行比较,根据评价指标的数据和实验的预测效果,分析LSTM注水预测模型的可行性。

2.1 数据来源

笔者选取某油田2015年的注水开发数据,其数据记录折线图如图3所示。

图3 注水数据折线图Fig.3 Line chart of water injection data

其中将2015年11月某一时段的数据作为训练集,用于拟合模型,这一时段的后半部分的数据作为验证集,用于确定网络结构和模型参数。隔5 s记录一组数据,共计取777组数据。模型的输出变量是油井的注水量,输入变量包括注水量、套压和油压。

2.2 数据标准化

在建立油田注水预测模型过程中,数据输入时,可能会存在取值范围相差较大的问题,需避免数值过大的特征值输入对预测结果的影响,所以有必要对数据进行预处理,即数据归一化,将输入数据转换为标准正态分布,以平衡特征间的数值差异,提高模型训练的速度与稳定性。数据归一化的计算公式为

其中xnom为标准化处理后的值,x为原始值,xmax为样本数据的最大值,xmin为样本数据的最小值。

2.3 评价指标的选择

为评估LSTM模型在注水预测上的准确度,笔者选取均方根误差(RMSE:Root Mean Squared Error)、平均绝对误差(MAE:Mean Absolute Error)、决定系数(R2)作为评价注水预测模型精度的指标,方程如下

笔者采用Windows系统下Python语言进行编程,其中主要通过Keras深度学习库实现LSTM神经网络的搭建,选取LSTM神经网络预测模型对油井注水量进行预测,具体实验流程如图4所示。首先随机初始化LSTM神经网络参数,隐藏层神经元个数为50,输出层为1个神经元,模型训练次数为60,每次抓取用于训练的批次大小为72。网络优化选用Adam优化函数,用于计算神经网络每个参数的自适应学习率。将数据集按一定比例划分,训练集占62%,测试集占38%,利用训练集对模型进行训练,模型训练结束后,再用测试集对模型进行评估。

图4 实验流程图Fig.4 Flow chart of experiment

2.4 仿真实验与分析

根据已设定的数据比例进行网络训练与验证,不同算法的评价指标对比如表1所示。数据显示,LSTM模型下的RMSE降低了13.95,MAE降低了9.3,数值大幅降低,R2由0.40增加至0.99,说明RNN预测准确性与LSTM神经网络相比差距较大,因此基于LSTM构建的预测模型效果要优于RNN预测模型。

表1 不同算法预测性能对比Tab.1 Comparison of prediction performance of different algorithms

损失函数的变化趋势如图5所示。通过图5可以看出,网络经过前28次迭代损失函数大幅降低,在第28~60次迭代阶段时逐渐趋于平稳,说明最终得到的参数是该结构下的最优参数结果。注水实际值和预测值的对比如图6所示。通过图6可以看出,LSTM模型得到的注水预测曲线,较传统RNN模型预测曲线表现的趋势更为接近注水数据的实际值,预测精度大幅提高。因此,LSTM预测模型的数据跟踪效果良好,稳定性较高,有效地避免了传统RNN模型在预测长时间序列数据时易产生的长期记忆缺失问题。由此可见,在注水预测中,LSTM模型预测效果更优。

图5 损失函数变化曲线Fig.5 The change curve of the loss function

图6 实际值与预测值对比Fig.6 Actual value vs predicted value

3 结 语

针对所研究的复杂断块油藏,笔者通过建立LSTM预测模型,将油田注水数据和影响因素同时间相关联,对油田的未来注水量进行了预测,并与RNN的评价指标结果和注水预测曲线进行比较。实验结果证明,LSTM注水模型预测效果和稳定性较好,预测精度更高,所以该方法可以应用于油田开发工程,作为指导油田注水开发的一条新渠道。同时,油田注水预测的特征数据还应增加其他数据,比如不同层位之间的地层数据分析等,使用更多的特征数据进行注水预测,有望进一步提高油田注水预测的准确率。

猜你喜欢

神经网络时刻油田
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
冬“傲”时刻
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
油田掠影
捕猎时刻
油田工人
一滴油的后面
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
光泽or油光?向夏日“大油田”sayno