APP下载

基于深度卷积生成对抗神经网络预测气窜方向

2020-07-29冯其红李玉润任佳伟周代余

关键词:高维气相油藏

冯其红, 李玉润, 王 森, 任佳伟, 周代余, 范 坤

(1.中国石油大学(华东)石油工程学院,山东青岛 266580; 2.非常规油气开发教育部重点实验室(中国石油大学(华东)),山东青岛 266580; 3.中国石油塔里木油田公司勘探开发研究院,新疆库尔勒 841000)

气窜一直以来都是影响注气开发的主要因素,通过前期的地质生产数据预测气窜形成在注气开发中具有重要意义[1-2]。注入气体(甲烷、CO2等)在油藏条件下的运移受混溶、降黏、膨胀、传质等多种机制控制[3-7],气窜形成需要考虑组分之间的相互作用,对于高维空间变量进行数值模拟,对计算力的要求非常高,尤其是进行大规模动态预测,实际应用中会考虑使用代理模型进行计算优化。常规的代理模型,克里金法、监督式机器学习等对于高维空间面临着运算量爆炸增长的情况[8-10];正交分解、混沌多项式展开等方法,根据实际的模型建立恰当的关系式需要很高的技巧,不适用于复杂的映射情况[11-12]。近几年,生成对抗神经网络模型在高维模型输入和输出域之间的映射关系表现出卓越的性能[9,13-14],Sun[15]利用SPID-GAN识别地层条件的状态参数。Liu等[16-18]将深度卷积网络引入对抗神经网络中,应用自动编码和自动解码技术,加强了GAN模型训练的稳定性。笔者利用DC-GAN框架建立从原始的高维地层参数输入到生产过程中高维地层信息输出之间的映射关系(pix2pix),通过深度卷积网络和反卷积网络,提取输入参数的特征信息并建立映射关系,判别器采用交叉熵损失函数,来实现注气之后气窜方向的判断。

1 深度卷积对抗神经网络框架

1.1 对抗神经网络

生成对抗网络模型(GAN)是由Goodfellow等率先提出的,由一对生成器和鉴别器组成。基本思想是通过鉴别器和生成器的相互博弈、相互对抗寻找到高维参数空间的纳什均衡点。GAN网络构建思路见图1。生成器G(x)代表输入图像到生成图像的映射关系G(x):X->Y,判别器D用于识别数据是来自于生成器生成的模型D(y)还是实际计算得到的模型D(G(x))。GAN的优势在于对于数据分布的假设要求低,既能适应高维参数的映射又能够突破高斯分布的限制[15]。在生产对抗神经网络中,生成器G和判别器D的代价函数V(G,D)表示为

图1 GAN网络构建思路

minGmaxDV(D,G)=Ex~pd(x)×

[lgD(x)]+Ez~pz(z)[lg(1-D(G(z)))].

(1)

式中,Ex~pd(x)和Ez~pz(z)表示求解来自真实数据的期望和来自生产数据的期望;x为实际油藏的模拟饱和度,服从分布pd(x);z为输入的油藏渗透率场数据,服从渗透率的分布pz(z)。

生成器的作用是让生成样本尽可能接近真实样本,即D(G(x))越接近1越好;判别器的作用是让D(y)尽可能接近1,让D(G(x))接近0。在训练过程中,GAN通过迭代计算不断提高生成器和判别器的能力。

1.2 卷积神经网络

卷积神经网络(CNN)由卷积层、激活层和池化层组成,通过提取图像特征,引入非线性映射关系,降低图像特征维数,提高神经网络的性能和泛化性[19]。CNN中卷积层在提取图像特征的同时,能够保留原始图像中像素之间的空间关系。通过卷积核在图片上的移动,读取每一个小区域内的像素之和获得新的输出,输出的矩阵称为特征图。深度学习中的卷积内核为2维权重的数组(例如2×2的单位矩阵)。每个2维权重数组都作用于上一层的输入通道,并进一步生成多通道的图像,然后将它们加在一起形成一个新的单个输出特征图。对所有权重数组重复此过程,生成多个不同的特征图作为新的输出层。具有不同权重的卷积核将为同一输入图像生成不同的特征图,前几次卷积的卷积层主要从图像中提取结构细节和位置信息,高次卷积的特征图包含较少的位置信息和更复杂的含义。整个过程不断地使用反向误差传播,在训练过程中学习和优化带权重的卷积核[20]。卷积过程如图2所示。

图2 深度卷积网络卷积过程

池化层的作用是在卷积和激活后对特征图进行下采样操作降低其维数,用时保留部分重要信息。池化层的结果是降低卷积后特征信息的维度,池化窗口的移动也是扩大每一个神经元的感受野(receptive field)的过程。池化层的目的是缓解卷积层对位置的过度敏感性,改善整个神经网络的泛化能力,并使其能够抵抗较小的变换、缩放和变形[21]。

全连接层是常规的多层感知器,并遵循softmax函数作为分类器。这种结构将卷积模块的输出与常规神经网络分类器输入连接在一起。全连接层使用卷积层提取的特征将输入图像分为不同的类别。完全连接层中的每个神经元都连接到上一层中的所有神经元。值得注意的是,可以将完全连接的层转换为卷积层,因为这些层具有相同的功能形式。这些层之间的唯一区别是,卷积内核连接到输入层的本地区域,而完全连接的内核覆盖整个输入区域。

1.3 DC-GAN结构

深度卷积生产对抗网络DC-GAN是GAN的一种变形,其思路与GAN框架相同。在对生成器进行构建的过程中使用了深度卷积网络来代替传统的非线性映射,通过输入高维参数,经过一系列卷积操作,包括卷积、偏置、归一化、激活4个步骤,形成中间参数特征图像,在通过一系列的反卷积操作进行上采样,形成高维映射后的图像。生成器的设计遵循Ronneberger等[14]最初提出的U-net设计。设置卷积层和反卷积层的内核均为4×4,步长为2。滤波器数量随着卷积层的增大而增大,设置最大数量为2 048,以此来学习图像中不容易观察到的细节。在反卷积过程中,将来自卷积的特征图与来自编码器的细粒度特征图组合在一起。输出层使用双曲正切函数(tanh)作为激活函数来恢复连续值,并生成具有与输入图像大小相同的输出图像。具体过程如图3所示。

图3 构建DC-GAN网络识别优势通道

输入图像经过6层卷积,卷积核、步长和边框分别为4、2、1,反卷积层的大小与通过线段连接的卷积层对应,卷积参数相同。左侧通过卷积提取特征图像,右侧通过反卷积获得真实图形的信息。左侧输入渗透率图像,右侧输出气相饱和度图像。生成器执行图像到图像的转换,而鉴别器是一个分类器,给出生成器输出数据的真实程度。

在判别器构建上,DC-GAN采用CNN网络实现,采用步长卷积代替池化层的操作。步长卷积的方法是通过建立上一层的感受野到下一层像素点的映射来反映采样区域的特性。激活函数采用ReLU函数,ReLU函数的特点是能够过滤负值,保持负半轴始终为0。ReLU函数如图4所示,在大多数情况下ReLU会比其他激活函数更快地训练神经网络[19],其中ReLU函数设置所有负值均为零。

图4 激活函数图形

在训练过程中交替地优化生成模型和判别模型,在网络训练中分别对鉴别器网络D和生成器网络G进行交替优化。用适应性矩估计(adam)求解器采用降低学习速率选项减少出现数值振荡。

1.4 结构相似性指数

通过结构相似性指数(SSIM)方法计算两个图片之间的相似程度[21]。SSIM利用人类视觉提取信息的思想,考虑了图像的结构计算两个图片的相似程度,当空间上的点距离越近,相关关系就会越凸显。SSIM指数由3部分组成:亮度相似度l(x,y)、对比相似度c(x,y)和结构相似性指数s(x,y)。其表达形式[22]为

SSIM(x,y)=[l(x,y)]α×[c(x,y)]β×[s(x,y)]γ.

(2)

通过使用x和y的样本统计量计算这3个相似度。首先,通过比较样本均值获得亮度l(x,y)的相似度x和y,表示为

(3)

(4)

(5)

采用SSIM计算相似程度的优点在于:①SSIM函数具有对称性,SSIM(x,y)=SSIM(y,x);②SSIM阈值在[-1,1]之间;③SSIM最大值为1,当且仅当x=y。

2 多组分气驱模型控制方程

在利用DC-GAN训练在油藏中注入气体(烃气)的驱替过程的替代模型中,假设在油藏中水相只有束缚水,气相只有注入的气体,采用达西渗流方程表征流量与储层特性、流体特性和流体压力之间的关系:

(6)

式中,下标i表示相,包括油相和气相;qi为相流量,m3/d;k为绝对渗透率,μm2;kr,i为相对磁导率;ρi为流体密度,kg/m3;μi为黏度,mPa·s;pi为某一相的流体压力,MPa。

油气组分的物质平衡方程[23]可表示为

(7)

注入的天然气与地层原油之间会发生相间传质现象,形成混相带。通过油气组分间的传质作用,原油与注入流体在流动过程中不断接触而形成混相。在组分模拟中,质量平衡用Rachford-Rice方程求解,表示为

(8)

式中,zi为组分i的总物质的量分数;fv为气相体积分数;Nc为组分数;Ki为组分的平衡比。

油气组分分布可根据求解逸度的热力学平衡方程实现,处于平衡状态,满足

fi,l(T,pl,xi)=fi,l(T,pv,yi).

(9)

式中,fi,l和fi,v分别为组分i在液相和气相中的逸度,MPa;T为温度,K;pl和pv分别为液相和气相压力,MPa。

可以使用Peng-Robinson状态方程计算气相和液相的逸度,表示为

Z3-(1-B)Z2+(A-3B2-2B)Z-(AB-B2-B3)=0.

(10)

式中,Z表示可压缩性;A、B为与压力、温度和纯组分有关的函数[24]。

3 结果与讨论

3.1 模型建立

基于塔里木油田实际情况,建立一系列的地质模型。油藏尺寸为2 000 m×2 000 m×10 m,根据矿场实际井网条件设置两口注气井、3口采油井,井网分布如图5中左图所示(加箭头的黑色圆圈表示注入井,红色圆圈表示生产井),定流量100 m3/d(地下条件)注入;注入气体为烃气,油层深度为4 800 m,厚度为20 m,初始压力为49.8 MPa,生产压差为8 MPa,岩石压缩系数为2×10-4MPa-1,渗透率利用顺序高斯生成器生成平均渗透率在(100~500)×10-3μm2的4 000个地质图像。预测的渗透率图像和直方图如图5所示。模型的渗透率是使用高斯变异函数模型进行模拟,频率直方图的间隔是10×10-3μm2。由于模型中设置的物理长度不同,渗透率的分布并不是严格的高斯分布。对4 000组不同的渗透率分布模型进行数值模拟,求解气体饱和度,训练生成对抗神经网络。饱和度图像每隔20 d输出一次,孔隙度根据Carman-Kozeny公式.[25]计算得

(11)

式中,dm为孔隙直径,取38.07 μm。

3.2 效果评价

训练得到DC-GAN训练损失值与时间的关系如图6所示。分析不同生产时间下训练损失值与迭代次数的关系,为了更好地观察一开始迭代达到平衡的状态,对于100、200、300和400 d的模型绘制了到第1 400步的生成器和判别器的损失函数值。设置最大训练迭代次数为3 000次,每一次的训练都包括对于生成器和判别器的独立训练过程。对于多数模型,训练迭代次数在500次前,模型可以达到纳什均衡的状态,即生成器和判别器形成了有效的对抗竞争关系,模型的精确度在训练中达到平衡。在投产500 d的模型中,气相的饱和度由于分布形态复杂,生产井多数已经见气,特征参数比之前的要复杂的多,需要更多的训练次数才能达到平衡,如图6(e)所示。

在相同渗透率条件下,绘制出由DC-GAN模型训练生成的气相饱和度,将其与油藏模拟器得到的气相饱和度进行对比,如图7所示。计算训练结果与油藏组分模拟器结果的图像相似度(SSIM值)进行对比,当训练次数达到2 000时,图像相似度可超过90%,训练结果与传统数模结果一致(图7最后两行图片)。基于DC-GAN框架训练得到的气相饱和度分布能够精确地提取气相饱和度随时间变化的分布特征,从而代替实际模型的注气结果,体现了DC-GAN模型的可靠性。

对比分析图7中t=400 d和t=500 d时的气相饱和度可以得出,对于中心注气井,在储层的东北和西南方向,气体存在明显的突进趋势。对于西北方向的注气井,由于地层渗透率低和中心注气井的干预情况,难以形成较大的压力梯度,气体窜进能力很弱。对于开发条件类似的同类油藏,可通过DC-GAN模型快速地预测气体窜流方向。

图7 不同投产时间下训练次数对比

对比不同时间的图像相似度(SSIM值)可知:迭代次数在400步之前,多数训练还停留在一个初步、混沌的映射状态;当迭代到400~1 000步的训练阶段,训练结果多数达到了稳定、高质量的映射状态(图8中200、300、400、500 d的曲线),之后训练的相似度变化幅度浮动很小。

图8 不同训练次数下SSIM值波动示意图(平滑窗口10)

在投产100 d的训练模型中,当训练次数约1 100时,相似度(SSIM值)有明显波动现象,这是由于不同渗透率条件下所形成的气相饱和度图像差异性较小,生成器中的卷积层在提取特征时难以快速地获取到图像的不同特征,所需训练时间较长。

在投产500 d的训练模型中,不同训练次数下的相似度(SSIM值)小于其他生产时间模型的相似度。与训练误差的图像(图6)对比后,可以看出,对于在训练过程中有波动的模型,在相似度的变化上也有所不同。训练的波动情况在一定程度上能反应SSIM值的大小,虽然最后都达到了稳定状态,但是波动情况剧烈的训练过程会导致较小的SSIM值。

图6 不同时间下DC-GAN训练过程

4 结 论

(1)DC-GAN是一种深度学习模型,在学习高维映射方面有独特的优势。通过GAN框架建立高维数值模拟的替代模型,训练好的代理模型,能够快速准确地预测气相饱和度的分布,进而判断气窜可能出现的方向,模型对于计算性能要求很低,计算时间短,可移植性强。

(2)DC-GAN模型通过预测气相饱和度的分布得到气窜方向,在不同时间段的训练中,模型结果与数值模拟结果对比,图像的结构相似性指数超过0.9,能够代替油藏数值模拟计算过程。

(3)利用DC-GAN框架,通过卷积层和反卷积层过程,可以精确地实现特征图像的提取和实际图像的构建;可以不引入其他限制条件,实现高维数据之间的映射,是一种基于数据驱动的代理模型构建方法。

猜你喜欢

高维气相油藏
气相色谱法测定饮用水中甲草胺和乙草胺
基于相关子空间的高维离群数据检测算法
化学气相沉积法合成金刚石的研究进展
页岩油藏提高采收率技术及展望
复杂断块油藏三维地质模型的多级定量评价
镇北油田某油藏延长低含水采油期技术研究
双冗余网络高维离散数据特征检测方法研究
微波处理-气相色谱法测定洋葱中氟虫腈残留
基于深度学习的高维稀疏数据组合推荐算法
高维洲作品欣赏