基于注意力机制的碳酸盐岩储层岩相识别方法

2022-07-16曾丽丽孟凡月汤华贝牛艺晓汤敏

测井技术 2022年3期

曾丽丽,孟凡月,汤华贝,牛艺晓,汤敏

(东北石油大学电气信息工程学院,黑龙江大庆163318)

0 引言

岩相识别是储层评价、油藏描述和地质分析等的基础工作。碳酸盐岩储层结构复杂,各测井数据间存在较强的非线性关系,传统的岩相识别技术难以对储层进行精准描述。

深度学习技术通过构建多隐层模型自动寻找储层信息中的非线性特征,在岩相识别方面取得了一定的成果[1-5]。郑阳[6]采用卷积神经网络(Convolutional Neural Network,CNN)识别测井岩相,相对于浅层网络[7-8],其准确率有较大提高。Yadigar等[9]通过一维卷积神经网络结合Adagrad优化器提高了岩相分类准确率。冯雅兴等[10]利用孪生卷积神经网络进行岩相自动识别,其岩相识别精度达89.4%。Li等[11]采用卷积神经网络处理声学测井数据,对混合噪声的测井数据有很好的识别效果。王俊等[12]利用长短期记忆循环神经网络实现岩相自动识别,有效地解决了长序列的梯度消失问题。然而,这些研究局限于单一深度神经网络算法,将各种测井数据直接输入网络,难以从非线性关系中有效提取关键特征,输入的特征值利用效率低,测井解释不准确,无法在岩相识别环节实现明显的突破。

注意力机制通过模拟人脑信号处理机制实现了按比例分配资源,已经广泛应用于自然语言处理[13-14]、图像识别[15-16]、语音识别[17-18]等各种不同领域的深度学习任务中。杜秀丽等[19]针对脑电信号识别准确率不高的问题,构建了注意力机制和神经网络相结合的模型,提高了脑电信号的识别准确率。袁英淏[20]利用前馈注意力机制进行地震储层图像解释,证明了前馈注意力机制能够提高网络的抗干扰性能。李宗民等[21]基于循环神经网络和注意力机制对油藏储量进行预测,缓解了数据波动对预测结果的影响,相对于单一循环神经网络,融合注意力机制预测模型的准确率得到了很大提升。

针对目前传统岩相识别和单一神经网络存在的问题,本文提出了一种融合注意力机制与卷积神经网络的非线性储层岩相识别网络。该网络利用特征注意力模块提取测井数据的关键特征,利用卷积神经网络模块提取测井序列之间的空间信息,实现了碳酸盐岩储层岩相的自动识别。同时,重点关注了注意力机制位置的不同对储层岩相识别精度的影响。最后,将该方法应用于碳酸盐岩非均质储层,并在交叉验证的基础上与传统的岩相识别方法进行性能比较与分析。

1 数据集及其预处理

1.1 数据集

本文采用的测井数据来源于伊拉克Mishrif组,该组所在的油田呈南北分布,长40 km,宽20 km,油气藏储量十分丰富,是世界上最大的油田之一[22-23]。该油田处于扎格罗斯盆地的过渡带,地势属于低角褶皱区域,气候干旱少雨,受蒸发作用的影响,形成以白云岩为主的碳酸盐岩储层。这种碳酸盐岩储层空间以孔隙为主,其形成直接受溶蚀和白云石化作用的控制,地层内部结构复杂,不同种类的测井数据之间具有高度的非线性关系。

选取研究区相邻2口井的测井数据作为实验数据集,共有3 436个样本,采样间隔为0.1 m,其中训练集占80%,井深为2 820.5～3 092.3 m;测试集占20%,井深为2 831.9～2 903.5 m。研究区碳酸盐岩储层主要由白云岩、硬石膏、泥岩、砂岩组成。

本文采用井径(CAL)、自然电位(SP)、自然伽马(GR)、密度(DEN)、侧向电阻率(RLL)、中子孔隙度(CNL)、声波时差(AC)等测井数据,实现非均质储层岩相的自动识别。采用皮尔森(Pearson Correlation Coefficient,PCC)系数评估岩相与各种测井曲线之间的相关性(见表1)。由表1可知,GR与岩相相关性最强,AC与岩相的相关性次之。岩相与CAL、DEN、RLL、CNL、SP的皮尔森系数绝对值小于等于0.250,最低值为-0.110,各种测井曲线与预测目标之间的弱相关性给岩相识别任务带来了一定的困难。

表1 岩相与各个测井曲线之间的相关性

1.2 数据预处理

为了提高岩相识别的准确率,防止模型过拟合,本文对选取的测井数据集进行数据清理、数据标签化、分辨率处理和数据归一化等数据预处理操作。

1.2.1数据清理

由于井斜不同、钻井液性能改变和仪器约束等原因导致原始测井数据存在异常值,不能直接作为深度神经网络的输入。需要对获得的数据集进行数据清理。首先采用奈尔(Nair)检验法判断各种测井数据的异常值,其次采用均值替代法对异常数据和噪声数据进行处理。

1.2.2数据标签化

随着地壳运动和气候变化的长时间影响,岩相边界模糊不清。同时,岩相识别属于多分类的监督学习过程,需要对测井数据进行分析和数据集标签化处理。以研究区4种岩相体积占比(v)为岩相标签的主要划分依据(见表2);当体积占比出现冲突时,利用测井数据特性辅助岩相划分(见表3);获得白云岩岩相、泥岩岩相、砂岩岩相、硬石膏-白云岩-泥岩混合岩相、白云岩-泥岩 -砂岩混合岩相、硬石膏-泥岩混合岩相、白云岩-泥岩混合岩相。为了方便介绍,这7种岩相在后文中均采用其标签数字1～7代替。

表2 岩相体积占比分类

表3 测井数据范围

*非法定计量单位,1 ft=12 in=0.304 8 m,下同

1.2.3分辨率处理

测井仪器的性能、老化程度和工作时长是导致各种测井数据分辨率出现差异的主要因素,低分辨率的测井数据将会降低携带信息的可信度、影响岩相识别的精度。本文采用三点反褶积法[24]提高测井数据的纵向分辨率,如式(1)所示。

(1)

本文所采用的测井数据中GR和DEN的纵向分辨率较低,图1呈现了采用三点反褶积法处理的结果,为便于观察只截取了少量数据进行绘图,其中蓝色为原始数据,橙色为处理后的数据。由图1可见,GR和DEN经过处理后使纵向分辨率得到提高,更加真实地描述了各测井数据对地层界面变化的敏感性,有利于提高储层岩相识别模型的精度。

图1 GR、DEN测井数据分辨率处理对比图

1.2.4数据归一化

每种测井数据具有不同的量纲和单位,直接作为深度神经网络的输入将会严重影响岩相识别的准确率。数据归一化可以消除各种测井数据之间的不同量级,提高数据集质量,进而改善岩相识别效果,加快迭代速度。本文采用Min-Max标准化法对选取的数据集进行测井数据归一化处理,见式(2)。

(2)

式中,zn为输入的测井数据;zmin为该类测井数据的最小值;zmax为该类测井数据的最大值;znorm为该类测井数据的归一化值。

2 方法

2.1 卷积神经网络

卷积神经网络是深度学习算法中应用最为广泛的一种深度前反馈神经网络。卷积神经网络的非线性拟合能力和权值共享的特点,有助于构建模型从测井数据和岩相的非线性关系中提取更多空间特征信息,提高模型的准确率,减少参数数量,降低计算成本。

矩阵X=[x1,x2,…,xk]为卷积神经网络的输入数据,则当前卷积神经网络的输出公式为

D=g(X⊗[σ1,σ2,…,σρ])

(3)

式中,D为当前卷积层的输出;σρ为第ρ个滤波器输出的特征映射信息;g(·)为激活函数(tanh函数或Relu函数);⊗为卷积运算。

2.2 模型设计

基于卷积神经网络,本文利用注意力机制所在位置的不同构建了3种非线性储层岩相识别网络模型,包括前置特征注意力(FAtt)模块的卷积神经网络(FAtt-CNN)模型、后置时间注意力(Time Attention,TAtt)模块的卷积神经网络(CNN-TAtt)模型、前后双置注意力模块的卷积神经网络(FAtt-CNN-TAtt)模型。图2给出了3种网络模型的具体结构,其中x为某种测井数据的归一化值,ϑ为某种测井数据的的归一化权重值。

图2 非线性储层岩相识别模型结构

本文以FAtt-CNN模型为例详细阐述岩相自动识别方法,FAtt-CNN模型由FAtt模块、CNN模块以及全连接网络层构成。特征提取是岩相识别模型的关键。首先,FAtt模块为测井数据自动赋值,实现测井关键特征提取。然后,CNN模块采用多个局部滤波器和滑动滤波器捕捉测井序列之间的空间特征。最后,经过全连接网络层输出岩相类别概率,实现非均质储层岩相自动识别。

2.3 FAtt模块

注意力机制源于对人类所特有的大脑信号处理机制的研究,通过模拟人脑机制计算相似性权重,突出关键输入数据对识别目标的影响,利用有限的注意力资源从海量数据中自动、快速的提取关键特征。

针对传统神经网络中特征提取权重等占比的不足,研究构建了FAtt模块,通过对识别目标和测井数据进行相似性度量,使每个测井数据值获得新的权重系数,进而提高测井数据的利用率和网络的关键特征提取能力。

设输入数据xnorm为预处理后的测井矩阵,如式(4)所示。

(4)

式中,d为测井深度,m;下标为各测井曲线。

FAtt模块主要由CNN层和Softmax归一化层组成,如图3所示。

图3 特征注意力模块结构

首先,把测井序列xGR作为CNN层的输入,通过CNN层计算GR与识别目标之间的相似性权重,如式(5)所示。

λGR=C(xGR)

(5)

式中,λGR为测井数据GR的相似性权重;C(·)为与CNN层有关的函数。同理,可求取其他测井数据的相似性权重。

(6)

最后,对输入测井数据进行加权获得测井关键特征,以测井数据GR为例,如式(7)所示。

(7)

2.4 CNN模块

(8)

(9)

非线性岩相识别网络最终输出的岩相类别概率矩阵Γk如式(10)所示。

(10)

式中,Γ1,d为在井深d时第1类岩相的概率;矩阵每行的第1个下角标为一种岩相。

2.5 评价指标

本文采用准确率(A)、精确率(P)、召回率(R)和F1分数(F1)作为评价系统的性能指标。

(11)

(12)

(13)

(14)

式中,TP为样本中α类岩相被正确识别的数量;TN为样本中β类岩相被正确识别的数量;FP为样本中β类岩相被错误识别为α类岩相的数量;FN为样本中α类岩相被错误识别为β类岩相的数量。

3 应用实例

本实验训练及测试代码均运行于Windows下Tensorflow深度学习平台。为了科学地评估所提出模型的性能,每个模型参数设置保持一致,选择Adadelta为模型优化器,交叉熵损失函数为模型损失函数,同时采用6倍交叉验证取平均值作为实验结果对岩相模型进行调优。

实验将该方法应用于碳酸盐岩储层,图4给出了测试集测井曲线及不同模型下识别的岩相与实际岩相分布情况。从图4中可以看出CNN模型的岩相识别效果最差,出现了明显的欠拟合现象。例如,在井深3 853～3 865 m位置,白云岩-泥岩混合岩相和硬石膏-白云岩-泥岩混合岩相交替出现的井段直接误判为白云岩-泥岩混合岩相;在井深2 840 m和2 846 m附近,CNN模型将硬石膏-白云岩-泥岩混合岩相误判为白云岩-泥岩-砂岩混合岩相;在井深2 890 m附近,密度突然增大,说明岩相有所改变,CNN模型对白云岩岩相识别失败。此外,由图4也可以看出白云岩-泥岩混合岩相与电阻率的值有很大关系,在白云岩-泥岩混合岩相出现时电阻率的对数值整体处于0～0.5 Ω·m,表明CNN模型对电阻率的特征提取能力较差。

图4 测试集测井曲线及不同模型中识别的岩相与实际岩相对比

随着注意力机制的加入,模型的非线性拟合能力和鲁棒性均有所提高。FAtt-CNN模型整体的岩相识别结果最优,该模型仅在井深2 871 m附近将极少量白云岩岩相误判成硬石膏-白云岩-泥岩混合岩相,岩相分布与实际岩相分布情况高度符合。在井深2 894 m附近,井径出现异常,但FAtt-CNN和FAtt-CNN-TAtt模型仍能准确地识别岩相,说明FAtt模块能够从当前井段的其他数据中提取出关键特征,减少了井径异常对岩相识别模型带来的影响。CNN-TAtt和FAtt-CNN-TAtt模型在井深2 846～2 863 m处,对白云岩-泥岩混合岩相识别出现明显误差,混淆了白云岩-泥岩混合岩相和硬石膏-白云岩-泥岩混合岩相。此外,在井深2 871 m附近,CNN-TAtt模型将一小部分的硬石膏-白云岩-泥岩混合岩相误判为白云岩岩相。实验结果分析表明,CNN-TAtt和FAtt-CNN-TAtt模型的非线性拟合能力稍逊于FAtt-CNN模型。

表4给出了4种模型岩相识别结果的精确率、召回率、F1分数和准确率,加粗字体表示同一岩相识别的最高值。

表4 不同模型中岩相识别的精确率、召回率、F1分数和准确率

从整体岩相的准确率来看,FAtt-CNN模型的岩相识别准确率为98%。相比传统的CNN模型,融合注意力机制的3种岩相识别模型准确率分别提高了9%、5%和4%。实验结果说明注意力机制和卷积神经网络两者结合后能够从测井数据的非线性关系中充分提取相关测井特征,有助于提高岩相识别的准确率。

从单一岩相的精确率来看,FAtt-CNN模型中白云岩岩相及相关混合岩相的精确率均为100%。FAtt-CNN-TAtt模型中白云岩岩相的精确率次之(73%),CNN-TAtt模型中白云岩岩相的精确率最低(56%)。CNN模型中白云岩岩相的精确率为100%,但其相关混合岩相普遍低于其他3种模型,其中白云岩-泥岩混合岩相的精确率最差(74%)。

从单一岩相的召回率来看,FAtt-CNN模型中,白云岩岩相和砂岩岩相的召回率分别为80%和92%,其他岩相的召回率均为100%。引入TAtt模块后,CNN-TAtt和FAtt-CNN-TAtt模型关于白云岩岩相的召回率均达100%。

F1分数基于精确率和召回率对模型性能进行综合性评估。研究区碳酸盐岩储层以白云岩为主,因此,下面主要从白云岩岩相及相关混合岩相的F1分数评价指标对实验结果进行分析。FAtt-CNN模型的识别效果最佳(见表4),泥岩岩相、硬石膏-白云岩-泥岩混合岩相、白云岩-泥岩-砂岩混合岩相、硬石膏-泥岩混合岩相、白云岩-泥岩混合岩相的F1分数达100%。CNN模型中白云岩岩相的F1分数为33%,性能最差。相比于CNN模型,FAtt-CNN模型中白云岩岩相的F1分数提高了53%,FAtt-CNN-TAtt模型中白云岩岩相提高了51%,CNN-TAtt模型中白云岩岩相提高了38%。

图5为各个模型岩相识别结果的F1分数评价折线图。可以看到,橙色线条代表的FAtt-CNN模型,各类岩相的F1分数在100%附近波动,波动范围较小,模型稳定性较高。灰色线条代表的CNN-TAtt模型,各类岩相的F1分数波动范围为71%～100%。蓝色线条代表的FAtt-CNN-TAtt模型,各类岩相的F1分数波动范围为84%～100%。黄色线条代表的CNN模型,F1分数波动范围为33%～100%,波动范围较大,该模型稳定性较差,其性能明显低于其他3种模型。实验结果说明在深度神经网络中引入注意力机制有助于提高模型稳定性和岩相识别精度。

图5 岩相评价结果的F1分数折线图

图6给出了4个模型中岩相识别的分布密度随井深的变化情况。琴型图左侧(绿色部分)代表岩相的识别结果,右侧(橙色部分)代表实际岩相。由图6(a)可观察到CNN模型对白云岩岩相、白云岩-泥岩-砂岩混合岩相和硬石膏-泥岩混合岩相识别效果均低于其他3种模型,岩相识别结果与岩相实际分布有明显差异。FAtt-CNN模型对白云岩岩相、泥岩岩相、砂岩岩相、硬石膏-白云岩-泥岩混合岩相、白云岩-泥岩-砂岩混合岩相、硬石膏-泥岩混合岩相、白云岩-泥岩混合岩相这7种岩相识别效果最佳[见图6(b)],识别得到的岩相和实际岩相的形状基本对称,说明识别密度与实际储层密度相符,该模型具有较高的岩相识别能力。CNN-TAtt模型在井深2 810～2 855 m附近,对白云岩岩相的位置分布判别出现错误[见图6(c)],导致图形拉长,与实际对比图形长度不相匹配。FAtt-CNN-TAtt模型对白云岩-泥岩-砂岩混合岩相和白云岩-泥岩混合岩相的识别效果和实际情况存在偏差[见图6(d)],图形对称效果稍差。

图6 不同模型中岩相识别的密度分布情况

在相同的网络结构和网络参数下,研究基于页岩储层,选取常规测井数据和声波成像测井数据实现储层岩相的自动识别。当识别目标与常规测井数据的非线性关系更强时,融合注意力机制的网络模型依然能够从成像测井数据中提取更多的关键特征,其岩相识别精度不低于碳酸盐岩储层。利用F1分数指标对模型进行评价,FAtt-CNN模型效果最佳,FAtt-CNN-TAtt模型和CNN-TAtt模型效果次之,CNN模型效果最差。实验结果表明,该方法适用于不同研究区的非线性储层岩相识别。

基于以上实验结果可知,尽管构建的3个模型对碳酸盐岩储层的岩相识别效果各不相同,但相对于单一卷积神经网络来说,融合注意力机制与卷积神经网络构建的模型在非线性岩相识别任务中取得了显著的效果。其中,FAtt-CNN模型对碳酸盐岩储层的岩相识别效果最佳,有效地提高了岩相识别的精度。不同研究区的实验结果表明该模型具有较好的迁移性。

FAtt-CNN网络模型前置FAtt模块可以更好地拟合测井数据与岩相数据之间的非线性关系,减少因环境因素引起的参数缓慢漂移的现象,同时增强模型的鲁棒性和系统的稳定性。CNN-TAtt模型后置TAtt模块,评价指标高于单一的CNN模型,但是由于卷积神经网络无时间记忆功能,TAtt模块无法沿储层垂向高效地提取时序信息,因此,岩相的识别准确率不及FAtt-CNN模型。FAtt-CNN-TAtt模型在卷积神经网络的基础上分别加入FAtt模块和TAtt模块,充分考虑了数据的时序性和测井数据的非线性,其评价指标均高于CNN和CNN-TAtt模型。然而,与CNN-TAtt模型同理,卷积神经网络无时间记忆功能,所以利用卷积神经网络同时从特征和时间维度进行信息提取时,这2个注意力模块相互干扰,导致岩相识别效果变差,这也是以后需要进一步解决的问题。