APP下载

融合图像外特征的岩屑岩性深度学习识别方法

2022-11-01覃本学沈疆海马丙鹏宋文广

科学技术与工程 2022年26期
关键词:岩屑岩性类别

覃本学, 沈疆海*, 马丙鹏, 宋文广

(1. 长江大学计算机科学学院, 荆州 434023; 2. 中国科学院大学计算机科学与技术学院, 北京 100190)

岩屑作为母岩岩石的碎块,保持了母岩的结构和大多数特征,对钻取上来的岩屑进行岩性分析,可生成地下岩性的三维分布特征,进一步分析可掌握地下的岩石成分、性质、地层变化和油、气层情况[1]。对于岩屑的岩性分析,传统的做法是由专业人员进行人工鉴定,通过对岩屑进行观察、触摸、嗅、滴稀盐酸、元素分析、硬度检测、成分检测、伽马测井等方式。近些年来,随着机器学习方法在工业应用中的快速发展[2],人工神经网络在岩性自动化识别上得到了广泛应用[3],程国建等[4]使用普通卷积神经网络训练岩石薄片图像得到的模型,可对岩石的薄片图像进行自动粒度识别;张野等[5]和夏毅敏等[6]分别将普通卷积网络替换为更为深层次的Inception-v3和更为轻量化的MobileNet[7],对岩石照片进行训练,得到的模型对于常规岩石如花岗岩、石灰岩、大理岩等拥有较高的准确率。然而,岩性问题在钻井条件下则更复杂一些,马陇飞等[8]以鄂尔多斯盆地油田致密储层钻取的岩心为研究对象构建了全连接神经网络,准确率达71%;Alzubaidi等[9]将普通卷积网络替换为深度残差网络ResNeXt-50,可在加深网络深度的情况下避免网络退化问题,提高了识别准确率;Zeng等[10]提出了基于栅极循环单元(gate recurrent unit, GRU)神经网络的注意机制模型,建立了双向GRU网络,沿深度方向提取正后向测井数据特征,引入注意力机制,为隐藏层分配权重,以此提高了预测精度;Ao等[11]提出了一种概率的模糊表征结合随机森林算法的方法,相比于确定性岩性表征方法能获取更多关于韵律、非均质性和地层性质的信息; Gu等[12]提出了结合平均值影响(mean impact value, MIV)与粒子群优化(particle swarm optimization, PSO)的概率神经网络(probabilistic neural network, PNN)模型,充分考虑测井资料随深度的变化趋势、不同测井序列的相关性以及实际的深度积累效应,达到了较好的应用效果。地质领域,针对岩性识别的方法则更偏重于钻取物本身的物理、化学等特征,南泽宇等[13]对致密含钙砂砾岩地层钻井数据进行分级分类得到多级交会图,识别结果与岩心、薄片吻合良好,整个过程从粗分到细分,涉及电阻率、伽马、中子等测井方法,也是地质领域较为传统的方法。

以上方法分为两个方向,首先是偏重于图像的机器学习方法,此方法利用计算机的高性能计算,追求更深更复杂的网络,以计算性能换取识别精度;其次是利用测井方法与高精度仪器的传统地质学方法。两种方法各有优劣,前者更为方便,模型训练好即可实现自动识别,但是仅图像上的特征往往不足以作为分类的标准,因为图像特征易受拍摄环境、拍摄设备的影响,拍摄得到的特征并不完全可靠,得到的结果可信度和普适性不高;后者依赖的仪器价格高昂,而且便携性差,对于无法满足现场需要及时获取地层信息的需求,且识别过程繁琐、对专业领域知识依赖度高。

针对上述问题,结合现场录井的实际工作情况,现开展设计结合传统深度学习方法与传统录井方法的融合模型工作,利用二者的优势以达到更加准确可信的结果,同时使得模型能更加方便地应用到现场录井当中,以提高通用性和可移植性。

1 岩屑图像

本文的训练样本数据来自某油田的十口探井的岩屑数据,包含岩屑图像,和石油、地质专业人员对于岩屑岩性的鉴别记录表。其中岩屑图像为工业相机拍摄的高分辨率图像。为突出本文方法对于外观相近的岩屑的识别能力,选择5类岩屑图像比较接近的沉积岩进行实验,这5类分别是:白云岩(dolomite)、泥岩(mudstone)、石灰岩(limestone)、砂岩(sandstone)、页岩(shale),如图1所示。

由图1可以看出这几类沉积岩外观十分相似,仅凭肉眼几乎无法区分。即使通过高分辨率采集、补光拍摄、图像增强(image enhancement)等操作提高了图像质量与辨识度,但近似岩屑间的外观差异还是很难被人眼捕捉,即使是专业人员也需要对图像进行不断放大观察颜色、纹理,并结合自身经验和岩屑的本身物理、化学特征才能明确给定岩性,可见图像外特征不容忽视。

图1 5类岩屑图像Fig.1 Five types of debris images

2 岩屑的图像外特征

岩屑有大量的岩性信息无法被摄像机捕捉,如硬度、所含成分等,这些特征可由分析实验获得。有些复杂实验涉及昂贵的光学仪器,例如若想获得完整的、可靠性高的岩屑岩性,需要傅里叶红外光谱仪[14]、X射线衍射仪[15]、拉曼光谱仪[16]、扫描电镜[17]等仪器。但如果仅作现场分类,一些简单方便的实验即可获得很多有效的图像外信息,如滴加稀盐酸、元素分析、触摸、使用锤子敲击等,表1为地质工作者在现场记录的部分岩屑描述。

表1 岩屑图像外特征表Table 1 Exterior feature table of rock debris image

为了将这些传统描述特征应用到机器识别过程,设计了一套量化规则。

(1)盐酸特征:岩屑与稀盐酸反应的程度可用气泡的多少来度量,如果岩屑中含有碳酸盐,则会与稀盐酸反应,气泡越多说明反应越剧烈。剧烈程度用数字1~10来度量,1表示不反应,10表示反应剧烈,由小到大表示反应越来越剧烈。

(2)纯度特征:岩屑的矿物纯度主要是检测岩屑的成分,岩屑所含成分复杂且多则为杂,岩屑主要成分占比高且比较单一则可定为纯。最纯取值为10。

(3)元素分析特征:元素分析也是鉴别岩屑种类的一种方法。当高能X射线轰击样品时,原子核外电子释放出来,出现电子空位。这时处于高能态电子会跃迁到低能态来填补电子空位,并释放出特征X射线,X射线荧光具有物质元素的指纹效应,使用X射线荧光(X-ray fluorescence,XRF)分析仪可以检测出岩石中元素的含量。元素录井技术重点关注Si、Al、Fe、Ca、Mg、S、K、Ti共8种元素。本文元素检测作为外加参数无需测出每种元素含量,仅以Ca—Si两种岩屑中主要元素作为参照,使用式(1)即可得到一个在[1, 10]范围内的可以表示Ca—Si含量差异的值,V值越大,说明Ca相对于Si含量越高,反之则Si含量越高,PCa和PSi分别表示Ca和Si所占比例。

V=4.5[1+(PCa-PSi)]+1

(1)

(4)硬度特征:硬度的主要依据就是普氏系数,又称岩石坚固性系数、紧固系数,计算公式为

f=R/10

(2)

式(2)中:R为岩石的单轴抗压强度,MPa。一般根据岩石普氏系数将岩石分为10级,正好对应本文图像外参数取值的1~10,故以普氏系数分级作为度量,最硬(即分级为Ⅰ级) 在本文中取值为10。

将表1的特征转化为可训练的参数后,获得如表2所示的图像外特征数据。例如,一块标准的白云岩岩屑的图像外特征可表示为特征向量:(1, 7, 8.2, 4)。

表2 岩屑图像外特征参数示例表Table 2 Sample table of external characteristic parameters of rock debris image

3 岩性识别深度学习模型

本文模型如图2所示。

图2 模型示意图Fig.2 Model diagram

3.1 岩屑数据集

本文所用数据集在录井现场获取,是图像数据和图像外特征描述的合集。使用随机函数对数据进行打乱,选取数据的80%作为训练集,20%作为验证集。

在对岩屑图像外特征进行量化时,一些特殊情况下某一特征并不好界定,则可输入范围,根据混合同余法在给定范围给出一个均匀分布随机数,如式(3)所示,或任其为空。

(3)

式(3)中:zi为在范围[a, b]产生的随机数;A、C、M为参数;modM为取余操作。本文中A=2 045,C=1,M=220。

3.2 Xception特征提取器

岩屑图像本身包含着浅层的像素信息,如像素值大小、像素值分布情况与位置关系。但这些分布太过具体,无法作为区分类别的依据,所以需要神经网络对图像进行不断的卷积操作,获取图像的深层信息,深度越深特征越抽象,同类物质之间的共性越明显。本文选取深度可分离卷积与残差连接结合的Xception网络为图像特征提取器。其中残差连接能够在堆叠网络深度的情况下有效避免网络退化问题(degradation problem),同时Xception将卷积神经网络的特征图中跨通道相关性和空间相关性的映射进行完全解耦[18],采用深度可分离卷积,在保证精度的情况下大幅度降低卷积计算的参数数量[19],即

(4)

式(4)中:rNp为深度可分离卷积与传统卷积的参数量之比;Sk为卷积核的尺寸;CI为输入特征的通道数;CO为输出特征的通道数。由式(4)可以发现,使用深度可分离卷积代替普通卷积后参数量可减少大约CO倍。

3.3 损失函数与优化器

选取交叉熵作为损失函数。交叉熵可度量多个概率分布间的差异性信息,作为损失函数可辨识和消除训练过程中的歧义,且方法简单有效易于计算机自适应,计算公式为

(5)

式(5)中:Loss为损失值;S为样本的数量,本文取值为10 000;C为类别的数量,本文取值为5;i、j分别为样本编号和类别编号;Fij为指示变量,取值为0或1,如果该类别和样本i的类别相同则为1,反之为0;Pij为对于观测样本i属于类别j的预测概率。

此外,模型还需要优化器来更新和计算影响模型训练和模型输出的网络参数,使其逼近或达到最优值,从而最小化(或最大化)损失函数。本文模型采用的是Adam优化器[20],Adam优化器结合了AdaGrad和RMSProp两种优化算法,对梯度的一阶矩估计(firstmomentestimation)和二阶矩估计(secondmomentestimation)进行综合考虑,即综合考虑梯度的均值与梯度的方差,计算更新步长,即

(6)

(7)

(8)

3.4 激活函数

本文模型使用了ReLU和Softmax两个激活函数,其中ReLU用来使神经网络每一层的输出由线性变为非线性;Softmax函数用来做分类,输出每一类对应的概率值。

3.4.1 ReLU函数

函数表达式为

(9)

由于该函数为分段函数,在x=0处不可导,所以需要次梯度来实现模型的模型优化和反向传播,次梯度公式为

(10)

式(10)中:c为次梯度;x0为x变化前的值。当x≥0时,其导数为1;当x≤0时,其导数为0,将导数结果代入式(10)不等号右边,得到

(11)

则ReLU函数在x=0的次梯度是c∈[0,1],次梯度可取0~1的任意值,本文取0。

3.4.2Softmax函数

Softmax(归一化指数)函数的计算公式为

(12)

式(12)中:Oi为第i个结点的输出值;C为类别个数,本文中取值为5。由式(12)计算,经过Softmax函数之后每个类别的输出值会除以所有类别输出值的和,这样得到的就是每一个类别的概率值,各个类别概率值之和为1,以此概率值为依据就可对训练样本进行预测,选取预测概率值最大的一类作为样本的预测类别。

3.5 特征融合

图3 数据变换示意图Fig.3 Schematic diagram of data transformation

(13)

式(13):i为图像编号。

3.6 评价指标

在程序中已经使用交叉熵损失函数和准确率(accuracy)来动态度量模型在训练过程中的预测情况,为全面了解模型在样本上的预测性能,本文使用混淆矩阵来查看每一类样本被预测的情况,然后根据混淆矩阵求出精确率(precision,P),召回率(recall,R)和F-measure(F1),即

(14)

(15)

(16)

式中:NTP为预测为正类且预测正确的样本数量;NFP为预测为正类但预测错误的样本数量,即将其他类预测为该类;NFN为负类且预测错误的样本数量;C为类别数量,本文中为5。

4 实验与结果分析

4.1 融合特征与仅图像特征对比

为反映融合特征的性能表现,整理了两组实验数据集进行对比。两组数据集各包含10 000张图片共计5类岩屑,每类2 000张图片。两组数据集的区别:第一组图片如图1中所示,特征较为模糊,人眼很难识别;第二组则特征相对明显,人眼辨识性较强,如图4所示。

图4 5类高质量岩屑图像样本Fig.4 Five types of high-quality debris images

在两组数据集上,分别开展仅图像特征和融合特征的深度学习与测试实验,将识别结果代入式(14)~式(16),得到表3中的结果。实验结果表明,融合图像外特征的模型,岩屑的分类准确率得到了明显提升。在人眼辨识度较高的高质量数据集上提高了3.45个百分点,而在低质量数据集上提升达到20.92个百分点。由此可见融合了图像外特征的模型,普适性与鲁棒性都更优。

表3 两种模型对比Table 3 Comparison of two models

4.2 模型收敛性消融实验

针对仅图像训练模型与融合特征训练模型的收敛能力,在数据集1上设计消融实验。保证除模型不同的情况下其他参数均相同,使用交叉熵来度量损失,训练准确率就是在每张图片被预测为正确类别的概率。训练过程如图5和图6所示。

图5 仅图像特征的训练损失值与准确率变化图Fig.5 Chart of training loss and accuracy of only image feature

图6 融合特征的训练损失值与准确率变化图Fig.6 Chart of training loss and accuracy of mixed feature

仅图像训练模型经过30次训练,在验证集上得到的综合损失值为0.032 0,综合准确率为96.50%。

融合特征模型经过30次训练,在验证集上得到的综合损失值为0.003 5,综合准确率为99.95%,高于仅图像训练3.45个百分点。

对比图5和图6可得,融合特征训练的模型在训练过程中随着迭代次数增加,损失值和正确率曲线较为平稳,无较大波动,反观仅图像训练模型的曲线,验证集损失值在多次迭代之后仍上下起伏,幅度达到0.1,可见融合特征训练较仅图像训练鲁棒性更优。

4.3 模型特征提取器的选择

保证损失函数、优化器、迭代次数、批次大小、学习率等参数均不变的情况下,将模型图像特征提取器更换为以下几种常见网络:VGG16、ResNet和DenseNet在数据集1进行训练,计算其损失值和准确率得到表4。结果表明Xception作为特征提取器时准确率达到最高。

表4 不同网络学习模型对比Table 4 Comparison of different networks

5 结论

本文提出的融合图像特征与图像外特征的岩屑识别模型,结合传统录井与机器学习的优势,简化了录井过程、提高了识别精度,在应用神经网络优秀学习能力与抽象特征提取能力的同时,将岩屑本身的特性抽象为向量,与图像特征结合为更为全面、具体的特征,以此提高了模型的识别准确率与普适性,尤其是在低质量岩屑图像数据集上的效果更为显著。而且,随着需求和现场工作条件的变化,图像外参数还可以进一步量化其他岩性指标,在实际应用中灵活地改变和增加其他特征,以获得更好的实际工作效果,为油田开发提供了一种可靠、高效的方法。

猜你喜欢

岩屑岩性类别
一种识别薄岩性气藏的地震反射特征分析
岩屑床破坏器在水平井斜井段的清洁效果研究
论细碎岩屑地质录井
K 近邻分类法在岩屑数字图像岩性分析中的应用
岩屑实物录井成果网上应用研究
服务类别
论类别股东会
低渗岩性气藏压降法计算库容量改进
中医类别全科医师培养模式的探讨
基于核Fisher判别的致密碎屑岩岩性识别