APP下载

基于生成对抗网络的岩心薄片岩性智能识别方法

2022-03-21宋文广徐浩王浩张冰心张秋娟涂裕王新城

长江大学学报(自科版) 2022年2期
关键词:薄片岩性岩心

宋文广,徐浩,王浩,张冰心,张秋娟,涂裕,王新城

长江大学计算机科学学院,湖北 荆州 434023

在地质学研究领域中,为了寻找油气资源,储油层的勘探是重要工作之一[1]。钻井获取地下岩心样本,地质专家凭借自身经验鉴定岩心样本的岩性。传统鉴定方法往往是将岩石样本切割打磨成岩心薄片,专业人员通过偏光显微镜观察岩石的结构和特征,再根据个人经验鉴定,最后得出岩性的鉴定结果。传统鉴定方法[2]主要依赖专业人员的知识背景和工作经验。对于大量的岩心薄片岩性辨别,则需要大量的专业人员,耗时耗力,且鉴定结果也受个人感官认识、主观性等诸多因素影响。

20世纪末,LECUN等[3]提出了卷积神经网络(convolutional neural network,CNN)[4],在图像识别领域中取得突破性进展,其准确率远超传统的机器学习方法。传统图像识别方法通过手动设计提取图像特征进行识别,忽略了图像中高维的图像特征。在图像识别中引入CNN,可以自动提取并识别图像高维度特征,解决传统方法中存在的问题。深度学习模型通过自动学习岩性特征,如岩石的颜色、纹理、颗粒、结构构造、蚀变程度等属性[5],建立智能识别模型,提高岩性智能识别准确率。但是,由于岩心薄片图像数据公开少且难以获得,而训练深层的网络模型需要大量的训练样本支撑,较少的岩心薄片图像样本数据不足以训练庞大的网络参数权重[6]。仅用小样本岩心薄片作为训练集训练深度神经网络模型,模型易过拟合,泛化能力差[7],致使岩性识别准确率低,导致智能识别模型在岩性识别中的效果并不理想。此外,常用的数据增强方式通常是对原图像进行几何变换,如对岩心薄片进行翻转、旋转、裁剪、缩放等和颜色变换(如改变颜色、添加噪声、模糊处理、擦除等)[8]。颜色变换的数据增加技术并不适用于岩心薄片图像处理,会干扰其颜色特征[9]。而生成对抗网络(generative adversarial networks,GAN)可以很好地还原真实的岩心薄片图像数据。

GAN[11]是一种由生成器网络模型(generative model,G)和判别器网络模型(discriminative model,D)组成的一种强大的生成对抗网络模型:G的作用是将输入的高斯分布噪声Pz(z)(z为随机噪声数据),通过学习真实数据x的分布Px(x),生成假数据G(z);D的作用是判断输入的数据是真实数据x还是生成器生成的假数据G(z)。G和D交替训练,最大化D的区分度以区分真实数据样本和模拟数据样本,G最小化G(z)与x的数据分布以欺骗D,经过相互博弈,使得D、G 2个模型达到最佳状态。在最佳状态下,判别器输出结果值为0.5,即D(x)与D(G(z))都是0.5,D分辨不出是真实数据还是模拟数据。GAN目标函数为:

(1)

式中:V(D,G)为GAN目标函数;E为期望值。GAN的模型结构如图1所示。

图1 GAN的模型结构Fig.1 Model structure of GAN

原始GAN模型训练时易出现梯度消失、梯度不稳[12]和模型训练不稳定等现象,造成模型崩溃,导致生成图像差、判别器判别能力差。即使再迭代训练多次也无法解决该问题[13]。主要原因是原始GAN要使生成数据分布与真实数据分布的KL(Kullback-Leibler divergence)散度最小,同时又要最大化两者的JS(Jensen-Shannon)散度,这种矛盾的目标使得生成器的优化方向发生错误。且由于JS散度的特性,JS散度是常数,会造成梯度消失。因此,2017年ARJOVSKY M等[14]提出了改进的模型WGAN(Wasserstein GAN)。WGAN的核心改进是将不合理的等价优化的距离度量方式(JS散度/KL散度)更改为Wasserstein距离。用Wasserstein距离来量度真假数据分布之间的距离。Wasserstein距离又称作EM(earth mover)距离,定义为:

(2)

式中:W(PR,PG)为Wasserstein距离;PR为真实样本分布;PG为生成样本分布;П(PR,PG)为PR和PG这2个分布所有可能的联合分布的集合;γ为属于该联合分布的集合;y为生成数据。

从联合分布集合中取样(x,y)~γ,获得真实数据样本x和生成数据样本y,并计算x和y之间的距离||x-y||,然后计算样本对距离的期望E(x,y)~γ(||x-y‖),最后在所有联合分布中使得该期望值取到下界值,该下界值即为Wasserstein距离[15]。Wasserstein距离能在真实样本和生成样本的分布没有重合的情况下,表示出其距离的远近,使得生成的对抗模型不会因为梯度问题而崩溃,确保训练模型稳定。优化目标函数L为:

L=EX~Px(x)[D(x)]-Ez~Pz(z)[D(G(Z))]

(3)

WGAN通过最小化L值,使生成样本分布与真实样本分布接近,最终生成图像实现以预期目标。

为此,该次研究使用Wasserstein GAN[10](WGAN)对抗训练方法,自主学习岩心薄片图像的纹理、颜色等特征,通过生成器生成新的岩心薄片图像并对图像数据进行增强,提高智能识别精度。

1 岩心薄片岩性识别算法

基于生成对抗网络的岩心薄片岩性智能识别方法,其计算过程如图2所示。

图2 岩心薄片岩性识别算法计算过程Fig.2 Algorithm process of core slice lithology identification

1.1 生成对抗网络

1.1.1 生成器模型

生成器模型如图3所示。首先创建一个100维正态分布的向量作为输入数据,再通过RESHAPE操作转换成4×4大小,1024通道数的三维张量,最后通过反卷积层DECONV1~DECONV6进行上采样,最终生成一张大小为256×256、通道数为3的RGB生成图像G(z)。每层的步幅为2,卷积核尺寸为5×5。DECONV1~DECONV5中,添加批量归一化方法(batch normalization,BN),避免梯度消失

图3 生成器模型设计Fig.3 Generator model design

的问题,从而使网络训练稳定;正则化方式的Dropout层使模型避免过拟合且均使用ReLu非线性激活函数;最后一层使用Tanh激活函数,如图4所示。

图4 生成器模型反卷积层Fig.4 Deconvolution layer of generator model

1.1.2 判别器模型

判别器模型如图5所示,输入层为一张大小为256×256、通道数为3的真实图像或者生成判别器模型图像,经过六层卷积层降采样后成为(4,4,1024)三维张量,提取输入图像特征;然后通过平坦层(Flatten)操作将前一层的三维张量变为一维向量;最后通过两层全连接层输出结果,判断出输入的图像是真实样本还是生成样本。其中下采样过程中均采用5×5的卷积核,步幅大小为2,添加批量归一化方法和正则化Dropout层使用LeakyReLu激活函数,如图6所示。

图5 判别器模型设计Fig.5 Discriminator model design

1.1.3 生成对抗网络模型

图6 判别器模型卷积层流程
Fig.6 Convolution layer of discriminator model

生成对抗网络模型训练过程是G和D交替训练。在G训练时,固定D的参数,G通过输入噪声

z

,经过上采样操作后生成一批图像。将生成的图像送入D进行真假识别,利用D反馈的损失值和真假样本之间的Wasserstein距离进行权重更新,最小化Wasserstein距离。判别器模型的训练则是将生成图像和真实图像输入到判别器中进行辨识,通过反馈的损失值去最小化Wasserstein距离。两个模型均采用RMSProp算法对模型权重进行优化调整。最终,真实图像和生成图像之间的Wasserstein 距离越小,表示生成对抗网络模型生成的图像越接近真实图像。

1.2 岩心薄片岩性识别模型

1.2.1 判别器模型迁移

生成对抗网络模型训练完成后,即可生成出高质量的生成图像,所以生成器可以生成判别器无法判断真伪的沉积岩岩心薄片图像,同时判别器学习了岩心薄片图像的大量特征。运用迁移学习在对抗训练中学习到大量特征的判别器模型用于解决岩心薄片岩性识别。使用的岩心薄片岩性识别模型如图7所示。通过参照判别器模型进行设计,保留判别器的卷积层,删掉后面二分类的全连接层,改为三层全连接层,最后一层输出岩心岩性的类别,然后迁移所有卷积层的权重。新的岩心薄片岩性识别模型只需要训练最后两层全连接层和分类层。将生成图像和真实图像一起作为数据集进行训练。

图7 岩心薄片岩性识别模型Fig.7 Lithology identification model of core slice

1.2.2 岩心薄片岩性识别训练

将训练好的生成对抗网络模型的判别器应用到岩心薄片岩性识别中,对判别器卷积层网络参数进行迁移,添加2个全连接层和1个输出层,2个全连接层采用ReLu激活函数,输出层采用softmax激活函数对岩心薄片岩性进行识别。该模型采用的损失函数是交叉熵损失函数:

(4)

其中:

(5)

式中:N为样本数量;i为样本序号;c为种类;M为种类数量;yic为符号函数0或者1,如果是真实样本的类别,则用1表示,否则用0;Pic为第i个样本属于c类的置信度;j为种类数量;yi为c类的得分结果;yj为第j类的得分结果。

利用随机梯度下降法SGD(stochastic gradient descent)对模型参数进行优化调整。

1.3 岩心薄片岩性识别

输入一张岩心薄片图像,通过岩心薄片岩性识别模型提取到图像特征,最后通过输出层softmax激活函数式(6)进行岩性预测:

(6)

式中:Si为概率;ezi为softmax层的输入神经元;zi为第i类的得分。

2 生成对抗网络模型验证

2.1 模型验证环境

硬件:CPU为Intel(R)Core(TM)i7-8700,GPU为NVIDIA Geforce GTX 1080Ti,内存为32G。

软件:操作系统Ubuntu18.04,编译软件为Pycharm,编程框架为Pytorch。

沉积岩岩心薄片数据集中有黏土岩、碎屑岩、碳酸盐岩和凝灰岩4种。每一张岩心薄片都具有相同视野的正交偏光和单偏光显微图像各一张,每一张图像分辨率为1280×1024,其中黏土岩有336张,碎屑岩326张,碳酸盐岩356张,凝灰岩328张。由于图像过大,通过对图像进行裁剪,一张图像裁剪成4张图像并缩放成256×256大小,共计5384张显微岩心薄片图像。最终数据集如表1所示,样本图像如图8所示,训练数据集与测试数据集设置为8∶2。

2.2 模型验证

表1 沉积岩岩心薄片数据表

数据集采用沉积岩岩心薄片图像训练集,学习率设置为0.0002,batch_size设置为32,训练周期为800,判别器和生成器交替训练,训练一次判别器时,需要训练2次生成器,开始时先训练判别器,并在一块NIVDIA Tesla K80显卡上面进行训练。训练初期,图像生成质量差,不能作为样本数据对数据集进行扩充。随着训练周期的不断增长,生成的岩心薄片图像越来越清晰(见图9)。通过Wasserstein距离可以看出生成的样本图像经过不断训练后越来越接近真实图像的分布,如图10所示,当迭代次数大于720时,Wasserstein距离开始收敛。此时,生成器和判别器接近最优状态,得到的生成图像能够以假乱真且可以生成多种类别的沉积岩岩心薄片图像,可以将生成的图像作为样本扩充数据集。

图8 沉积岩岩心薄片样本图Fig.8 The sample of sedimentary rock core slice

图9 生成图像效果图Fig.9 The effect of the generated image

图10 Wasserstein距离Fig.10 Wasserstein distance

2.2.1 新增强算法与传统增强方法对比

在相同的岩心薄片岩性识别模型下,使用新增强算法和传统增强方法,对2种不同的数据增强方法的数据集进行扩充,获得不同的数据集。传统数据增强方法采用图像旋转、高斯噪声、椒盐噪声、高斯模糊4种,其中图像旋转采用对每张图像向左旋转90°或180°或270°,每张图像只旋转一次,对原始数据集扩充1倍。其他3种传统增强方法均是对每张图像进行处理,对原数据集扩充1倍。在生成对抗模型WGAN训练迭代800次完成后,使用生成器为训练集中每张图像生成1张生成图像,大约对原数据集扩充1倍。再设置一组空白对照组,不对原始数据进行扩充。最终不同的数据增强方法下的岩心薄片岩性识别准确率如表2所示。

由表2可知,采用不同的数据增强方法对岩心薄片岩性识别准确率有很大影响。其中不使用增强算法时,岩性识别准确率为88.62%。而使用高斯噪声、椒盐噪声和高斯模糊数据增强方法的岩性识别准确率均低于88.62%,其中高斯模糊增强算法效果最差。这是由于模糊处理后对岩心薄片的纹理特征进行了破坏,使得准确率下降严重。相比之下,图像旋转增强方法的准确率上升1.5个百分点,是因为扩充了数据集的同时,没有破坏图像的颜色纹理特征,但同时也缺乏了图像的多样性,以致于岩性识别准确率提升不高。而采用WGAN增强数据方法,相对于不增强时,准确率提升5.16个百分点,是因为利用训练好的生成器模型生成的逼真图像是原数据集没有的,不仅扩充了数据集,还增加了图像的多样性,使得模型的岩性识别准确率有较大提高。

表2 不同数据增强方法下岩性识别准确率

表3 迁移参数对岩性识别的影响

表4 不同方法下的岩性识别准确率

2.2.2 模型参数迁移试验

在训练好的生成对抗网络中,判别器已经提取到了岩心薄片图像的大量特征,因此通过迁移判别器模型卷积层的参数到岩心薄片岩性识别的模型当中,固定卷积层的参数,只需要训练全连接层即可。通过迁移参数与不迁移参数2组试验数据对比,数据集采用WGAN数据增强方法。由表3可知,通过迁移训练好的生成对抗模型中判别器模型的参数,只需训练后两层的全连接层和分类层,最终迁移参数后的岩心薄片岩性识别模型准确率略高于不迁移的识别模型。原因是由于判别器的损失函数和岩心薄片岩性识别模型的损失函数不同,且二者训练方式不同,造成提取特征时有差异。从结果来看,判别器提取特征能力更为优秀。

2.2.3 不同岩性识别方法对比

为了验证方法的优劣性,通过与传统方法相对比,进行试验对比。试验一:采用人为提取岩心薄片的颜色特征和纹理特征,在HSV颜色特征空间下提取颜色特征[16],利用LBP算子提取纹理特征[17]后使用PCA主成分降维[18],获取低维的纹理特征,再将颜色特征和纹理特征进行融合,将融合后的特征对支持向量机(support vector machine,SVM)进行训练学习,获得一个SVM岩心薄片岩性识别分类器。试验二:利用岩心薄片图像对WGAN进行对抗训练,完成后,利用生成器对原数据集进行增强,然后迁移判别器的卷积层参数到岩心薄片岩性识别模型,只需训练全连接层和分类层。试验三:采用经典网络模型AlexNet进行岩性识别。数据集和试验一的数据相同,均为原始数据集。3种试验方法统计结果数据如表4所示。

通过试验一和试验二数据对比分析,“WGAN+判别器参数迁移”的岩心薄片岩性识别方法明显优于传统方法。传统方法是手动提取特征,只能学习到岩心薄片图像的浅层特征,而试验二通过对抗训练,卷积层可以提取更高维度的图像特征,从而识别准确率较高。试验三和试验二数据对比分析,虽然都是深度学习提取图像特征,但是“WGAN+判别器参数迁移”方法可以通过生成对抗模型中的生成器扩充数据集,并通过迁移判别器参数,保留对抗训练完成后判别器提取到的特征,使得笔者提出的“WGAN+判别器参数迁移”岩性识别模型的智能识别能力较强。该研究成果可以通过模型智能识别岩心薄片的岩性,既提高了识别速度,又降低了对地质专家的依赖性,具有广泛的应用价值。

3 结语

目前关于岩心薄片图像岩性识别的研究鲜有成果,针对传统人工鉴定方法的缺陷和目前较少将生成对抗网络应用于岩心薄片的岩性识别的现状,通过研究首次提出一种基于生成对抗网络的岩心薄片岩性智能识别方法。该方法可以通过训练好的生成对抗模型中的生成器生成岩心薄片图像,扩充原始岩心薄片图像数据集,增加数据集的多样性,可以提高模型预测精度。相对传统数据增强方法,提出的基于生成对抗网络的岩心薄片岩性智能识别方法对于岩心薄片岩性识别准确率有明显提高。判别器参数迁移到岩心薄片岩性识别模型中,保留了判别器提取的岩心薄片特征,进一步提高了岩性识别准确率。通过试验数据对比分析,证明该方法可以提高岩心薄片岩性智能识别精度,精度高达94.93%,完全能够满足生产实践的要求。

猜你喜欢

薄片岩性岩心
来自森林的植物薄片
Osteotomized folded scapular tip free flap for complex midfacial reconstruction
一种识别薄岩性气藏的地震反射特征分析
你真好
你真好
一种页岩岩心资料的保存方法
K 近邻分类法在岩屑数字图像岩性分析中的应用
Acellular allogeneic nerve grafting combined with bone marrow mesenchymal stem cell transplantation for the repair of long-segment sciatic nerve defects: biomechanics and validation of mathematical models
长岩心注CO2气水交替驱试验模拟研究
低渗岩性气藏压降法计算库容量改进