基于混合随机深度学习的页岩地层图像增强

2020-11-14钟元权

合肥学院学报(综合版) 2020年5期

钟元权

(安徽文达信息工程学院计算机工程学院，合肥 231201)

0 引言

天然多孔介质和材料以及许多合成介质是异质的。因此，对多孔介质形态的鲁棒性表征是一个长期以来引起人们极大关注的问题。[1]多孔介质形态的准确表征不仅可以阐明其复杂孔隙空间的结构，而且可以准确估算其有效流动、传输、反应和弹性。多孔介质成像技术的应用使其成为可能，并且在研究介质微观方面取得了一些进展。成像技术不仅可以直观地显示多孔介质的微观结构，而且可以构建微观多孔介质模型。[2]

使用X射线计算机断层扫描(X-CT)技术，观察多孔介质中天然气水合物的形成和分解具有实时，直观且具有无损的优势。由于颗粒边缘图像体积的影响和X-CT分辨率的限制，多孔介质系统中不同物质的边界域难以确定，影响了多孔介质中水合物状态的准确评估。[3]通过使用计算机技术，收集煤和真实岩石结构的数据，并结合3D重建算法，可以从煤和岩石结构中获取3D重建图像信息。[4]高分辨率聚焦离子束扫描电子显微镜也已成为表征多孔材料微观结构的重要组成部分。但是，扫描过程中，图像的获取成本很高。此外，高分辨率离子束扫描电子显微镜仅可用于小规模样品。[5-6]三维光学层析成像可以在生物体内提供目标分布信息，并克服了平面成像的局限性。因此，在肿瘤检测，基因表达，蛋白质分子检测和表达身体功能变化方面具有巨大的潜在应用前景。[7]

近年来，人工智能和深度学习算法已获得广泛的应用，通过学习算法提高图像质量已经取得了很大的成功。深度学习方法也被认为是使用非线性模块来形成多层次表示形式的算法。对于大数据集和复杂图像时，卷积神经网络(CNN)是首选。卷积层从先前的层中识别出要素的局部连续性，并将它们组合在一起。使用这种架构的原因是假设某些特征在整个图像中会重复出现，并且它们的局部统计量是相同的。这意味着相同的模式共享相同的权重和误差。[8]换句话说，分析的系统是空间固定的。正是这一功能使深度学习成为分析多孔介质问题的一种有吸引力的方法。但是，由于缺乏用于网络训练的大数据集，因此无法进行深度学习。解决该问题的一种方法是通过增强可用于给定多孔介质的图像，以扩展数据集。增强功能使人们可以更好地估计多孔介质的物理特性，例如其渗透性，这是表征流体在其孔隙空间中流动的关键特性。

本文通过提出一种混合方法来解决数据量不足的问题。在所提出的方法中，基于一些初始图像，使用随机重建方法来生成大量多孔介质的图像作为输入数据。然后，使用各种滤镜以在随机生成的图像中生成进一步的变化。最后，通过连接图像的高分辨率和低分辨率片段，将多样化的数据集用于训练深度学习网络。

1 方法

给定可用数据，可以通过使用单个图像或多个图像来增强低分辨率和嘈杂的图像，以产生增强的图像。目标是通过最小化生成的高分辨率图像和原始低质量版本之间的均方误差(mean square errors，MSE)来提高图像质量。[9-11]

1.1 深度学习

在提高图像质量的情况下，深度学习算法通过训练过程来学习仅在高频细节方面有所不同的低分辨率和高分辨率图像之间的映射。实际上，该领域中每种方法的性能都取决于网络的训练方式，而网络的训练方式则受到训练所提供数据集的大小和多样性的控制。因此，使用这种方法的一个突出问题是其要求具有许多用于训练网络的高分辨率图像。[12]另一方面，为复杂的多孔介质设置大量高分辨率图像是不可行的，因为获取它们既费时又昂贵。为了解决该问题，提出了一种方法。该方法使用有限数量的高分辨率图像来为深度学习的训练阶段生成多样化的大型数据集。

1.2 随机建模

使用随机建模的主要目的是增加训练图像的数量并使模式多样化。为此，使用了基于互相关的仿真(Cross Correlation-based Simulation，CCSIM)算法，该算法已被证明能够基于其图像成功地对各种复杂的2D和3D多孔介质进行建模。[13-14]CCSIM表示数字图像(digital image，DI)或要通过计算网格(grid，G)建模的多孔介质，该网格划分为大小重叠的块Tx×Ty，其中G和DI具有相同的大小，相邻块共享具有大小的重叠区域Lx×Ly。然后，从G的角块开始，并沿一维栅格路径访问每个网格块。对于每个网格块，随机选择来自DI的异质性模式，并将其插入到访问块中。将插入的模式称为数据事件DT。然后，根据相邻点和DI之间的相似性选择下一个模式，这意味着，不考虑所有先前构造的块，而仅考虑当前邻域中的那些块用于计算。接下来，基于表示DI与DI之间的卷积的互相关函数来量化相邻块与DI之间的相似度或接近度。

(1)

其中，i∈[0,Tx+x-1)，j∈[0,Ty+y-1)。因此，大小的重叠区域Tx×Ty在两个相邻块之间和一个数据事件DT用于匹配DI中的模式。重叠区域包含一组像素，这些像素是从以前构造的块中选取的，并在公式(1)中使用，识别下一个异构模式。当ψ(i,j;x,y)的值超过预设阈值时，会随机选择一个可接受的阈值，并将其插入G中当前正在访问的块中。重复该过程，直到网格G的所有块都已重构为止。

2 混合随机深度学习算法

提出的混合随机深度学习(Hybrid Stochastic Deep Learning，HSDL)算法的示意图如图1所示。大型数据集对于深度学习的精确度至关重要，但并非总是有这样的数据集。因此，为了解决这个问题，使用了随机的CCSIM算法以生成用作训练的图像。为了多样化，使用各种过滤器对训练图像进行变换，以增加训练数据集之间的多样性。

图1 HSDL算法流程图

随机训练图像的一部分以较大的尺寸生成，以便在将某些滤镜应用到它们时具有相同的质量。因此，旋转和调整大小也被应用于这种图像。深度学习算法使用高质量的训练数据，并使用残差学习策略提取它们与同一集合的放大图像的差异。实际上，训练图像都具有高分辨率，而需要增强的图像是低分辨率图像，即尺寸较小的图像。

文中使用的深度学习神经网络架构是卷积深度学习网络。该网络学习低分辨率输入图像到高分辨率训练图像的映射。所使用的图像的内容相似，但细节不同。为了减少计算时间，从每个训练图像中选择了来自训练数据的的随机块，并将其用于神经网络，而不是处理完整大小的图像。低分辨率图像代表第一层。下一层是卷积层，包含64个3×3大小的滤镜，因此为每个面片分配一个滤镜。除最后一层外，每个卷积层都有64个3×3大小的滤波器。其余19层包含相似的卷积整流线性单元(Rectified Linear Unit，ReLU)元素。初始权重是随机分配的，但在学习过程中已进行了优化。对于隐藏层，使用ReLU元素，它代表非线性激活函数的最简单形式，而不是通常的S型。该层将公式(2)(整流器)

f(x)=log[1+exp(x)]

(2)

用作输入值，而不更改其深度信息。这被称为Softplus或SmoothReLU函数。ReLU具有通过大型训练网络加速计算并使其比普通激活函数快得多的功能。[15]网络的最后一层是单个过滤器，最后是计算MSE的回归层σ2，如公式(3)所示。

(3)

其中σ2代表神经网络的损失函数，y(i,j,k)表示残差图像yResid(i,j,k)和提出的HSDL网络预测图像yHSDL(i,j,k)在(i,j,k)的像素值。

HSDL方法的深度学习部分经过随机梯度下降动量优化训练，其中梯度表示误差。因此，算法在每次迭代后都与动量一起使用，其动量定义为梯度的移动平均值，动量用于防止优化计算收敛到局部最小值或鞍点。高动量参数可以将收敛速度加快到真正的最小值σ2。另一方面，过低的动量系数不能可靠地帮助最小化以避免局部最小值，从而减慢了训练速度。为了具有更稳定的收敛性和高度优化的矩阵运算，梯度下降法仅使用几个训练示例进行更新，该更新用于梯度计算中。动量更新如公式(4)所示。

(4)

这里，Qi(w)是数据集中第一次观察到的损失函数，α是学习率或步长，β是超参数，β∈[0,1]，vt是校正后的偏差。超参数是确定NN结构的变量，例如其隐藏单元数，这些变量确定NN的训练方式。学习速率是另一个超参数，它控制相对于损耗梯度应调整网络权重的程度。其值越低，迭代沿着向下的斜率朝着真正的最小化状态传播的速度就越慢。虽然使用低的学习率初始值似乎可以确保没有将局部最小值视为真正的最小值，但是优化计算也将花费很长时间收敛。表1是HSDL计算中使用的所有参数的值。训练和验证阶段的损失函数(MSE)在图2中进行了比较。最初MSE变化较大，在大约迭代了20次后变化趋于稳定。另外，从图2中也可以看出，100次迭代足以训练网络。

图 2 训练和测试阶段的MSE比较

表1 HDSL算法参数列表

3 结果与讨论

HSDL算法用于分析和建模具有不规则孔隙的复杂页岩地层。为了检查结果的准确性，在严格的统计测试的基础上，对它们进行了计算比较，以衡量增强图像与原始图像之间的相似性。为了更好地证明所提出方法的功能，将结果与双三次插值方法以及常规的深度学习算法进行了比较。

使用的第一个度量是峰值信噪比R，它与双三次插值法和HSDL算法生成的图像一起使用。

(5)

这里，MI表示图像I的最大可能像素值，MSE为均方差。

第二个度量是使用结构相似性指标Is来评估图像特征(例如亮度)的视觉影响。

Is(I1,I2)=lα(I1,I2)cβ(I1,I2)sγ(I1,I2)

(6)

这里，I1代表增强的图像，I2是高分辨率图像。其他三项的含义由公式(7)-(9)给出。

(7)

(8)

(9)

第三个度量是自然图像质量评估法。它估算感知图像质量，测量自然场景的输入图像统计信息与用于训练HSDL网络的数据集中图像特征之间的距离。[16]

表2中列出了计算结果。峰值信噪比和结构相似性指标的较大值表示更好的图像质量。自然图像质量评估法的较低值表示较好的感知质量，并被解释为表示所生成图像的自然场景与参考图像之间的距离较小(相似性更强)。表2表明，由HSDL图像生成的图像会产生峰值信噪比和结构相似性指标的最大值以及自然图像质量评估法的最小值。此外，表2中的定量比较表明，没有丰富训练图像的常规深度学习算法所产生的结果要比HSDL算法产生的结果更不准确。

表2 算法结果对比

通过图像像素点的频率分布，对HSDL算法的准确性进行验证，得到如图3所示页岩图像。其中，(a)为原始图像，(b)为通过HSDL算法获得的图像。从图3中可知，通过HDSL算法能以较低的成本获得质量较高的图像。

(a)

此外，为了进一步验证算法的有效性，采用双三次插值，常规算法以及HSDL算法来生成岩层图像，并对获得的不同岩层图像进行孔隙度预测，得到如图4所示的结果。从图4中可知，HSDL算法生成的图像的孔隙率估算值与原始高分辨率参考图像的孔隙率估算值更接近，对了解地下岩层的物理特性具有更好的指导意义。

图4 不同算法获得的岩层图像孔隙度预测比较

考虑到代表高度非均质多孔介质的页岩地层的形态是一个难题。尽管可以获取和分析此类结构的二维或三维图像，但它们要么不能捕获多孔介质的纳米尺度特征，要么图像太小以致不能准确代表介质。尽管可以使用高分辨率图像来训练深度学习网络以提高低分辨率图像的质量，但是一个重要的障碍是，通过实验手段获得大量高分辨率图像耗时且昂贵，因此，为了解决这个问题，提出了一种混合算法，通过该算法，随机重建可用于生成大量合理的页岩地层图像，然后训练深度学习卷积网络。结果表明，图像质量得到改善，其准确性可得到确认。下一步工作，考虑改进算法，更充分地利用网络学习的特征对图像进行重建，并尝试采用不同的训练策略，以期获得更好的图像重建效果。