基于改进残差网络的地震相识别方法研究
2022-11-29李增浩硕良勋柴变芳王天意赵云鹤
李增浩, 硕良勋, 柴变芳, 吴 恒, 王天意, 赵云鹤
1. 河北地质大学 信息工程学院, 河北 石家庄 050031; 2. 河北省智能传感物联网技术工程研究中心, 河北 石家庄 050031
0 引言
地震相是由沉积环境所形成的地震特征, 可用于地层解释和预测生油区域以及沉积层岩性, 地震相解释的过程可为后续勘探工作提出指导性的建议[1,2]。随着地震数据采集和处理技术的发展, 地震数据包含的信息愈加丰富, 而传统人工解释的方法工作量大、效率低, 解释过程往往依赖于翻译人员的经验知识,因此亟需引入高效的方法挖掘地震相特征, 快速准确对地震相进行分类, 以减轻相关研究人员的工作负担[3]。
随着深度学习技术在地震领域的应用, 研究者提出了许多基于计算机视觉中语义分割技术的地震相识别。 Chevitarese 等[4]将深度学习模型应用于地震相分割, 产生像素级别的地震图像预测。 Alaudah 等[5]使用基于小尺度(patch) 数据和地震剖面数据训练的反卷积网络用于地震相分类, 但其识别精度低, 分类效果弱于一般的监督学习方法。 Di 等[6]提出了一种编码—解码器模型, 用于分割12 个地震相的几何形状。 Lima 等[7]使用二分类网络分割地震相, 相比Di 等人使用更少的参数获得更加详细的预测结果。Zhang 等[8]使用DeepLabV3+语义分割网络提取多尺度地震相并取得良好效果, 但该网络参数量巨大, 需要大量标注的数据集进行训练。 闫星宇等[9]在U-Net末端加入金字塔池化模块(Pyramid Pooling Module,PPM) 用于提取不同等级的特征信息, 但是边界刻画效果并非十分理想。 图1 为U-Net+PPM 地震相剖面预测结果图片(a) 与地震相标签图, 图1 (b) 中可以看出在地震相之间的边界较为模糊, 且在地震相横向变化幅度较大之处也有较差的预测结果。
图1 地震相标签与U-Net+PPM 在剖面的预测结果Fig.1 Label and prediction in U-Net+PPM
上述语义分割模型的特征通常由深层低分辨率的特征映射得到, 牺牲空间分辨率、 忽略细节信息, 因此模型对于地震相类别间的边缘精细度刻画差, 交叉熵损失函数对于错误类别预测结果惩罚严重。 针对以上问题, 论文提出一种改善地震相边界刻画问题的模型, 加以混合损失辅助模型训练。 一方面, 使用特征提取能力较强的ResNet34 残差网络, 其残差块使用了跳跃连接, 有着良好的深层特征提取能力, 网络末端加入残差重构模块RRM 使用残差方式重构特征,可获得多尺度上下文信息, 提升精度; 另一方面, 改善的损失函数综合特征提取层和网络输出结果, 真实评价差异。
1 融合残差网络和残差重构模块的地震相识别模型
首先分析地震相识别模型ResNet+RRM 提出动机, 并给出模型框架, 然后详细给出模型各部分组成及模型优化目标。
1.1 ResNet+RRM 模型框架
地震相的预测是地震数据图像的语义分割结果,可使用计算机视觉的语义分割方法求解地震相识别问题。 语义分割是一种将图像依据一定规则划分为不同区域的过程[10-12]。 现有的语义分割模型, 如U-Net、DeepLabV3+等模型, 容易忽略细节信息。 因此论文融合残差网络和特征重构模块, 能够获得全局特征信息, 对地震相边界预测有着明显的改善效果。 模型结构如图2 所示。
图2 ResNet+RRM 模型整体结构图Fig.2 Structure of ResNet+RRM model
图2 展示了基于语义分割的地震相识别模型整体架构。 语义分割是一个端到端的过程, 将地震数据作为输入, 地震相分割结果作为输出, 使用语义分割模型可以用来进行地震相的识别。 地震数据自身包含一定的空间规律和分布规律, 使用U-Net 对地震数据进行分割模型编码—解码网络可以获取地震数据中的特征信息, 编码网络可以得到低分辨率的特征, 解码网络可以将其恢复为原图尺寸。 但传统U-Net 的编码网络特征提取能力差, 一旦网络层数加深, 则会不可避免的造成网络过拟合, 产生梯度消失现象, 且缺少特征的传递和复用过程, 以上原因将导致模型分割效率低下、 准确率下降。 因此论文特征提取网络选择ResNet 深度残差网络[13], 其特点是由残差块组成。残差块易于优化, 可以通过增加网络层数的方式提高准确率, 其内部存在跳跃连接, 在保证特征传递过程中叠加原始特征信息减少信息的丢失, 也缓解网络深度增加时带来的梯度消失问题[13]。
但是ResNet 提取的特征不能提取细节特征, 在改进残差网络后加入残差重构模块 (Residual Refinement Module, RRM)[14]。 如图2, 由前一阶段提取的粗糙特征图, 依然存在着模糊和富含噪声的边界。 在这一阶段进行另一个残差的编码—解码过程。这一过程与上一过程的结构相比是一个更加轻量的结构。 下面详细说明ResNet 网络结构和RRM 网络结构。
1.2 ResNet 网络结构
模型的特征提取方面使用基于编码器—解码器结构的ResNet 残差网络, 构建对称的恢复原图尺寸的解码网络, 并使用跳层连接避免过拟合。 该结构可更好缓解上采样过程中丢失信息的问题。 ResNet 网络的基本单元为残差块网络结构。
设x为输入, 残差块网络结构学习结果为
如图3, 残差块为一个残差函数
图3 残差学习Fig.3 Residual learning
当F(x) 为0 时, 构成一个恒等映射, 其可拟合残差[13]。
ResNet 主要通过堆叠两种残差块完成网络模型的搭建(如图4)。 图4 (a) 中输入图像尺寸224×224,通道数为64, 经由卷积核尺寸为3×3、 步长为1 的两个卷积层以及ReLU 激活函数得到输出。 然后与跳跃连接过程中的输入进行通道数上的叠加, 最后又通过一次ReLU 激活函数非线性变换, 输入输出的尺寸和通道数不变。 图4 (b) 中, 输出图像尺寸为原来的一半, 通道数为输入的2 倍, 第一次卷积过程中设置步长为2、 通道数为128, 得大小为112×112×128 的尺寸。 再经由步长为1、 卷积核大小为3×3 的卷积层输出, 与跳跃连接中调整尺寸后的输入进行叠加最后得到输出。
图4 两种ResNet34 残差块结构Fig.4 Two residual blocks in ResNet34
输入的地震剖面图片经由编码解码器后可以提取较为准确的粗糙特征图。 但是这一过程缺少对地震剖面的全局信息的提取, 剖面的全局上下文信息在前一过程中无法充分获得。 因此, 在ResNet34 网络的输出之后利用RRM, 提取分辨率大小不同、 深层和浅层之间的特征信息。
图5 残差重构模块Fig.5 Residual Refinement Module
RRM 模块由上采样和下采样部分构成。 每部分包含4 个阶段, 每一阶段都有一个卷积层。 每一层都具有64 个大小为3×3 的卷积核、 批标准化和ReLU 激活函数, 下采样过程中使用最大池化。 4 个阶段分别将输入的粗糙特征图缩小至原有大小的1/2、 1/4、 1/8 和1/16。 上采样部分使用双线性插值恢复至原特征图尺寸, 使用跳跃连接在特征图大小相同的深浅不同的层之间进行连接, 减少特征信息的丢失。
1.3 融合交叉熵损失和多级损失的优化目标
语义分割是一个端到端的过程, 是对地震图像进行逐像素点的分类, 模型训练的损失函数使用最终划分结果的损失函数与多级损失函数融合的优化目标函数。 最终的损失函数采用多类交叉熵损失函数Lce,表达式为
其中,C为地震相的类别个数,N为地震剖面图片上的像素点个数。p(x) 表示真实标记,q(x) 为预测标记。
由于单一交叉熵损失函数惩罚过于严重, 易于导致边界模糊, 使用多级损失函数。 在模型上采样过程中不同尺寸大小的粗糙特征图与真实地震相标签进行交叉熵计算并求和, 与模型最终预测的特征图进行加权求和, 减少单一交叉熵损失函数的比重。 以下是整体损失函数的公式,α为模型训练超参数。
2 实验与结果分析
2.1 数据集
实验采用数据集为荷兰北海F3 工区公开数据集,F3 工区是一个16×24 km 的区域, 地震道采样点共462 个, 采样间隔4 ms。 本实验采用人工标记好的部分工区, 其中主测线inline 范围为0~400, 共401 条,联络测线crossline 范围0 ~100, 共701 条, 标签共有地震相6 类, 图6 为实验采用工区的地震体与标签。左图为F3 地震体三维立体展示, 右图为地震体对应标签, 通过不同颜色可以看出标签可分为6 类。
图6 实验使用部分F3 地震体与标签Fig.6 F3 seismic block and labels in experiment
2.2 评价指标
为了全面客观评价模型对于地震相图的分类结果, 综合测试集的表现, 实验使用准确率 (PA)、类准确率(CA)、 平均交并比(mIOU) 3 种指标进行评价, 其中Pc为模型预测为c类的像素点的集合,Yc为c类标签像素点的集合。 PA 为在测试集上正确分类的像素点个数与总像素点个数的比值, 表达式为
CA 用于评价模型对于每一类地震相的预测结果
mIOU 指标用于评价模型的分割性能, 衡量每一类地震相预测结果与实际标签的集合重叠程度。
2.3 实验结果
为验证模型混合损失对于模型训练的提升, 固定学习率为1e-4, 因此实验采用不同模型和参数进行对比, 统计结果如表1 所示。
表1 不同模型、 参数对地震相分割结果统计表Table 1 Statistical table of seismic facies segmentation results by different models and parameters
表1 结果表明, U-Net 后端添加RRM 模块后的模型在准确率上有提升, 但是识别精准度依旧较差, 因此需要使用特征提取能力更强的残差网络; 适当增加混合损失的权重可以使模型得到更好的地震相预测结果, 在固定学习率的同时, 模型性能也得到了提升,这说明残差网络对于特征的提取有着较好的能力。 表2 结果表明, 从整体数据来看, 由于前3 类地震相分布较为均匀且横向变化不大, 因此模型学习前3 类的特征较易, 而第5 类、 第6 类地震相的拟合程度差,原因在于第5 类、 第6 类在横向有较大变化, 类与类之间界限不清晰, 而ResNet+RRM 的改进模型由于有着较好的特征提取能力, 因此对第5、 6 类地震相特征学习较好, 边缘刻画因而更加准确。
表2 不同模型类准确率结果统计表Table 2 Statistical table of class accuracy results for different models
图7 中(a)、 (b) 为F3 工区Inline185 上的地震剖面图片与标签图片。 (c) 为U-Net 模型在此剖面上的预测结果, (d) 为添加了RRM 模块的U-Net 模型预测效果, 在黄色圈出的部分进行对比。 可以得出RRM模块对于模型编码器提取到的粗糙特征图有着明显的改良和提升作用。 而(e)、 (f) 则是使用ResNet34+RRM 模型的结果。 对比(c)、 (d) 与(e)、 (f) 的黄色圈出区域可知, ResNet 的全局和边缘特征提取能力高于U-Net 模型, 边缘刻画更为良好, 其中(e) 的超参数值为1e-4, (f) 为实验最优超参数值5e-3 的预测结果图, 在红色箭头处边缘刻画也有着更好的提升。
图7 Inline185 剖面不同模型、 参数预测结果Fig.7 Results of different models and parameters in Inline185 section
3 结论
提出一种融合残差网络和残差重构模块的地震相识别网络结构, 并以最终划分结果的交叉熵损失和多级特征提取交叉熵损失指导模型参数学习。 该方法通过特征重构和特征提炼, 捕捉全局特征、 精细特征,可得到更精准的地震相划分结果, 获得良好的边缘刻画效果。 将此研究方法应用于荷兰北海F3 工区数据的实验结果表明: 模型在地震相主测线剖面的预测中有着更高的精度与更加良好的边缘刻画结果, 具有应用意义。 现有方法主要使用监督方法提高地震相识别效果,未来将考虑自监督学习技术提升模型的适应场景。