基于扩散模型的地震数据随机噪声压制方法
2024-01-01吴迪文武门哲马一凡
摘要: 地震数据中的随机噪声毫无规律,常规去噪方法难以达到理想的效果,影响后续的地震数据解释和分析。为此,提出一种基于扩散模型的地震信号去噪方法。该方法的前向扩散过程是通过对地震数据进行一定程度的加噪,将地震数据变成存在大量各向同性的高斯噪声的含噪地震数据,再利用训练后的扩散模型对含噪数据进行重建,提高地震数据的信噪比。预测网络部分是基于改进的U‐Net 网络,该网络中引入了注意力模块和ResNet 模块,以提高网络对重要区域的关注度,避免深度网络中的梯度消失问题。理论数据和实际数据的应用结果均验证了文中方法的有效性。该方法去噪效果远超FX 滤波、SVD 等传统去噪方法,同时也比经典的深度学习网络CNN、GAN 更加优秀,能够完整地保留有效信号,极大提升地震数据的质量。
关键词: 随机噪声压制,扩散模型,残差模块,注意力模块
中图分类号:P631 文献标识码:A DOI:10. 13810/j. cnki. issn. 1000-7210. 2024. 06. 007
0 前言
在地震数据采集过程中不可避免地会接收到大量噪声,会降低数据的质量和准确性,影响数据的分析、解释和应用。因此,抑制噪声并重建地震记录已成为地震数据处理的重要任务。根据噪声的规则性与不规则性,噪声又可以分为规则噪声和不规则噪声。规则噪声是在地震数据中以一定的周期性或模式性出现的噪声,这种噪声可能源于人类活动(如交通、建筑施工等)或自然现象(如海浪、风等)。由于其周期性,规则噪声通常较容易识别和处理。不规则噪声是在地震数据中以随机或不确定的方式出现。这种噪声可能是由地下岩层的复杂结构、仪器故障、电磁干扰等引起的。不规则噪声可能在频谱和时间域上都表现出随机性,因此处理起来更具挑战性。
目前,地震数据随机噪声压制方法大致可分为基于模型驱动和基于数据驱动两类。基于模型驱动的方法通常需要对地震噪声和信号的性质有一定的先验了解,并且需要建立一个数学模型描述地震数据中的噪声和信号。基于模型驱动的方法主要有FX 域预测滤波[1]、小波变换[2-4]、奇异值分解(SingularValue Decomposition,SVD)[5-7]、自适应滤波[8-11]、稀疏表示[12-13]等。FX 域预测滤波主要思路是将地震数据从直观的时间—空间域转换至频率—空间域进行分析与处理。这一过程旨在利用不同域的特性更有效地识别并处理噪声。FX 域预测滤波在其设计的特定应用(如线性噪声抑制)上效果良好,但缺乏处理复杂、非线性噪声的能力。基于小波变换的方法是地震数据随机噪声压制中常用的技术之一,通过将待去噪的信号进行小波分解,得到不同频率的子信号。选择适当的阈值来判断哪些小波系数表示噪声,哪些表示信号。然而,小波变换并不适用于所有类型的噪声。SVD 方法是一种常用的矩阵分解方法,可以用于地震数据的随机噪声压制。通过对奇异值的大小判断,选择一个阈值,将较小的奇异值置为零,从而实现噪声的压制,但对于一些特定的噪声类型可能效果不佳。此外,SVD 方法也可能会对地震信号造成一定的损失。自适应滤波也是一种常用的地震数据随机噪声压制方法。该方法根据数据的统计特性自动调整滤波器参数并将地震数据输入自适应滤波器,通过不断调整滤波器参数,使得滤波器能够最小化噪声的影响,但性能受到滤波器参数的选择和调整的影响,选择合适参数较为困难。稀疏表示可以用于地震数据的随机噪声压制。通过字典学习算法学习一个稀疏字典,该字典包含了地震信号的基本原子或模式。然后对于每个地震数据样本,使用稀疏编码算法将其表示为字典中的一组稀疏系数。通过设置一个适当的阈值,将稀疏系数中较小的值设为零,从而抑制噪声。稀疏表示方法的性能高度依赖于字典的选择。如果选择的字典不适合地震信号的特征,可能无法有效地压制噪声。
总体来说基于模型驱动的噪声压制方法,发展的时间比较长,技术相对比较成熟。但由于其在压制噪声的时候初始条件和数学原理是从频率强弱、区域统计规律、振幅强弱等特定角度出发,方法存在一定的局限性[14-16]。
随着深度学习技术的不断发展,基于数据驱动的噪声压制方法得到了较快发展,这类方法不需要对地震噪声和信号的性质有明确的先验知识,它们从数据本身学习和提取特征。
基于不同深度学习框架产生了很多噪声压制方法。如韩卫雪等[17] 基于深度学习卷积神经网络(CNN)的地震数据随机噪声去除算法。该方法与常规地震数据去噪算法相比具有更强的噪声压制能力。李海山等[18]根据深度残差网络原理设计了一种深层随机噪声压制网络,并应用于叠前随机噪声压制,取得了较好的效果。但CNN 自身结构相对简单,存在对训练样本要求高等问题[19-20]。生成对抗网络(Generative Adversarial Networks,GAN )的出现在一定程度上解决了这些问题。Wang 等[21-23]将GAN 用于地震数据的噪声压制,取得了一定的效果。由于GAN 网络的训练过程是基于特定数据集的,在处理不同地震数据集或不同噪声类型时,GAN 网络存在不稳定的问题。特别是在处理大规模地震数据时其模型泛化能力有限。
扩散模型与GAN 网络相比更加稳定且易于训练,其扩散过程可以看作是一个平滑滤波器,它在保持信号重要特征的同时,逐渐抹平那些不连续的、随机的高频波动,这些高频波动往往代表了噪声成分。在这个过程中,每个数据点(粒子)的新值由周围点(邻近粒子)的加权平均计算,权重通常与距离成反比,即距离越近的点影响越大[24-26]。
本文构建一种适合地震信号去噪的扩散网络模型并将之用于地震数据随机噪声的去除。预测网络基于改进的U-Net 网络,网络中引入了注意力模块,用于提高网络对重要区域的关注度;使用ResNet 模块构建深度网络,从而避免了深度网络中的梯度消失问题。实验证明,本文方法较其他深度学习方法而言,可以进行无监督学习,同时能有效的去除随机噪声,大大提升了实用性。