基于多尺度卷积自编码器的地震噪声智能压制方法及应用

2024-02-03徐天吉钱忠平唐建明文雪康

石油物探 2024年1期

谢晨,徐天吉,2,钱忠平,沈杰,刘胜,唐建明,文雪康

(1.电子科技大学资源与环境学院,四川成都611731;2.电子科技大学长三角研究院(湖州),浙江湖州313000;3.油气勘探计算机软件国家工程研究中心,东方地球物理公司,北京100088;4.中石化西南油气分公司勘探开发研究院,四川成都610041;5.中石化石油工程地球物理有限公司南方分公司,四川成都610041;6.中国石化西南油气分公司,四川成都610041;7.中国石化西南油气分公司工程监督中心,四川德阳618000)

地震勘探中,受地质、地理、人文等因素的影响,地震数据采集将面对复杂的噪声干扰,对后续的地震数据精确成像及地震资料的沉积、构造、断层、储层等地质解释工作必然产生不利影响[1]。因此,有效地压制各种噪声干扰、提高地震数据的信噪比具有重要的现实意义。

地震数据采集时会受到随机、相干、单频、强能量等多种类型噪声的污染,且各类噪声均具有其独特的特征。例如,随机噪声没有固定波形特征,无规律可循;而相干噪声大多具有一定的运动学特点,波形随时间变化存在一定的规律性。目前,针对地震噪声的压制方法可以归纳为两类,即基于变换域特征的传统去噪方法和基于深度学习的智能去噪方法[2]。其中,传统去噪方法主要根据噪声与有效波在变换域中的动力学、运动学、几何学的差异,有针对性地设计滤波器压制噪声数据[3]。例如,在频率域中针对低频、高频或者具有固定频率的噪声进行滤波去噪;在波数域中的f-k滤波,多应用于面波的压制[4];时空域中的中值滤波对于相干线性噪声具有较好的去噪效果。由环境导致的随机噪声与相干噪声不同,不具有特定的运动学特征,同时也分布于各个频段,其随机性和多样性为去噪工作增加了难度。传统压制随机噪声的方法包括f-x域预测滤波、相干加强技术等,前者对地震剖面上的线性同相轴进行预测,使得噪声和有效信号得以分离[5];后者利用地震同相轴的相干性来压制随机噪声[6]。传统噪声压制方法大多根据噪声所具有的特性进行压制,不同的信号需要不同的流程、参数和方法类型,泛化性较弱;去噪效果也在一定程度上受到参数选择和处理人员经验的影响,主观性较强。因此,探索更简捷、更有效的噪声压制方法是地震勘探领域长期的研究热点。

随着人工智能技术的快速发展,深度学习在地震噪声压制方面的优势正在被深度挖掘和广泛应用。究其原因,深度神经网络模型拥有强大的特征学习能力,能够在较短的计算时间内拟合出目标信息的抽象特征,实现目标特征精确提取[7],因此,深度学习方法相较于前述传统方法在噪声压制中不需要考虑噪声类型,只需通过大量的样本训练网络,使其学到相应的有效信号特征,即可实现对随机、相干等多种噪声的智能压制。同时,由于基于深度学习的噪声智能压制方法具有不需要考虑噪声的类型和复杂性且泛化能力较强等显著优势,已经在地震数据去噪领域取得了大量的研究成果。王钰清等[8]提出一种基于数据增广和卷积神经网络的U型网络(U-Net)压制地震资料中随机噪声的方法;韩卫雪等[9]提出基于卷积神经网络的地震数据随机噪声去除算法,该算法利用CNN通过残差学习实现了叠前/叠后地震数据去噪,更好地压制了随机噪声。目前,虽然大量深度神经网络模型已经应用于地震数据去噪领域,但是网络结构的选择对去噪效果存在一定的影响。高好天等[10]对比了DnCNN、U-Net和曲波变换对地震随机噪声的压制效果,表明DnCNN相对于曲波变换方法能够更好地去除随机噪声,并保护有效信号;同时,U-Net比DnCNN更能够在地震随机噪声压制中取得良好的效果。雷景生等[11]提出一种基于Inception模块的卷积自编码器图像去噪算法,该算法的去噪结果表明,InceptionV4卷积结构能够增强网络提取特征的能力。本文将该卷积结构引入地震噪声压制领域,以提高网络从地震数据中提取噪声特征的能力,并获得信噪比更高的地震数据。

总之,基于深度学习的地震噪声智能压制方法能够有效地从大数据中挖掘出丰富的抽象特征表达,从而达到高质量的去噪效果。然而,目前大多数智能去噪方法采用了基于数据驱动的监督学习型算法,在训练神经网络时需要大量无噪声的地震数据作为标签数据进行训练,存在难以获取实际无噪声数据、去噪效果严重依赖无噪数据的弊端。因此,探索针对小样本地震数据噪声压制的深度学习算法,不仅需要克服传统去噪方法的局限性和监督学习算法依赖大量样本数据的弊端,而且在提升地震数据质量、减少处理环节、缩短处理周期、节约人工成本等方面具有重要意义。

为此,针对地震噪声压制问题和传统去噪方法的不足,本文基于多尺度卷积自编码器开展地震噪声智能压制方法研究,旨在高效、高质量地压制地震数据中随机、相干等噪声。同时,为了解决实际无噪声训练数据稀缺的问题,重点从神经网络模型和训练策略两方面实施针对性的设计,拟融合InceptionV4的卷积结构以增强神经网络提取特征的能力,并引入注意力机制,使得神经网络将有限的学习能力分配到有效特征的学习上,以充分利用少量的无噪声数据。此外,在训练策略上拟采用迁移学习的方法,将利用正演地震数据训练得到的神经网络模型应用到实际地震数据去噪问题上,以降低训练成本并有效利用少量的无噪声样本,探索适合压制实际地震数据噪声的智能方法。

1 方法原理

采用深度学习智能方法压制地震噪声的效果受多方面因素影响,如神经网络结构、训练策略等。针对上述因素,首先从神经网络结构方面着手,搭建基于InceptionV4和注意力机制的卷积自编码器,利用其较强的特征提取和表达能力有效压制噪声;其次在训练策略层面,采用迁移学习的方式,仅利用少量无噪声实际地震数据使神经网络从正演模拟数据噪声压制过渡到实际地震数据噪声压制,并在实际地震数据应用中保持良好的压制效果。

1.1 自编码器

自编码器是一种常用于地震噪声压制的深度学习神经网络模型,以此为基础结构衍生出了大量性能优异的神经网络模型,并将其广泛应用于地震噪声压制领域。该神经网络由对称的编码阶段和解码阶段构成,且具有重构过程简单、可堆叠多层等优点。传统自编码器的原理是在输出层得到重构的输入数据,使得重构数据尽可能地接近输入数据[12],具体结构如图1所示。其中编码器主要负责提取输入数据的重要特征表达,而解码器则需要利用该特征表达重构数据。

图1 传统自编码器结构

根据图1的自编码器结构,其编码、解码的过程可描述如下[13]。

编码过程:

h1=f1(W1x+b1)

(1)

解码过程:

y=f2(W2h1+b2)

(2)

式中:W1,b1为编码器的权重和偏置;W2,b2为解码器的权重和偏置;f1和f2分别为编码和解码的非线性变换函数;h1为编码器输出。自编码器的作用是利用优化模型的参数使得重构输出y尽可能地接近输入x,如(3)式所示:

(3)

式中:L(·)表示L2范数;θ1为编码参数,θ1=[W1,b1];θ2为解码参数[14],θ2=[W2,b2]。

1.2 多尺度卷积自编码器

卷积神经网络因其局部连接和权值共享的方式降低了神经网络的参数规模和复杂度,而传统的自编码器对称式的模型结构具有较强的特征提取能力和较高的可堆叠性,卷积自编码器则结合两者的优点,将传统自编码器中的全连接层用卷积层和池化层代替,其对称结构与传统自编码器相似,卷积操作的输入数据与卷积神经网络类似[15],利用多层的卷积处理提高了神经网络从多维数据中提取特征表达的能力,并且保留了多维数据中的空间信息,因此具有更高的运算效率。

为了适应实际地震数据较高的复杂性,本文网络模型的卷积模块采用InceptionV4多尺度卷积的部分模块,该卷积模块包含多种大小的卷积核,可以对同一输入映射上的多个不同变换结果进行并行计算,并输出融合结果,从不同尺度提取深层和浅层特征,提高了模型的泛化能力[16]。与此同时,该网络模型在增加网络深度和宽度的同时减少了参数体量[17],降低了计算成本,还可以有效地提取地震数据的复杂特征。

本文在编码阶段采用Inception-A,Inception-B,Inception-C的卷积结构搭建特征提取器,并且为了减少因池化层导致的特征丢失现象,在上述3个模块之间分别插入Reduction-A和Reduction-B模块对特征图像进行下采样,该方式相比较简单的池化层更好地保留了特征信息,在减小特征尺寸的前提下尽可能多地传递了重要特征表达。

1.3 注意力机制

注意力机制是将网络有限的注意力集中于目的区域以提升获取有效信息的效率,为了合理利用网络的有限资源,需要引入注意力机制来实现有侧重地观测关注点[18]。本文基于地震资料的特点引入空间软注意力机制模块,将整个地震数据各空间位置的重要程度利用一组连续分布且可微可学习的权重进行衡量,并根据网络的前、后传播特点更新权重参数,以指导网络着重学习噪声与有效信号的特征,达到准确压制噪声的效果。该模块包含卷积和矩阵点乘两个部分,通过卷积部分生成权值矩阵,并在点乘部分将特征图与权值矩阵相点乘,实现对重要特征的重点关注。

1.4 迁移学习

在基于数据驱动的深度学习中,标签数据的质量是网络效果的重要保证,而地震数据通常缺乏高质量的标签数据,因此实际地震数据去噪时,网络在训练阶段往往陷入训练效果对标签数据的依赖与标签数据稀缺之间的矛盾。在实际应用中,由于合成数据和实际数据的噪声压制任务在数据、任务和网络模型方面均具有高度的相似性,因此本文考虑引入迁移学习的训练策略,将利用合成数据训练得到的网络参数作为实际模型的初始化参数,再利用少量的实际样本进行模型参数的微调,使得该模型对于实际地震数据具有更好的适应性和泛化能力,以提高其噪声压制效果。

1.5 自编码器网络设计

自编码器网络整体架构与传统自编码器类似,主要由编码器和解码器两部分组成。自编码器网络架构如图2所示。

图2 自编码器网络架构

在编码器阶段,网络由InceptionV4卷积模块中的Inception-A、Reduction-A、Inception-B、Reduction-B、Inception-C顺序连接组成,为了减少网络深度的增加对网络性能的影响,同时提高网络的收敛速率,本文在每个模块均采用残差学习的方式对网络进行训练。

在编码器阶段,首先由连续交叉的卷积和下采样模块提取出含噪数据中不同空间尺度的特征,再经过Dense全连接层进行特征映射以获取丰富的特征表达。其中,在两个全连接层之间设置一个DropOut层,以避免网络出现过拟合的现象,该层的原理是在训练时随机地让网络中一些节点失效,不参与向前传播,以此来提高模型的泛化能力和鲁棒性,且不会过于依赖某些局部特征。

在解码器阶段,首先采用两个多尺度反卷积层同时对特征数据进行上采样和映射,在反卷积模块中使用1×1、3×3和5×5的卷积核并行卷积。与此同时,两个反卷积模块分别与前述的Inception-A和Inception-B特征提取模块跳跃连接。该连接机制能够促使神经网络在重构阶段充分利用特征提取阶段所获得的丰富特征,具有规避特征丢失、恢复细节信息的作用。经过两个反卷积模块处理后,再通过一个残差卷积模块完善重构结果,该模块中包含6个3×3的卷积层,每个卷积层均利用Tanh函数进行激活。

最后,在模型中引入空间软注意力机制模块,引导模型有侧重地学习噪声特征。本文实现的注意力机制模块由一个卷积层和一个Softmax激活层连接组成,如图3所示。将解码器的输出作为输入,再与含噪数据利用长路径拼接,接着利用1×1的卷积层提取注意力信息,最后通过Softmax函数进行归一化处理,得到归一化后的权重系数矩阵。将权重系数矩阵与解码器的输出点乘即可获得整体的输出。

图3 注意力机制模块

2 模型试算

利用正演数值模拟地震数据,可以验证本文方法的有效性。设计长81m、深700m的二维地质模型,包含4层水平层状介质,正演模型参数如表1所示。以主频为40Hz的Rick子波为激发震源,设置81个检波点,时间采样间隔为1ms,利用波动方程可以正演模拟地震波在该模型中传播的地震记录,获得的单炮正演地震数据如图4a所示。图4b至图4f分别为在原始正演模拟地震数据中加入噪声后形成的单炮记录及不同方法的去噪结果。

表1 正演模型参数

图4 正演地震数据去噪对比a 单炮正演地震数据; b 加噪后的正演地震数据; c 本文方法去噪后的地震数据; d 本文方法得到的去噪残差; e DnCNN方法去噪后的地震数据; f DnCNN方法得到的去噪残差

在野外实测地震记录中,往往包含大量的随机噪声和相干噪声。为了与实际地震数据对比,利用公式(4),在正演单炮地震记录中添加单频、多频、强能量单频和弱能量单频等4种信号作为拟压制的噪声(图5)。

(4)

图5 4种噪声

式中:xF为仿真地震信号;x1,x2分别为xF的两个分量;A1,A2均为振幅;Q为吸收系数;t为传播时间;f1,f2均为频率;φ1,φ2均为相位;上述4种噪声信号的参数如表2所示。

表2 噪声信号的参数描述

分别将上述4种噪声信号和均值为0、方差为0.1的高斯随机噪声加入地震数据中,可形成与野外实际地震记录近似、含严重噪声的正演模拟地震数据。

得到了含有噪声的地震记录后,利用本文方法进行噪声压制。本文对于地震数据的处理策略是,将完整的地震数据利用大小为16×16、步长为1的窗口滑动截取,产生大量训练样本,以更好地提取地震数据细节信息。由于本文方法包含监督学习模型,因此需要利用大量的含噪声与无噪声样本对其进行训练。模型参数的更新是通过优化重构数据与原始无噪声数据间的损失函数实现的。

获取训练集后,利用Keras搭建模型、Adam优化器,并将学习率设置为1×10-5,损失函数为重构输出与无噪声样本之间的均方根误差。由于地震数据正负均有,若选择sigmoid或ReLu激活函数会丢失负数部分,因此在模型搭建过程中,均采用了tanh激活函数。训练时,batch_size设置为64,训练100

次,保存均方差最小的模型参数。利用最优模型对图4b 中的含噪地震数据进行处理,获得了如图4c所示的噪声压制效果,与此同时,利用DnCNN方法针对测试数据进行处理,结果如图4e所示。

首先从定性的角度加以验证,一方面,依靠残差法原理,基于噪声压制结果与原始数据的差值[19]观察被压制部分是否为噪声,对试验效果进行初步的直观判断。利用本文方法和DnCNN方法得到的去噪残差分别如图4d和图4f所示,可以发现本文方法压制了绝大部分的随机噪声和相干噪声,同时最大程度地避免了有效信号的损失,具有较好的保幅性。在噪声压制和有效信号的恢复效果上,本文方法均显著优于DnCNN方法。将本文方法、DnCNN方法的噪声压制结果与原始数据的振幅属性进行对比,对本文方法的保幅性进行评价[20],得到的结果如图6所示。图6a所示的平均振幅中,本文方法得到的去噪结果与原始数据大致趋势相同,部分噪声压制后的平均振幅变小,符合某些道的噪声振幅值相较于有效信号较大的特点,本文方法相较于DnCNN方法具有更好的保幅性;图6b所示的平均绝对振幅值中,相较于DnCNN方法去噪结果,本文方法去噪结果与原始数据的大致趋势更为一致;图6c所示的均方根振幅最能说明问题,本文方法去噪结果与原始数据趋势基本一致,在振幅值较大的道,本文方法的保幅效果明显优于DnCNN方法的保幅效果。综上,本文方法在有效压制噪声的同时具有良好的保幅特性。

图6 正演数据振幅属性a 平均振幅对比; b 平均绝对振幅对比; c 均方根振幅对比

其次,在定量分析方面,分别利用均方根误差(MSE)、信噪比(SNR)以及峰值信噪比(PSNR)3个评价指标对比说明去噪效果。其中,MSE的计算公式如(5)式所示,用来衡量重构数据与原始数据间的偏差;SNR的计算公式如(6)式所示,SNR代表有效信号与噪声的功率比,值越大则说明噪声越少;PSNR与MSE类似,可以用于衡量重构数据与原始数据的相似度,其计算公式如(7)式所示。

(5)

(6)

(7)

表3 DnCNN方法与本文方法去噪评价指标

由上述3种评价指标的对比可知,本文方法的噪声压制效果明显优于DnCNN方法的压制效果。MSE和PSNR指标的对比,说明本文方法能够更有效地恢复有效信号,而SNR指标的大幅度提升则说明本文方法压制噪声更彻底,可大幅度提升地震数据的信噪比。

综上所述,本文方法可有效压制正演模拟数据中的随机噪声和相干噪声。此外,本文方法具有良好的保幅特性,在有效信号的重建方面更具优势。

3 复杂山前带地震资料智能去噪

龙门山前复杂构造带天然气资源丰富,已经发现了中坝、孝新合(孝泉-新场-合兴场)、磨溪和卧龙河等大型气藏,勘探开发前景十分广阔。试验区位于龙门山前缘川西绵阳罗浮山一带,地表以喀斯特地貌为主,高陡碳酸盐岩地层出露,地震采集难度大;地下的深层海相储层为油气攻关目标,储层埋藏深,地震信号高频衰减快、主频低、频带窄。受工厂生产、景区建设、大型车辆等复杂环境的影响,采集得到的地震数据包含了多种噪声源的干扰(图7),噪声类型复杂,获得高信噪比、高品质的地震资料难度极大。

图7 实际叠前地震数据

利用前述噪声压制方法,开展了针对川西龙门山前复杂构造带地震数据的噪声智能压制试验。首先,利用1.5节中的神经网络模型压制实际地震数据噪声;其次,在该网络训练阶段,针对实际无噪声数据的可用数据少、获取难度大等问题,根据迁移学习的原理,利用以正演数据集训练得到的参数初始化网络,以及现有的少量实际地震数据集继续训练。其中,试验处理的实际地震数据共720道,每道长度6s,设置大小为16×16,步长为1的窗口滑动截取训练集。由于实际无噪声地震数据的稀缺,适当调整训练超参数,将训练批次减少为32,训练轮数增加为200轮,迁移训练结束后,保存重构数据与原始数据均方差最小的网络参数,再利用最优网络模型对实际低信噪比地震数据进行测试。

针对如图7所示的实际地震数据,对比分析本文方法与以Radon变换为主的传统噪声压制方法的压制效果,结果表明前者在噪声压制、有效信号恢复等方面更具优势。本文方法与传统方法的压制效果如图8所示。分析可知,首先,本文方法能够有效压制工业电、高频干扰、随机背景噪声等噪声;其次,本文方法压制直达波的效果优于传统方法的压制效果,但压制并不彻底,仍存在残留噪声;再者,在面波的压制效果上,本文方法能够有效压制大部分面波干扰。此外,两种方法的噪声残差分别如图8b和图8d所示,本文方法在压制过程中对有效信号的损失相对较少,具有一定的保幅性,并且能够在被面波和工业电噪声严重污染的区域恢复并增强双曲波形式的有效信号。

图8 实际地震数据去噪效果对比a 本文方法压制后的地震数据; b 本文方法噪声残差; c 传统方法压制后的地震数据; d 传统方法噪声残差

此外,从平均振幅、平均绝对振幅以及均方根振幅3个方面对比分析,可得出本文方法具有更好的保幅特性的结论。在图9a所示的平均振幅对比中,本文方法压制后的地震数据基本与原始地震数据大致吻合,在振幅值较大的地方明显变小,符合某些道的噪声振幅值较有效信号相对较大的特点,且振幅值有正有负。对于图9b中的平均绝对振幅,本文方法的去噪结果与原始地震数据基本一致,并且与传统方法的去噪结果相比,在涉及最大或最小值的道时,振幅值明显变小。从图9c所示的均方根振幅对比可以看出,本文方法得到的去噪结果相较于传统方法更贴合原始数据振幅,趋势基本一致,符合噪声压制过程中的均方根变化规律。

图9 实际数据振幅属性a 平均振幅对比; b 平均绝对振幅对比; c 均方根振幅对比

总体看,本文方法对于实际地震数据中的多种噪声类型都具有一定的压制能力,并且在保持噪声压制能力的前提下,能够有效恢复有效信号。此外,相较于传统方法,本文方法简洁的处理思路和较强的噪声普适性使得其具有良好的竞争力和应用潜力。

为了进一步证明本文方法的实际地震噪声压制能力,利用该方法对共计114炮,每炮360道的低信噪比实际地震数据进行了噪声压制处理,并对压制后的地震数据进行叠加处理,图10展示了去噪前叠加、传统方法去噪后以及本文方法去噪后再叠加的剖面。

图10 去噪前后叠加剖面局部效果对比a 去噪前叠加; b a中黄框部分放大显示; c 传统方法去噪后叠加; d c中黄框部分放大显示; e 本文方法去噪后叠加; f e中黄框部分放大显示

从叠加剖面可以看出,传统方法和本文方法均能有效压制实际低信噪比地震数据中的大部分噪声干扰,并清晰地恢复出有效波。但是从两者的对比中可看出,本文方法对有效波的恢复更清晰,同相轴更连续,细节特征更明显,局部对比效果如图10b,图10d 以及图10f所示。在针对某些复杂噪声的压制上,本文方法相较于传统方法更具可行性,前者能够突破后者的局限性,有效地压制噪声。

综上所述,本文方法针对实际低信噪比地震数据在多种噪声的压制和有效信号的恢复效果上均优于传统方法,并且在节省成本、提高效率、降低学习成本等方面具有一定优势。当然,本文方法的去噪效果也存在一定的不足,如在噪声压制过程中会产生假频干扰,有效信号的保幅性还有待提高。

4 结论与认识

本文建立了一种有别于传统噪声压制模式的深度神经网络方法,将基于InceptionV4卷积自编码器引入地震噪声压制领域,同时融合注意力机制和迁移学习训练策略,使得该方法在网络结构方面具有较强的特征提取与建模能力,也在训练策略方面达成了有效利用少量无噪声数据的目的。本文方法在龙门山前“双复杂”区域取得了良好的应用效果,有效压制了绝大部分的随机噪声和相干噪声,同时较好地恢复了有效信号。此外,本文方法可泛化性强、处理环节简洁,具有良好的应用前景。