地震绕射波弱信号U-net网络提取方法
2023-03-15盛同杰赵惊涛彭苏萍
盛同杰, 赵惊涛,*, 彭苏萍
1 中国矿业大学(北京)地球科学与测绘工程, 北京 100083 2 煤炭资源与安全开采国家重点实验室, 北京 100083
0 引言
传统地震反射波勘探受限于菲涅尔带假设,对地下小尺度非均匀地质体的探测精度有限(王志辉等,2019).绕射波是尖灭、断层、溶洞等小尺度非均匀地质体的地震响应,充分利用绕射波信息能够有效提高小尺度地质体的探测精度(赵惊涛等,2011).与反射波相比,绕射波能量弱1到2个数量级,在偏移成像剖面中绕射波通常会被强能量的反射波掩盖(韩令贺等,2021).因此,从地震数据中提取绕射波,并将绕射波单独成像成为精细刻画地下小尺度地质体、提高地震勘探横向分辨率的关键.为了分离反射波与绕射波,国内外众多学者已开展大量尝试和研究,诸多绕射波分离与成像方法相继提出,主要分为两大类:数据域绕射波分离和成像域绕射波分离方法.
第一类数据域绕射波分离方法在偏移前的地震数据域完成.Fomel(2002)研究了平面波解构滤波器(PWD),根据反射波和绕射波的几何形态差异,在叠后数据中分离绕射波.朱生旺等(2013)联合局部倾角滤波和预测反演方法分离绕射波.PWD方法在绕射波分离中得到广泛的应用,但该方法不能很好处理绕射波相位反转问题.为解决相位反转问题,孔雪等(2017)采用平面波预测滤波技术,使得去除反射波后的绕射波场保真度得到了提高,保持了绕射波原有的相位信息.Gong等(2017)使用基于变速的Slot正演和成像算子代替顶点时移Radon算子,同时采用阈值分割快速迭代算法分离绕射波;Zhao等(2019)将炮集数据变换至拉平炮域,利用空间变化中值滤波器(space-varying media filter)分离绕射波.Li等(2021a)基于反射波和绕射波的几何差异,构建不同的结构元素,通过数学形态学滤波器分离绕射波.地震记录中的反射波可视为源自虚震源,而绕射波传播无此规律,基于此原理,Li等(2021b)研究了共虚震源变换,在共虚震源道集中分离绕射波.此外,共反射面方法(Rad et al., 2018)、多聚焦方法(Berkovitch, 2009)、奇异值分解技术(魏巍等,2020)等也被提出用于绕射波分离与成像.
第二类成像域绕射波分离方法在偏移过程中或偏移后进行,对速度模型具有一定的依赖性.由于反射波能量主要集中在菲涅尔带内,Moser和Howard(2008)在偏移过程中利用反稳相滤波器,抑制反射波能量.Li等(2020)结合反稳相滤波器和反极性滤波器的特点,提出一种自适应相位滤波器压制反射波.Zhao等(2016)提出基于马氏距离的绕射波成像方法,通过基于马氏距离的振幅衰减运算修改偏移核,在偏移过程中衰减反射波,增强绕射波.李正伟等(2018)通过精确切除倾角域-偏移距域道集中的菲涅尔带,压制反射波能量,提取绕射波.汪天池等(2020)通过逆时偏移生成倾角道集,利用中值滤波分离倾角道集中的反射波和绕射波.Zhao等(2020)提出了基于马氏距离的低秩-稀疏矩阵分解方法,分离倾角域中的三维绕射波.此外,第一类分离方法也可以应用到偏移后的道集中,如Radon变换(Klokov and Fomel, 2012; Silvestrov et al., 2016)、PWD(刘斌等,2014)等.
传统绕射波分离方法通常需要地震处理人员凭借经验反复调整方法参数和测试才能达到较好的效果,该过程十分耗时且主观性强,无法满足高效智能的大数据处理需求,亟需在其他领域寻找新的智能化方法.深度学习已成为热门研究方向,近年来发展了大量经典的方法,其中神经网络最为突出.Serfaty等(2017)将深度学习方法应用到方位倾角道集绕射波分离中,通过主成分分析(PCA)和卷积神经网络进行绕射波的识别与分类.Yu等(2019)提出一种基于深度卷积神经网络的地震数据去噪方法,与传统地震数据去噪方法相比,该方法无需对噪声和信号进行精确建模及调整优化参数,实现 “智能”去噪.王钰清等(2019)针对地震数据去噪存在的领域标注数据不足的问题,提出一种基于数据生成和增广的卷积神经网络去噪框架,并利用可视化方法对卷积神经网络的每一层的学习内容进行了一定程度上的解释.安振芳等(2020)提出一种小样本卷积神经网络的井震映射反演方法,通过网络结构优化设计,应对在井少地区因无法获得大量测井数据而导致的卷积神经网络过拟合问题,有效地提高反演精度.王坤喜等(2021)通过数据增广和迁移学习构建了衰减多次波的卷积神经网络模型,使模型具有良好的泛化性和稳定性.张逸伦等(2021) 使用U-net模型拾取初至,大幅降低了低信噪比情况下漏拾与误拾发生的概率.
针对绕射波弱信号分离中的陡倾角强反射波去除难题,本文研究了基于U-net网络和注意力机制的绕射波智能分离方法.融合注意力机制和U-net网络,构建了绕射波分离U-net网络;通过数据增广方法扩充数值模拟数据与实际数据,结合增广的模拟数据与实际数据构建绕射波分离训练数据集从而提升U-net网络的泛化性,利用训练后的U-net网络分离绕射波,并对分离后的绕射波偏移成像.数值模拟数据和实际资料应用表明,本文构建的U-net网络能够有效去除陡倾角反射,更加完整地保留绕射波振幅,提升绕射成像横向分辨率.
1 方法原理
1.1 卷积注意力
深度学习中的注意力机制借鉴了人类的视觉注意力,其核心思想是从特征映射包含的众多特征信息中选择出对当前任务更重要的信息.Woo等(2018)提出了卷积注意力模块(Convolutional Block Attention Module,CBAM),CBAM使网络能更好地聚焦重要的特征,压制一些不重要的特征,有效提升网络的性能,作为轻量级的通用模块,可以插入到任何卷积神经网络中.CBAM包含通道注意力模块和空间注意力模块:
通道注意力模块关注特征映射中重要特征的内容,通道注意力以中间层的特征映射F为输入,其计算过程如下:
Mc(F)=σ(MLP(AvgPool(F))
+MLP(MaxPool(F))),
(1)
其中,Mc(·)表示通道注意力,σ(·)表示sigmoid函数,AvgPool(·)表示平均池化,MaxPool(·)表示最大池化,MLP(·)为只含一个隐藏层的多层感知机.
空间注意力模块关注特征映射中重要的特征所在的位置,其计算过程如下
Ms(F)=σ(f7×7(Cat(AvgPool(F),MaxPool(F)))),
(2)
其中,Ms(·)表示空间注意力,f7×7(·)表示卷积核大小为7×7的卷积操作,Cat(·)表示拼接操作.
CBAM以中间层的特征映射F为输入,先后计算通道注意力和空间注意力,如图1所示,其过程可以被如下公式描述:
(3)
其中,⊗表示矩阵的按元素的乘法,F′表示通道注意力优化后的特征映射,F″表示空间注意力优化后的特征映射.
1.2 U-net网络结构
U-net(Ronneberger et al., 2015)是一种广泛应用的网络结构,U-net包含了一个编码器和解码器.编码器提取地震数据的绕射波特征,解码器通过提取的绕射波特征恢复绕射波,在这一过程中,并不直接去除反射波,而是通过最小化网络输出与绕射波标签的误差,间接地去除反射波.
编码器包含卷积层和下采样层,卷积层执行的操作可以由以下公式表示:
ak=ReLU[BN(Wk*ak-1+bk)],
(4)
其中,ak表示编码器中第k层的特征图,ReLU(·)表示修正线性单元(Rectified Linear Unit),BN(·)表示批规范化(Ioffe and Szegedy, 2015),Wk和bk分别表示第k层的权重矩阵和偏置矩阵,*表示卷积运算.在编码器的卷积层中,来自上一层的特征图会进行2次公式(4)所示的计算(卷积操作中的卷积核大小3×3,卷积步长为1),并通过补零保持特征图的大小不变.在第一次计算后特征图的数量翻倍,第二次计算后特征图的数量不变.卷积层后紧跟下采样层,下采样层执行的操作可以表示为
图1 卷积注意力模块Fig.1 Convolutional block attention module
ak+1=Down(ak),
(5)
其中,Down(·)表示下采样操作.传统U-net的下采样层采用最大池化(maxpool)进行下采样操作,最大池化会丢失特征图的部分信息,本文采用卷积核大小为4×4,卷积步长为2的卷积操作代替最大池化,以减少信息的丢失.
U-net在编码器和解码器之间连接 4 个跨接线(concatenate),以融合不同尺度的特征,如图2所示.解码器包含卷积层和上采样层,在解码器的卷积层中,来自上一层的特征图通过跨接线与来自编码器的特征图拼接,拼接后的特征图作为卷积层的输入,其过程可以表示为
(6)
本文将CBAM插入U-net网络,提升U-net网络对绕射波特征的提取能力,本文构建的U-net网络如图2所示.
图2 U-net网络结构Fig.2 The structure of U-net
1.3 地震绕射波U-net网络提取方法
含有反射波和绕射波的地震数据可表示为
y=r+d,
(7)
其中,y表示含有反射波和绕射波的数据,d表示绕射波数据,r表示反射波数据.
U-net网络以含有反射波和绕射波的地震数据y为输入,以绕射波d为期望输出,也就是利用如下公式建立y与d的关系:
d=Unet(y;θ),
(8)
其中,θ={W,b},W、b都是神经网络参数,其中W表示权重矩阵,b表示偏置矩阵.Unet(·)表示U-net网络的处理过程.
在U-net网络的训练过程中,网络实际输出Unet(y;θ)与期望输出d之间的误差不断缩小,可以用均方误差去衡量Unet(y;θ)与d之间的误差:
(9)
网络训练的过程就是网络参数θ不断更新的过程,利用基于梯度下降的反向传播算法实现:
(10)
式(4)中,θ(k)表示第k层的神经网络参数,α为学习率.对于训练后的U-net网络模型,输入地震数据y′,U-net网络输出分离后的绕射波d′从而实现端到端的绕射波分离:
d′=Unet(y′;θ).
(11)
2 方法试算
2.1 训练数据集及标签构建
训练数据集对U-net网络的性能有着重要的影响,为了增加训练数据集的多样性,本文结合合成数据和实际数据构建训练数据集.
对于合成训练数据,我们通过Kirchhoff正演只含有反射层和只含有绕射体的模型,得到反射波和绕射波共偏移距数据,图3展示了这些数据中的一部分.通过将这些反射波数据和绕射波数据随机组合以构建合成训练数据集,如图4所示,并选择图3中的绕射波数据作为合成训练数据集的标签.
图3 合成的反射波共偏移距数据(a)—(c)和绕射波共偏移距数据(d)—(f)Fig.3 Synthetic reflection (a)—(c) and diffraction common offset data (d)—(f)
图4 反射波和绕射波组合后的训练数据Fig.4 Training data combined by reflection and diffraction
为了提升U-net对实际数据的处理能力,选择Viking Graben 数据集作为实际训练数据,如图5a所示.不同于合成训练数据,无法直接得到实际数据的绕射波作为训练网络需要的标签.选择利用已有的绕射波分离方法构建实际数据的绕射波标签, Viking Graben数据集中反射波具有平滑连续、倾角不大的特征,这些反射波符合PWD方法的理论模型假设,通过PWD方法可以获得高质量的绕射波标签.因此,我们对Viking Graben 数据集使用PWD方法构建绕射波标签,PWD方法分离的绕射波如图5b所示.实际数据中的地质情况相比于合成数据更加复杂,在叠后地震数据中反射波不仅表现为平滑的线性同相轴,有时也会局部表现出类双曲形态,我们称这类反射波为陡倾角反射波.传统绕射波分离方法难以去除陡倾角反射波,针对传统方法所存在的问题,我们构建了对应的陡倾角合成共偏移距训练数据,图6展示了这些数据中的一部分.结合陡倾角数据和Viking Graben 数据集,构建实际训练数据集.这些训练数据可以提升U-net网络的泛化能力,令U-net在处理实际数据取得更好的绕射波分离效果.
图5 Viking Graben 数据集(a) 全波场叠后数据; (b) PWD方法分离的绕射波数据.Fig.5 Viking Graben data(a) Full wave field stacked data; (b) Diffraction separated from PWD method.
图6 含有陡倾角反射波的共偏移距训练数据(a) 基于sigsbee2b模型构建的训练数据; (b) 基于sigsbee2a模型构建的训练数据; (c) 基于overthrust模型构建的训练数据.Fig.6 Common offset training data containing high-slope reflection(a) Training data based on sigsbee2b model; (b) Training data based on sigsbee2a model; (c) Training data based on overthrust model.
以数据增广的方式进一步扩充训练数据集,对上述训练数据集进行旋转变换、时间降采样、镜像变换、空间降采样等操作,增加训练数据集的多样性,提升网络的泛化能力.
为了节省训练时消耗的GPU内存,将数据集分块处理:将训练数据及标签切分成大小为128×128的切片.需要注意的是,在使用训练后的U-net网络处理数据时并不需要将数据切分为128×128大小的切片.对于合成训练数据集,得到8400个全波场数据切片及其对应标签,将其中的6720个切片作为网络的合成训练数据集,其他1680个切片作为验证集.对于实际训练数据集,得到12192个全波场数据切片及其对应标签,将其中的9754个切片作为网络的实际训练数据集,其他2438个切片作为验证集.
2.2 训练U-net
设置初始学习率为0.001,使用带热重启的余弦退火算法(Loshchilov and Hutter, 2017)衰减学习率,批大小(batch size)设置为48,epoch为120,使用Adam算法(Kingma and Ba, 2017)优化学习目标.
2.3 数值模型测试
本节在合成数据上进行算法的有效性测试.设计了如图7a所示的二维地质模型,模型大小为3000 m×5000 m,模型具有2个不同倾角的反射层和2个断层,断层断距分别为100 m和10 m,在反射层和断层附近设置了多个10 m×10 m的溶洞.采用自激自收的观测系统,501个炮点和检波器均匀分布在地表,炮间距、道间距均为10 m,正演采用Kirchhoff正演模拟算法,震源使用主频为25 Hz的雷克子波,采样间隔4 ms,正演时采用的速度如图7b所示.
图7 合成数据的反射率模型及速度(a) 反射率模型; (b) 背景速度.Fig.7 Reflectivity model and velocity of synthetic data(a) Reflectivity model; (b) Background velocity.
图8a为模型的合成零偏移距数据,使用此数据测试基于合成训练数据集训练的U-net.合成零偏移距数据的全波场Kirchhoff偏移剖面如图8b所示.偏移剖面中,反射层清晰成像,散射点则被反射层掩盖,成像不清晰,分辨率不高,部分靠近反射层的散射点被反射层掩盖以致不可见.我们选择PWD方法作为本文算法的比较,PWD方法分离的绕射波如图9a所示,PWD方法分离的绕射波剖面中,部分反射波残留,并且绕射波遭到了一定的破坏,如红色箭头指向的部分.来自散射点和来自断层的绕射波具有不同的相位特征,来自散射点的绕射波同相轴两翼具有相同的相位,来自断层的绕射波同相轴的两翼具有相反的相位,这一特征是识别偏移剖面中散射点和断点的标志.PWD滤波器是一种求导滤波器,PWD滤波会引起双曲同相轴的相位反转(孔雪,2012),图9a中来自地下散射点的绕射波发生相位反转,分离后的绕射波的相位与原始相位不同;对于来自断层的绕射波相位反转现象更加明显,如图9a中蓝色箭头指向的部分.图9b展示了U-net分离后的绕射波场,反射能量得到了很好的压制,绕射波能量保留得更加完整,同时保留了来自散射点和断层的绕射波的相位特征,为绕射波场清晰成像提供了基础.图10a展示了PWD方法分离的绕射波场Kirchhoff偏移剖面,在偏移剖面中可以看到部分残留的反射波,并且,由于绕射波遭到一定的破坏,绕射聚焦效果差.同时,由于PWD滤波引起了绕射波相位反转,在成像剖面上散射点易被识别为断点,断点易被识别为散射点,为正确识别小尺度地质体带来了一定的困难.图10b展示了U-net分离后的绕射波场Kirchhoff偏移剖面,绕射点清晰成像,聚焦效果良好,分辨率得到显著提高.由于U-net分离后的绕射波场保留了绕射波的相位特征,在成像剖面中,可以准确的识别断点的位置,图10b中红色箭头指向了这些断点.
图9 PWD方法与U-net分离的绕射波对比(a) PWD方法分离的绕射波; (b) U-net方法分离的绕射波.Fig.9 Comparison between diffraction separated from PWD method and U-net(a) Diffraction separated from PWD method; (b) Diffraction separated from U-net.
图10 PWD方法与U-net分离的绕射波成像对比(a) PWD方法分离的绕射波成像; (b) U-net分离的绕射波成像.Fig.10 Comparison between diffraction image from PWD method and U-net(a) Diffraction image from PWD method; (b) Diffraction image from U-net.
2.4 实际资料的应用
本节在实际叠后数据上进行算法的有效性测试.盐丘构造普遍存在于深海碳酸盐储层中,其中发育的小尺度不连续体如断层、裂缝和盐丘边界等常被视为油气的运移通道和储集空间.绕射波是这些小尺度不连续体的地震响应,由于其优越的照明能力,绕射波对于盐丘检测具有高分辨率成像潜力(Lin et al., 2021).选取的实际叠后地震资料来自墨西哥湾数据集(Fomel et al., 2007),如图11a所示.数据包含大量的来自大尺度反射面的反射波,这些强能量的反射波掩盖了来自盐丘粗糙表面能量较弱的绕射波,绕射波场的广泛分布揭示了该区域盐丘的多个锐利边缘和地质构造的复杂性.同时,实际数据中含有陡倾角反射波,且反射波大多与绕射波相干,这为绕射波分离带来一定难度.图11b展示了实际叠后数据的全波场Kirchhoff偏移剖面,连续的反射层得到良好成像,盐体边缘的成像却效果不佳.
图11 实际叠后数据及其Kirchhoff偏移剖面(a) 实际叠后数据; (b) 实际叠后数据的Kirchhoff偏移剖面.Fig.11 Field data and Kirchhoff migration(a) Field stacked data; (b) Kirchhoff migration of field stacked data.
合成训练数据集不能很好的模拟复杂的实际数据,这可能导致使用合成训练数据集训练的U-net网络无法处理实际数据,因此,将合成训练数据集训练的U-net网络作为初始模型,使用2.1节中构建的实际训练数据集继续训练U-net网络,提高其处理实际数据的能力.同样选择PWD方法作为U-net的对比方法,参考Fomel等(2007)的工作,将PWD方法的平滑参数设置为10和40.图12a展示了PWD方法分离的绕射波,PWD方法对平滑连续的反射波去除效果较好,但对陡倾角反射波去除效果较差,红色方框圈出了残留的陡倾角反射波,同时,PWD方法对绕射波也造成了一定的损伤,这可能会导致小尺度地质体成像不清.图12b展示了U-net分离的绕射波,陡倾角反射波被有效压制,同时蓝色方框圈出的绕射波部分相比于PWD方法保留更好.图13展示了2种方法得到的绕射波成像.为了便于对比,我们放大了图13中的一部分,如图14所示.图14a为PWD分离的绕射波场成像,PWD方法分离的绕射波场成像中反射残留较多,并且由于绕射波能量损失严重,2.15s附近与盐体粗糙边缘相关的不连续点成像不清.图14b为U-net分离的绕射波场成像剖面,成像剖面中反射波残留更少,小尺度不连续体特征突出,同时,由于U-net分离的绕射波振幅保留更加完整,成像剖面中2.15s附近与盐体粗糙边缘相关的不连续点成像更加清晰.图14中红色圆圈圈出的断点证明了本文方法相较于传统的PWD对绕射成像剖面中小尺度构造的分辨率的提升.
图12 PWD方法与U-net分离的绕射波对比(a) PWD方法分离的绕射波; (b) U-net方法分离的绕射波.Fig.12 Comparison between diffraction separated from PWD method and U-net(a) Diffraction separated from PWD method; (b) Diffraction separated from U-net.
图13 PWD方法与U-net分离的绕射波成像对比(a) PWD方法分离的绕射波成像; (b) U-net分离的绕射波成像.Fig.13 Comparison between diffraction image from PWD method and U-net(a) Diffraction image from PWD method; (b) Diffraction image from U-net.
图14 PWD方法与U-net分离的绕射波成像局部放大对比(a) PWD方法分离的绕射波成像; (b) U-net分离的绕射波成像.Fig.14 Local comparison between diffraction image from PWD and U-net(a) Diffraction image from PWD method; (b) Diffraction image from U-net
墨西哥湾数据的应用验证了本文训练的U-net网络在除陡倾角反射波的同时,可以较好地保留绕射波能量,绕射成像剖面证明了该方法能够揭示深水区盐丘的小尺度不连续结构,有助于海相碳酸盐岩储层的高分辨率成像.
3 结论
本文提出了基于U-net网络的绕射波分离方法,通过注意力机制强化U-net网络实现了绕射波特征的定位与提取,提升了U-net网络的绕射波分离能力.针对陡倾角反射波难以去除问题,本文构建陡倾角反射波训练数据集并使用数据增广技术扩充训练数据集,提升网络对复杂波场的处理能力,增强了U-net网络的泛化能力.数值模型测试验证了训练后的U-net网络可以较好地保留绕射波相位特征,实现对地下溶洞和断层的高分辨率成像;实际资料的应用说明了本文方法在有效去除陡倾角反射波的同时保护了绕射波能量,提升盐体粗糙边缘相关不连续点的分辨率.本文获得的主要结论与认识如下:
(1) 传统的PWD绕射波分离方法对陡倾角反射波去除效果差,同时易造成绕射波顶点能量损失,在绕射成像剖面中,绕射波聚焦性差;PWD引起的相位反转问题也容易导致绕射成像剖面中散射点与断点的混淆.本文结合合成数据和实际数据构建训练数据集,并通过数据增广技术进一步增加训练数据集的多样性,提升网络的泛化能力,相较于传统的PWD绕射波分离方法,训练后的网络既能有效地压制陡倾角反射波能量并保留绕射波顶点能量,提高偏移时绕射波的聚焦效果,又能保留绕射波相位特征,避免成像剖面中散射点和断点的混淆.
(2) 作为数据驱动的算法,训练数据集对U-net网络的性能有着重要影响,直接关系到网络映射关系的建立.对于实际数据集,标签数据是通过传统方法分离绕射波得到的,这意味着U-net网络的性能对传统方法的绕射波分离效果具有一定的依赖.合成数据集通过正演的反射波数据与绕射波数据相加得到,可以构建含有复杂的反射波场和绕射波场的训练数据,同时,对应的标签数据不受传统绕射波分离方法的限制.结合合成数据集与实际数据集构建训练数据集,一定程度上缓解了对传统绕射波分离方法的依赖,提升网络性能.然而,构建大量数值模型会花费大量时间,下一步的研究方向是结合无监督学习解决上述问题.
(3) 传统的绕射波分离方法在应用于具有复杂地质情况的实际地震数据时,难以确定合适的分离参数,需要进行反复的调试才可能得到良好的分离效果.本文提出的U-net网络绕射波分离方法只需在训练网络时需要花费一定时间进行参数调试,一旦网络训练完成,在后续应用环节不需要调试参数,给定网络输入即可得到绕射波分离结果,相较于传统的绕射波分离方法,减少了对人工经验的依赖.