深度学习在地震初至拾取中的应用综述
2022-08-23高新成杜功鑫王莉利
高新成,杜功鑫,王莉利,李 强,柯 璇
(1.东北石油大学 现代教育技术中心,黑龙江 大庆 163318;2.东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318;3.东北石油大学 地球科学学院,黑龙江 大庆 163318)
0 引 言
静校正是地震勘探过程中至关重要的一部分,而初至波的拾取效果决定了静校正的好坏[1]。传统初至拾取方法主要包括能量比法(孙淑琴等,2009;Coppens等,2010;秦宁等,2014;陈金焕等,2015;张凯等,2018)、小波振幅比法(王国富等,2015)、地震道瞬时强度比法(张伟等,2009)、分形法(Boschettiet等,1996;曾富英等,2002;左国平等,2006)、沿地震道分形维法(张琪等,2019)、互相关估计地震道相对时差法(林凡生等,2017)以及能量比迭代法(许银波等,2015)等。但是这些传统方法都存在明显缺陷,如在高信噪比或非水平地层情况下,这些方法的拾取效果不佳。
随着人工智能技术的迅速发展,计算机硬件不断提高,使得深度学习再次受到人们的追捧和探索,尝试将深度学习算法应用到各行各业。该文通过深入研究当前基于深度学习算法的地震初至拾取方法,对比分析常用深度学习算法在地震初至拾取中的应用效果,讨论总结深度学习在地震初至波拾取中存在问题和应用前景,为提高初至波拾取的效率与精度提供一些崭新的方向。
1 传统地震初至拾取方法
1.1 长短时均值比法
STA/LTA法,又称能量比法,是通过计算短时间窗口和长时间窗口内的能量信号平均值之比(即噪声信号和地震信息振幅差异)进行初至拾取[2],见图1(a)。Ambuter等[3](1976)提出简单识别地震震相;Allen(1978)提出长短时均值比法,此后Alle[4](1982)又提出以特征函数作为STA/LTA法的输入,提高对幅度和频率变化的灵敏度;张军华等[5]提出将小波变换和能量比法相结合来拾取初至时间;叶根喜[6](2008)提出运用时间窗均值比法进行初至拾取。STA/LTA法计算简单、计算速度快,但依赖依据人为经验预先设定的阈值,以及在低信噪比情况下拾取效果不佳。
(a)长短时均值法
1.2 AIC初至拾取法
AIC方法,又称统计学方法,是根据极大似然原理和信息论推导出的一种初至拾取方法,见图1(b)。在地震数据资料中,地震信号和噪声信号的特性差异性较大,导致在微地震信号和噪声交界点处,两种信号的拟合度最差(最小平方统计),此时求得的AIC值最小,即对应地震信号初至时刻[7]。Maeda等[8](1985)利用上述原理创新提出不利用AR模型得到AIC值方法;张军华等(2002)将AIC法和小波分解相结合,极大地提高了对低信噪比信号的拾取效率,有效地压制了噪声信号;王洪超等[9](2017)简化了AIC法的计算公式,提高拾取速度。但是,AIC法依赖时窗的选取,只有当选取合适时窗时才能得到好的拾取结果。
1.3 偏振分析法
地震能量信号一般可表示为三分量,即x,y,z。因为地震信号和噪声信号的运动轨迹有着巨大的差异,可以由此对其三分量进行分析计算以达到拾取的目的[10]。1965年,Flinn等[11](1965)首先提出在偏振分析中加入协方差矩阵;Moriya等[12](1996)提出通过对地震信号三分量数据进行傅里叶变换来拾取初至;Du等[13](2000)尝试使用多阶窗函数解决地震信号时间频域的局部矛盾,朱卫星等[14](2010)改良了该理论,实现自适应极化滤波,改善了拾取效果;李健等[15](2014)为提高偏振分析质量,改善方位角估算的准确性,在偏振分析的基础上增加信号检测频带。但是,偏振分析法在低信噪比情况下拾取效果不佳。
2 深度学习在地震初至拾取中的应用
2.1 基于卷积神经网络(CNN)的应用
2.1.1 残差神经网络(ResNet)
为了提高初至拾取的效率和精度,帅威、王君等[16](2019)提出基于残差神经网络的地震初至拾取方法,对不同地表的地震初至数据进行训练,建立初至拾取网络模型。浦义涛等[17](2019)提出将残差神经网络应用于地震初至拾取,以不同地形、不同震源类型的地震数据为数据集,进行标签化处理,识别学习不同标签的训练集,逐步提高网络对初至波的识别能力和网络的泛化能力,并对比分析传统初至拾取方法。此外,借鉴ResNet在图像去噪中的应用,陈沅忠等[18](2020)以U-Net为主体框架,并引入残差网络结构用以提高网络的抗噪能力。
对于具有两宽一高、面积大特点的地震数据,基于ResNet的拾取方法在拾取精度上达到90%以上(除个别异常点),拾取效率和准确度优于STA/LTA法和传统神经网络,并且可以提升网络抗噪能力。但还存在一定不足,比如网络模型层数非常深、对原始数据集需进行复杂的预处理等问题,具有较大的改进空间,可以考虑和其他网络结构(如U-Net、GAN等)进行优点结合,形成新的网络,该方法具有较高的研究意义和研究价值。
2.1.2 全卷积神经网络(FCN)
李辉峰等[19](2006)和牛沛琛等[20](2007)提出一种基于边缘检测的拾取方法,将地震数据先灰度处理,再二值化处理,最后在对获得的二值图像进行边缘检测。在此基础上,刘佳楠等[21](2018)结合初至波的特点,将初至波看成二分类问题,运用FCN拾取初至波。通过对地震勘探资料进行解析获得地震共炮数据集并对数据进行标注归一化处理,将训练集放入FCN中进行训练学习,对比分析不同层数的FCN,获得性能最佳的FCN结构(4layer)。再对比分析基于FCN(4layer)与市场地震数据处理软件TomoPlus的拾取效果。
基于二值图像边缘检测的初至拾取方法与传统方法相比计算量小,抗噪能力强,提高了检测效率,但是当初至波与背景噪声的边界很模糊时,拾取的效果就很差,而且图像处理技术对于二值化阈值的要求很高。在此基础上,基于FCN的初至拾取方法在高噪声情况下拾取率方面比商业软件TomoPlus效果更好,并且在低噪声情况下在拟合度方面比商业软件TomoPlus效果更好。但是,目前国内研究者较少,参考文献较少,更多的是研究基于FCN延伸出的U-Net的拾取方法。
2.1.3 U型完全卷积网络(U-Net)
为克服在复杂近地表条件下地震初至波数据所具有的能量弱、信噪比低、相位变化剧烈等问题,Hu等[22](2019)提出基于U-Net的初至波到时拾取,将其描述为二值分割问题,利用一组地震波形数据及其对应的初至时间对U-Net进行训练,利用训练后的模型对一个合成数据集和三个低质量的野外数据集进行验证。张逸伦等[23](2020)提出基于U-Net的多道联合微地震震相初至拾取方法,利用深度学习自动特征提取能力,根据井中微地震数据特点,构建U-Net网络进行初至拾取。该方法不仅可以学习单道内的数据特征,还可以自适应地学习道间震相的波形相似特征。丁建群等[24](2020)提出基于U-Net的初至波拾取方法,引入常规卷积与孔洞卷积的交错的方法,实现初至波的分割与准确定位方法,并且在学习前进行高斯去噪等一系列数据处理,降低深度学习的特征识别难度。吴雨鑫[25](2020)将初至拾取看作图像分割问题,并使用U-Net网络作为训练框架,合成需要的带标签的初至拾取训集,并对损失函数做了修改,结合图像梯度,增大了初至部分的权重,使模型的训练更聚焦于初至的部分。
通过对U-Net网络结构进行优化或与其他结构特点结合,提高网络的训练效率。如杨双瑜等[26](2020)利用Dense Block优化U-Net网络层深,构建MS-Net。此网络既具备U-Net全卷积网络“端对端”精细化识别的能力,能够对任意微地震输入信号在保留输入空间位置信息的同时实现逐采样点地“端对端”精细化输出;又保留Dense-Net网络对深层特征的捕获能力,更好地实现低信噪比微地震信号信噪可辨。李薇薇等[27](2021)通过改进U-Net结构(U-Net++),提出一种基于U-Net++的初至波拾取方法。将原始地震数据及少量初至时间的标签数据放入U-Net++进行监督学习,用西部某工区地震数据对建立的U-Net++进行测试,将其拾取结果与目前主流商业软件以及基于U-Net模型拾取结果进行对比分析。张逸伦等[28](2021)基于深度学习技术的自动特征提取能力,并根据井中微地震观测系统的多道数据源特点,提出基于U-Net的多道联合震相识别和初至拾取方法(MT-Net)。该方法以具有不同信号特征的多道微地震监测记录作为输入,以P波、S波及噪声的概率分布标签作为输出,采用具有“逐采样点”识别能力的U-Net模型,设置二维卷积操作使得道内与道间的波形信息同时被自适应地学习。
此外,为了解决基于U-Net的初至拾取方法中制作标签耗时费力、数据预处理过程繁琐、网络结构过于复杂等问题,陈德武、杨午阳等[29](2020)结合U-Net与SegNet网络的优点,提出一种新的网络模型U-SegNet,并且运用到初至拾取中。U-SegNet模型中的上采样过程是参考U-Net模型,用反池化层代替反卷积层,加快模型收敛速度;参考SegNet模型,在其解码器网络的反卷积层之前加入跳跃连接信息,提高模型性能。最后选取最优U-SegNet结构层数,对比分析最优层U-SegNet和商业软件的拾取效果。除此之外,陈德武、杨午阳等[30](2021)还针对传统的地震波初至拾取方法对低信噪比资料拾取精度较低、算法的鲁棒性较差等缺点,对U-Net网络结构进行改进,将U-Net网络结构中的跳跃连接改为包含多个卷积块的残差连接,减小了网络结构中融合的两个图像特征的差异,并使用自动拾取的小尺寸训练和测试样本,并对比分析了改进的U-Net网络模型(ResConnU-Net)和商业软件的拾取效果。
基于U-Net的初至拾取方法只需少量标记数据进行学习,就能自适应地识别不同的初至时间,无论是在初至峰值还是在初至低谷,可以克服能量弱、信噪比低、相位变化剧烈等问题。但根据不同情况,人们又考虑可不可以对U-Net网络结构进行优化或与其他结构特点结合,更好地提高不同震源下的初至波拾取准确率。于是就有了MS-Net、U-Net++、MT-Uet、U-SegNet、ResConnU-Net等模型出现,并且都取得了不错的成果。基于U-Net及其优化模型的拾取方法,目前国内研究者居多,可以与很多模型进行优点结合,具有很好的研究意义。
2.2 基于深度信念网络(DBN)的应用
为解决微弱信号在低信噪比中拾取准确率低的问题,郑晶等[31](2018)提出基于S变换和深度信念神经网络的地震波到时拾取方法,对原始数据进行S变换,提高小样本的识别效率,将经过S变换的数据放入受限玻尔兹曼机进行无监督预训练,得到网络模型参数的初值,通过误差反向传播来微调网络参数,构建最终的深度信念神经网络模型。利用测试数据对训练之后的DBN与STA/LTA法进行对比分析,对DBN网络的准确率进行大样本测试,获取准确率的统计分析结果。
基于DBN的初至拾取方法,模型结构设计简单,实现便捷,拾取效率高于STA/LTA法。对于含噪数据,该方法的拾取准确率可以达到90%以上,具有较好的拾取精度和鲁棒性。此外,通过利用S变换对原始数据进行预处理,可以丰富时域原始信号时频特征,有效的提高DBN网络预测的精度,但是,该方法的参考文献很少,当遇到无方向可选时,可以考虑选择此方法。
2.3 基于生成对抗神经网络(GAN)的应用
地震记录初至拾取质量往往受限于地震数据的复杂性,在陆地和浅海地震数据中尤为明显。为了更高效地拾取初至波,周创、居兴国等[32](2020)构建了一种适用于地震数据初至拾取的深度卷积对抗神经网络(DCGAN),在对地震数据进行能量均衡等预处理后,选取初至时刻后含波峰的半波长数据作为初至特征加入训练,将预处理后的地震数据与初至数据用于生成器与判别器的训练,直到得到网络结构的最优参数。用山地地震数据进行初至拾取实验与STA/LTA法、AIC法进行对比分析,验证该方法的有效性。薛东等[33](2021)提出基于现有地震初至波拾取方法和成果,生成地震训练数据样本,通过机器学习算法优化组合、自主特征学习,建立适合吉林探区地质特征的地震初至波拾取的深度学习方法和模型,使用对抗神经网络异常初至修正算法,生成对抗网络包括生成器和判别器,将原始数据作为输入,训练生成器生成初至,再训练判别器,对生成的初至进行判别准确与否,交替训练两个GAN网络直至生成的初至被判别器认为是准确的初至,智能地自动识别和修正异常初至,有效提高了拾取初至的准确度和效率。
基于GAN的拾取方法具有一定可行性,可以利用GAN网络智能地识别和修正异常初至,能保证较高的精度,比传统方法拾取效果好,满足生产需要。因此,该方法有着很高的研究意义和研究价值。
2.4 基于深度递归网络(RNN)的应用
对于不同信噪比的地震资料数据,传统的拾取算法的拾取效率和精度低并且无法避免人工修改参数,为解决该问题,Jing Zheng等[34](2018)提出基于深度递归神经网络的初至拾取算法,为获得不同信噪比的数据集,在原始数据集中随机加入噪声,将到达选择任务转换为序列标记任务,通过时间误差反向传播算法对模型进行训练以更新权重参数,然后用梯度下降法对整个网络参数进行优化,并用RNN建立一个串行注释模型,最后将原始波形信号输入到一个线性网络模型中,模型输出一个初至时间明显的特征向量。并对比分析RNN模型与STA/LTA方法。余杨等[35](2019)针对波形初至拾取任务,充分利用地震数据的序列性,借助序列标注的思想,提出了一个基于深度递归神经网络的拾取模型。以序列数据为输入,对序列数据实现降维并利用序列标注得到波形初至的大致到时,利用大致波形初至到时切分波形,并将传统拾取方法应用于切分出的波形数据,从而精确拾取波形初至到时。郭锐等[36](2019)针对实际采集的井中微地震三份量信号,在设计训练样本集的基础上,最终采用卷积层与循环神经网络相结合的混合网络模型。引入循环神经网络,提高了各接收器到时拾取的相关性,通过将约束引入训练目标,进一步降低了到时拾取的误差。张全敏[37](2021)为解决低信噪比微震初至波的自动拾取问题,提出基于长短时记忆网络(LSTM)的微震初至拾取算法。利用卷积运算对原始振幅数据提取相关特征,然后将其输入到长短时记忆网络中进行训练,利用长短时记忆网络完成对时序数据关系的学习,接着用Softmax层完成各点的分类,生成一个与输入数据等长的标注序列,首次出现标签1的采样点即为P波初至到时点。
基于RNN的拾取方法通过引入RNN,提高各接收器的相关性,结合地震数据的序列性,提高拾取精度,具有较高的选择精度和鲁棒性。此外,还可以结合一种特殊的RNN模型——LSTM,完成对时序数据关系的学习,通过分类得到初至点。该方法基于RNN,随着RNN的快速发展和大量运用,也具有较好的研究价值。
3 结束语
随着人工智能时代的到来,地震研究学者不断探索利用先进的机器学习方法推动地震勘探的发展,逐步开展将深度学习技术与地震初至波拾取应用相结合研究,该文通过对比分析深度学习中CNN、DBN、GAN和RNN等网络模型在地震初至波拾取中的应用效果,大致讨论了各个方法的存在问题和研究意义。对于未来的研究方向,个人意见如下:
(1)基于CNN的拾取方法中,U-Net具有最大的研究价值,只需少量的标记数据进行学习,就能自适应地识别不同的初至时间,并且可以考虑的方向很多,比如对U-Net本身做改进、和其他网络结构(如SegNet、ResNet等)优点结合以及和地震数据特点结合做改进等。ResNet和FCN也可作为考虑对象,尤其是ResNet可以提高网络的抗噪能力,但也存在一定的局限性。
(2)基于DBN、GAN、RNN的拾取方法中,GAN和RNN具有较大的研究意义,使用GAN修正异常初至,使用RNN提高各接收器的相关性,并且还可以充分考虑结合数据的序列性,有效提高拾取精度和效率。至于基于DBN的方法运用较少,仅提供一种思路。
(3)基于深度学习的地震初至拾取方法可以有效解决地震初至波数据所具有的能量弱、信噪比低、相位变化剧烈、传统的拾取算法的拾取效率和精度低等一系列问题,提高拾取效率和精度,增强抗噪能力。