基于信号处理的欠规则地震数据重构方法综述
2022-04-07秦思,田琳
秦 思,田 琳
(伊犁师范大学 电子与工程学院,新疆 伊宁 835000)
在当今时代,油气资源是不可缺少的必需品。一方面,它渗透在人们生活所需的方方面面,推动着工业和经济向前发展;另一方面,它与国家安全密切相关,保障着脚下土地的一方和平。在勘探油气资源时,所进行的地震勘探容易受到外来因素影响,比如天气、风声、脚步声等,会给地震数据带来偏差。还有有限的经济成本制约,使得结果并不尽如人意。
地震数据重建,即从不完整或缺失的地震数据重建出完整规则的地震数据。总而言之,对地震数据进行重建使其尽可能地恢复为规则数据,具有很重要的意义。如果不进行抗假频的插值重建,压制欠规则缺失道引起的空间假频,则会影响后续的地质资料处理,如:多次波去除、偏移、成像和振幅随偏移距变化的分析。如果选择合适的方法进行插值重建,能够降低费用,更能够逼真地还原成像。随着技术的发展,人们致力于追求一种高效简单的地震数据重建方法,重建出精度更高、无限接近规则采样地震数据的方法。
由于现有地震数据重建综述类文章少,而重建方法众多,只凭少量单一介绍某种方法重建的文章不足以快速了解该方向研究进展。在此基础上,文章分析整理了近些年来基于信号处理,用于地震数据重建的方法,梳理了各方法的研究进展及其成果,便于快速了解和研究地震数据重建处理。
1 地震数据重建研究现状
近些年来,随着科学技术不断发展,地震数据重建技术也不停发展,当下主要流行的几种重建方法包括:基于压缩感知的地震数据重建方法、基于深度学习的地震数据重建方法。在压缩感知理论下,又分为基于低秩约束的地震数据重建方法和基于稀疏约束的地震道重建方法。一般情况下,基于稀疏约束的地震数据重构方法,需要将地震数据转换到稀疏域。稀疏变换主要有傅里叶变换、曲波(Curvelet)变换、小波变换、剪切波(Shearlet)变换等。常借助的算法为正交匹配追踪算法(Orthogonal Matching Pursuit,OMP),平行矩阵分解(Parallel Matrix Factorization,PMF)算法,交替最小化(Alternative Minimization,AM),交替方向乘子法(Alternating Direction Method Of Multipliers,ADMM)算法,正交秩-1矩阵追踪(Orthogonal Rank-One Matrix Pursuit,OR1MP)算法,自适应性矩估计(Adaptive momentum,Adam)算法,L1范数谱投影梯度(Spectral Projected-Gradient ForL1Minimization,SPGL1),低秩张量补全算法(Low-rank Tensor Completion by Parallel Matrix Factorization,TMac),张量核范数(Tensor Nuclear Norm,TNN),块坐标松弛(Block Coordinate Relaxation,BCR)算法,匹配追踪(Matching Pursuit,MP),不动点连续(Fixed Point Continuation,FPC),Wrap算法(Wrapping-Based Transfrom),极大极小算法(Majorization-Minimization,MM),快速不动点连续(Fast Fixed Point Continuation,FFPC),凸集投影算法(Project Onto Convex Sets,POCS),快速字典学习算法(Fast Dictionary Learning,FDL)等。深度学习方法重建地震数据主要用到的网络为卷积神经网络(Convolutional Neural Networks,CNN),残差网络,生成对抗网络(Generative Adversarial Network,GAN),条件生成对抗网络(Conditional Generative Adversarial Networks,cGANs),递归神经网络(Recurrent Neural Network,RNN),长短期记忆(Long Short-Term Memory,LSTC)网络,UNet网络,Res-UNet网络等。
2 基于压缩感知的地震数据重建方法
2.1 基于低秩约束的地震数据重建方法
马坚伟提出了基于块纹理变换的三维地震数据低秩重建,该方法基于核范数最小化,利用了低秩矩阵拟合的快速矩阵补全算法,该算法避免了奇异值分解的计算,通过对合成数据和真实数据的实证研究表明,该方法与传统的凸集投影比较,有良好的性能[1]。马坚伟等将欠规则地震数据构建成一个近似低秩矩阵,并提出了核范数最小化来重构矩阵的方法,数值实验表明,与其他模型相比,基于核范数最小化模型具有更高的数据恢复效率和性能。文献同时比较了加速近似梯度法与低秩矩阵拟合的计算量[2]。刘丽娜利用矩阵完备方法重构随机缺失地震数据,其核心思想为:把向量正交匹配追踪算法延伸到矩阵中,在迭代过程中,需要对残差进行奇异值分解,计算量较大;接下来发展了基于幂法的秩-1匹配追踪算法,用幂法代替奇异值分解;由于上述方法要储存大量的基,对上述方法改进,迭代过程进储存新估计矩阵和本次迭代得到的秩-1矩阵,得到了改进的秩-1匹配追踪算法[3]。传统方法将高阶张量展开为长条形矩阵,高建军等提出了平行平方矩阵分解张量补全方法(Parallel Square Matrix Factorization Algorithm,PSMF),该方法将高阶张量沿每一维展开为一个平方矩阵,然后对该平方矩阵实施矩阵分解降秩。与传统方法比较,在采样点数更少的情况下,能恢复出相同的低秩张量[4]。刘慧梅等对求解低秩张量补全的核范数最小化模型的现有算法进行了综述,对张量的基本知识以及张量核范数最小化模型进行了说明,列出了几种主流算法,包括简单低秩张量补全、高精度低秩张量补全、核心张量核范数的张量补全等,并提出了研究发展方向[5]。张飞笼将频域数据构造成Hankel矩阵,建立了基于Hankel张量核范数正则化的目标函数,寻找变量的解使用交替方向乘子法,减小时间复杂度依靠随机张量奇异值分解方法,选取奇异值的个数借助阻尼截断的方法,提出了基于Hankel张量核范数正则化的地震信号恢复方法;文献还给出了第二种地震数据插值方法:在张量字典学习中首次引入张量乘积方法,形成目标函数。在时域和频域计算稀疏系数使用交替迭代算法,训练张量字典借助拉格朗日对偶的方法,再迭代改善稀疏系数与张量字典,提出了基于字典学习正则化稀疏表示的地震信号恢复方法。两种方法分别适合于处理低秩性比较好的数据和处理数据缺失较少的情况,可用于高维地震数据[6]。
陈全提出了基于张量核范数最小化约束的新的张量补全方法,即采用张量奇异值分解直接分解高维数据,并将低秩性约束和Hankel变换结合起来,通过交替最小化算法求目标函数,提出了基于低秩张量分解的正则化方法,适用于缺失率高、本身低秩特性很好的数据重建。针对有噪和无噪数据情况,给出了不同的改进交替最小化算法,有噪算法的优点是信噪比提高,不足之处是计算速度较慢;无噪算法的优点是可拥有高于同类算法4~5个数量级的重构精度,还提升了计算速度[7]。李铭利用图像处理器(Graphics Processing Unit,GPU)进行并行计算,提出了基于图像处理器的张量Tucker分解及重构算法,实验结果表明,该算法的加速比提高了几倍至几十倍。另外,实现了大规模三维地震数据可视化[8]。畅京博结合压缩感知数据重建理论和张量稀疏编码,把二维字典学习用张量乘积延伸到三维,提出了基于张量联合稀疏编码的重构方法[9]。张雪敏基于三种不同的预变换,发展了三种天然地震数据重建方法。第一,对二维天然地震数据,利用Hankel矩阵预变换来处理经过傅里叶变换得到的频率切片,得到具有低秩性的Hankel矩阵,并对Hankel矩阵奇异值分解,利用奇异谱分析算法重构地震数据;当地震数据量变多,上述方法已经不再适用,该文献发展了正交秩-1 Hankel矩阵追踪算法,再逆Hankel变换即可重构数据。第二,对三维天然地震数据做类似操作,只是将Hankel矩阵预变换替换成块Hankel矩阵预变换,传统的多道奇异谱分析算法降秩的核心还是依靠奇异值分解,这里依旧使用正交秩-1矩阵追踪算法来进行优化,发展出了基于低秩矩阵补全的三维天然地震信号重建。实验结果显示,正交秩-1矩阵追踪算法比传统的奇异谱分析算法和多道奇异谱分析算法有更高的峰值信噪比,且天然地震信号的重建也较好地实现。第三,对于高缺失情况下的三维天然地震数据重构,基于Hankel张量重建的准确性和鲁棒性都高于基于块Hankel矩阵重建。因此,文献采用Hankel张量预变换。如果采用奇异值分解算法处理预变换后的Hankel张量,不仅耗时而且计算效率低,所以文献中给出了并行矩阵分解的低秩张量补全算法对Hankel张量进行低秩矩阵分解,提出了并行矩阵分解Hankel张量重建算法。对于天然地震数据实验结果显示,与经典的高阶奇异值算法比较,并行矩阵分解Hankel张量重建算法运算速度更快,重构精度更高[10]。Fernanda Carozzi和Mauricio D.Sacchi认为大量的高维地震数据重建算法通常采用L2范数来测量观测数据和重建数据之间的差异。严格来说,这些算法假设噪声在理想情况下遵循高斯分布。当不稳定噪声污染地震道时,5维地震数据重建必须采用稳健准则来测量观测数据和重建数据之间的差异,文献提出利用L1/L2作为误差范数。文献提出了鲁棒并行矩阵分解(Parallel Matrix Factorization,PMF)方法,通过引入鲁棒误差范数来处理此类不稳定噪声。这种修改考虑了重建误差幅度的差异,从而导致减少了对观测数据的要求,并且重建数据误差小。PMF算法由两个阶段组成。第一步,通过简单的插补算法计算数据的新估计。第二步,展开估计数据形成的张量,然后对展开张量得到的矩阵进行降秩。在迭代算法中,通过降秩阶段获得的新数据和观察值进行加权,以生成重构数据的当前估计。非鲁棒PMF算法不考虑重建数据幅度误差大小的差异。因此,倾向于处理含有不稳定噪声叠前数据。PMF算法的降秩阶段可以通过多种方法实现。文献采用随机QR分解对矩阵做降秩处理。随机QR分解放松了对展开最佳秩的精确确定,因此增加了算法的实用性。合成和现场数据示例检验了所提出的鲁棒重建技术,该算法不会引入伪影[11]。刘群等考虑到多道奇异谱分析利用随机奇异值分解直接降秩,得不到最优解,与核范数相比,Lp范数跟秩函数更接近,于是提出非凸Lp范数Hankel矩阵重建方法,适用于三维地震数据。此方法利用地震数据频率切片构建块Hankel矩阵,接着将构建的块Hankel矩阵降秩近似,引入最小Lp范数,采用加权奇异值阈值算法计算全局最优解,由设置权重约束奇异值来迭代求解,保证了低秩性。实验结果显示,此方法比多道奇异谱分析方法和正交矩阵匹配追踪Hankel重建方法更优,信噪比更高[12]。马文秀发展了基于平行矩阵分解算法的多维地震数据重建方法,依靠傅里叶变换将五维地震数据从时间域变换到频率域,利用稳健的平行矩阵分解算法对五维数据进行插值重建,用交替最小二乘算法求目标函数使其最小化,实现了同时重建和去噪。实验结果显示,该方法对地震数据不规则或稀疏分布起到了有效的解决效果[13]。邓弢为解决高维张量恢复,提出了基于交替迭代最小化的张量感知算法,把矩阵感知延伸到三维张量,借助张量的双线性分解和交替迭代最小化算法,把原始问题变成了交替迭代求解两个低秩张量的问题;另外,对四维地震数据,借助截断张量核范数和交替方向乘子法,在Curvelet域进行补全,提出了一种同步稀疏低秩张量补全算法[14]。
Feng Qian等提出了一种结构化张量补全框架地震数据的重建方法,该方法的优势在于同时平衡Hankel结构和低tubal秩约束。利用管状采样的优势,在结构化张量补全框架内提出了3种张量分解方法,分别是结构张量因子分解、无奇异值分解张量因子分解和加权张量核范数,分别用于恢复轻、中、重噪声环境下的数据。文献开发了交替最小法算法和交替方向乘子算法来解决矩阵分解和结构化矩阵加权核范数问题。与众所周知的降秩方法相比,文献中的结构化张量补全利用附加了Hankel结构约束,并针对不同的噪声环境构建优化的张量模型,从而获得更好的同时重建和去噪结果。合成数据和三组现场数据能用来证明在缺失数据补全和信噪比方面的性能改进[15]。Liu Qun等提出了一种有效的二维地震数据重建方法,该方法基于块张量的框架,首先将地震数据矩阵重排为三阶块张量,将纹理块折叠为张量。通过张量补全算法降秩重建地震数据,将地震数据重建问题转化为低秩张量补全问题,并使用低秩张量补全和并行矩阵分解两种经典方法实现了张量补全。合成和实际地震数据测试验证了其有效性,该方法的优点在于避免了破坏空间结构,并充分保留了地层下的有用信息[16]。Zhang Wanjuan等分析了核范数最小化实现重建地震数据的弊端,提出了基于纹理块矩阵的截断核范数正则化地震重建新方法,并进一步提供了截断核范数正则化方法中估算秩的策略,该策略可以有效地降低计算成本。在合成数据和真实数据上进行的数值实验表明,该算法的重建质量优于基于奇异值阈值算法和低秩因子分解模型(低秩矩阵拟合)的重建质量[17]。
豆蔻等提出了基于张量链分解的核心张量模型,该模型的原理:张量链分解能够将高阶张量分解成一组三阶核心张量,并且能有效降维。该方法采用张量核范数最小化方法求优化解,对缺失张量的低秩补全问题进行了探讨,该方法与传统方法比较,在运行速度、收敛性、补全结果方面有优势[18]。
李言言等提出了基于对数函数的非凸张量模型,首先对三维地震数据的频率切片进行Hankel变换,通过降秩地震数据插值重建,由于最小化秩是一个NP-难的问题,用对数函数代替秩函数,借助交替方向乘子法求目标函数的优化解用于实验,结果表明,与传统的基于块Hankel变换的多道奇异谱分析方法和基于凸松弛的低秩张量补全方法对比,该方法重建精度更高[19]。
2.2 基于稀疏约束的地震道重建方法
李海山在二维地震数据插值重建时,利用形态分量分析(Morphological Component Analysis,MCA)方法,同时选用二维非抽样离散小波变换字典和Curvelet字典,以此来对地震数据的局部奇异部分和线状变化部分进行稀疏表示,采用块坐标松弛算法计算目标函数,发展了基于形态分量分析的二维地震数据插值重建方法;面对三维地震数据,选择二维双树复小波字典对切片数据进行稀疏表示,选择引入信息缺失算子的L1范数最优化问题,采用迭代软阈值算法求解目标函数,发展了基于二维双树复小波变换的三维插值重建方法[20]。王本峰选用Dreamlet变换将欠规则数据转换到稀疏域,选择L0范数作为正则项,通过凸集投影算法得到优化解,进而实现地震数据插值,迭代过程阈值采用指数函数。该研究表明Dreamlet变换相对Curvelet变换在去混叠方面表现好[21]。王本峰基于Curvelet变换,根据迭代硬阈值(Iterative Hard Thresholding,IHT)推导出凸集投影算法公式,然后结合加权凸集投影法(Weighted Projection Onto Convex Sets,WPOCS),发展了对地震数据同时插值和去噪的改进的凸集加权投影法(Improved Weighted Projection Onto Convex Sets,IWPOCS)[22]。孔德辉对比了小波变换和Curvelet变换,发现小波变换无方向敏感性,而Curvelet变换包含几何多分辨率特性能有效获取方向信息,所以选择Curvelet变换进行稀疏表示,通过迭代收缩阈值(Iterative Shrinkage Threshold,IST)算法求解目标函数,进行了缺失道插值处理实验,实验结果表明使用该方法处理的数据与原数据吻合度较高[23]。张良等基于信号的稀疏性,在欠采样的情形下,依照地震数据的缺失情况构建采样矩阵,利用剪切波变换进行稀疏化,在Shearlet域借助正交匹配追踪算法求解稀疏系数,最后通过剪切波反变换实现地震数据重建。该方法与基于压缩感知技术的傅里叶变换、离散余弦变换、小波变换、Curvelet变换作比较,重建精度更高,该方法对计算机要求较高,有望减少运算时间[24]。王本峰把含噪声的欠规则采样数据转换成Curvelet复数形式的系数,采用凸集投影算法求解优化解,在时域,主频率域,主频率-波数域,都取得了较好的地震数据重建效果,研究表明该方法精确和有效,该方法在2维数据上实现,有望拓展到高维数据处理[25]。
张岩利用地震数据Curvelet系数的相关性,构建了地震数据和噪声信号的Curvelet变换父子系数联合分布模型,在Curvelet域通过贝叶斯最大后验概率估计建立双变量阈值函数;根据Curvelet变换最高尺度和邻域窗口分布特点确定参数,通过Landweber迭代算法求解稀疏约束正则化模型,提出基于Curvelet域的贝叶斯估计阈值函数的地震数据重建方法;由于用波原子变换系数能更加有效地稀疏表示地震数据,该文献还创立了基于压缩感知框架的波原子域稀疏约束正则化模型;波原子缺乏平移不变性会引起重建地震数据的失真,该方法利用循环平移技术,克服了这一问题,并抑制了地震数据重建的噪声;利用指数阈值收缩模型去除缺失道引起的噪声;该方法不仅能够较好地重建了缺失地震道,还能够较好地重建同向轴中的纹理[26]。刘争光通过小波变换稀疏地震数据,其测量矩阵由随机高斯矩阵构成,在此基础上,分别采用匹配追踪算法、不动点连续算法、快速不动点连续算法等多种方法进行重建,实验结果对比显示,快速不动点连续算法不但重建精度最高,而且耗时最短[27]。杨志权研究了欠规则采样的浅层地震数据重建,依靠Wrap算法对数据进行Curvelet变换,通过Curvelet变换建立稀疏变换域,借助双曲正弦函数作为0-范数的逼近函数来构建目标函数,通过迭代得出最优解,提出了0-范数逼近的稀疏变换重建算法。实验结果显示该方法能很好地重建随机缺失地震数据[28]。
曹静杰和杨志权等以Curvelet变换为稀疏变换,利用双曲正切函数构造了0-范数的逼近函数,建立了稀疏反演模型,提出了一种针对二维随机缺失地震数据快速求解的重建方法。测试验证了文献中提出的方法对于低信噪比的欠规则采样浅层地震数据重建是可行的,与基于频率切片的低秩矩阵拟合方法和迭代软阈值方法两种比较,文献给出的方法重建效果更好[29]。王锦妍等发展了基于频率切片对数函数稀疏约束的地震数据重建方法,该方法的处理对象是二维随机缺失数据,采用傅里叶变换得到频率切片,利用对数函数作为稀疏约束项,把重构问题变为非凸半定规划问题,再将此问题用极大极小算法转换成凸半定规划问题,然后借助交替方向乘子算法迭代求优化解,该方法与基于频率切片的低秩矩阵拟合方法和迭代软阈值方法相比,具有更高的重建精度[30]。杨冠雨等利用Shearlet变换,在L1正则化模型中引入广义全变分(Total Generalized Variation,TGV)约束,建立了基于L1和TGV的双正则化模型,并使用交替方向乘子法计算该模型,发展了基于Shearlet变换的双正则化模型的重建方法。实验表明,该方法对随机采样缺失地震道重建效果较好,对于连续缺失数据有一定的重建效果[31]。
段中钰等提出了一种基于字典学习的稀疏表示地震缺失重建方法,该方法基于平方正则交替乘子方向算法,平方正则交替乘子方向算法的优势在于加入了平方正则项,而且能够自适应地选取参数平衡因子,该方法能适用于三维地震数据重建[32]。闫海洋等提出了一种分段随机采样不规则地震数据的重构方法,该方法的优势在于:相对于呈白噪谱的全局采样因子,分段随机采样因子的频谱有效频带混叠小,且该方法优于全局随机采样的重建效果[33]。张恒琪等对比了时间切片和频率切片地震数据重建方法,时间切片地震数据重建方法是对时域数据利用Curvelet变换和凸集投影算法进行插值重建;基于此,提出直接对频率切片进行数据重建的思想。实验结果显示,对缺失数据进行时间切片和频率切片处理的方式均能很好地重建,其中频率切片处理效果更优[34]。张恒琪[35]采用Curvelet变换和凸集投影算法构造稀疏约束重建方法,重构随机欠采样三维地震数据体,当三维数据沿炮点方向随机欠采样后,二维共炮点道集与共偏移距道集地震数据重建比较,共偏移距道集域重建效果更好。将稀疏变换由Curvelet变换变成傅里叶变换,对三维欠采样地震数据进行重建,共偏移距—中心点域重建效果比共炮点—检波点域好。
经典K-SVD算法稀疏编码时得不到全局最优解,李婷婷和段中钰提出了基于快速字典学习的地震数据重构方法,使用快速字典学习算法稀疏表示数据,在稀疏编码时结合稀疏约束上限和字典相干性,获取自适应稀疏约束上限,用块坐标下降法求目标函数最优解,与K-SVD算法和Curvelet变换两种方法作比较,该算法性能好,耗时短,重建振幅与原始数据最相近[36]。
3 基于深度学习的地震数据重建
Silva Reinaldo等借助条件生成对抗网络,依靠最优映射函数的最小—最大优化方案,实行基于条件生成对抗网络的插值地震数据[37]。陈全提出了基于三维深度卷积生成对抗网络的3D张量补全网络,其中,张量补全是由三维卷积核完成,参数优化采用自适应性矩估计算法和批量标准化(Batch Normalize,BN)算法完成,探索出了一种输入缺失数据即可重建的方法,适用于低秩性较差的地震数据重构[7]。王峰利用深度卷积神经网络,通过监督学习策略,发展出了随机噪声压制方法以及规则和不规则采样的重建方法,适用于二维地震数据和三维地震数据,实现了同时去噪和重建[38]。WANG Qin等在深度内部学习方法的基础上,利用卷积神经网络,使用随机梯度下降求解器,提出了深度内部学习的地震插值方法[39]。
Daeung Yoon等用递归神经网络算法,选择均方误差当目标函数,用自适应性矩估计优化器来最小化目标函数,用带有跳过连接的深度双向长短期记忆进行插值[40]。Daeung Yoon等提出了一种用于地震数据插值的双域条件生成对抗网络。双域条件生成对抗网络由生成器网络和鉴别器网络组成,使用时域地震数据和频域地震数据作为输入向量。双域条件生成对抗网络的损失函数由生成性对抗损失、数据损失函数和总变化损失来决定。因此,可以更准确地训练双域条件生成对抗网络。鉴别器用于计算插值地震数据集和完整地震数据集之间的特征差异,以驱动生成器网络学习最佳参数。合成数据集和实际地震数据集验证了插值的效果[41]。陈锐和王琴根据卷积神经网络,网络框架使用UNet网络和残差网络,通过对地震数据的空间方向多尺度采样、翻转、加噪等数据增广策略,用增广的数据集训练卷积神经网络,提出了一种基于数据增广的CNN地震数据重建方法[42]。WANG Qin用深度外部学习和内部学习相结合的算法,把外部数据集的预训练与无监督的内部微调相结合,通过多尺度残差网络,重建地震数据[43]。FANG Wen-qian根据UNet网络和地震信号的纹理约束,利用K-means算法,提出一种基于UNet地震信号插值方法[44]。LIU Qun使用UNet网络和自适应性矩估计优化,提出了基于深度地震先验的地震数据重建方法[45]。FANG Wen-qian等结合深度神经网络和预测误差滤波器方法,使用卷积神经网络和自适应矩估计方法,提出了基于预测误差滤波器网络的地震数据插值方法[46]。
张岩等采用了卷积神经网络模型,结合了时域和小波域,利用小波变换,根据二维快速小波变换计算小波系数,提出了一种基于小波分析的地震数据重建方法[47]。孟宏宇等利用残差网络,使用自适应性矩估计优化算法,提出了无监督深度学习地震数据重建方法,该方法只需要地震道缺失的数据和优化的残差网络,便可重构出完整的地震数据[48]。王本锋等结合深度残差网络(Deep residual network,ResNet)和UNet的优势设计了Res-UNet网络,用于共检波点道集缺失炮的智能重建。利用格林函数空间互易性自适应构建训练集,卷积核大小由地震数据的周期和波长属性共同决定[49]。
4 总结与展望
地震勘探野外工作是整个地震勘探生产的首要环节。现场收集的原始数据的质量和数量是直接影响后续处理的关键因素。由于采集过程中障碍物、故障源、接收器造成的无效记录道以及采集成本和不稳定噪声,会导致数据不完整并且含有噪声。为了提高最终成像的精度,原始数据的插值和去噪非常重要。在一定程度上,去噪问题与插值问题具有许多相似的特征,这两个问题可以在相同的算法框架中同时解决。因此,有很多地震数据重建算法在插值的同时,也能去除噪声。地震数据重建的研究包括欠采样数据的填充和随机噪声的压制,重建方法可以包含同时数据补全和噪声压制,有些方法也仅补全数据。
对地震数据进行高精度重建至关重要。从信号处理的角度出发,文章主要研究了基于压缩感知和基于深度学习的地震数据重建方法。在压缩感知理论下,又研究了基于低秩约束和稀疏约束的重建方法。压缩感知的优势在于打破了奈奎斯特采样定理的约束,即采样频率忽略两倍最高频率的限制,利用信号的稀疏性和低秩性,获取少量的数据就能精确重建缺失数据。同时该方法不需要地下结构的先验信息,易于实现。深度学习的优势在于打破了理论的限制,直接利用数据训练,学习插值缺失数据;缺点是训练所需样本数量大[50]。有人将压缩感知和深度学习结合起来,利用各自的优点,发展了深度压缩感知框架,提高了计算速度。在未来,深度压缩感知将会继续发展,成为一个发展趋势。
地震数据重构处理的维度问题主要有二维、三维、四维和五维地震数据,五维数据是三维地震采集中的原始记录形式,包括来自所有纵向、横向、时间、偏移距、方位角五个维度的信息。高维重构能更好地利用空间的关联性。高维地震数据重建已成为地震数据处理领域的主要研究课题。二维数据的重建方法拓展到三维甚至更高维是地震数据重建问题的一个发展方向。补全的地震数据有共偏移距道集,有共炮点道集,也有共接收点道集,研究表明相同的算法情况下,共偏移距道集重建效果比共炮点道集效果好。
基于低秩约束的矩阵或者张量补全问题,是利用低秩约束和已有的部分观测元素恢复大量的缺失信息。秩最小化对于矩阵或者张量来说,是NP-hard问题,研究人员用它的凸松弛代替,现有的矩阵低秩约束有核范数、加权核范数,Schstten-p范数、L2,1范数,截断核范数等,不断出现新的接近秩最小化效果的范数。矩阵低秩补全的预变换由Hankel变换、块Hankel变换和Hankel张量变换等,不断发展变化。
张量低秩补全方法中用到的张量分解方法有:CP分解(标准分解和平行因子分解的缩写形式)、Tucker分解、张量SVD分解、张量列、张量环等分解方法[51]。CP分解的实现方法为贝叶斯CP因子分解和平滑平行因子分解,其中贝叶斯CP因子分解的特点是包含潜在因子并自动确定秩,但需要较高的计算成本。平滑平行因子分解的特点是采用了具有CP分解的平滑约束,秩需要手动固定。Tucker分解现有的实现方法有三种:核范数之和、张量分解补全、基于Kronecker基的表示方法,其中核范数之和方法是凸函数且易于处理,但没有同时利用所有维度之间的联系;张量分解补全方法利用因子先验来表征底层流形,Tucker秩需要适当固定;Kronecker基表示方法用Kronecker基表示度量张量稀疏性,计算量大。张量SVD分解有张量核范数和部分Tubal核范数之和等两种方法,前一种方法的特点是对L1范数的最紧凸松弛,可能导致对较大奇异值的过度惩罚,后一种方法仅在小的奇异值上收敛,需要对Tubal秩进行正确的估计。张量链式分解实现方法基于张量序列的并行矩阵分解,特点是构造张量的良好平衡矩阵化方案,需要充分的ket增强;张量环分解实现方法是低秩因子的张量环,特点是对潜在张量环因子执行核正则化,也需要ket增强。
张量低秩补全的正则化函数有张量核范数、核心张量核范数、截断张量核范数、低tubal秩函数、对数函数、CP秩、Tucker秩等,不断发展变化。张量低秩补全以最近比较热门的张量环式分解框架为例,相比于常用的CP分解和Tucker分解,张量环式分解处理高阶张量更具有优势。这种分解结构可以挖掘和表达更多的数据模式,但与常用的张量分解低秩结构一样,随着数据张量的阶数增加,找到一个合理低秩结构的难度也会相应地增加。因此出现张量环核范数正则化、Lpε(0
0)范数正则化、张量环因子核范数正则化等,在不同的算法框架下考虑张量稀疏结构,有增强重建效果等优势。寻找不同的正则项,优化张量稀疏结构是张量环式分解框架研究的发展方向。
地震道缺失数据重建方法包含两个关键因素。第一,在数据采集时,由于某些客观因素,导致数据缺失,缺失的地震道具有随机性;第二,信号在诸如傅立叶变换、小波变换或小波变换之类的特定变换下是稀疏的。一般来说稀疏信号重建方法有两类主要的数值方法:凸松弛和贪婪算法。基于稀疏约束的地震道重建方法根据不同变换域中不同的数据特征,转换到相应的数据域进行处理。一般而言,地震资料是丰富的,因此,需要找到合适的稀疏变换进行稀疏表示。基于稀疏约束地震数据重建的稀疏变换有傅里叶变换、离散余弦变换、Curvelet变换、Shearlet变换、Dreamlet变换、轮廓波(Contourlet)变换、拉东(Radon)变换、小波变换,还有新发展的非亚采样轮廓波变换、复小波变换等。还发展了形态分量分析方法,根据地震数据的不同部分,采用多种不同的变换组合起来进行稀疏表示。基于稀疏约束地震数据重建的正则项有L0范数、L1范数最小化,发展为Huber范数最小化,L1范数和双曲正切组成的非凸组合约束,L1和广义全变分组合的双正则化,运用不同的正则项,构建不同的模型,是地震数据稀疏重建的一个研究方向。联合低秩约束,建立联合稀疏低秩先验模型,也是地震数据重建的一个研究方向。
深度神经网络在恢复不完整的地震数据方面显示出相当大的前景,它的优点是低频成分保留得好,均方误差的缺点是出现过平滑问题(与丢失高频密切相关);并且一些基于深度神经网络的方法忽略了特定的地震数据本身的特点,只注重缩小恢复和原始信号的差异。条件生成对抗网络旨在训练一个生成器,该生成器可以将缺失数据映射到真实数据,因此该网络可以从混叠地震数据获得空间无混叠数据,它能对缺失地震数据进行极化,以消除空间混叠;该网络需要测试不同的参数,以获得最佳插值结果;因此需要设置合适的损失函数,以改进条件生成对抗网络,以获得鲁棒性更好、插值性能更优良的神经网络。UNet网络体系结构包含两个自动编码器和跳过连接,UNet网络具有提取和本地化上下文信息,并且可以有效地插值规则和不规则缺失具有小间隙的地震道。然而,由于UNet网络的下采样过程,数据的高频分量可以丢失,导致混叠问题,运用时需要改进;并且对于连续的大间隙缺失场景,UNet的插值精度较低振幅缺失分量需要改进。ResNet网络可以用来增加等距地震数据的采样密度,该网络可以利用模块和结构相似性来增强地震插值的性能。生成对抗网络运用于能够插值规则和不规则缺失的地震数据,是通过自学习提取训练数据的特征向量,算法不需要传统插值方法线性或数据稀疏性的假设,并且可以很容易地应用于3D地震数据集。深度神经网络需要合适的框架来训练网络,添加合适的损失函数使模型正则化,以获得精确的插值结果。卷积自动编码器和循环生成对抗网络模型的优点是能够插值规则和不规则缺失的地震数据。卷积神经网络的优点是对连续缺失的地震道友好。自编码器卷积神经网络的优点是可插值欠规则缺失的地震数据。
大多数现有基于深度学习的地震数据重建方法参考了计算机视觉视频补全的方法,在进一步的研究中需要考虑图像处理和地震数据处理之间的差异,即考虑丰富的地震数据特征。另一方面,地震数据采集成本高,将神经网络推广到新数据集,必须克服依赖大量训练样本的挑战,未来的神经网络特点是训练样本少,并且网络要具有很好的泛化能力。