基于数据驱动紧框架理论的三维地震数据去噪与重建

2020-08-18陈力鑫马泽川

石油地球物理勘探 2020年4期

陈杰牛聪李勇*③ 黄饶陈力鑫马泽川

（①成都理工大学地球物理学院，四川成都610059；②中海油研究总院有限责任公司，北京100027；③油气藏地质及开发工程国家重点实验室（成都理工大学），四川成都610059）

0 引言

三维地震勘探是油气勘探的主要技术，包括地震资料采集、处理及解释流程。由于受经济成本、地质条件等因素限制，地震采集数据一般为欠采样数据且含有噪声［1-2］，将对数据处理和地质解释产生严重影响。因此，三维地震数据去噪与重建是一个有重要意义的课题。

地震数据去噪方法很多，主要分为滤波法和数学变换法两类。地震数据重建方法主要分为五类：预测滤波法、波动方程法、相干倾角插值法、矩阵降秩法和数学变换法。其中数学变换法是基于压缩感知理论的一类稀疏变换算法，是目前较为主流的地震数据重建和去噪算法，如傅里叶变换［3-4］、Radon变换［5-6］、小波变换［7-8］、曲波变换［9-10］等稀疏变换算法。

上述传统的基于变换域的去噪和数据重建算法都是对原始数据进行某种变换，然后在变换域对系数进行阈值处理，从而恢复高精度数据。传统算法中稀疏变换的基函数一般是固定不变的，不同的稀疏变换局限于处理特定结构的数据，使这些算法无法适应结构复杂的地震数据。块匹配三维协同滤波（BM3D）和块匹配四维协同滤波（BM4D）是一类利用数据局部相似性的算法［11-12］，近年来被用于地震信号恢复，这类算法可用于结构复杂的地震数据重建与去噪。为了获得一种自适应的稀疏变换基函数，人们提出了多种通过字典学习估计基函数的自适应稀疏变换算法，这类算法能够自适应地从数据本身派生出模型，从而处理结构复杂的数据。常用的具有代表性的字典学习算法有：①最优方向法［13］，是一种较早提出的字典学习算法，用L0范数计算数据的稀疏性、用交替优化方式求解学习模型；②K奇异值分解（K-singular value decomposition，K-SVD）算法［14-15］，是对K均值算法的拓展，通过字典更新和稀疏编码两个步骤的不断迭代处理数据；③在线字典学习算法［16-17］，通过一次只处理一个样本并结合最小角回归算法进行系数编码获得更快的字典学习收敛速度，实现大规模样本的字典学习。此外，还有广义主成分分析、组结构字典学习等具有代表性的字典学习算法。

上述字典学习算法都对字典的自由度进行一定控制，从而使算法稳定。数据驱动紧框架（datadriven tight frame，DDTF）理论［18］限定学习字典为一组平移不变的冗余小波紧框架，通过进一步控制字典的自由度，使DDTF算法拥有良好的鲁棒性，并且利用小波紧框架完美的重构特性，可更好地保留数据的精细特征。

DDTF算法已广泛用于图像处理领域，近年来也尝试处理二维地震数据［19］。本文将DDTF理论扩展到处理三维地震数据，并通过仿真实验和实际数据处理，对比曲波变换、BM4D和DDTF的三维地震数据去噪与重建效果。数值试算结果表明，DDTF算法在地震数据去噪和重建方面更具优势。

1 基本原理

应用DDTF算法实现三维地震数据去噪和重建包含两个主要阶段：第一阶段是DDTF字典学习阶段，以数据驱动的方式获取地震数据的稀疏表示；第二阶段是去噪和插值阶段，通过对稀疏系数进行阈值处理实现数据去噪、重建。

1.1 DDTF

定义1 设｛fi｝i∈N∈H，其中｛fi｝i∈N是一个序列，N为自然数集或是自然数集的某一子集，H为希尔伯特（Hilbert）空间，如果存在两个正常数A、B，且A≤B，有

则称｛fi｝i∈N是H中的框架，其中A、B为框架的上、下界。当A＝B时，｛fi｝i∈N称为紧框架。对于紧框架，框架界的值称为冗余比，若衡量冗余比的界值A＝B＝1，则紧框架是一组正交基，此时｛fi｝i∈N称为正规化紧框架［20］，即

在紧框架上可以定义滤波器组（字典）矩阵W及其转置WT

式中：L2（N）表示可测集为N的L2空间；ai为WT中的第i个列向量，｛ai｝为ai的向量集。利用W可以将原始数据变换为系数，利用WT又能把处理过的系数重构为数据。

定义2 小波紧框架是将小波理论和框架理论相结合的产物，小波紧框架是正交小波基的一般变换，即在小波系统中引入冗余性。可测集为R的L2空间L2（R）中的小波框架是由有限母小波Ψ＝｛ψ1，…，ψm｝∈L2（R）集合的平移和放大产生的［21］，即

当X（Ψ）是紧框架时，称之为小波紧框架。本文使用小波紧框架初始化字典对字典进行限定。

利用DDTF算法的去噪和重建问题可以看作最优化问题，目标函数为

式中：v为系数向量；g为数据向量；λ为拉格朗日常数，用于平衡重构误差‖v－Wg‖22和稀疏性‖v‖0的权重参数；I为单位矩阵。

通过以下迭代过程得到目标函数。

（1）稀疏编码阶段。固定W，通过经典的稀疏近似问题求解系数向量v

通过硬阈值方法解决上述优化问题［18］。

（2）字典更新阶段。固定v，求解W

Cai等［18］推出了上述问题的显式解，本文省略了推导过程

可以通过SVD法得出S和U

式中：U、S和D分别为将VGT通过SVD算法分解所得的两个相互正交的矩阵和一个对角矩阵；V＝［v1，v2，…，vN］为gN在W下变换所得系数向量组合而成的矩阵；G＝［g1，g2，…，gN］为矢量形式的样本组合矩阵。

图1为DDTF初始字典与训练字典。由图可见，对应于初始字典（图1a），在训练字典中可以看到明显的结构性特征（图1b），故训练字典能更稀疏地表示原始数据。

1.2 数据分块与块聚合

字典训练的样本由数据分块策略获取，且为了获取更多的样本，在分块时保证块之间具有一定的重叠度。由数据分块策略得到的样本不但可以获取数据本身的先验信息，且基于数据块之间的相似性，在保留数据有效信息的同时去除无用信息。本文将数据分块后，然后将块向量化，作为一个列向量得到样本矩阵（图2）。数据分块时使用分块算子B，块聚合时使用合成算子BT。若将块转换为数据时，把每一个像素除以其重叠度，即可得到原始数据。

图1 DDTF初始字典（a）与训练字典（b）

图2 数据分块

1.3 去噪与插值算法

从迭代中得到训练字典W后，采用稀疏促进方法去噪和重建。优化以下目标函数

式中：g0为采样数据；A为采样矩阵。如果A＝I，上述目标函数表示去噪问题。如果A是一个稀疏采样矩阵，则上述目标函数表示插值问题。

对于去噪问题，使用单步阈值算法求解

式中Tθ为软阈值算子，其中θ为阈值参数。

对于插值问题，使用迭代收缩阈值（IST）算法求解

式中参数αk控制算法的稳定性，迭代过程中αk从1减小到0。

1.4 算法实现流程

算法主要包含两个阶段（图3）。

（1）字典学习，在此阶段利用小波紧框架初始化字典，再通过稀疏编码和字典更新得到训练后的字典。

（2）去噪或插值，由训练后的字典得到数据的稀疏表示。若输入含噪地震数据，则使用单步阈值法处理稀疏系数，得到去噪后数据；若输入预插值后的欠采样地震数据，则使用迭代收缩阈值法处理稀疏系数，得到重建数据。

图3 本文算法流程

2 仿真实验和实际应用

对于三维地震数据去噪和重建，应用DDTF算法进行仿真实验，作为算法对比，选用固定基函数的典型稀疏变换方法（曲波变换）和基于块匹配策略的协同滤波算法（BM4D）处理地震数据。利用三维合成地震数据和三维实际地震数据作为原始数据，原始数据尺寸为128×128×128，字典尺寸和样本尺寸为8×8×8，并尽量选择能达到最高信噪比（SNR）的其他参数，利用

初步判断不同方法的数据处理效果。式中X*和X分别表示原始地震数据及去噪或重建后的地震数据。

2.1 仿真实验

为了验证本文算法的可行性和优势，合成了一个三维地震数据作为仿真实验模型并验证处理结果（图4）。

2.1.1 合成数据去噪

对纯净的三维合成地震数据添加强随机噪声后，致使部分有效信号被强噪声覆盖，同相轴连续性变差、细节变模糊（图5）。曲波变换具有多尺度、多方向性质，适用于处理同相轴完整、连续的地震数据。BM4D通过相似匹配获取数据先验信息，DDTF通过字典学习获取数据先验信息。上述三种算法对含噪数据（图5）的去噪结果（图6）中均残留少量噪声，整体去噪效果较好，但DDTF的去噪效果更好（图6c、图6f），同相轴更完整。

图4 三维合成地震数据（a）及其局部放大（b）

图5 对图4a数据添加20%随机噪声（SNR＝14.44dB）

2.1.2 合成数据重建

对图4a数据随机剔除50%的地震道得到欠采样三维合成地震数据（图7），其同相轴不连续、有效信号缺失严重。同样使用曲波变换、BM4D、DDTF算法对图7数据的重建结果表明：①整体上三种算法的重建效果较好，较完整地恢复了同相轴。②曲波变换重建效果较好，但是同相轴外的区域产生了少量噪声，造成同相轴局部扭曲（图8a、图8d）；BM4D重建结果中存在同相轴局部轻微错动（图8b、图8e）；DDTF重建结果中同相轴更完整且连续，重建数据的信噪比最高（图8c、图8f）。

图6 合成数据去噪结果及其局部特征

2.2 实际应用

为了验证DDTF算法的实际应用效果，从新疆A区的三维实际地震数据中截取了尺寸为128×128×128的数据（图9a）作为含噪数据或欠采样数据的原始数据，并验证处理结果。

2.2.1 实际数据去噪

对实际三维地震数据添加20%的随机噪声，能量较强的噪声几乎将能量较弱的有效信号全部覆盖，同相轴连续性很差、细节特征丢失严重（图10）。应用曲波变换、BM4D和DDTF三种算法对图10数据的去噪结果表明：①由于实际地震数据结构更复杂，传统的固定基函数的曲波变换算法的去噪效果较差，同相轴连续性差（图11a、图11d）。因此由固定的模型套用结构复杂的数据是勉强的，须利用数据的先验信息自适应构建稀疏变换的基函数。②BM4D和DDTF能够较好地利用数据的先验信息，去噪效果较好，但是BM4D的去噪结果过于平滑，缺失了数据本身的一些细节特征（图11b、图11e）；DDTF的去噪结果更多地保留了原始数据的精细特征，且信噪比更高（图11c、图11f）。

图7 欠采样合成三维地震数据（SNR＝3.29dB）

图8 合成数据重建结果及其局部特征

图9 三维实际地震数据（a）及其局部放大（b）

图10 对图9a数据添加20%的随机噪声（SNR＝14.56dB）

2.2.2 实际数据重建

对实际三维地震数据随机剔除50%的地震道得到欠采样数据（图12），使用曲波变换、BM4D、DDTF算法对欠采样数据的重建结果表明：①由于曲波变换固定基函数的局限性，重建结果不理想（图13a、图13d）；BM4D的重建结果过于平滑，细节特征缺失严重（图13b、图13e）；DDTF的重建结果信噪比更高，且尽量保留了原始数据的精细特征，从而验证了DDTF算法的实用性（图13c、图13f）。②曲波变换和BM4D在处理结构更复杂的实际地震数据时，去噪和重建效果较仿真实验差，但是DDTF去噪和重建效果仍然较好。

2.3 计算效率分析

表1为不同方法的计算时间对比。由表可见，DDTF算法的计算时间是另外两种算法的几倍至几十倍，原因为：一是计算机自身属性；二是DDTF方法采用字典学习算法，大量的字典训练量会消耗较多的时间；三是DDTF算法进行数据重建时进行了多重迭代过程，同样会消耗较多的时间。在实际工作中如果遇到数据量更大的三维地震数据，可以采用并行化算法，或在数据分块时减少块之间的重叠，减少训练样本数量，从而提高DDTF算法的计算效率。

图11 实际数据去噪结果及其局部特征

图12 欠采样实际三维地震数据（SNR＝3.01dB）

表1 不同方法的计算时间对比

图13 实际数据重建结果及其局部特征

3 结论

本文基于DDTF理论，研究了三维地震数据去噪和重建问题。DDTF算法通过字典学习，能从数据本身得到最优的稀疏表示，从而适用于结构复杂的地震数据，并且利用小波紧框架完美的重构特性，可以很好地恢复原始数据的精细特征。仿真实验和实际数据应用结果表明：DDTF算法对结构简单的三维合成地震数据及结构复杂的实际三维地震数据都具有良好的去噪和重建效果，但计算效率较低，还需进一步改进；曲波变换对实际数据的去噪和重建效果较差；BM4D的去噪和重建结果过于光滑，会丢失一些结构特征。