基于CEEMDAN和小波变换的地震信号随机噪声压制新方法
2022-11-03郭晓菲欧同庚马武刚吴林斌赵义飞徐春阳
郭晓菲 欧同庚 马武刚 吴林斌 赵义飞 刘 军 徐春阳
1 中国地震局地震大地测量重点实验室,武汉市洪山侧路40号,430071
2 武汉地震科学仪器研究院有限公司,湖北省咸宁市青龙路11号,437099
随机噪声压制或去噪是地震数据分析与应用的重要前提。基于经验模态分解(EMD)[1-3]的信号分解技术在地震信号去噪领域应用广泛,但EMD存在模态混叠现象。为了改进该问题,基于白噪声平衡的集合经验模态分解(EEMD)[4-5]逐渐受到重视。但单纯应用EMD或EEMD进行信号去噪,往往直接剔除首条高频IMF分量、最后一条低频IMF分量或剩余分量,对其他分量未作更加精细的去噪分析,这样可能遗漏地震数据关键信息,且重构后的信号还原效果不理想。 CEEMDAN[6-8]是一种基于EMD分解并借鉴EEMD中添加白噪声来平衡信号随机干扰的新型信号分解方法,能有效抑制EMD分解时模态混叠的出现,克服残余噪声在分解过程中定向传递的问题,并保证信号不失真,具有良好的自适应性、还原性和完备性。
本文基于皮尔斯相关系数(Pearson correlation coefficient,PCCs),提出一种结合CEEMDAN和小波变换(wavelet transform,WT)的地震信号噪声压制新方法。并通过模拟实验和2021年青海玛多7.4级地震数据验证其有效性。
1 信号去噪、重构与效果评估
1.1 CEEMDAN-WT方法去噪流程
CEEMDAN-WT方法的去噪流程如图1所示,具体步骤如下:
1)设原始信号为x(n),对其进行CEEMDAN分解,得到m个IMFi(i=1,2,…,m)分量和1个剩余信号R,上述分量按照频率高低依次排列。
2)计算各IMFi分量及余量R与初始信号x的皮尔森相关系数PCCsj(j=1,2,…,m+1)。
3)根据相关性强弱划分原则,分别设定α、β为弱相关阈值和显著相关阈值,将|PCCsj|∈(α,β)的K个分量分别作小波变换[9]处理,剔除高频成分,得到wk(k=1,2,…,K)。
4)|PCCsj|∈[β,1]的分量与初始信号相关性显著,且基本为高频分量,为了更多地保留有效成分,不作任何处理,将P个该分量记为Gp(p=1,2,…,P);|PCCsj|∈[0,α]的分量与初始信号相关性较低,且基本为低频分量,予以删除。
5)信号线性重构:
(1)
1.2 去噪效果定量评估
分别从去噪有效性(信噪比、样本熵变化量)、信号还原度(皮尔森相关系数、互信息、均方误差)、算法效率(去噪速度)等3个方面设计指标定量评估信号去噪的效果。各指标物理意义如下:
1) 信噪比(SNR)。SNR是衡量地震信号去噪质量的主要指标,是信号中有效成分与噪声的相对程度,去噪目标之一即是提高SNR值。
2) 互信息(mutual information,MI)。MI是信息论中表示2个信息之间相关性的指标。
3) 样本熵[10]变化量(variety of sample entropy,VSE)。样本熵可用来描述信号的复杂状态,值越大,信号复杂程度越高,而VSE表示原始含噪信号与去噪后信号的样本熵值之差,其值为正,则表示随机噪声得到一定抑制,信号复杂性有所降低及波形更加平滑;反之,去噪效果不理想。
4) 皮尔森相关系数(PCCs)。PCCs用来反映两个对象之间的相关程度,其值介于-1与+1之间,表征去噪后信号的还原程度。
5) 均方误差(MSE)。MSE表示原始含噪信号与去噪后信号间的差异程度。
6) 去噪时长。去噪时长为信号分解、去噪与重构的计算耗时。
2 仿真实验
为了验证CEEMDAN去噪效果的有效性,首先利用MATLAB 2019A平台生成一个简单的仿真地震波形,加入6 dB的高斯白噪声(图2),然后对含噪波形信号分别进行EMD、EEMD、CEEMDAN,以及EMD-WT、EEMD-WT、CEEMDAN-WT去噪处理。前3种方法直接对首阶高频IMF分量进行剔除后线性重构,而EMD-WT、EEMD-WT的去噪原理类似于CEEMDAN-WT去噪。
实验参数设置为:EMD分解维数为8;EEMD的白噪声标准差为0.15,白噪声添加数目为20;CEEMDAN的噪声标准差为0.2,噪声数量为20,最大迭代次数为3 600;α、β分别设置为0.20、0.85;小波基函数采用db4;样本熵参数值为0.15(STD)。
图3为EMD、EEMD及CEEMDAN分解得到的各IMF分量与初始纯净信号间相关系数值的分布。可以看出,CEEMDAN得到的与初始信号高度相关的IMF分量数目较多,分解效率较高,便于后期的高低频成分分析与有效成分提取。
图4给出了6种方法的去噪结果,表1为6种去噪方法的评价指标结果。可以看出,EEMD和EEMD-WT去噪效果一般,其余4种方法去噪效果较明显,特别是CEEMDAN-WT方法,将初始含噪信号的信噪比由6 dB提升到了15.696 0 dB,且其MI、PCCs和MSE指标结果也最佳。
需要特别注意的是,EEMD方法虽然在波形复杂度降低方面效果较为突出(VSE=1.215 6),但去噪后信号失真较严重,信噪比结果未达预期,其对信号与噪声的分离效果不佳。同时,从图表信息可观察到,EMD-WT方法几乎在每一个去噪性能指标数值上都接近于CEEMDAN-WT方法,且其去噪时间更短。因此,在对数据处理效率要求较高的场合,EMD-WT方法可以作为CEEMDAN-WT方法的可靠替代方案。
图5为仿真地震波信号的去噪结果频谱图。可明显看出,CEEMDAN-WT与EMD-WT去噪频谱结果的高频噪声成分(10~50Hz)得到有效抑制,其他4种去噪方法相对表现较差,仍存在大量的高频噪声,尤其是EEMD-WT方法,这与表1的分析结论一致。
表1 仿真地震信号去噪效果对比
3 地震信号去噪实验
为了进一步验证CEEMDAN-WT算法的去噪效果,应用2021-05-22发生于玛多的M7.4地震强震动记录进行去噪实验,该震为我国近几年震级最大、余震较多的一次典型地质破坏事件,地震烈度X度区域半径达69 km,具有显著的研究价值。地震数据由中国地震局工程力学研究所负责观测记录,包括西宁、湟源、民和等16个地震台站(图6)记录的三分量加速度数据,共48条。
表2为48个地震样本数据实施CEEMDAN-WT去噪的总体结果。从VSE来看,有97.916 7%(47/48)的样本的波形随机性得到抑制,PCCs与MI指标皆在0.930 0与0.830 0以上,其均值分别达到0.982 7和0.872 4,去噪重构后的有效成分保留较好。
图7为48个地震数据样本在不同区间下CEEMDAN各分量与初始样本相关系数的分布结果,统计区间阈值分别为0.2、0.5、0.8。由图可知,分解出显著相关(PCCs>0.8)分量的概率是27.083%(13/48),分解出较大相关(PCCs>0.5)分量的总体概率是100%(48/48);对于单个地震样本得到的全部9个分量而言,CEEMDAN能准确分离出该地震样本的有效成分,其数量在1~4之间。地震信号有效分量的提取除了利于进行后续的CEEMDAN-WT高频成分去噪外,还有助于进行地震波形多尺度特征的提取与地震事件属性辨识,对其他基于信号处理的地震学研究也有一定的参考价值。
表2 基于CEEMDAN-WT的玛多地震信号去噪效果
图8为地震样本1(表2)的CEEMDAN-WT去噪结果。可以看出,地震信号经过CEEMDAN分解得到9个IMF分量,IMF1~IMF9的中心频率依次下降,波形光滑性与周期性逐渐增强,即高频随机噪声的影响持续减弱。根据IMF分量波形特征以及皮尔森相关系数计算结果,IMF6~IMF8的PCCs值分别为0.731 1、0.585 6、0.563 6,可以推测其为地震波真实成分,其余PCCs值较低的IMF分量可能为高频噪声成分或低频噪声成分。经过CEEMDAN-WT去噪、线性重构后,地震波形至少在8个局部区域(图中虚线圆圈标注)受到明显的光滑滤波处理,并与原信号保持较为一致的波形形状,该样本的去噪指标MI、VSE、PCCs、MSE分别为0.878 1、0.045 4、0.985 7、0.023 4(表2)。
4 结 语
1)相对于EMD-WT、EEMD-WT等5种去噪方法,CEEMDAN-WT方法在各个去噪效果评价指标上皆取得最好的噪声压制效果,SNR从6 dB提升到了15.696 dB,并最大程度地保留了原始地震仿真信号的有效成分,MI、PCCs和 MSE 分别为 0.878 8、0.988 3和0.0461;在保证去噪效果良好的前提下,如果对去噪时效性要求较高,EMD-WT方法可作为CEEMDAN-WT方法的代替方案。
2)2021青海玛多M7.4地震的天然地震信号去噪实验结果整体符合预期目标:97.916 7%的样本波形复杂程度得到一定抑制,信号还原性较好,PCCs与MI指标均值分别达到0.982 7和0.872 4;CEEMDAN-WT方法分离出PCCs>0.5的IMF分量的概率达到100%,这有助于对指定IMF分量进行高频去噪;在保证地震波形整体变化趋势无明显变化的同时,该方法实现了一定的局部光滑去噪效果。
3)考虑到台站场地条件、震源深度和震级等因素对随机噪声的影响,下一步将探索分析CEEMDAN-WT方法在各类地震案例样本中的表现。
致谢:感谢中国地震局工程力学研究所提供数据。