APP下载

基于时频分析的感应传输CTD数据降噪方法研究

2021-06-16李红志

中国测试 2021年5期
关键词:时频盐度残差

靳 萍,李红志,王 磊

(国家海洋技术中心,天津 300112)

0 引 言

感应传输CTD,是一种主要用于浅海区固定水层对温盐进行长期、定点观测的剖面仪,主要搭载于潜标、浮标和锚泊式观测平台等。通过在温盐链不同位置部署多个CTD测量仪,以感应传输的方式,将水下CTD传感器测得的水文信息上传到水上终端,以实现温盐剖面的实时观测。由多个感应传输CTD构成的系泊系统既可用来研究上层海洋复杂的运动过程,也能有效捕获上层海洋对气候的影响过程[1]。然而,由于海水变化是一个随机过程,再加上浅海区易受周围环境干扰的特殊性、及测量仪的长期工作等,在对海水测量的过程中会不可避免地受到各种噪声源的干扰,使CTD测量仪测得的原始水文数据必然存在测量误差[2-3],这就极大地限制了数据的实用性。

自20世纪80年代以来,海洋科学工作者十分重视CTD数据资料校正技术的研究,并提出了CTD数据处理的主要方法和步骤[4-6],当前美国Seabird Electronics SBE Data Processing软件中提供的CTD数据处理模块是较为常用的数据校正方式,包括:数据滤波、逆压订正、对齐订正、热滞订正、压力/时间平均等,主要针对CTD在下放过程中出现的传感器响应时间不匹配、船体上下摇晃及仪器装配和电导池热滞效应等问题进行处理。此外,梁广建等[7]和刘首华等[8]在统计检验基础上,分别采用滤波/拟合、局部检验方法对异常值进行质控;Uchida等[9]采用低通滤波方法降低高频噪声干扰;郑一等[10]提出一种小波分析方法降低测量误差。然而这些校正方式主要针对CTD垂直剖面测量过程中产生的误差问题进行,对定点式测量误差校正研究甚少,且降噪方法是基于某个时域或频域单独进行,有一定局限性。而通常情况下,海水变化非平稳,定点式测量过程中也会存在各种噪声干扰,单独时域或频域处理很难保证方法的有效性,如时域降噪方法虽有很好直观性,却容易混淆视觉,造成误判;频域处理方法虽能将时域内隐含的特征很好地表征,但需满足时间序列平稳性的前提条件,小波变换可处理非平稳信号,但对小波基和系数有着较高要求,这就限制了其适用性。因此,鉴于时域和频域各自的优缺点、CTD各参数测量值非线性非平稳性变化,提出一种时频分析方法,用于对感应传输CTD海试数据进行降噪,其总体设计框图如图1所示。该方法不仅能够有效识别与去除高频噪声成分,还能在提升信噪比基础上保留原有信号的细微变化。

图1 感应传输CTD数据降噪的总体设计框图

1 时频分析方法及基本原理

感应传输CTD获取的温盐深水文数据是一种非线性非平稳的时间序列,其中,压力在测量剖面的水平方向上以布放深度为基线平衡点,在海流、引潮力、降雨、风等作用下围绕基线上下波动、漂移,存在着明显的潜周期性,其降噪处理过程如图2所示;温度和电导率的变化相对缓慢,两者变化趋势基本一致,主要受到CTD布放的水层位置、太阳辐射及气温的日、月、季节性变化等因素影响,温度和电导率的降噪处理过程一致,如图3所示。

图2 压力降噪处理过程

图3 温度/电导率降噪处理过程

其中,CEEMD分解的自适应性能有效识别CTD信号中的高频谐波成分,且第一经验态本征函数IMF0变化频率最快,鉴于异常值幅值及频率突变的特点,可有效定位异常突变点;随机森林中决策树选择的随机性和有放回的随机抽样技术,使回归具有较强的鲁棒性,非常适用于处理非线性数据;FFT变换用于CTD各参数谐波振荡的频谱特点分析,对其所含的高频低幅值噪声识别。

1.1 CEEMD分解

CEEMD方法将复杂的时间序列根据其变化特征自适应地分解为一系列从高频到低频具有固定模态的基函数IMF,每个IMF代表一个的基本谐波振荡,是 EMD(empirical mode decomposition)和EEMD(ensemble empirical mode decomposition)的改进算法,可有效解决EMD的模态混叠现象和EEMD噪声残留问题,CEEMD分解步骤如下[11]:

3)求多组分量的瞬时平均值

1.2 随机森林

随机森林是将多棵决策树集成的一种机器学习算法,每个决策树是一个单独的基评估器,通过求平均或多数表决的原则进行回归,可有效改善决策树在回归时易过拟合的缺陷,提升回归准确率。随机森林的构建过程如图4所示[13]。

图4 随机森林模型构建过程

随机森林算法进行鲁棒性回归时,需重点解决两个核心问题:1)找到最佳节点和分枝;2)让决策树停止生长,防止过拟合。这两个问题关键在于分枝质量衡量指标的选取和参数调优,鉴于均方误差存在异常点敏感、鲁棒性不强的问题[14],本文选择平均绝对误差(mean absolute error,MAE)作为分枝衡量指标,同时采用学习曲线与网格搜索法相结合的方法优化随机森林参数,拟寻找最小化泛化误差。

式中:yi——第个样本点的实测值;

fi——第i个样本点模型回归的值;

N——观测的样本点数。

1.3 FFT变换

2 含噪CTD仿真信号分析

鉴于海水运动复杂性,为了更好地模拟海水压力、温度和电导率时间序列的变化,本文将CTD水文信号的仿真分为3种信号的叠加。第一类是真实水文信号,是由海流、波浪、潮汐,以及太阳辐射、风等自然现象引起的水文变化[15],以实测数据求滑动平均的方法进行模拟;第二类是随机误差信号,诸如仪器固有的电子和布朗热运动等问题引起的白噪声[10],通过一个平稳的伪随机高斯白噪声进行仿真;第三类是异常信号,如微生物附着、海面油污、人为破坏或仪器不稳定等问题造成的暂态信号,通过添加幅值、频率突变样点进行模拟。限于篇幅,本文只对温度和压力信号进行仿真和降噪验证。

2.1 压力信号

1)压力信号仿真

压力信号仿真如图5所示,其中1 bar=0.1 MPa。

图5 压力信号仿真

2)压力信号降噪

① 异常值定位

压力IMF0如图6所示,可以看到图中存在3个明显的幅值突变点,与压力信号添加异常点的位置刚好吻合。

图6 压力IMF0

② CEEMD分解及FFT谱分析

压力时间序列经CEEMD分解为IMF0至IMF5的固态特征分量,对其进行相应的FFT谱分析,结果如图7所示。

从时频分析图7中可以看到,IMF0时域上的幅值变化表现随机性,频域上的主频谱主要集中在高频域,含大量的噪声成分;从IMF1到IMF5,变化频率依次降低,主频谱向低频集中靠拢,有用信号的频率主要集中在0~20 Hz之间;IMF1含有部分高频噪声,IMF5反映了压力信号的基线变化趋势。

图7 压力CEEMD分解的时频图

3)降噪结果分析

通过时频域分析可知,噪声部分主要集中于固态特征分量IMF0、IMF1,滤波后的得到图8所示的降噪对比结果。

从降噪结果对比图8中可以看到,压力降噪后的变化趋势与真实信号高度一致,毛刺现象减少,有效降低噪声干扰;表1中,相关性99%以上,信噪比提升了约9 dB。

图8 压力降噪结果对比

表1 压力降噪结果统计

2.2 温度信号

1)温度信号仿真

温度信号仿真,如图9所示。

图9 温度信号仿真

2)温度信号降噪

①异常值定位

温度IMF0如图10所示,可以看到图中存在4个明显的幅值突变点,与温度信号添加异常点的位置刚好吻合。

图10 温度IMF0

②随机森林回归

a.构造特征项

从表2可以看到,将时间和压力作为特征项时,可有效提高模型回归的准确性。

表2 特征项选择

b.参数调优

通过学习曲线和网格搜索法,以平均绝对误差作为模型回归的评价指标,确定最终参数:树深为10,树数26,分枝节点最小样本数2,叶节点最小样本数30,调参后准确度提升了0.003 ℃,见表3。

表3 参数调优

③残差CEEMD分解及FFT谱分析

温度序列经随机森林鲁棒性回归后,对拟合残差性进行CEEMD分解,分解为IMF0至IMF6的固态特征分量,对其进行相应的FFT谱分析,结果如图11所示。

从图11中可以看到,IMF0时域上的幅值变化随机,变化频率明显高于其他特征分量,主频谱主要集中在高频域,含大量的噪声成分;从IMF1到IMF6,变化频率依次降低,主频谱向低频集中靠拢,有用信号的频率主要集中在0~20 Hz之间,其中IMF1含有较多的高频噪声。

图11 温度回归残差CEEMD分解的时频图

3)降噪结果分析

通过时频域分析可知,噪声主要集中于固态特征分量IMF0、IMF1,滤波后的得到图12所示的降噪对比结果。

从降噪结果对比图12中可以看到,降噪后的变化趋势与真实信号高度一致,既保留了细节信息,又减少了毛刺噪声干扰;从表4中,相关性和信噪比分别提升了约2%和9 dB。

表4 温度降噪结果统计

图12 温度降噪结果对比

3 实测CTD信号分析

感应耦合传输CTD在威海褚岛海域锚泊平台进行海试,水深约70 m,该次试验投放开始于2019年10月24日,2020年5月20日回收,历时长达约7个月,采样间隔为10 min。为了验证基于时频分析的降噪方法的有效性,基于压力背景场的周期性波动,选取2019.11.21-2019.11.22海试数据为例说明,将布放深度最为相近(相差约1.5 m)的国产ICTD57和进口SBE37_57设置为比测对照组。

鉴于海水运动复杂多变,联合国教科文组织关于海洋科学第54号文件的第5章中提及采用均方根误差(root mean squared error,RMSE)作为准确度评价指标,故本文将其作为CTD准确度的评价指标。

式中:xi、yi——比测对照组在第i个样本点值;

N——观测的样本点数。

3.1 压力降噪

应用本文所提的压力时频分析方法对ICTD57和SBE37_57的压力实测值分别进行降噪处理,降噪处理对比结果如图13、图14和表5所示。

从图13可以看到,压力时频分析的降噪方法能够有效识别异常突变点,降噪后的变化趋势与原始数据基本一致,即保留了细微信息,又降低了毛刺噪声干扰;从图14和表5可以看到,经过降噪处理后,测量偏差在小提琴图上下端的尖峰分布明显减少,RMSE减小,相关提升。

图13 ICTD57和SBE37_57压力降噪结果对比

图14 ICTD57与SBE37_57压力测量偏差分布

表5 ICTD57与SBE37_57压力降噪前后的统计对比

3.2 温度降噪

首先,对温度序列利用随机森林进行鲁棒性回归,构造特征项和参数调优是提升模型回归准确性的关键。本文通过构造不同的特征项,选择平均绝对误差作为分枝质量的评价指标,并基于学习曲线和网格搜索法相结合的方法对参数调优,以ICTD57为例,ICTD57温度回归最优参数为:最大树深为9,数树数43,分枝节点最小样本数2,叶节点最小样本数1,最终拟合效果如表6所示。

从表6可以看到,将时间和压力综合作为特征项时,平均绝对误差有效减小,压力经降噪处理及调参后模型准确性提升,也从侧面说明了压力降噪方法的有效性。

表6 ICTD57温度回归特征项选择

应用温度时频分析方法对ICTD57和SBE37_57的温度实测值进行降噪处理,如图15、图16和表7所示。

图15 ICTD57和SBE37_57温度降噪结果对比

图16 ICTD57与SBE37_57温度测量偏差分布

表7 ICTD57与SBE37_57温度降噪前后的统计对比

从定性分析结果图15和16看,温度时频分析降噪方法在保留温度原有变化趋势的基础上,可减少随机噪声干扰,测量偏差在小提琴两端的尖端分布现象明显减少;从定量分析结果表7中,温度的RMSE达到了GB/T 12763.2—2007《海洋调查规范第2部分:海洋水文观测》的一级准确度要求:±0.02 ℃,经降噪处理后,可达到±0.01 ℃的准确度要求,相关性提高了约4%。

3.3 降噪结果综合检验

1)有效性分析

鉴于海水中同一观测量无法复测的特殊性及温盐参数对海洋动力学研究的重要性,通过检定比测对照组温盐的测量准确性(见表8),以检验该降噪方法的有效性。

表8 温盐测量准确性

由表8可知,经过降噪处理后,温度和盐度测量准确性分别提升约1.4、1.3倍,均达到了GB/T 12763.2—2007的一级准确度要求;温度的准确度可以达到±0.01 ℃,表明该降噪方法有效。

由于海水盐度并非由传感器直接测量而是由压力、温度和电导率参数衍生得到,由误差传递原理,可通过盐度检验的方法对降噪结果的有效性进行综合分析。根据PSS-78盐标定义,由降噪后的压力、温度和电导率值计算出新的盐度值,降噪对比结果如图17、图18、图19和表9所示。

表9 ICTD57与SBE37_57盐度降噪前后的统计对比

图17 ICTD57与SBE37_57盐度降噪前后对比

图18 ICTD57与SBE37_57盐度降噪方法对比

图19 ICTD57与SBE37_57盐度测量偏差分布

从图17中红色标示可以看到,该降噪方法既可识别盐度变化中的异常突变点,又去除了毛刺噪声干扰;图18中,与常规低通滤波相比,能有效保留了海水的细微变化信息。

从图19可以看到,经降噪处理后,仍保留了盐度测量偏差的原有分布规律,但在小提琴两端的尖峰分布问题明显减少;表9中,降噪后的相关性提高了约2%,准确性提升1.3倍,测量准确度达到了GB/T 12763.2—2007的一级准确度要求,进一步说明了该降噪方法的有效性。

2)白噪声检验

鉴于海水中对同一观测量无法复测的特殊性,且对海水的实际值未知,为了保证没有滤除海水变化的有用信息,需对降噪后的残差进行白噪声检验,本文采用直方分布、相关性检验和LB显著性检验相结合的方法分别对降噪后残差的幅值分布、平稳性和随机性进行检验,检验结果见图20~图22。

从图20可知,降噪后的残差服从高斯分布;图21中,只有滞后0时,相关性最强,在95%的置信区间内相关系数基本上接近于0,表明降噪后的残差满足白噪声标准差为常数、二阶矩在时间滞后大于0时不相关的平稳性特点;图22中,LB统计量和BP统计量的 P 值均大于0.05(图中绿色横线),故不拒绝原假设,即降噪后残差项分布呈随机性,是白噪声,说明了该降噪方法的可靠性。

图20 盐度降噪残差幅值分布

图21 盐度降噪残差相关性

图22 盐度降噪残差白噪声检验

4 结束语

感应传输CTD在海上试验时,会受到各种噪声干扰引起的测量误差。基于温盐深各参数的变化特点,提出一种基于时频分析的降噪方法,首先,基于随机森林回归的鲁棒性和CEEMD分解自适应性提取高频谐波振荡;其次,由FFT谱特点可对高频成分信噪分离,提取出所含的高频噪声成分。为了验证该降噪方法的有效性和可靠性,本文设置比测对照组,以盐度检验的方法对降噪效果分析,并通过仿真试验和实例分析验证,结果表明:

1)从仿真试验结果来看,温盐深各参数降噪后的变化趋势与真实信号高度一致,毛刺现象明显减少,表明时频分析的降噪方法对噪声干扰和异常突变点具有较高的识别性,降噪后各参数的信噪比提升。

2)在实例分析中,由比测对照组可以看到,经降噪处理后的两型CTD的温盐测量准确性均达到了GB/T 12763.2—2007《海洋调查规范第2部分:海洋水文观测》的一级准确度要求,且与常规低通滤波相比,时频分析降噪方法可保留海水的细微变化信息,说明了该降噪方法的有效性。

3)以盐度检验的方法对降噪效果分析,降噪后的残差通过了平稳性和LB显著性检验,满足高斯白噪声的特性要求,即时频分析的降噪方法并没有将有用信息去除,表明了该降噪方法的可靠性。

猜你喜欢

时频盐度残差
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
盐度和pH对细角螺耗氧率和排氨率的影响
盐度胁迫对入侵生物福寿螺的急性毒性效应
平稳自相关过程的残差累积和控制图
适用于高盐度和致密岩层驱油的表面活性剂
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进
双线性时频分布交叉项提取及损伤识别应用