循环神经网络在浅海声速-声源联合反演中的应用
2021-09-08王同苏林任群言王文博马力
王同, 苏林, 任群言, 王文博, 马力
(1.中国科学院 水声环境特性重点实验室, 北京 100190;2.中国科学院 声学研究所, 北京 100190;3.中国科学院大学, 北京 100049)
海水中的声速决定了海洋中的声传播特性[1],剖面受到很多海水环境参数的影响,其中有一些相对稳定的参数,如海底的结构、海洋的深度等;还有一些动态变化的参数,如海水的生物群、海流、温度、盐度等。这些动态变化的参数,会随着时间的变化而发生变化。变化不稳定,会导致海水中声速产生变化,使得水层声速剖面具有明显的时空变化。
海水声速剖面的显著时间演化特性为声速剖面的序贯反演提供了可行性。Candy[2]将扩展卡尔曼滤波算法引入到海洋声学反演中,将声速剖面的时间演化过程建立为一阶时间演化模型。Yardim[3]通过经验正交函数(empirical orthogonal function,EOF)描述声速剖面,采用序贯滤波中的卡尔曼滤波和粒子滤波的方法对地声参数进行跟踪。Carriere[4-5]在水平变化环境中将声学反演问题改进为状态-空间模型,通过序贯滤波的数据同化算法进行海洋环境状态估计。李建龙等[6]通过海洋动力学模型与声速的关系反演声速场的时间与空间结构信息并验证了算法的有效性;金丽玲等[7]利用自回归分析拟合方法将声速场扰动建模为高阶自回归演化模型,通过集合卡尔曼滤波序贯的估计时间演化的海洋声速场。这些研究将时变声速剖面的反演问题改进为由描述声速剖面时变特性的状态方程与包含测量声场信息的测量方程组成的状态-空间模型,应对声场环境的时变特性。
由于浅海声场环境的复杂性,难以直接描述声速剖面时变特性的状态方程,通常为一阶随机游走过程,此时的状态方程不能很好的预测状态变量的走向,序贯滤波的应用会受到限制。而深度学习的分析归纳能力强,可以将复杂的问题表示为嵌套的层次概念体系,所以尝试利用深度学习方法的循环神经网络,处理相关数据,描述声速剖面的时变特性。学习数据构建模型并配合序贯滤波器进行估计,这一方法在其他学科中广泛应用。例如,文献[8]中将长短期记忆人工神经网络(long short term memory network,LSTM)与卡尔曼滤波(Kalman filter,KF)深度融合,提出了一种KF修正的LSTM混合模型KF-LSTM,其结果与LSTM模型、浅层神经网络模型和KF模型单独使用的结果相比,能够有效提升性能;文献[9]中将BP神经网络用于测量方程的优化,再通过卡尔曼滤波器进行估计;文献[10]利用神经网络对非线性系统建立状态空间模型,采用高阶容积卡尔曼滤波对新的状态进行实时更新,从而达到神经网络对非线性系统模型的真实逼近以及对状态值的精确估计。
本文将深度学习中的循环神经网络引入到序贯滤波中,利用循环神经网络学习历史水文数据,对浅海环境下的时变声速剖面进行学习建模,在此基础上,利用集合卡尔曼滤波进行了对声速剖面和声源位置的联合反演,通过实测声速剖面的仿真声学数据验证了方法的可行性。
1 声速剖面时变特性模型
LSTM 神经网络由Hochreiter等[11]提出,并由Graves[12]进行改进,是基于RNN的一种完善,解决RNN中易出现的梯度消亡问题。在LSTM中,通过门结构来对细胞状态信息进行增加或删除。门结构通常由一个sigmoid神经网络层和逐点乘积的操作组成,从而选择性地让信息通过。LSTM通过输入门、遗忘门和输出门3个门结构来实现对信息的控制。
基于循环神经网络进行模型构建与训练。模型训练的数据集来自于某次浅海实验中A、B2点约10 d的水文数据,数据集中包括A点声速剖面和B点声速剖面,每10 s记录一次数据。利用这个数据集构建浅海环境下的声速剖面时变特性模型,最终达到已知A点处前1 h的水文数据,可以预测B点1 h后的声速剖面。在Keras框架下进行了模型的构建与训练。
在模型训练结束后,使用测试集数据进行模型测试。图1为实际声速剖面、模型预测的声速剖面、模型预测的误差。可以看出,模型预测值的变化趋势,与实际声速剖面的时间演化趋势基本一致,只在温跃层深度处,因声速剖面起伏较大,模型的预测误差变大。图2为测试集数据进行预测的均方根误差,在温跃层起伏较大时,均方根误差较大。
图1 声速剖面时变特性模型的预测结果Fig.1 Predicted results based on lstm model using SSP time-varying characters
图2 模型预测结果的均方根误差Fig.2 Root mean squared error of predicted results based on lstm model
2 基于声速剖面时变特性模型的联合反演
2.1 声速剖面参数化
EOF方法能够有效地将声速剖面参数化,降低表示声速剖面所需要参数个数[13-14]。假设在一段时间内测量得到N条声速剖面SSP数据,在深度上进行等间隔线性插值。离散到M个深度上:c1(zj),c2(zj),…,cN(zj),j=1,2,…,M
从而可以通过求平均值的办法得到平均声速剖面:
(1)
则第i条SSP在第j个深度处的声速起伏为:
(2)
协方差矩阵R可以表示为:
(3)
(4)
对矩阵R进行特征值分解,可以得到:
(5)
式中λ1>λ2>…>λM为对应特征向量fn的特征值。
由于本征值快速衰减,通常前几阶数EOF系数就可以较为准确地描述声速剖面:
(6)
式中αk和fk(z)分别为第k阶EOF系数和第k阶EOF向量。
2.2 空间-状态方程
本文利用集合卡尔曼滤波方法[15]对浅海环境下时变声速剖面及声源位置同时进行反演,系统的状态方程需要同时描述声速剖面和声源位置的变化。在先验数据的基础上,利用前3阶经验正交系数表示声速剖面:
(7)
式中:wk为状态噪声向量;L表示之前所构建的声速剖面时变特性模型,以A点前1 h的声速剖面数据作为先验数据,逐步预测B点声速剖面,并进行EOF分解,更新α。
(8)
(9)
式中:s为声源的参数,Z为声源的深度,R为水平距离;v为速度;Δt为2次测量之间的时间差;vd和va分别是声源深度与速度的随机变量。
则系统的状态向量定义及系统的状态方程和测量方程为:
(10)
xk=f(xk-1)+vk
(11)
yk=h(xk)+wk
(12)
式中:f(·)为状态向量的状态转移函数;L为声速剖面时变特性模型;F为声源位置状态转移矩阵。vk和wk为过程噪声和测量噪声;h(·)为简正波模型;考虑远场近似,k时刻水平距离R、深度Z处的声源,在接受阵列处的声压P可以表示为:
(13)
式中:Φm(z)为本征函数,描述了第m号简正波的模式形状;krm为本征值,即水平波数;ρ为海水密度;M为简正波个数;Z为声源深度。
2.3 集合卡尔曼滤波
集合卡尔曼滤波[16]为基于蒙特卡罗采样的卡尔曼滤波,可以解决非线性和非高斯的问题。本文在2.2节的基础上,获得由N个样本点组成的背景集合Xk和观测集合Zk,并计算背景集合的平均状态分别为:
Xk={xk,i,i=1,2,…,N}
(14)
Zk={zk,i,i=1,2,…,N}
(15)
xk,i=f(xk-1)+vk
(16)
(17)
其中观测集合在背景集合的基础上构建:
zk,i=h(xk,i)
(18)
利用最新的观测信息,通过卡尔曼滤波更新当前时刻的背景集合里的每个样本点,得到分析集合:
(19)
(20)
其中Gk为卡尔曼增益:
(21)
利用分析集合的平均值对k时刻的状态进行更新:
(22)
3 联合反演结果
3.1 匀速直线运动声源仿真
假设声源做匀速直线运动,利用KRAKEN声场计算工具,使用实测声速剖面数据进行浅海波导下的声场仿真。仿真波导的海深为84 m,海底密度为1.78 g/cm3,海底声速为1 650 m/s,海底衰减为0.13 dB/λ。
利用LSTM声速剖面时变特性模型进行了声速剖面和声源位置的联合反演,记为LSTM-EnKF方法;同时利用了一阶时间演化模型进行了声速剖面和声源位置的联合反演,记为EnKF方法。将反演结果进行对比。
LSTM-EnKF方法和EnKF方法下声源参数的反演结果如图3、图4所示。图3(a) 、(c) 、(e)分别为LSTM-EnKF方法下声源深度、距离、速度的反演结果与实际的对比,图3(b) 、(d) 、(f)为3个参数的反演误差;图4(a) 、(c) 、(e)分别为EnKF方法下声源深度、距离、速度的反演结果与实际的对比,图4(b) 、(d) 、(f)为3个参数的反演误差。可以发现2种方法都能够对声源参数进行追踪,且均展现了较好的追踪性能,3个参数的误差均在0左右。这是由于在进行声源追踪时,2种方法使用了相同的状态方程和状态转移矩阵。
图3 LSTM-EnKF 方法下匀速直线运动声源追踪结果Fig.3 Inversion results for the source parameters using LSTM-EnKF method when the source in state of uniform motion
图4 EnKF 方法下匀速直线运动声源追踪结果Fig.4 Inversion results for the source parameters using EnKF method when the source in state of uniform motion
如图5所示,对于EOF前3阶系数的追踪结果,在第3阶EOF系数的追踪上,EnKF追踪结果的误差要略大于LSTM-EnKF追踪结果的误差。并且可以看出,使用一阶时间演化模型的EnKF方法,在前30 min左右出现了较大的误差,也正是EnKF方法在第3阶EOF系数追踪上,误差较大的时刻。此外,图4显示EOF3的跟踪比EOF1和EOF2系数差。与前2阶相比,第3阶EOF系数对SSP扰动的控制作用较小,导致声速的微小变化。通过比较,验证了LSTM-EnKF法在声速剖面的追踪上的可行性,LSTM-EnKF法能够估计所有参数,且波动范围较小,与真实值几乎完全吻合。
图5 匀速直线运动声源下EOF反演结果Fig.5 Inversion results for the EOF parameters when the source in state of uniform motion
3.2 非匀速运动声源仿真
在相同仿真参数下,利用KRAKEN声场计算工具,使用实测声速剖面数据,选取该海域某次浅海实验移动声源的实测运动参数,进行非匀速运动声源的浅海声场仿真。使用LSTM-EnKF方法,进行了声速剖面和声源位置的联合反演。如图7所示,与图3中LSTM-EnKF方法对匀速直线运动声源的追踪结果相比较,对于实测声源的追踪,由于声源做非匀速运动,追踪结果的误差略大。其中声源速度的追踪性能较差,这可能是由于在表1所示的仿真参数下,测量方程(18)所对应的代价函数对声源速度的敏感度较低。
图6 匀速直线运动声源下声速剖面反演结果Fig.6 Inversion results for the sound speed profile when the source in state of uniform motion
图7 LSTM-EnKF方法下非匀速直线运动声源追踪结果Fig.7 Inversion results for the source parameters using LSTM-EnKF method when the source in state of non-uniform motion
LSTM-EnKF方法下声源参数的反演结果如图8所示,上中下3个参数分别为声源深度、水平距离及声源速度,其中进行了估计值与真实值的比较,并展示了声源参数的反演误差。图8、9中为EOF 3阶系数与声速剖面的反演结果,第3阶EOF系数追踪效果较差,但由于第3阶EOF系数对SSP扰动的控制作用较小,声速剖面的时间演化过程仍能够很好地描述;其误差与图6(b)相比略小,对比图5(b)与图8,这可能是由于第2阶EOF系数对SSP扰动的控制要大于第3阶系数。
图8 非匀速直线运动声源下EOF反演结果Fig.8 Inversion results for the EOF parameters when the source in state of non-uniform motion
图9 非匀速直线运动声源下声速剖面反演结果Fig.9 Inversion results for the SSPs when the source in state of non-uniform motion
4 结论
1)使用循环神经网络对历史水文数据进行学习建模,能够得到对声速剖面的时变特性较为精确的描述。
2)在相同的仿真数据下,使用循环神经网络训练得到的模型作为状态方程,相较于使用一阶随机游走过程,前者联合反演结果更为精确,能够追踪声速剖面波动。
在仿真条件中,声源的移动轨迹较为平缓,应使用复杂多变的运动轨迹来进行方法的验证;仿真过程和联合反演过程中将浅海环境视为水平均匀环境,未考虑声速剖面空间变化对联合反演结果的影响;该方法需要测量点前一小时的声速剖面数据作为先验数据。在后续的工作中,要根据以上几点,探寻利用深度学习,如何进行水平非均匀环境下时变的声速剖面的描述,并进行相应复杂环境下的目标定位。