基于LSTM的弹道导弹主动段轨迹预报
2022-05-23吉瑞萍张程祎王跃东
吉瑞萍, 张程祎, 梁 彦,*, 王跃东
(1. 西北工业大学自动化学院, 陕西 西安 710072;2. 信息融合技术教育部重点实验室, 陕西 西安 710072)
0 引 言
弹道导弹因其速度快、射程远、抗电磁干扰、高突防,甚至能运载核弹头等特点,已成为国防安全面临的最大威胁之一。为建立有效的导弹防御系统,相关学者进行了大量研究。在导弹防御系统的众多技术环节中,弹道导弹长周期轨迹预报是至关重要的一环,因为其可以为防御系统提供响应时间,并为拦截器提供制导信息。
弹道导弹的整个轨迹通常分为3个基本阶段:主动段、自由段和再入段。由于弹道导弹在后两个阶段受力相对简单 (自由段仅受重力影响,再入段受气动阻力和重力影响),传统的轨迹预报方法大多集中在这两个阶段,根据解析法、数值积分法或函数逼近法推断导弹的未来状态。解析法将自由段轨迹近似为以地球为中心的椭圆,然后通过描述椭圆信息的开普勒模型进行轨迹预报。数值积分法根据一定的积分准则外推弹道导弹的动力学方程,进而得到目标轨迹的预报值。函数逼近法则是使用多个基函数的线性组合来对弹道进行逼近,从而预报未来弹道。自由段与再入段的轨迹可预测性使得大多数拦截方法主要面向这两个阶段。然而,弹道导弹在自由段会释放多枚弹头和诱饵,后两阶段的拦截将面临目标识别的困难。相比之下,主动段拦截的优势在于:目标导弹具有大而明亮的尾焰,使得导引头容易追踪目标位置,且无欺骗式干扰,拦截发生于敌国境内。基于上述考虑,有学者开展了弹道导弹主动段拦截方面的研究工作。为了给主动段拦截提供精确可靠的目标预报信息,本文对弹道导弹主动段长周期轨迹预报这一问题进行研究。
弹道导弹在主动段受到推力、气动阻力和重力等未知力的影响,因此该阶段的轨迹预报相比自由段和再入段更具挑战性。受力的复杂性使得主动段轨迹不能用椭圆来近似。若考虑使用数值积分法从某一时刻的状态估计开始外推弹道导弹动力学模型,由于经验模型、量测等建模误差的存在,目标状态积分初值与弹道参数估计误差的累积传播会使长周期轨迹预报变得不可靠。函数逼近法原则上能够用于弹道导弹主动段轨迹预报,但是需要根据主动段轨迹数据特征选择合适的逼近函数空间,从而在预报精度与计算复杂度上获得折中。因此,有必要研究有效的弹道导弹主动段轨迹预报方法。
近年来,已经开发了许多机器学习方法从大量数据中提取感兴趣的知识,并且在航空航天领域获得了广泛的应用。例如,文献[20]针对卫星通信非合作接收成对载波多址复用混合信号盲分离中高复杂度束缚,提出了一种基于前馈神经网络的分离算法;文献[21]将神经网络和卡尔曼滤波器相结合,解决了航天器状态估计和过程动态不确定性的估计问题。不同于一般的神经网络,循环神经网络及其重要变体——长短时记忆(long short-term memeory, LSTM)网络,由于能够有效提取序列上下文信息,在处理复杂时间序列问题上具有明显优势。例如,文献[22]设计了一种基于深度LSTM的机动目标跟踪方法估计与飞机运动序列一致的真实状态;文献[23]针对现有卫星通信系统无法适应信道时变问题,利用LSTM神经网络建立了信噪比预测模型调整系统的调制与编码方案;文献[24]建立了基于LSTM的战场意图识别模型,以实现对战场敌方目标战术意图的自动识别。
考虑到LSTM在处理时间序列上的优势,本文提出了一种基于LSTM的弹道导弹主动段长周期轨迹预报方法。首先,根据弹道导弹主动段动力学模型及弹道参数典型取值生成轨迹库,为待设计的网络构建多样化训练样本。其次,设计了基于深度LSTM的弹道导弹长周期轨迹预报算法。最后,与基于数值积分法、多项式拟合及反向传播神经网络的3种轨迹预报方法的实验对比表明了所提方法在弹道导弹主动段轨迹预报上的优越性。
1 问题描述
本文的目的是根据对弹道导弹连续跟踪至时刻的状态估计值实现其主动段未来任意>时刻的轨迹预报。为此,需要首先确定弹道导弹主动段动力学模型与量测模型。
1.1 主动段动力学模型
如前所述,弹道导弹在主动段受到推力、气动阻力与重力的作用。当采用常用的地心地固 (earth-centered earth-fixed, ECEF)坐标系描述其运动时,弹道导弹还受到科氏力与向心力的影响。因此,根据牛顿力学定律,弹道导弹主动段动力学模型为
(1)
式中:=[,,]与=[,,]为目标在ECEF坐标系的位置与速度;,,,,分别为推力、气动阻力、重力、科氏力与向心力加速度。
与文献[7]类似,进行下述假设获得加速度的解析表达式:
(1) 推力与速度方向一致;
(2) 火箭排气速度和归一化质量燃烧率为常数;
(3) 弹道系数为常数。
基于以上假设,有
(2)
式中:代表时间;()=e- 为空气密度;和为已知常数;=‖‖-为目标高度,为地球半径;为地球重力常数;为地球自转角速度;=[0,0,]。
将式(2)代入式(1),得到弹道导弹主动段位置与速度的衍化公式为
(3)
1.2 量测模型
=(-)
(4)
式中:=[,,]和分别为目标与雷达在ECEF坐标系中的位置;为ECEF至ENU坐标系的旋转矩阵,表示为
(5)
式中:和分别为雷达的经度与纬度。
因此,ENU坐标系中的量测模型为
(6)
式中:为协方差矩阵等于的零均值高斯白噪声。
1.3 主动段轨迹预报问题
弹道导弹主动段动力学模型,即式(3),能够为弹道数据库的生成提供依据;此外,还可以为用于目标状态估计的跟踪器的设计提供指导。但是,由于该模型中存在火箭排气速度、归一化质量燃烧率、弹道系数等未知参数,无法将其直接用于非合作导弹的轨迹预报。虽然可以通过期望最大化等方法获得目标状态和未知参数的联合估计,但是无论选择何种跟踪器,这些估计值总是或多或少地带有估计误差。这里,采用灵敏度指标(定义为归一化状态变化率与归一化控制变化率的比值)来定量分析轨迹控制变量 (即弹道参数和初始弹道导弹状态)的估计不确定性对外推弹道的影响。
图1描绘了相对于1%的轨迹控制变化量,方向上位置和速度分量的增量灵敏度。图1(a)表明,弹道导弹轨迹相对于排气速度和归一化质量燃烧率的灵敏度高于弹道系数的灵敏度,这与文献[7]的结果一致。另外,如图1(b)所示,弹道轨迹对初始弹道状态也具有很高的灵敏度 (对和方向上状态分量的灵敏度分析可以获得类似结果)。因此,基于跟踪器输出的导弹状态与弹道参数估计值对动力学方程外推的轨迹预报方案是不可行的。
图1 x方向上状态分量对1%轨迹控制变化量的灵敏度
事实上,式(3)中的非线性及未知参数隐含在生成的弹道数据中。如果能够获得大量轨迹数据,就有可能学习出弹道导弹状态随时间的变化关系。因此,与其尝试获取尽可能准确的弹道导弹状态和未知参数估计值对弹道进行外推预报,本文考虑利用LSTM网络学习弹道导弹主动段轨迹库中相邻时刻目标状态的变化关系,即构建的网络实现如下功能:
(7)
2 弹道导弹主动段轨迹库生成
弹道导弹主动段轨迹数据来源有两种:通过监视、侦察、情报收集等手段获取部分关键弹道数据;利用主动段动力学模型及弹道参数典型取值生成目标导弹的弹道数据。由于神经网络训练需要大量样本,本文采用第二种方法为基于LSTM的网络提供丰富的样本数据。
由于弹道参数与导弹类型相关,因此需对目标导弹的弹道参数在可行范围内遍历取值,以生成多条可行轨迹。另外,弹道导弹如果存在多级发动机助推,弹道参数还会面临分级突变的问题。考虑到多级弹道导弹助推器的分离高度速度等关键信息难以获取,本文构建单级中程弹道导弹主动段轨迹库以验证所提方法的有效性。
通过对文献[27]中弹道参数的标称值进行拉偏以实现弹道参数遍历,并求解弹道导弹主动段动力学模型,生成了满足中程导弹飞行时间与高度要求的10 000条主动段轨迹,如图2所示。图2表明建立的弹道轨迹库可以覆盖从指定位置发射的弹道导弹的大范围攻击区域。此外,表1总结了生成弹道导弹主动段轨迹库的参数设置。
图2 弹道导弹主动段轨迹库
表1 弹道导弹主动段轨迹标称参数
3 基于LSTM的轨迹递归预报方法
图3 基于LSTM的弹道导弹主动段轨迹预报方案
3.1 数据预处理
3.1.1 轨迹分段
实际情况中,当对弹道导弹仅进行较短时长的持续观测时,就可能有对其进行长周期轨迹预报的需求。因此,为使LSTM网络在在线预报与离线训练时的数据长度相匹配,需要将训练集中每一条完整的主动段轨迹分割成长度为的若干轨迹片断 (假设轨迹预报的最短持续观测时长为个采样周期)。这里以一条长度为的轨迹进行分段示例说明,如图4所示。
图4 轨迹分段示例
3.1.2 数据归一化
弹道导弹在主动段时,状态不同维度之间量级相差很大,如图2表明目标位置至少为10量级,而目标速度是从零开始累积的。如果将导弹状态估计值直接输入LSTM网络并与网络中的随机权重矩阵进行前向计算,目标状态中的速度特征将会被位置特征“淹没”。此外,量级过大的位置输入也会使第一层LSTM网络中单元的激活函数工作在饱和区域,这将阻碍损失函数的反向传播。为此,需要对用于弹道导弹轨迹预报的LSTM网络的输入输出数据进行归一化,以确保网络的损失函数可以收敛到令人满意的值。
本文对长度为的输入输出导弹轨迹序列采用最大值归一化,即
(8)
(9)
3.2 深度LSTM网络训练模型
本文设计的深度LSTM网络包括3个LSTM层、一个最大输出(Maxout)层和一个全连接(fully connected, FC)层,如图5所示。3层LSTM网络用于充分挖掘弹道导弹状态之间的时序关系。Maxout层在第3层LSTM网络的输出空间中生成一个最大子集,其将网络中对输入数据不敏感的部分丢弃,仅训练对输入数据敏感的剩余网络,以保证网络更容易学习到输入轨迹序列中的信息。FC层将Maxout层的输出转换为与轨迹预报序列具有相同维度的数据。
图5 基于LSTM的弹道导弹主动段轨迹预报训练模型
在误差反向传播阶段,采用Adam算法对网络进行优化直至收敛,其中损失函数定义为训练轨迹样本的正则化平方误差:
(10)
式中:为单步训练的小批量样本数;为自定义的惩罚项系数;为网络中待学习的参数。
3.3 在线预报与轨迹更新
由于任意相邻轨迹序列均存在长度为-2的重合预报时刻,对于预报长度为-的弹道导弹轨迹序列,+1≤≤-1之间的时刻由于神经网络的递归外推会生成(2≤≤)个不同的预报值,因此需要将其平均以获得时刻轨迹预报的更新估计。将各时刻更新后的轨迹预报值按时间顺序排列,即可获得完整的弹道导弹轨迹预报序列。
基于LSTM的弹道导弹主动段在线轨迹预报与更新方案如图6所示。
图6 基于LSTM的弹道导弹主动段轨迹在线预报方案
4 实验验证
本节验证基于LSTM的弹道导弹主动段轨迹预报(LSTM-based trajectory prediction, LSTM-TP)方法性能,包括参数设置、网络收敛性分析与实验结果3部分内容。
4.1 参数设置
实验中涉及到的参数包括用于网络训练的超参数与样本参数,各参数取值如表2~表4所示。
表2 不同网络层神经元节点数设置
表3 网络训练参数设置
表4 样本参数设置
为了分析网络参数对平均预报均方根误差 (average prediction root mean square error, APRMSE)和平均在线运行时间的影响,表3中列出了不同网络参数取值下验证集上的预报性能。可以看出,当网络参数选为表3中第1列数值时,在验证集上的整体预报性能是最优的。此外,表5还表明增加网络结点数会增加LSTM-TP的平均运行时间,但不一定能提升APRMSE;增加训练迭代步数也不一定能提升APRMSE。
表5 不同网络参数下验证集预报性能分析
4.2 网络收敛性分析
LSTM-TP网络训练过程中在验证集上的损失如图7所示,其中学习率以每5 000步指数衰减形式从10开始降低。可以看出,网络在验证集上的损失可以收敛到较好结果。
图7 LSTM-TP网络训练过程中在验证集上的损失
4.3 实验结果
共进行了两组实验验证。第1组将LSTM-TP方法与基于数值积分法、多项式拟合及反向传播(back propagation, BP)神经网络的弹道导弹轨迹预报方法进行了对比。第2组验证轨迹估计序列长度对LSTM-TP方法的影响。所有轨迹预报方法用到的目标状态估计序列均由URTSS-EM(uscented Rauch-Tung-Striebel smoother with expectation-maximization)算法提供,因为其可以较好地解决具有未知参数的非线性状态估计问题。此外,量测模型中取值参考文献[32],即径向距、方位角、俯仰角的观测误差标准差分别为15 m, 0.1°, 0.15°。
4.3.1 实验验证1
本组实验中,跟踪器提供的弹道导弹状态估计序列长度=10(采样周期为1 s),需预报11~80 s之间的目标状态。不同轨迹预报方法对弹道导弹位置与速度的预报均方根误差如图8所示。
图8 不同轨迹预报方法性能对比
可以看出,4种方法在弹道导弹主动段的长周期轨迹预报中均存在不同程度的发散。其中数值积分法的发散程度最高,这是因为目标状态初值与弹道参数的估计误差会在动力学模型的积分外推中累积传播。多项式拟合法对累积至当前采样时刻的目标状态估计值进行最小二乘回归,并用该回归模型对未来时刻目标状态进行预报,预报精度优于数值积分法。BP神经网络与LSTM-TP方法由于利用了离线轨迹数据,预报效果整体上优于前两种方法。相比于BP神经网络,LSTM-TP能够提取轨迹序列的时序特征,因此在弹道导弹主动段长周期轨迹预报中性能最优。
此外,表6中统计了4种轨迹预报方法的平均在线运行时间。虽然LSTM-TP方法的计算复杂度是最高的,但0.5 s的运行时间仍然能够满足弹道导弹主动段长周期轨迹预报的实际运行需求。
表6 4种轨迹预报方法平均在线运行时间
4.3.2 实验验证2
本组实验中,跟踪器提供的弹道导弹状态估计序列长度分别为=5和=10(采样周期均为1 s)。与第1组实验相同,仍需预报11~80 s之间的目标状态。LSTM-TP方法在不同估计序列长度下的轨迹预报性能如图9所示。
图9 不同估计序列长度LSTM-TP轨迹预报性能对比
图9表明,用序列长度=10的数据训练的LSTM-TP网络的性能要优于用=5的数据训练的网络。这是因为用于训练的时间序列的长度越长,LSTM网络记忆的时间信息就越多,对时间序列的拟合效果也就越好。因此,LSTM-TP方法在实际应用中,应积累尽可能长的弹道导弹轨迹估计序列,再进行长周期轨迹预报。
5 结 论
本文研究了弹道导弹主动段长周期轨迹预报问题,提出的解决方案为基于LSTM的深度神经网络。得益于深度神经网络强大的非线性拟合能力与LSTM对时间序列的记忆功能,设计的LSTM-TP方法通过对目标当前状态估计序列的连续外推实现了未来轨迹的递归预报。最后,在弹道导弹主动段轨迹库上证明了所提轨迹预报方法的有效性。