APP下载

基于增强上下文信息长短期记忆网络的弹道轨迹预测

2023-03-21任济寰吴祥薄煜明吴盘龙何山

兵工学报 2023年2期
关键词:炮弹弹道时序

任济寰, 吴祥, 薄煜明, 吴盘龙, 何山

(南京理工大学 自动化学院, 江苏 南京 210094)

0 引言

根据己方的观测数据进行弹道轨迹预测,是提升现代陆军反应速度和打击精度的重要手段。在陆军的进攻及防御反制措施中,对来袭弹进行拦截时,要求对弹道轨迹进行精准且高效的预测。

现役火控系统对弹道预测主要采用解算时间较短的射表函数逼近方法,通过建立运动学或动力学模型,利用函数逼近法等进行轨迹预报[1]。该方法设计过程繁琐、精度有限,且不同弹种的具体弹道和修正量需要分别解算,不利于火控系统的通用性发展[2]。为克服上述问题,基于数值积分法求解弹道微分方程组的方法被逐渐应用起来。该方法利用雷达获得来袭弹现在点位置、速度矢量及弹道参数,通过弹道解算来确定炮弹的未来运动轨迹[3]。弹道方程预测法虽然通用性较好,但需要多次弹道迭代才能得到较高精度的结果,实时性不强。

除以上弹道轨迹预测方法外,考虑到弹道轨迹是时序数据,可采用时序预测的方法对雷达采样数据进行处理、分析并进行预测。近年来,在机器学习领域涌现了一批优秀的时序预测方法,其中包括经典结合随机过程的高斯过程回归(GPR)[4-6]及高斯混合模型(GMM)[7]。考虑到弹道轨迹是一段复杂的非线性曲线,可将炮弹的轨迹视为一个随机过程,而随机过程可以表达为基于某一核函数的高斯过程(GP)。GP作为一个特殊的随机过程,它结合了贝叶斯后验概率和核方法,提供了一个有效的概率方法用于回归问题。当GP用于处理回归问题时,被称为GPR,而GMM使用不同类型的核函数分别做GPR建模,最后对各自输出结果进行加权线性组合,进一步提高了预测精度。GMM预测法中,核函数直接决定了GPR的预测精度,它用于捕捉不同输入点之间的关系,从输入的训练数据预测未知点的值。文献[8]使用GMM,通过所收集的传感器数据和操作监控信息对复杂工业系统组件的剩余寿命进行预测。文献[9]利用GMM预测新冠疫情在全球的预期病例、死亡总数、结束日期。GMM具有容易实现、超参数自适应获取的优点,但其存在因为非参数性质导致计算量大的问题,在面对大数据集时存在应用瓶颈[10]。

近年来,受人脑工作原理启发而设计的神经网络迅猛发展,其旨在模拟人脑的学习过程,实现对信息的智能处理及进一步决策。时序预测是神经网络研究的一个重要领域,在处理时序信息的过程中,记忆是学习的核心环节。卷积神经网络(CNN)[11]主要具有空间记忆能力。文献[12]使用CNN对飞机的三维飞行轨迹进行预测,但受限于CNN有限的时序记忆能力,只能将飞行轨迹拆为3个坐标轴上的分量分别预测,其应用前景有限。

为更好地形成时空记忆,循环神经网络(RNN)[13]通过隐状态传递时序信息。RNN中每个隐状态都会在下一时刻被更新,对短期内的信息更为敏感。在一些复杂场景,如军用、战场等环境中,往往需要处理较大规模的时序数据,要求神经网络必须具备长期记忆能力,RNN就显得力不从心。同时,RNN还存在难以训练、收敛速度缓慢,并时常伴有致命的梯度消失与梯度爆炸等问题。长短期记忆(LSTM)网络[14-16]克服了传统RNN网络存在的大部分问题,能够从时空特征中提取出有效的信息。文献[17]提出使用LSTM网络对战场目标进行建模,通过对其轨迹的预测来感知和预测战场态势,体现出了LSTM网络在时序数据处理领域的优势。但目前将LSTM网络用于炮弹轨迹预测在国内外公开发表的文献中未见报道。

针对弹道轨迹预测问题,本文提出了上下文增强的长短期记忆(CE-LSTM)网络,进一步加强短期时序特征之间的关联性,以模拟炮弹在飞行过程中的运动状态。用实际弹丸参数建立包含13 500条不同口径及气象条件的弹道轨迹样本数据集,以保证仿真结果的真实性。利用数据集中样本的最后20 s轨迹的空间坐标,对CE-LSTM网络进行训练、验证及测试。通过对比外弹道数值解法及GMM等方法,表明CE-LSTM网络在有效保证实时性的同时提高了预测精度。

1 CE-LSTM网络轨迹预测模型

1.1 LSTM网络简介

LSTM网络是一种应用在深度学习特殊领域中的循环神经网络,它克服了RNN训练过程中的梯度爆炸和梯度消失问题,并针对短期记忆的问题进行了优化,能够建立较长距离的时间依赖关系,在1997年由Sepp等首次提出[18]。LSTM网络的核心在于引入了用于循环传递信息的LSTM单元(LSTM Cell),能够建立有效的时序依赖关系,适用于军用场景中复杂时序数据的处理。同时,它也通过LSTM单元缓解了RNN训练过程中存在的梯度爆炸和梯度消失等问题。

图1 LSTM单元Fig.1 LSTM unit

LSTM单元中门控单元的工作机制和流程依次为:遗忘门以Xt和ht-1为输入,经sigmoid函数压缩至(0,1)区间后与Ct-1数乘,其中1表示全部保留,0表示全部丢弃,从而决定将要从Ct-1中丢弃哪些信息,其表达式如下:

ft=σ(Wf[ht-1,Xt]+bf)

(1)

式中:Wf、bf分别为遗忘门的权值与线性偏置。

并非所有的新信息都会被存入Ct,输入门的输入与遗忘门相同,其作用是过滤。输入门决定了哪些新信息可以存入Ct,其表达式如下:

it=σ(Wi[ht-1,Xt]+bi)

(2)

(3)

式中:Wi、bi分别为输入门的权值与线性偏置;Wc、bc分别为LSTM单元的权值与线性偏置。

(4)

最后由输出门对网络单元最终的输出进行控制,其表达式如下:

ot=σ(Wo[ht-1,Xt]+bo)

(5)

ht=ot·tanh(Ct)

(6)

式中:Wo、bo分别为输出门的权值与线性偏置。该单元的输出ht分为隐藏层向更深层网络的输出以及横向上对该层中其他神经元的输出。

1.2 CE-LSTM模型

考虑到陆军常规火炮的弹药在发射后不具备主动改变轨迹的能力,气象等条件在局部范围内对其轨迹影响有限,因此弹道轨迹本质上是一条连续的、短时段内有一定规律的复杂且光滑曲线,具有时序关联性强的特点。与寻常时序数据不同,弹道轨迹中当前时刻炮弹位置与上一时刻数据的联系非常密切,在使用LSTM网络对炮弹轨迹进行预测时对其进行相应的改进,在不丢失长期记忆的前提下进一步加强短期记忆,以获得更佳的性能表现。

图2 CE-LSTM单元Fig.2 CE-LSTM unit

由式(6)可见,循环结构单元在当前时刻隐藏层的输出ht仅取决于当前时刻的ot与Ct,没有着重考虑炮弹当前时刻位置信息对下一时刻的影响。针对该问题,CE-LSTM在原有LSTM循环结构单元的基础上,充分考虑计算效率以及相邻帧短时上下文信息利用效率,构建隐藏层输出混合单元,对当前时刻隐藏层上输出ht的形式进行改进。具体地,引入一个超参数α作为隐藏层输出的权值,将当前时刻隐藏层输出与前一时刻LSTM单元的隐藏层输出进行线性加权组合,作为当前时刻的最终隐藏层输出。CE-LSTM循环结构单元的结构如图2所示,其中h′t为隐藏层输出混合单元的输出,α取值为0.9,

h′t=α·ht-1+(1-α)·ht

(7)

通过构建隐藏层输出混合单元,任意两个连续时刻之间产生了更紧密的联系。在不损失长期记忆信息的情况下,大大增强了短期记忆能力以及短期记忆之间的相关性,使网络结构更适用于炮弹轨迹预测场景。

2 基于CE-LSTM的轨迹预测

弹道轨迹预测是利用火控雷达所获得的一定帧数炮弹在三维空间中连续的坐标,对该弹体之后的弹道轨迹进行预测。

2.1 弹道轨迹预处理

在弹道轨迹预测问题中,每一条样本轨迹都存在多个潜在特征,这些特征往往存在量纲和数值量级上的差异,若使用原始样本轨迹数据而不加处理,则会使神经网络难以训练,无法收敛。标准化可以克服以上问题,它为不同潜在特征提供统一的尺度,使不同的特征具有可比性。在神经网络利用梯度进行训练和学习参数时,标准化后的数据可使不同特征对同一参数的影响程度一致,从而加快训练时梯度下降的速度,提高模型在迭代过程中的收敛速度,故应该对数据集做标准化处理。在不改变样本数据原有概率分布的情况下,标准化使每条轨迹样本数据均值为0、标准差为1,其公式如下:

(8)

式中:x′为经过标准化后的样本;x为原始样本;μ为全体样本的均值;ρ为全体样本的标准差。

2.2 弹道轨迹预测流程

外弹道学的研究表明,影响弹道的因素众多,除温度、湿度、气压等较稳定的基本气象条件之外,还有横风、纵风等不确定性强、波动幅度较大的干扰因素。因此对弹道轨迹的预测需要一个强时空相关性且高度复杂的非线性模型。LSTM理论上具有可以拟合任意非线性函数的优秀特质,而CE-LSTM在此基础上进一步加强了模型对相邻帧相关性特征的提取。

本文利用CE-LSTM进行弹道轨迹预测,其过程遵循以下步骤:

步骤1处理各型火炮的弹道数据,取弹丸命中目标前20 s的末段数据。

步骤2标准化数据。

步骤3由标准化后的弹道数据建立弹道轨迹的时序数据集,包括训练集、验证集和测试集。

步骤4构建CE-LSTM模型,设置参数和超参数后利用训练集训练CE-LSTM预测模型,并使用验证集验证模型的表现,直到模型达标。

步骤5将测试集中每个样本一定帧数的炮弹在三维坐标信息输入CE-LSTM模型,由模型进行预测并输出炮弹后续20 s的轨迹。

详细的弹道轨迹预测模型的训练及预测流程如图3所示。

图3 模型训练及预测流程Fig.3 Model training & prediction flowchart

3 仿真实验与分析

3.1 实验设定

3.1.1 构建训练集与测试集

为让模型得到有效训练,本文通过采样不同气象条件、不同弹道条件、不同射击诸元等不同条件下的各种弹道轨迹,构建轨迹样本共13 500条,其中包含155 mm榴弹炮、122 mm榴弹炮、35 mm高射炮等3种不同口径的陆军常规火炮各4 500条样本,它们分别以700 m/s、690 m/s、1 050 m/s的初速发射弹丸,武器高低角除35 mm高炮为30°~80°外,其他均为25°~65°。选择使用多种不同类型弹道训练同一个预测模型的目的,是因为在实战中同时来袭的炮弹种类可能较多,若针对每一种弹道单独训练一个预测模型,则虽然精度会更高,但是会因为辨识弹道产生额外的计算开销而影响实时性。此外,弹道辨识的准确性难以保证,存在错误辨识弹道类型并使用错误模型预测的“误判”风险,大大牺牲预测模型的鲁棒性。

为使预测模型更贴近实战情况,在构建数据集时为3种火炮的弹头初速均加上-30~30 m/s的随机误差,以模拟火炮发射过程中强烈冲击与震荡对弹头初速造成的波动;为武器高低角加上-1°~1°的随机误差,以模拟跳角的误差。为武器高低角加上随机误差的意义除模拟误差外,还在于模拟敌方多次开火时重新瞄准所造成的武器线变动。随机误差的加入不仅贴近实战,还让预测模型具备了更强的鲁棒性和泛化能力,使模型在面对未知轨迹时也能做出准确预测。

火炮发射过程中除武器线的变化之外,风速是影响外弹道的另一个极不稳定且重要的因素,其中横风和纵风影响最大。为此,在同一口径火炮的4 500条轨迹中,包含以下3种风况各1 500条:随机选取8~12 m/s的恒定风力;每0.1 s随机选取8~12 m/s的时变风力;每0.1 s增加0.02 m/s的线性时变风力。不同风况的引入进一步增强了外弹道的不确定性和非线性,虽然会增加模型训练难度但同样有利于增强模型的鲁棒性和泛化能力。数据集构成如表1所示。

表1 数据集构成Table 1 Composition of datasets

将3种口径火炮每种风况的1 500条轨迹中取出1 450条轨迹作为训练集,40条轨迹作为测试集,剩余10条作为验证集。

3.1.2 CE-LSTM网络结构

网络结构是影响神经网络预测准确率的另一个决定性因素,在固定超参数的条件下,不同网络结构的性能表现天差地别,为获得高预测准确率,选择合适的网络结构非常重要。本文采用的CE-LSTM网络结构包括输入层、隐藏层、回归层三部分,其中输入层和回归层形式固定,故确定网络结构主要是对隐藏层进行设计。CE-LSTM炮弹轨迹预测网络结构如图4所示。

图4 CE-LSTM网络结构Fig.4 Schematic diagram of the CE-LSTM network

网络在获得输入后共使用4层隐藏层:包括2层CE-LSTM和2层全连接层。其中2层CE-LSTM层再搭配适当的激活函数即可表示足够精度的决策边界,并可以拟合足够精度的平滑映射。隐藏层内部的设计主要是选择数量合适的神经元。在神经元数量选择时,一方面,全连接层分别选择6个和3个神经元,是为了数据传递时呈倒三角型逐层压缩,最后形成3维输出。另一方面,在其他参数、超参数和结构固定的条件下,为每层CE-LSTM分别选择16、32、64、128、256、384、512个神经元,并在训练神经网络时,每50次迭代采样一次当前网络模型在验证集上的均方根误差(RMSE),以确定最优神经元数量。不同数量神经元设定下预测的均方根误差如图5所示。

图5 不同数量神经元对应RMSEFig.5 RMSE with different number of neurons

由图5可知,神经网络在测试集上由RMSE度量的预测准确率随神经元数量的增加呈先减小后增大的趋势,且在256个神经元时RMSE最小。此外,神经元数量应尽量选择2的整数次幂,最大限度利用GPU的并行计算资源,提高计算速度,故每层CE-LSTM使用256个神经元。此外,包括隐藏层层数在内的其他参数调节均采用同样方法,通过重复探索来进行局部优化,以获得一组使模型预测精度令人满意的参数组合。

对输入权重及循环权重引入L2正则化以降低过拟合风险,训练CE-LSTM网络时初始学习率经过多次试验后选择0.001,且每训练10轮便将学习率减半,既能保证收敛速度,又可在多轮迭代后使学习率尽量小,以逼近损失函数的全局最优值。

3.1.3 对比方法

3.1.3.1 弹道方程预测法

(9)

式中:vd、vz、vh分别为炮弹速度矢量在三坐标轴上的分量;C为弹道系数;Hτ(hq)为虚拟气压函数;G(vrτ)为虚拟阻力函数;wd、wz、wh分别为纵风、横风、垂直风的风速;az(t)为偏流加速度。

弹道方程预测法的实施分为三步,首先根据雷达探测到的炮弹轨迹,滤波估计出其坐标位置与速度矢量;其次将滤波估计的结果作为输入量代入弹道方程,得到关于弹道系数的方程,解方程得到弹道系数;最后将滤波估计的最新结果作为弹道起始条件,利用上一步得到的弹道系数,代入弹道方程组,使用4阶龙格- 库塔法[20]解算炮弹的未来轨迹。

3.1.3.2 GMM预测法

在确定核函数时,为符合炮弹轨迹的特点,本文选择平方指数函数(SE)与有理二次函数(RQ)作为核函数,分别用kSE(r)、kRQ(r)表示,它们对应的GP均有光滑、平稳且无限可微的优秀性质,其一般表达式如下:

(10)

(11)

式中:β、l>0为待确定的超参数,l表征特征长度尺度;r为任意两个随机变量之间的距离。

GMM预测过程为:首先,将炮弹轨迹拆分为3个坐标轴上的独立运动轨迹,并分别用GP表示;其次,将3条轨迹代入GPR回归模型进行预测;最后,将预测结果重新整合为3D空间上炮弹的预测轨迹。t时刻单一坐标轴上的预测数据点Xt可表示为

Xt=ξxt,SE+ηxt,RQ

(12)

Pt={Dt,Zt,Ht}

(13)

3.2 实验结果与分析

3.2.1 训练结果评估

使用训练集中的12 900条轨迹数据,训练CE-LSTM网络模型,记录训练过程中训练集的损失变化情况,如图6所示。

图6 不同数量神经元对应损失Fig.6 Loss with different number of neurons

设定训练400轮作为停止优化损失函数的停止条件。将拟合误差边界定义为:验证集损失小于0.000 05,且最后10轮训练时,验证集损失的均值与训练集损失的均值之比小于1.15。通过400轮训练中损失函数值的变换情况可知,CE-LSTM网络损失下降非常迅速,可在短短几轮后降到0.1%左右,并在第50轮左右趋于零,在此之后虽然验证集的损失会有所波动,但始终与训练集的损失接近。在第150轮左右将图6蓝色矩形框中曲线放大,可见损失降至十万分位水平,测试集损失曲线平稳,小于上述拟合误差边界,因此认为网络已收敛。

3.2.2 弹道预测结果分析

使用训练好的CE-LSTM网络对测试集中的轨迹进行预测,随机挑选具有代表性的4条轨迹,展示预测结果。在给定前1 s共100个坐标值和前0.5 s共50个坐标值的情况下,CE-LSTM和对比方法的预测结果分别如图7和图8所示。为进一步分析各种模型在预测轨迹时的特点,选择图8(a)中155 mm榴弹炮弹丸在全程恒定8~12 m/s随机风力情况下的轨迹,分别作出3种预测模型在3个方向上预测值的绝对误差随时间变化的曲线,如图9所示。

图7 基于前100个坐标值的预测结果Fig.7 Prediction results based on the first 100 coordinate values

图8 基于前50个坐标值的预测结果Fig.8 Prediction results based on the first 50 coordinate values

结合图7与图8的8组预测表现来看,CE-LSTM网络的预测结果精度最高,整体表现平稳,该网络在预测轨迹时几乎不受外界不确定因素影响,可以对各型火炮在不同气象条件下的炮弹轨迹进行精确预测。GMM模型的表现在轨迹初始段良好,但其精度随时间推移整体呈逐渐下降的趋势,误差不断累积,导致在轨迹末端的表现不佳。弹道方程解算模型的表现虽然整体较为平稳,但精度较低,同样存在误差随时间积累的问题,并在轨迹初始段表现也不如其他两种模型。

图9 不同坐标轴上的绝对误差Fig.9 Absolute errors for different coordinate axises

由图7(c)与图8(c)可知,无论是GMM方法还是弹道方程解算法,预测精度均明显低于其他组,其原因是35 mm高炮弹丸自重仅0.685 kg,远低于155 mm榴弹炮弹丸52.8 kg及122 mm榴弹炮弹丸21.76 kg,因此外弹道受气象条件,诸如横风与纵风的扰动所造成的影响被放大,导致其弹道非线性程度增大,轨迹复杂、更难预测,而CE-LSTM网络表现依然良好,可见该模型在高扰动下的鲁棒性优于其他两种,得益于神经网络能够拟合任意非线性曲线的良好性质。

以图7(a)与图8(a)为例,横向对比各模型在相同气象条件下,在给定不同时长坐标值时的表现,并以预测值的均方根误差度量,结果如表2所示。

由表2可知,提供给模型的观测值数量越多,其预测精度越高,这一趋势在弹道方程解算模型中表现尤为突出。

图9形象地刻画了各种模型的特点,可见CE-LSTM网络的表现在全时段良好且平稳;GMM模型受累积误差影响严重,逐渐发散;弹道方程模型精度低,且呈接近线性的趋势发散,注意到图9(c)虽然误差看似逐渐降低,但其末段有重新上升趋势,可以预估其随时间推移,依然会发散。

综上,可认为CE-LSTM网络能够在全时段精确地进行炮弹轨迹预测,GMM模型的预测结果在初始的2~3 s内可用,其在3个方向上的平均RMSE略大是因为轨迹中末段发散导致,而弹道方程解算模型所预测结果的可用区间则更窄。

表2 不同时长坐标值下均方根误差表Table 2 RMSE with different time-length coordinate values

3.2.3 模型泛化能力测试

为进一步测试本文所提方法的鲁棒性并验证其泛化能力,在去掉原数据集中横风、纵风等气象条件的影响,保持原有射击诸元、弹道条件不变的情况下,重新构建一个不含横风与纵风影响的数据集,按照2.2节方法,训练一个CE-LSTM预测模型,简称无风模型。之后,使用无风模型预测有横风、纵风影响的轨迹数据,随机选取两条预测轨迹如图10所示。

图10 泛化能力交叉验证Fig.10 Cross-validation for generalization capability

由图10可知,CE-LSTM预测模型的表现在有一定相关性的全新数据集上虽然有所下降,但整体预测精度依然较高。通过这种交叉验证的方式,证明了本文所提方法的鲁棒性和泛化性较强,可以对一些未经训练的弹道轨迹进行较为准确的预测。

3.2.4 预测用时分析

本文通过对测试集中所有弹道轨迹进行预测,并求取各种模型预测用时的平均值方式,有效地说明CE-LSTM网络在实时性上的优势。在MATLAB2020环境下(Windows 10,R7-4800H CPU,2.9 GHz 主频,Nvidia RTX2060-MaxQ GPU,16GB RAM)其结果如图11所示。由图11可以看出,本文所提方法在预测阶段的平均用时远低于GMM方法与弹道方程方法:比GMM快约3倍,比弹道方程方法快约10倍。

图11 预测平均用时Fig.11 Average prediction duration

4 结论

本文在LSTM网络的基础上提出了基于新型CE-LSTM网络的弹道轨迹预测方法,构建隐藏层输出混合单元,更适合弹道轨迹预测场景。通过仿真实验证明了该方法相比GMM方法和弹道方程解算方法,在预测精度和实时性上均有大幅提升,而且泛化能力测试证明了本文所提方法有能力预测一些有相关性的全新弹道轨迹。

目前本文方法暂停留在仿真阶段,在工程实际中面临的难点是如何获取足量的敌方数据以训练预测模型,可行的方案是先用仿真数据和我方数据对模型进行预训练,再用有限的真实弹道数据进行微调,通过在线学习的方式提高模型的实战精度。

在后续工作中,将实弹轨迹数据加入训练集,并在靶场验证模型的实战精度。此外,弹道轨迹预测是顺着来袭弹的轨迹进行的,后续工作可以考虑利用CE-LSTM模型逆轨迹而行,对来袭弹轨迹进行反向推演和坐标转换,从而准确得出敌方火炮位置,进行反制和相关反火炮应用的研究。

猜你喜欢

炮弹弹道时序
弹道——打胜仗的奥秘
树上长“炮弹”
基于Sentinel-2时序NDVI的麦冬识别研究
装填炮弹
一维弹道修正弹无线通信系统研制
“炮弹”表妹
基于FPGA 的时序信号光纤传输系统
一种毫米波放大器时序直流电源的设计
积木炮弹
基于PID控制的二维弹道修正弹仿真