APP下载

基于网格划分与BP网络的中制导弹道在线生成方法

2019-09-26雷虎民张大元

弹道学报 2019年3期
关键词:离线弹道制导

邵 雷,雷虎民,张大元

(1.空军工程大学 防空反导学院,陕西 西安,710051;2.中国人民解放军95983部队,甘肃 酒泉,732750)

在针对临近空间高超声速目标的拦截过程中,为提高拦截弹对目标的杀伤性能,通常采用“中制导+末制导”的复合制导方式[1]。为保证拦截弹进入末制导后具有良好的制导控制性能,一方面希望中制导阶段能量消耗尽量少,保证拦截弹在末制导阶段具有对抗目标机动的足够能量;另一方面,也希望在中制导结束时具有合理的交汇条件,为末制导提供良好的初始条件[2]。这些需求对中制导段弹道设计构成了严格约束,因此,中制导段弹道的合理设计对于改善拦截弹的飞行品质,提高武器系统的最终制导控制性能均具有重要作用,中制导阶段弹道优化设计成为拦截弹总体设计的一项重要内容。

中制导弹道优化本质上是一类受约束最优控制问题,通常可分为直接法和间接法[3]两类求解方法。其中,间接法以Pontryagin极小值原理为出发点,利用一阶必要性条件将弹道优化问题转化为两点边值问题[4]。通过求解该问题得到相对精确的弹道优化结果,但这种方法通常推导过程繁琐,同时收敛域小,对初值要求高,很难直接得到优化结果[5]。直接法采用参数化方法(Runge-Kutta法[6],Hermit-Simpson法,伪谱法[7-8]等)将连续空间的优化问题离散化为非线性规划(NLP)问题,并通过数值方法(梯度下降法、动态规划法、直接打靶法、微分包含法等)求解获得最优轨迹。这种方法求解精度相对较低,但过程简单,同时收敛较快,经过参数化处理后,可广泛采用各种非线性寻优和智能优化算法求解,也是近年来的主要研究方法[9]。

这些研究均针对拦截弹中制导弹道进行离线设计,能够有效提高复合制导拦截武器的制导控制性能。但不管是直接法还是间接法,本质都是根据状态方程以及约束条件求解满足指标需求的优化弹道,实际均为开环过程。然而临近空间高超声速目标通常具有较快的速度和较大的机动范围,这种特性将导致中制导约束条件发生较大变化甚至无法满足末制导需求,离线设计的优化弹道将难以保证武器系统的整体制导控制性能。为此,一些学者提出了在线生成轨迹的方法。文献[10]采用奇异摄动技术求解两点边值问题,实现中制导律在线解算;文献[11-12]根据拟平衡滑翔条件分别基于速度与航程,速度-阻力关系等内在机理,采用开关方式对飞行器载入轨迹进行修正,在线生成轨迹,但精度较差,且无法保证最优性。文献[13]则采用在线优化的方法开展研究,通过在线对飞行器参数、状态误差等的估计,利用在线轨迹优化算法实现轨迹的在线生成。但这种弹道优化方法往往非常耗时,难以在拦截弹上实时进行弹道优化。基于此,本文充分利用离线优化弹道,采用弹道数据库和神经网络相结合的方法设计中制导弹道生成方法。

1 中制导弹道优化问题描述

1.1 拦截弹质点运动数学模型

弹道优化计算一般采用拦截弹质点运动模型[14]:

(1)

式中:m,S为导弹质量和参考面积;v为导弹速度;F为发动机推力;θ为弹道倾角;q为动压;g为重力加速度;Cx,Cy分别为阻力系数和升力系数,其中:

(2)

在实际飞行过程中“考虑到弹道的稳定性”,通常对控制变量进行如下约束:

αmin≤α≤αmax

(3)

qmin≤q≤qmax

(4)

nmin≤n≤nmax

(5)

式中:n为过载。

1.2 优化问题描述

在设计拦截弹飞行弹道时,不仅要保证导引头能够稳定跟踪目标,同时也希望拦截弹与目标相遇时具有较高的速度。为此,在中制导优化过程中,通常以末端速度最大为优化指标建立指标函数:

(6)

中制导弹道设计实际上是求解最优控制量α与中制导结束时间tf,使得由拦截弹运动方程组确定的系统,在满足给定的约束条件下的性能指标最优。对于该问题当前已有较多算法,这里不再赘述。

2 中制导弹道在线生成方法设计

2.1 基本思想

在实际弹道设计过程中,为兼顾末制导特性以及拦截弹整体弹道特性,通常以目标预测遭遇点作为拦截弹中制导弹道优化的终端约束进行弹道优化设计,通过离线弹道优化得到拦截弹的中制导优化弹道[14]。然而,受到遭遇点预测精度的影响,遭遇点位置往往不完全准确;同时,目标遭遇点在实际拦截过程中也将随着目标的运动不断发生变化,特别是在针对高速目标的拦截过程中,其变化范围可能较大,为保证拦截弹整体制导性能,必须使中制导弹道能够随着遭遇点的变化而不断修正,导致中制导弹道的末端约束条件不断发生变化。

考虑到弹道优化通常较为耗时,难以直接进行在线优化求解,为充分利用离线计算的优化弹道,本文采用基于网格划分所形成的弹道数据库和BP神经网络相结合的方法设计中制导弹道在线生成方法。该方法的基本思想:首先,以拦截弹的中制导调整能力为基础,对目标空域采用网格划分方法形成弹道终端约束网格点,并以这些网格点为基础设计离线弹道,构建针对各个网格点的优化弹道数据;其次,利用优化弹道数据构成训练样本,对BP神经网络进行训练,得到能够覆盖目标运动空域的BP神经网络模型,进而利用该模型在线生成弹道。拦截弹发射后,按照一定的周期修正预测遭遇点,构成中制导弹道末端约束条件,根据装订的BP神经网络模型实时形成优化弹道指令。基本流程如图1所示。

图1 网络工作流程

图1中,利用神经网络对网格划分所生成弹道数据库进行逼近,实现该区域弹道的在线生成,在线生成弹道的质量将主要取决于网格划分所产生弹道数据库与神经网络训练的泛化能力。

2.2 网格划分与网络训练

对预测区域进行网格划分,首先必须建立预测区域参数空间,本文根据中制导终端约束的维度构建参数空间。假定约束维度为d维,对每个维度按照一定的方法进行网格划分,可以得到d维变量的递增集合:

P可表示为如下所有各个维度划分的组合,即

以网格空间P中的每一个元素为约束,离线求解式(6)中的优化问题,即可得到针对该网格空间所确定区域的一系列优化弹道数据,每一条弹道数据对应于一个网格划分约束点。

利用这些网格及其对应的弹道构成弹道数据空间。本文利用神经网络对数据空间的逼近特性,通过训练实现对弹道数据库的逼近。结合拦截弹运动模型,以纵向平面为例,选择拦截弹速度、弹道倾角、X坐标与预测交接点X坐标差值、Y坐标与预测交接点Y坐标差值,作为神经网络的输入变量,拦截弹的需用攻角作为输出变量,构成BP神经网络;同时,为保证一定精度,选择一定数量的网络隐层。在训练过程中,按照一定的间隔从优化弹道数据库中选择弹道数据,作为相应输入、输出数据,并按照网络训练算法实现网格训练。网络训练示意图如图2所示,图中,(xeq,yeq)为期望交接班位置,αc为参考攻角指令,α′c为实际攻角指令。

研究表明,网格划分间隔不能过大,同时一个网络负责的区域也应该在一定范围内,否则会因为训练样本过大导致预测精度不高;另一方面,网格划分间隔不能过小,过小将生成过多的网格点,进而使得弹道数据库的数量大增,降低轨迹生成的效率,同时也不利于网络训练。因此,网格划分间隔需要根据拦截弹的中制导段调整能力进行合理选取。一种网格划分示意图如图3所示。

图2 网络训练示意图

图3 网格划分示意图

考虑到本文的重点在于设计一种弹道在线生成方法,具体的BP网络训练已有较多适用算法,这里不再赘述。

3 仿真分析

采用与文献[14]相同优化条件进行仿真,通过仿真实验验证本文设计中制导弹道生成方法的有效性。

3.1 网格划分

假定预测遭遇点区域如图4所示,对该区域进行网格划分,通过弹道优化设计形成优化弹道数据库。

图4 仿真区域示意图

3.2 离线弹道优化

按照示意图4中对该区域的网格划分,可以得到4个边界点P1,P2,P3,P4,以各个点的坐标为终端约束进行弹道优化,可以得到各条弹道控制量,如表1所示,表中,αc,k(k=1,…,5)为针对给定的各遭遇点采用直接法优化得到的最优控制量(攻角)。

3.3 网络训练

以表1中的各个预测遭遇点坐标以及相应的控制量形成各条优化弹道,构成弹道数据库;采用2.2节中的方法构建神经网络,并对其进行训练。为提高训练效果,可先对数据进行归一化处理,训练过程如图5所示,图中,横坐标N为训练次数,纵坐标为无量纲误差lge。由图5知,经过135次训练可以达到0.000 1的误差要求。

表1 训练点和最优控制量

图5 MATLAB下BP神经网络训练过程

3.4 在线生成验证

为验证3.3节中神经网络模型用于轨迹生成的性能,通过两个方面的仿真实验分别对其复现训练弹道的能力与应对终端约束变化的能力进行检验。

①仿真实验一:训练弹道复现能力分析。

为分析神经网络模型复现训练样本弹道的能力,选择训练样本中遭遇点P1为目标,同时假定在中制导过程中该遭遇点不再发生变化,仿真结果如图6所示。

图6 预测命中点不变时的弹道计算结果

从图6中2种方式生成的弹道曲线、速度曲线以及弹道倾角曲线的对比可以看出,神经网络模型在线生成的弹道相比离线优化弹道,具有相似的弹道特性,而且精度较高,这表明神经网络模型对训练弹道具有较好的逼近特性。

②仿真实验二:训练弹道调整能力分析。

当针对高速、高机动目标进行拦截时,预测遭遇点的变化将不容忽视,这就要求拦截弹在拦截过程中具有较强的中制导段弹道调整能力。为验证预测遭遇点发生变化时弹道的调整能力,假定在拦截弹中制导过程中,预测遭遇点由P1变为P3,仿真结果如图7所示。

图7 预测命中点切换时的弹道计算结果

图7中,优化轨迹1是以遭遇点P1为终端约束得到的优化弹道,优化轨迹2是以遭遇点P3为终端约束得到的优化弹道。从图7中2种方式生成的弹道曲线、速度曲线以及弹道倾角曲线的对比可以看出,中制导过程中,神经网络模型生成的弹道首先按照P1遭遇点对应的弹道,当遭遇点发生变化后,弹道逐渐由轨迹1调整为轨迹2,并在到达约束遭遇点P3时与轨迹2保持趋近一致。这表明通过神经网络模型能够实现中制导弹道的在线调整,同时弹道的调整目标与新约束下优化弹道一致逼近,这也验证了本文设计中制导弹道生成方法具有一定的优化特性。

需要注意的是,遭遇点变化带来的攻角突变可能引起拦截器控制失稳,在具体实现时需要采取一定的平滑措施,保证控制量的平滑过渡。

4 结论

为改善拦截弹中制导性能,提高拦截弹弹道品质,本文将网格划分与神经网络相结合,提出了一种中制导弹道生成方法。该方法基于拦截弹调整能力对拦截区域进行网格化划分,以各个网格点为约束,采用数值优化方法生成多条离线弹道,构建弹道数据库;利用BP神经网络对非线性函数的逼近特性,通过网络训练实现BP网络对弹道数据库的覆盖,构建神经网络模型,实现对拦截弹在给定区域优化轨迹的覆盖。仿真研究表明,神经网络模型能够较好地适应中制导终端约束条件的变化,且精度较高,具有较强的借鉴意义。本文方法可为拦截弹中制导弹道的在线调整提供思路与参考。

猜你喜欢

离线弹道制导
基于卷积神经网络的离线笔迹鉴别系统
弹道——打胜仗的奥秘
多飞行器突防打击一体化微分对策制导律设计
THAAD增程型拦截弹预测制导方法
异步电机离线参数辨识方法
高超声速伸缩式变形飞行器再入制导方法
空投航行体入水弹道建模与控制策略研究
新版Windows 10补丁离线安装更简单
机载武器导航与制导关键技术研究
MF-1飞行试验弹道差异分析及弹道重建研究