基于数据驱动的攻击时间和攻击角度控制导引律
2022-10-10常思江
黄 嘉,常思江
(南京理工大学能源与动力工程学院,江苏 南京 210094)
0 引 言
制导武器在发展的同时,反导防御系统也在不断发展,单枚导弹突破反导防御系统的概率变得越来越小。为提高打击效率,采用多枚导弹实施饱和打击,是突破反导防御系统有效打击目标的可靠方法。对于带攻击时间控制导引律[1-5]的导弹,其能在期望的时间打击目标,而带有攻击角度控制导引律[6-10]的导弹,能够以期望的攻击角度打击目标。同时,带有攻击时间和攻击角度控制导引律[11-22],导弹能够有效地对特定目标进行饱和攻击,这将大大提高导弹在战场的打击效能。因此,研究攻击时间和攻击角度控制导引律具有重要的现实意义。
针对同时满足攻击时间和攻击角度控制的导引律设计问题,目前已有一些经典的方法和理论,如最优理论[11-13]、基于比例导 引的 方法[14-16]以及 滑模 控制 理论[17-19]等。文献[11]提出一种既能控制攻击时间又能控制攻击角度的导引律,该控制导引律由一个反馈回路和一个附加的控制指令组成。文献[12]在最优控制框架下,设计出一种新的攻击时间和攻击角度导引律。文献[13]研究了跟踪误差模式下的最优收敛模式,给出实现跟踪误差最优收敛模式的最优误差动力学,据此设计出攻击时间和攻击角度控制导引律。文献[14-15]基于比例导引法,提出了偏置比例导引律,通过设计附加项,实现攻击时间和攻击角度的控制。文献[16]基于几何修正的比例导引法,推导出一种攻击角度导引律,在此基础上,利用约束一致算法设计了导弹协同推力控制律,实现了对攻击角度和攻击时间的控制。文献[17]将实际视线角与理想视线角之差作为状态变量,基于非奇异终端滑模理论设计滑模面,设计出不存在控制奇点的攻击时间和攻击角度控制导引律。文献[18]基于非线性动力学理论,在无小角度近似的条件下,设计出一种在滑模面上达到期望攻击时间和角度的导引律。文献[19]通过切换基于滑模控制的攻击时间和攻击角度导引律来实现攻击时间和攻击角度控制。此外,文献[20]设计了一种虚拟目标方法,采用非奇异滑模攻击角度导引律与比例导引律的切换逻辑,同时实现期望的攻击时间和攻击角度。文献[21]基于视线角整形方法,通过构造视线角多项式,设计出针对运动目标的攻击时间和攻击角度控制导引律。文献[22]在轨迹成型的基础上,提出一种新的虚拟目标轨迹跟踪控制几何方法,在圆弧段采用前馈加反馈的复合控制方案,在直线段采用带角度控制的比例导引方案,从而实现攻击时间和攻击角度控制。
除上述方法,目前,一种以数据驱动为核心的研究方法在航空航天领域逐渐兴起并受到重视。数据驱动对于解决复杂物理模型有其独特优点,通过对模型输入和输出数据的分析,寻找模型变量之间的关系来代替复杂关系解析式,简化了对模型目标解的分析和求解。此外,在处理多目标优化问题时,通过采集数据构建代理模型,预选出对真实问题比较好的解,可减少对真实问题的评估次数,降低优化问题评估的代价。由于对数据处理与计算分析的工作是在线下进行的,且现代计算机的计算能力很强,数据驱动的方法在飞行器轨迹优化、制导等领域逐步得到广泛研究。文献[23]针对空中交通管制问题,基于数据驱动的方法提出了一种无冲突规划方法,调和了需求与约束之间的平衡及无冲突规划的要求。文献[24]针对无人机路径规划问题,提出了一种基于动态数据驱动的飞行能力评估路径规划方法。文献[25]在行星际低推力任务中,创建了必要的数据来训练人工神经网络以求解最优制导律。文献[26]通过训练深度人工神经网络解决了航天器精确着陆时的最优控制问题。目前,在导弹领域,应用数据驱动方法开展导引律设计的研究相对较少。在制导精度方面,文献[27]为在制导精度、能量消耗和拦截时间之间进行权衡,提出了一种启发式奖励函数,即深度确定性策略梯度,直接从数据中学习制导指令。文献[28]利用优化理论进行迭代解算制导变量,以此为基础离线生成样本数据,并选择合适的多结构模态神经网络,进行基于调度管理的神经网络训练,完成神经网络控制器的设计,能够快速实时解算实现高精度制导。数据驱动方法也被用来改善制导系统的稳定性,如文献[29]提出了一种滑模攻击角度控制导引律,在此基础上,通过数据训练小波神经网络自适应更新附加控制指令,降低高频滑模控制的抖振,提高了系统的鲁棒性。此外,针对约束条件下的控制导引问题,文献[30]利用数据训练深度神经网络,学习飞行状态与距离之间的映射关系,在此基础上提出了一种智能、多约束的预测-校正制导算法。文献[31]基于比例导引和数据驱动的方法提出了一种攻击时间控制导引律,实现了对导弹的攻击时间控制。
针对攻击时间和攻击角度控制导引律设计问题,同时考虑时间和角度约束,对于模型方程的建立与求解都较为困难,若单独考虑一个约束条件,建立简单物理模型以计算数据样本,再利用数据样本反馈处理时间和角度约束,将使得问题大为简化。本文旨在提出一种以数据驱动为核心的攻击时间和攻击角度控制导引律。本文的设计思路是将导引律分为两个阶段:第一阶段为攻击时间控制;第二个阶段为攻击角度控制。首先,设计第二阶段的攻击角度控制导引律,考虑攻击角度约束,利用该导引律计算所需的数据样本。其次,在满足攻击角度的要求下,基于数据驱动方法设计第一阶段的攻击时间控制导引律。上述方法的核心步骤在于:①建立符合攻击角度约束的飞行状态样本与剩余飞行时间数据库;②训练反向传播(back propagation,BP)神经网络得到剩余飞行时间映射网络;③利用此网络求解攻击时间误差,反馈攻击时间误差以设计攻击时间导引律;④通过剩余飞行时间映射网络实现第一阶段向第二阶段的转换,从而同时满足攻击时间控制和攻击角度控制的要求。
本文的结构安排如下:第1节给出了平面弹目运动学方程;第2节介绍了离线驱动数据库的建立以及导引律的设计;第3节通过算例仿真验证了本文所设计导引律的性能;第4节给出了本文的研究结论。
1 问题描述
考虑平面弹目拦截运动模型,如图1所示。
其中,θ角为弹目视线角;γ为导弹弹道角;ϕ为导弹速度矢量前置角(后文简称前置角);R为导弹与目标之间的距离;V m为导弹的速度;am为导弹的加速度。
弹目运动学方程如下:
为使导弹在满足脱靶量的同时满足攻击时间和攻击角度要求,导弹在击中目标时,满足以下约束方程:
式中:t f为导弹击中目标时的时间;t d表示导弹击中目标时的期望攻击时间;θf表示导弹击中目标时的期望攻击角度。
2 导引律设计
2.1 设计思路
对于单纯的攻击角度控制导引律而言,若给定一个期望的攻击角度和一个期望的攻击时间,在满足攻击角度控制时,必然存在一个攻击时间误差。为使导弹在击中目标时同时实现攻击时间和攻击角度控制,作如下分析:给定一个期望攻击角度θf,一个期望攻击时间t d;以单纯的攻击角度导引指令控制导引,可以满足攻击角度要求,但不满足攻击时间要求,导弹在飞行过程中的任意飞行状态下,都存在一个对应的剩余飞行时间。在该导引律下,影响剩余飞行时间的飞行状态量为(R,γ,θ),故在任意飞行状态(R,γ,θ)下,都存在对应的剩余飞行时间,相应地存在攻击时间误差et;若攻击时间误差et能够在期望攻击时间内收敛到零,就能满足攻击时间要求。
同时,考虑攻击时间和攻击角度约束设计导引律,使得分析和求解过程都变得困难。为此,本文基于数据驱动方法设计两阶段导引律。图2展示了基于数据驱动的攻击时间和攻击角度控制导引律的设计思路。首先,只考虑攻击角度约束,设计攻击角度控制导引律。其次,选取一定量的飞行状态样本,利用攻击角度控制导引律离线计算剩余飞行时间数据库,并利用飞行状态样本和剩余飞行时间数据库训练神经网络模型,以得到飞行状态变量和剩余飞行时间之间的映射关系,建立剩余飞行时间映射网络。对于任意飞行状态,基于剩余飞行时间映射网络可计算出攻击时间误差et,将攻击时间误差et反馈设计攻击时间导引律,获得导引指令。在攻击时间导引律的作用下,攻击时间误差et在攻击时间控制阶段收敛到零,当满足攻击时间误差收敛到零时,攻击时间控制阶段转为攻击角度控制阶段。
图2 基于数据驱动的控制导引律设计图Fig.2 Design diagram of control guidance law based on data-driven
需要注意的是:在攻击时间控制阶段的任意飞行状态下,对应的攻击时间误差以攻击角度导引律满足期望的攻击时间为目标。此时,剩余飞行时间对应攻击角度导引律在该飞行状态下的剩余飞行时间,将其作为攻击时间控制阶段下的虚拟剩余飞行时间,其关系式表示如下:
式中:t为导弹当前所处时刻;(R,γ,θ,θf)表 示攻击角度导引指令在任意飞行状态下对应的剩余飞行时间;表示攻击时间控制阶段的虚拟剩余飞行时间。
2.2 驱动数据的生成与映射网络的建立
数据是数据驱动方法的核心,本文所用的数据包括飞行状态数据和剩余飞行时间数据,根据第2.1节设计思路,驱动数据通过对攻击角度控制导引律仿真得到。由于文献[6]提出的攻击角度导引律具有良好的性能,本文选择其作为第二阶段攻击角度控制导引律,如下:
对于平面问题,设定期望攻击角度为θf,采用攻击角度控制导引律来控制导引,已知当前飞行状态(R,γ,θ,θf),则剩余飞行时间与当前飞行状态量(R,γ,θ,θf)存在某种函数映射关系,可表示为
该函数映射关系实际求解起来比较复杂,因此对于一组当前飞行状态,可以通过仿真计算出导弹在当前飞行状态下的剩余飞行时间;为了寻求飞行状态与剩余飞行时间之间的映射关系,需要获得一定量的数据样本,本文采用如下方式:
(1)给定一个所需的攻击角度θf,分别在R,γ,θ的范围内取一定量的样本点,将这3个变量的样本点组合成飞行状态样本空间Y(R,γ,θ,θf),由该样本空间仿真计算得到对应的剩余飞行时间数据库
2.3 导引律的具体形式
在攻击时间控制阶段,基于剩余飞行时间映射网络计算出此时的虚拟剩余飞行时间,由此可以得到此时的攻击时间误差et,通过反馈攻击时间误差设计出攻击时间导引律。
对于第一阶段攻击时间控制,考虑到比例导引法具有良好的性能,本文攻击时间控制导引律基于比例导引法设计,其中比例导引法的导引指令aPNG可表示为
式中:N为制导增益,一般取N>2。
结合式(1)~式(4),可以得到前置角的变化率:
由式(13)可知,在速度恒定的情况下,影响前置角变化的量是制导增益N,对于平面问题,导弹飞行时间是前置角的函数。因此,可以通过改变制导增益的大小来控制前置角的变化,继而实现对导弹飞行时间的控制。此外,为使加速度的变化更加连续平滑,将第一阶段攻击时间控制导引指令设计成如下形式:
式中:k为满足k>1的正实数。
当攻击时间误差趋于零时,意味着在此飞行状态下,以攻击角度导引律来控制导引,导弹在满足攻击时间的要求下可实现攻击角度控制。在实际导引时,通过切换攻击时间导引律和攻击角度导引律来实现攻击时间和攻击角度控制,具体形式如下:
式中:ε是一个比较小的正数,可取ε=0.01。
3 仿真及结果分析
为验证本文所提攻击时间和攻击角度控制导引律的有效性,采用数值仿真的方式,并将结果与文献[6]和文献[18]的结果进行对比。
本文仿真条件设置为:目标处于静止状态,导弹速度恒为250 m/s,导弹坐标为(0,0)m,目标坐标为(10-000,0)m。
3.1 剩余飞行时间映射网络的建立
首先,建立剩余飞行时间映射网络,对应不同的攻击角度要求,建立相应的剩余飞行时间映射网络,四维飞行状态取值范围如下:R∈[0,10-000]m,γ∈[-90°,90°],θ∈[-90°,90°],θf∈[-90°,-65°,-60°,-30°,0°,30°,60°];对应于一个攻击角度,在飞行状态(R,γ,θ)范围内取样本点,组合成飞行状态样本空间,这里对R取20个样本点,对γ,θ分别取31个样本点,由此可得到组合样本点19-220个。利用攻击角度导引指令,在不同的期望攻击角度条件下进行仿真,由此构建出剩余飞行时间数据库,利用该数据库和飞行状态样本空间训练BP神经网络,其中70%作为训练集,15%作为测试集,15%作为验证集,共得到7个剩余飞行时间映射网络,如下
3.2 给定攻击角度下不同攻击时间的仿真
对本文导引律在给定期望攻击角度θf=-30°,期望攻击时间分别为45 s、50 s、55 s、60 s 4种情况下进行仿真,并对文献[6]在期望攻击角度θf=-30°时进行仿真,初始前置角为30°,并将式(15)参数设为N=4,k=1.7。仿真结果如图3所示,导弹击中目标时的攻击时间误差和攻击角度误差情况如表1所示。
表1 不同攻击时间的攻击时间误差和攻击角度误差(θf=-30°)Table 1 Impact time error and impact angle error for dif ferent impact time(θf=-30°)
图3 不同攻击时间仿真结果(θf=-30°)Fig.3 Simulation results of different impact time(θf=-30°)
图3是仿真条件为θf=-30°、不同攻击时间的结果图。图3(a)是导弹的轨迹图,可以看出导弹以不同轨迹击中目标;图3(b)显示出本文导引律对应的弹目距离在期望的攻击时间收敛到零,文献[6]对应的弹目距离收敛时间为41.93 s;由图3(c)可以看出,本文导引律在实现攻击时间控制的同时,也能较好地实现攻击角度控制,而文献[6]导引律只能实现攻击角度控制;由图3(d)可以看出,在4种攻击时间要求下,导弹的剩余时间误差在25 s内都能收敛到零,实现攻击时间控制;由图3(e)可知,本文导引律在4种约束条件下的加速度都处于比较小的范围内,且变化连续平滑,文献[6]对应的加速度在-6 m/s左右变化。
表1给出了导弹击中目标时攻击时间误差和攻击角度误差的大小。表1结果表明,在各约束条件下,导弹都能实现攻击角度控制;此外,相比较于文献[6],本文所提导引律不仅能实现攻击角度控制,也能较好地实现攻击时间控制,且具有较宽的控制时间范围。
3.3 不同攻击时间、不同攻击角度的仿真
考虑下列5种仿真条件:攻击时间t d=45 s,对应攻击角度θf分别为0°,30°,60°,式(15)参数设置为N=5,k=2.5;攻击时间t d=55 s,对应攻击角度θf分别为-60°,-90°,相应的参数设置为N=4,k=1.2,初始前置角为30°。仿真结果如图4所示,导弹击中目标时的攻击时间误差和攻击角度误差情况如表2所示。
表2 不同攻击时间不同攻击角度的攻击时间误差和攻击角度误差Table 2 Impact time error and impact angle error for dif ferent impact time and different impact angles
图4 不同攻击时间不同攻击角度仿真结果Fig.4 Simulation results of different impact time and different impact angles
图4是不同攻击时间、不同攻击角度下的仿真结果图。由图4(a)可知,在给定的攻击角度和攻击时间下,导弹都能有效击中目标;图4(b)展示了弹目距离在期望的攻击时间收敛到零;图4(c)表示在期望的攻击时间,视线角收敛到期望的攻击角度;图4(d)表示剩余时间误差在期望的攻击时间内收敛到零;图4(e)是各个条件下的加速度仿真结果图,如图所示,加速度的变化整体处于比较小的范围内,且整体变化较为平滑,只有仿真条件为t d=45 s的加速度在攻击时间误差收敛到零时刻发生小幅跃变,这是由攻击时间导引律转换为攻击角度导引律的结果。
表2是在不同攻击时间和不同攻击角度条件下,导弹击中目标时的攻击时间误差和攻击角度误差。结果表明,应用本文所提导引律,导弹可较好地实现攻击时间和攻击角度控制。
3.4 对比仿真
为进一步说明本文所设计导引律对现有文献的贡献与补充,本文采用与文献[18]相同的条件,开展对比仿真。
根据文献[18],设置初始前置角为60°,取攻击约束θf=-30°,t d=55 s和θf=-65°,t d=55 s两种情况。式(15)参数设置为N=4,k=1.5。仿真结果如图5所示,导弹击中目标时的性能指标如表3所示,表中导引过程的总控制能量J计算如下:
表3 本文导引律和文献[18]导引律的性能指标对比Table 3 Comparison of performance indexes between the proposed guidance law and the guidance law in[18]
图5 与文献[18]对比仿真结果Fig.5 Simulation results compared with[18]
图5是本文和文献[18]导引律的对比仿真结果图,图5(a)显示在两种导引律作用下,导弹都能沿各自轨迹击中目标;图5(b)是视线角曲线图,可以看出两种导引律都能满足攻击角度和攻击时间要求;由图5(c)所示的前置角曲线可知,相较于文献[18],本文导引律对应的前置角变化更为平缓,原因是本文导引律对应加速度一直处于较小范围内连续变化;如图5(d)加速度曲线所示,文献[18]加速度在前10 s变化比较剧烈且出现振荡,这对工程应用是不利的,而本文加速度变化较为平缓,且连续无振荡。
表3给出了两种导引律的性能指标,由表3可知,本文加速度极值的绝对值小于文献[18],在攻击约束θf=-30°,t d=55 s时,本文最大过载较文献[18]减少42.91%。在消耗的总控制能量方面,文献[18]导引律在导引过程中消耗的总控制能量较多,在攻击约束θf=-30°,t d=55 s时,本文消耗的总控制能量比文献[18]少45.77%;在攻击约束θf=-65°,t d=55 s时,本文消耗的总控制能量比文献[18]少4.32%。这在一定程度上也体现出本文导引律的优势。
4 结 论
本文采用数据驱动的方法,设计了一种新的两阶段攻击时间和攻击角度控制导引律。通过利用飞行状态数据和剩余飞行时间数据训练神经网络,求得剩余飞行时间映射网络,并据此计算攻击时间误差,从而设计两阶段导引律并控制导引律之间的转换,实现对攻击时间和攻击角度的控制。通过仿真分析表明,相较于现有文献,本文提出的导引律在导引过程中的过载更小,且消耗的控制能量更少。本文结果为攻击时间和攻击角度控制导引律的研究提供了一种新的思路,是对现有文献研究的较好补充。