带有神经网络干扰观测器的视线角约束制导

2024-03-27郭宗易

系统工程与电子技术 2024年4期

何通, 卢青, 周军, 郭宗易

(西北工业大学精确制导与控制研究所, 陕西西安 710072)

0 引言

制导武器打击目标时,对于部分目标,需要特殊的终端攻击角度进行打击,才能实现最佳打击效果,常见的终端角有弹道角(弹道倾角、弹道偏角)、相对速度矢量夹角和视线角(视线倾角、视线偏角)[1-4]。自Kim等[5]在1973年首次提出终端角度约束的概念后,关于终端角度约束的很多方法逐渐被提出,常见的有基于传统比例导引(proportional navigation, PN)的改进方法、基于现代控制理论的最优控制方法和基于几何计算的方法。Kim等[6]通过在传统的PNG方法中附加一个时变偏置项,实现了将导弹以期望的撞击角击中目标。Zhou等[7]提出一种考虑系统舵机二阶响应的制导律,利用反步法求解了最终的制导过载。Park等[8]利用现代控制理论思想,采用具有状态变量不等式约束的最优控制理论设计引导律,使具有距离加权函数的控制能量性能指标最小化,实现角度约束。文献[9]利用几何法设计的制导律,实现了终端角度约束,但是该方法针对的是导弹和目标速度恒定的情况。文献[10]设计的制导律也存在假设目标静止的情况。文献[11-14]利用强化学习的方法实现终端角度约束制导,但使用的方法较为复杂,不利于工程实现。Harl等[15]利用可变参数的多项式设计角度滑模制导律,但是需要选择合适的多项式参数。Wang等[16]利用模型预测控制(model predictive control, MPC)的方法实现角度约束,但基于的是线性化假设。

上述方法能够很好地完成角度约束制导律的设计,但是当目标机动性较强、作战场景复杂多变时,上述方法的制导效果并不理想。这种情况下,滑模制导律依托其固有的强鲁棒性特点逐渐成为研究的热点。目前,很多学者利用滑模控制理论设计了终端角度约束的制导律[17],针对终端滑模面存在的奇异性的问题,Song等[18]设计了切换滑模面,解决了奇异性问题。文献[19]设计了一种快速非奇异终端滑模面,不仅避免了奇异问题,而且提高了制导系统的收敛速率,实现了终端角度约束的目的。这些滑模制导方法能够有效提升制导精度和鲁棒性,但是这些方法对过载受到约束的情况考虑较少,而实际作战过程中过载的约束会对最终的制导精度产生很大影响,因此有必要设计一种新的制导律,在过载有限的情况下实现较高的制导精度。

在制导方法实际实施过程中,目标机动会对制导模型造成干扰,使得设计的制导律不能达到期望的效果,甚至导致制导失效。为进一步提升制导系统性能,需要对目标机动产生的干扰进行快速、准确的观测并消除。1987年,日本学者Ohnishi首次提出控制领域干扰观测器(disturbance observer, DOB)的概念[20],其核心思想是将控制系统的实际输出与理想模型的输出间的差异作为等效干扰,并将其补偿到控制系统的输入中,从而消除干扰。在此之后,滑模控制理论凭借其鲁棒性强的特点逐步被应用于干扰观测器的设计过程中[21]。众多学者在消除抖振和提升收敛速度方面做出很多努力并取得了大量成果。宋俊红等[22]设计了一种二阶滑模干扰观测器,在收敛速度方面获得了很大提高,但是存在稳态误差大的情况。Lin等[23]设计了一种非线性滑模趋近律,用于快速收敛和减少抖振。Zhang等[24]设计了一种自适应趋近律,并证明了其在减少达到时间和抑制震颤方面优于指数趋近律。与传统的一阶滑模观测器(sliding mode observer, SMO)相比,高阶SMO[25]在减少抖振方面的性能更好。文献[26]提出一种高阶快速终端滑模。Utkin等[27]提出的积分滑模设计概念从一开始就保证了滑模不变性,在保持鲁棒性和精度的情况下实现了抖振减轻。随着计算机技术的发展,智能算法被应用于干扰观测器的设计过程中,其中径向基函数(radial basis function, RBF)神经网络方法凭借其结构简单、可以精确地快速逼近任意非线性函数的优势逐渐成为研究热点。Huo等[28]面向刚体航天器姿态控制问题提出一种基于神经网络干扰观测器的自适应控制方法,但稳定精度仍有待提高。岳晓奎等[29]在航天器姿态控制中利用RBF神经网络对外界干扰进行估计并引入控制系统进行补偿,取得了较好的效果。本文基于RBF神经网络方法设计一种干扰观测器,与传统的干扰观测器相比,无需关于扰动的相关假设条件与扰动的先验信息,即可实现高精度的在线估计,用于观测目标运动的加速度信息,相比传统的滑模干扰观测器有更快的收敛速度和更小的稳态误差。

本文结构如下:第1节对导弹和目标的运动和相对运动进行建模,并引出目标机动干扰的概念;第2节针对目标机动干扰采用RBF神经网络设计了一种干扰观测器;第3节分析常规的滑模趋近律问题,分别设计了纵向和侧向两个通道终端视线角约束制导律,并给出了收敛性证明;第4节对设计的干扰观测器和滑模制导律进行了仿真校验。

1 问题描述

本文主要研究空空导弹中末段具有终端角度约束的制导律设计,其中目标机动过载未知,为提高制导性能,需要估计目标机动加速度。为简化研究过程,针对三自由度模型开展研究,建立导弹和目标弹道系下质心运动和相对运动模型,给出由目标机动产生的干扰问题。

1.1 质心运动动力学方程

假设空空导弹和来袭飞机目标服从相同的动力学模型,建立导弹和目标的质心运动方程如下:

(1)

1.2 弹目相对运动关系

图1 弹目相对运动关系Fig.1 Relative movement relationship of missile and target

(2)

对式(2)中的第2项、第4项、第6项分别求导[30-32]可得

(3)

在正常情况下,目标加速度未知,如果在制导律设计过程中将目标机动作为干扰忽略将会降低制导性能。为提高制导效果,将含有目标加速度信息的部分当作干扰,在本文进行观测,因此定义视线纵向方向和侧向方向的干扰dε和dβ如下:

(4)

因此,本文设计的目的是采用RBF神经网络干扰观测器对目标加速度信息进行观测。在此基础上,通过改进滑模制导律求解导弹加速度指令amε,amβ,使导弹命中目标并满足视线角约束。

2 RBF神经网络干扰观测器的设计

对目标机动干扰的估计效果体现在快速性和准确性上,同时如果能够减少干扰观测器的计算量,将有利于工程实现。RBF神经网络结构简单,几乎可以精确地快速逼近任意非线性函数,因此利用RBF神经网络做干扰观测器有独特的优势,其能够较快地跟踪干扰信号,并且跟踪误差较小。本节设计的RBF干扰观测器以视线角跟踪误差和视线角速度跟踪误差作为输入量,构造一个包含2个输入、7个隐含层节点的RBF神经网络,在线估计目标的机动状态。

2.1 RBF神经网络的基本原理

RBF神经网络一般由输入层、隐含层、输出层构成,具有良好的泛化能力[33]。输入层经过非线性变换后得到隐含层的输出,隐含层的输出乘以一定的权系数得到输出层。网络通过一定的反馈机制不断地更新隐含层到输出层的权系数,使得网络收敛到理想状态。含有2个输入、包含7个节点的隐含层、包括1个输出的RBF神经网络结构如图2所示。

图2 RBF神经网络结构Fig.2 Structure of RBF neural network

图2中,X=(x1,x2,…,xi)T为网络的输入矩阵,H=(h1,h2,…,hj)T为隐含层各节点的输出值,W*=(w1,w2,…,wj)T为理想权系数矩阵,f为网络的输出。网络可以表示为如下形式:

f=W*TH+ε

(5)

式中:ε为偏置项。

网络隐含层的高斯基函数可表示为

(6)

式中:bj和cj为网络参数。

2.2 RBF神经网络权值更新方法及稳定性证明

对于一个二阶参考系统:

(7)

(8)

定义s3函数为

(9)

由于

(10)

选取Lyapunov函数[33]如下:

(11)

求导可得

(12)

设计控制律如下:

(13)

则

(14)

取φ>εN,设计自适应权值矩阵更新律如下:

(15)

则

(16)

取φ=φ0+εN,φ0>0,则

(17)

根据Lyapunov稳定性理论,系统能够在稳定有限时间内收敛到零附近,即参考系统的状态量收敛到实际系统的状态量,f收敛到系统状态量的二阶导数。

2.3 视线纵向RBF干扰观测器设计

对于视线纵向方向,将视线倾角、视线倾角角速度、视线倾角角加速度构成的系统作为实际视线倾角系统,构造与第2.2节相同的参考系统用于跟踪实际视线倾角系统,第2.2节的参数选取如下:

(18)

(19)

2.4 视线侧向RBF干扰观测器设计

对于视线侧向方向,第2.2节的参数选取如下:

(20)

网络的初值设置与侧向通道相同。同纵向通道,网络收敛后,视线侧向通道目标的加速度干扰观测量可表示为

(21)

3 视线角约束制导律设计

假设导弹自动驾驶仪是理想的无滞后环节,参考文献[7]的思路,分别设计两个通道具有视线角约束的滑模制导律:由于超螺旋(super-twisting, ST)算法[34-37]是一种改进的滑模趋近律,根据ST算法的思想,通过在原滑模趋近律的基础上增加误差的幂次项,能够使滑模面更加快速地收敛到稳定状态。

3.1 制导律设计

结合基本滑模制导律设计思想,设计纵向、侧向滑模面如下:

(22)

式中:qεf,qβf分别是纵向和侧向的终端视线倾角;k1,l1是正实数。

设计纵向和侧向的趋近律如下:

(23)

式中:k2,k3,k4,l2,l3,l4均为正实数;0

(24)

联立式(3)、式(22)～式(24),可以解得导弹纵向和侧向的制导律指令为

(25)

式中:Δamε,Δamβ为导弹过载扰动项,由目标机动引起的干扰项dε、dβ需要用干扰观测器进行估计。

3.2 纵向滑模制导律收敛性证明

对纵向通道滑模制导律的收敛性进行证明。

选取Lyapunov函数为

(26)

求导可得

(27)

由于k2,k3,k4,a,r均为正数,且s1,tanhs1同号,故:

(28)

根据Lyapunov稳定性理论,系统能够稳定,且滑模面在有限时间内收敛到零附近。

同时,联立式(3)、式(24)、式(25)、式(27)可得

(29)

假设在制导过程中导弹和目标的相对距离变化较为缓慢,近似为一个常数,即

(30)

式中:c是正的常数。在时刻t可得

r(t)=r(0)-ct

(31)

联立式(29)、式(31)可得

(32)

当滑模面收敛到零时:

(33)

由于r(tf)≪r(0),因此有

tf=(r(0)-r(tf))/c≈r(0)/c

(34)

联立式(33)、式(34)可得

(35)

状态收敛到滑模面上后,滑模面趋于零,即

(36)

可解得

qε(t1)e-k1vmΓ(t,t1),t1≤t

(37)

因此,在终端时刻,式(37)中

(38)

由式(36)～式(38)可得

(39)

终端时刻,导弹视线倾角能够收敛到所设计的期望视线倾角,同时视线角速度趋于零。

3.3 侧向滑模制导律收敛性证明

选取Lyapunov函数为

(40)

求导可得

(41)

l2,l3,l4,b,r为正数,且s2与tanhs2同号,故

(42)

根据Lyapunov稳定性理论,系统能够稳定,且滑模面在有限时间内收敛到零附近。

联立式(3)、式(24)、式(25)、式(41)可得

(43)

仿照纵向方向的证明方法可得

(44)

终端时刻,导弹视线偏角能够收敛到所设计的期望视线偏角,同时视线角速度趋于零。

本节设计的制导律采用滑模控制的方法,该方法具有一定鲁棒性。在目标机动特性弱时,忽略目标机动影响对制导效果影响不大。当目标机动特性强时,制导效果将会受到影响,目标机动就不可忽略,因此有必要基于第2节的RBF神经网络干扰观测器对目标加速度进行观测,从而掌握目标机动特性,提高制导精度。制导律算法的总体流程如图3所示。

图3 算法流程图Fig.3 Algorithm’s flowchart

4 仿真校验

为了验证本文提出的RBF神经网络干扰观测器和终端视线角约束制导律的有效性,本节对比3种方法,并针对4种不同角度约束场景进行检验,场景1和场景2中目标在弹道系下呈变加速运动,场景3和场景4中目标静止,在两种目标运动场景中都采用相同的终端角度约束,场景详细信息如表1所示。本节主要验证制导效果(拦截时间、终端角度误差)、干扰观测器观测效果(误差跟踪效果)和系统鲁棒性(命中率、平均脱靶量)。

表1 场景信息Table 1 Information of the scenes

方法 1文献[7]采用的角度约束制导律。

方法 2文献[19]采用的角度约束制导律。

方法 3本文设计的角度约束制导律。

其中,Δaty和Δatz为目标的扰动过载。

导弹制导律参数设置如下:k1=1,k2=2,k3=0.000 1,k4=10,l1=1,l2=2,l3=0.000 1,l4=280,a=0.85,b=0.85。

RBF干扰观测器隐含层设定为1层7节点形式,参数选取如下:

纵向通道:[c1,c2,…,c7]=[-6,-4,-2,0,2,4,6], [b1,b2,…,b7]=[3,3,3,3,3,3,3],ρ=1 500,φ=0.01,c=5。

侧向通道:[c1,c2,…,c7]=[-6,-4,-2,0,2,4,6], [b1,b2,…,b7]=[3,3,3,3,3,3,3],ρ=1 500,φ=0.001,c=20。

导弹加速度约束为|amε|≤5g, |amβ|≤5g。

设置仿真步长为0.001 s。

4.1 制导效果校验

对3种方法分别比较不同场景下导弹的拦截时间T、终端时刻视线纵向角度误差(Δqε=qε-qεf)和视线侧向角度误差(Δqβ=qβ-qβf),并假设导弹和目标的扰动过载为0,4种不同场景下的制导性能结果如表2所示。

表2 制导性能Table 2 Guidance performance

通过仿真结果统计可知,在目标扰动过载存在的情况下,由于RBF神经网络干扰观测器的存在,本文设计的方法在不同的场景下均能够将终端角度偏差控制在2°以内。将场景1和场景2对比、场景3和场景4对比可知,在不同的终端角度约束条件下,本文所提方法的终端角度误差均小于其他两种方法。将场景1和场景3对比、场景2和场景4对比可知,本文提出的方法同样能够实现更小的终端角度误差。4种场景下3种方法的仿真曲线如图4～图19所示。

图4 场景1弹目相对运动轨迹Fig.4 Trajectories of missile and target in scene 1

图5 场景1视线倾角Fig.5 Line-of-sight elevation angle in scene 1

图6 场景1视线偏角Fig.6 Line-of-sight azimuth angle in scene 1

图7 场景1导弹过载Fig.7 Overload of missile in scene 1

图8 场景2弹目相对运动轨迹Fig.8 Trajectories of missile and target in scene 2

图9 场景2视线倾角Fig.9 Line-of-sight elevation angle in scene 2

图10 场景2视线偏角Fig.10 Line-of-sight azimuth angle in scene 2

图11 场景2导弹过载Fig.11 Overload of missile in scene 2

图12 场景3弹目相对运动轨迹Fig.12 Trajectories of missile and target in scene 3

图15 场景3导弹过载Fig.15 Overload of missile in scene 3

图16 场景4弹目相对运动轨迹Fig.16 Trajectories of missile and target in scene 4

图17 场景4视线倾角Fig.17 Line-of-sight elevation angle in scene 4

图18 场景4视线偏角Fig.18 Line-of-sight azimuth angle in scene 4

图19 场景4导弹过载Fig.19 Overload of missile in scene 4

通过图4～图19的对比可以看出,4种场景下,在相同的终端角度约束的情况下,本文设计的制导律具备如下优势:① 在实现终端角度约束的过程中视线角变化更加平滑,且末端精度更高;② 导弹的过载能控制在设计的范围内。

4.2 干扰观测器误差跟踪校验

为进一步定量分析RBF干扰观测器的效果,对比文献[22]采用的SMO,定义视线纵向和视线侧向的干扰跟踪误差分别为

(45)

由表3和表4可以看出,视线纵向和侧向两个方向的RBF神经网络对目标过载的跟踪效果在收敛时间和跟踪误差上均优于方法1。

表3 视线侧向过载跟踪效果Table 3 Acceleration tracking effect in azimuth

表4 视线纵向过载跟踪效果Table 4 Tracking effect in elevation

从图20～图23可以看出,RBF干扰观测器的状态量能够很快收敛到实际的视线倾角、视线倾角角速度、视线偏角和视线偏角角速度,且跟踪误差很小。

图20 视线倾角Fig.20 Line-of-sight elevation angle

图21 视线倾角角速率Fig.21 Line-of-sight elevation angle’s angular rate

图22 视线偏角Fig.22 Line-of-sight azimuth angle’s angle

图23 视线偏角角速率Fig.23 Line-of-sight azimuth angle’s angular rate

两个通道的过载曲线如图24和图25所示。通过两图可知,SMO方法的收敛时间在3 s左右,而RBF干扰观测器对于目标过载的估计在1.1 s后基本收敛到目标的真实过载,RBF干扰观测器的收敛速度更快,能够较好地跟踪目标过载情况,且跟踪误差较小。

图24 目标纵向过载Fig.24 Target overload in elevation loop

图25 目标侧向过载Fig.25 Target overload in azimuth loop

4.3 鲁棒性校验

为检验设计的制导律和干扰观测器对系统鲁棒性的影响,采用蒙特卡罗打靶方法对场景1进行校验,设置目标和导弹的扰动过载如下:Δamε=U[-1.5,1.5],Δamβ=U[-1.5,1.5],Δaty=U[-0.75,0.75],Δatz=U[-0.75,0.75]。其中U[a,b]表示[a,b]的均匀分布。

对3种方法各打靶1 000次,结果如表5所示。

表5 蒙特卡罗实验结果Table 5 Monte Carlo experimental result

由表5可知本文设计的视线纵向和视线侧向两个方向的终端角度约束制导律和干扰观测器具有较好的鲁棒性,平均脱靶量、平均纵向角度误差和平均侧向角度误差均小于方法1和方法2。采用方法3进行蒙特卡罗打靶的弹目运动轨迹如图26所示。

图26 蒙特卡罗仿真轨迹Fig.26 Monte Carlo simulation trajectory

5 结论

本文针对具有终端角度约束的机动目标拦截问题,给出了一种带有RBF神经网络干扰观测器的视线角约束制导律设计方法。基于RBF神经网络干扰观测器完成了对目标的高精度跟踪,在此基础上分别开展纵向、侧向角度约束制导律设计。仿真结果表明,该方法能够在目标干扰未知和过载受限的条件下完成针对机动目标的跟踪和拦截任务,拦截过程视线角变化平缓,终端角度偏差小,鲁棒性强。