带有神经网络干扰观测器的视线角约束制导
2024-03-27郭宗易
何 通, 卢 青, 周 军, 郭宗易
(西北工业大学精确制导与控制研究所, 陕西 西安 710072)
0 引 言
制导武器打击目标时,对于部分目标,需要特殊的终端攻击角度进行打击,才能实现最佳打击效果,常见的终端角有弹道角(弹道倾角、弹道偏角)、相对速度矢量夹角和视线角(视线倾角、视线偏角)[1-4]。自Kim等[5]在1973年首次提出终端角度约束的概念后,关于终端角度约束的很多方法逐渐被提出,常见的有基于传统比例导引(proportional navigation, PN)的改进方法、基于现代控制理论的最优控制方法和基于几何计算的方法。Kim等[6]通过在传统的PNG方法中附加一个时变偏置项,实现了将导弹以期望的撞击角击中目标。Zhou等[7]提出一种考虑系统舵机二阶响应的制导律,利用反步法求解了最终的制导过载。Park等[8]利用现代控制理论思想,采用具有状态变量不等式约束的最优控制理论设计引导律,使具有距离加权函数的控制能量性能指标最小化,实现角度约束。文献[9]利用几何法设计的制导律,实现了终端角度约束,但是该方法针对的是导弹和目标速度恒定的情况。文献[10]设计的制导律也存在假设目标静止的情况。文献[11-14]利用强化学习的方法实现终端角度约束制导,但使用的方法较为复杂,不利于工程实现。Harl等[15]利用可变参数的多项式设计角度滑模制导律,但是需要选择合适的多项式参数。Wang等[16]利用模型预测控制(model predictive control, MPC)的方法实现角度约束,但基于的是线性化假设。
上述方法能够很好地完成角度约束制导律的设计,但是当目标机动性较强、作战场景复杂多变时,上述方法的制导效果并不理想。这种情况下,滑模制导律依托其固有的强鲁棒性特点逐渐成为研究的热点。目前,很多学者利用滑模控制理论设计了终端角度约束的制导律[17],针对终端滑模面存在的奇异性的问题,Song等[18]设计了切换滑模面,解决了奇异性问题。文献[19]设计了一种快速非奇异终端滑模面,不仅避免了奇异问题,而且提高了制导系统的收敛速率,实现了终端角度约束的目的。这些滑模制导方法能够有效提升制导精度和鲁棒性,但是这些方法对过载受到约束的情况考虑较少,而实际作战过程中过载的约束会对最终的制导精度产生很大影响,因此有必要设计一种新的制导律,在过载有限的情况下实现较高的制导精度。
在制导方法实际实施过程中,目标机动会对制导模型造成干扰,使得设计的制导律不能达到期望的效果,甚至导致制导失效。为进一步提升制导系统性能,需要对目标机动产生的干扰进行快速、准确的观测并消除。1987年,日本学者Ohnishi首次提出控制领域干扰观测器(disturbance observer, DOB)的概念[20],其核心思想是将控制系统的实际输出与理想模型的输出间的差异作为等效干扰,并将其补偿到控制系统的输入中,从而消除干扰。在此之后,滑模控制理论凭借其鲁棒性强的特点逐步被应用于干扰观测器的设计过程中[21]。众多学者在消除抖振和提升收敛速度方面做出很多努力并取得了大量成果。宋俊红等[22]设计了一种二阶滑模干扰观测器,在收敛速度方面获得了很大提高,但是存在稳态误差大的情况。Lin等[23]设计了一种非线性滑模趋近律,用于快速收敛和减少抖振。Zhang等[24]设计了一种自适应趋近律,并证明了其在减少达到时间和抑制震颤方面优于指数趋近律。与传统的一阶滑模观测器(sliding mode observer, SMO)相比,高阶SMO[25]在减少抖振方面的性能更好。文献[26]提出一种高阶快速终端滑模。Utkin等[27]提出的积分滑模设计概念从一开始就保证了滑模不变性,在保持鲁棒性和精度的情况下实现了抖振减轻。随着计算机技术的发展,智能算法被应用于干扰观测器的设计过程中,其中径向基函数(radial basis function, RBF)神经网络方法凭借其结构简单、可以精确地快速逼近任意非线性函数的优势逐渐成为研究热点。Huo等[28]面向刚体航天器姿态控制问题提出一种基于神经网络干扰观测器的自适应控制方法,但稳定精度仍有待提高。岳晓奎等[29]在航天器姿态控制中利用RBF神经网络对外界干扰进行估计并引入控制系统进行补偿,取得了较好的效果。本文基于RBF神经网络方法设计一种干扰观测器,与传统的干扰观测器相比,无需关于扰动的相关假设条件与扰动的先验信息,即可实现高精度的在线估计,用于观测目标运动的加速度信息,相比传统的滑模干扰观测器有更快的收敛速度和更小的稳态误差。
本文结构如下:第1节对导弹和目标的运动和相对运动进行建模,并引出目标机动干扰的概念;第2节针对目标机动干扰采用RBF神经网络设计了一种干扰观测器;第3节分析常规的滑模趋近律问题,分别设计了纵向和侧向两个通道终端视线角约束制导律,并给出了收敛性证明;第4节对设计的干扰观测器和滑模制导律进行了仿真校验。
1 问题描述
本文主要研究空空导弹中末段具有终端角度约束的制导律设计,其中目标机动过载未知,为提高制导性能,需要估计目标机动加速度。为简化研究过程,针对三自由度模型开展研究,建立导弹和目标弹道系下质心运动和相对运动模型,给出由目标机动产生的干扰问题。
1.1 质心运动动力学方程
假设空空导弹和来袭飞机目标服从相同的动力学模型,建立导弹和目标的质心运动方程如下:
(1)
1.2 弹目相对运动关系
图1 弹目相对运动关系Fig.1 Relative movement relationship of missile and target
(2)
对式(2)中的第2项、第4项、第6项分别求导[30-32]可得
(3)
在正常情况下,目标加速度未知,如果在制导律设计过程中将目标机动作为干扰忽略将会降低制导性能。为提高制导效果,将含有目标加速度信息的部分当作干扰,在本文进行观测,因此定义视线纵向方向和侧向方向的干扰dε和dβ如下:
(4)
因此,本文设计的目的是采用RBF神经网络干扰观测器对目标加速度信息进行观测。在此基础上,通过改进滑模制导律求解导弹加速度指令amε,amβ,使导弹命中目标并满足视线角约束。
2 RBF神经网络干扰观测器的设计
对目标机动干扰的估计效果体现在快速性和准确性上,同时如果能够减少干扰观测器的计算量,将有利于工程实现。RBF神经网络结构简单,几乎可以精确地快速逼近任意非线性函数,因此利用RBF神经网络做干扰观测器有独特的优势,其能够较快地跟踪干扰信号,并且跟踪误差较小。本节设计的RBF干扰观测器以视线角跟踪误差和视线角速度跟踪误差作为输入量,构造一个包含2个输入、7个隐含层节点的RBF神经网络,在线估计目标的机动状态。
2.1 RBF神经网络的基本原理
RBF神经网络一般由输入层、隐含层、输出层构成,具有良好的泛化能力[33]。输入层经过非线性变换后得到隐含层的输出,隐含层的输出乘以一定的权系数得到输出层。网络通过一定的反馈机制不断地更新隐含层到输出层的权系数,使得网络收敛到理想状态。含有2个输入、包含7个节点的隐含层、包括1个输出的RBF神经网络结构如图2所示。
图2 RBF神经网络结构Fig.2 Structure of RBF neural network
图2中,X=(x1,x2,…,xi)T为网络的输入矩阵,H=(h1,h2,…,hj)T为隐含层各节点的输出值,W*=(w1,w2,…,wj)T为理想权系数矩阵,f为网络的输出。网络可以表示为如下形式:
f=W*TH+ε
(5)
式中:ε为偏置项。
网络隐含层的高斯基函数可表示为
(6)
式中:bj和cj为网络参数。
2.2 RBF神经网络权值更新方法及稳定性证明
对于一个二阶参考系统:
(7)
(8)
定义s3函数为
(9)
由于
(10)
选取Lyapunov函数[33]如下:
(11)
求导可得
(12)
设计控制律如下:
(13)
则
(14)
取φ>εN,设计自适应权值矩阵更新律如下:
(15)
则
(16)
取φ=φ0+εN,φ0>0,则
(17)
根据Lyapunov稳定性理论,系统能够在稳定有限时间内收敛到零附近,即参考系统的状态量收敛到实际系统的状态量,f收敛到系统状态量的二阶导数。
2.3 视线纵向RBF干扰观测器设计
对于视线纵向方向,将视线倾角、视线倾角角速度、视线倾角角加速度构成的系统作为实际视线倾角系统,构造与第2.2节相同的参考系统用于跟踪实际视线倾角系统,第2.2节的参数选取如下:
(18)
(19)
2.4 视线侧向RBF干扰观测器设计
对于视线侧向方向,第2.2节的参数选取如下:
(20)
网络的初值设置与侧向通道相同。同纵向通道,网络收敛后,视线侧向通道目标的加速度干扰观测量可表示为
(21)
3 视线角约束制导律设计
假设导弹自动驾驶仪是理想的无滞后环节,参考文献[7]的思路,分别设计两个通道具有视线角约束的滑模制导律:由于超螺旋(super-twisting, ST)算法[34-37]是一种改进的滑模趋近律,根据ST算法的思想,通过在原滑模趋近律的基础上增加误差的幂次项,能够使滑模面更加快速地收敛到稳定状态。
3.1 制导律设计
结合基本滑模制导律设计思想,设计纵向、侧向滑模面如下:
(22)
式中:qεf,qβf分别是纵向和侧向的终端视线倾角;k1,l1是正实数。
设计纵向和侧向的趋近律如下:
(23)