带落角约束的均值聚类神经网络滑模制导律研究
2021-03-23张嘉文史金光刘佳佳徐东辉
张嘉文, 史金光, 刘佳佳, 徐东辉
(1.南京理工大学能源与动力工程学院,南京 210094; 2.辽沈工业集团有限公司研发中心设计二所,沈阳 110045)
0 引言
制导炮弹的出现为精确打击高价值战略、战术目标提供了强有力的支持,具有首发命中、效费比高、可对付静止和运动目标等优势,其因弹道可控,攻击模式灵活多变,对现代战争起到重要作用。随着末制导炮弹的发展,为了最大化战斗部的杀伤力,希望炮弹能以最小脱靶量命中目标的同时,还能以特定的落角攻击目标关键位置。因此,带有落角约束的末制导律目前逐渐成为国内外学者的研究热点。
张亚松等[1]设计了一种带落角约束的滑模变结构制导律,将该制导律与优化比例导引法进行对比,结果表明滑模变结构制导律优于比例导引法;辛腾达等[2]在滑模变结构控制的基础上针对滑模的抖振问题,引入了径向基函数神经网络来调节滑模切换增益以削弱抖振;刘成亮等[3]应用模糊控制和神经网络理论对滑模变结构控制中的滑模趋近系数和滑模切换项增益进行了自适应调节;张宽桥等[4]选取相对速度偏角作为滑模面,将变开关系数与饱和函数相结合达到了削弱抖振的效果;王荣刚[5]针对地面运动目标,将固定速度攻击运动目标的问题转化为变速度打击固定目标的问题,进而设计了滑模制导律;陈韵等[6]在落角约束的基础上利用飞行力学原理和最优控制理论研究了一种最优制导律;卢春燕等[7]在RBF神经网络的基础上将最优控制理论和变结构控制理论相结合,设计了最优滑模制导律。
普通的滑模制导律[8]通常是通过改变切换项增益来控制炮弹的运动轨迹,当切换项增益增大时,运动轨迹变弯曲,炮弹以大攻角击中目标,且其落角在较大范围内变动,与期望落角有较大误差。随着最优控制理论的发展,许多学者尝试将RBF神经网络加入到普通滑模制导律中[9],理论与数值仿真结果表明,通过对滑模切换项增益的自适应控制减小了脱靶量,但对于落角精度没有明显的改善。为此,本文提出在RBF神经网络控制中对高斯函数隐藏层的中心点运用均值聚类的方法,依据炮弹的飞行状态对中心点进行自适应调整,使得炮弹能在较小的误差范围内以期望落角命中目标。
1 弹目运动模型的建立与分析
合适的数学模型是进行问题研究的关键,因此需先建立适当的弹目运动模型。本文将地面静止目标以及做匀加速运动的目标作为研究对象,为简化制导炮弹与目标之间的相对运动关系,做如下假设:
1) 将炮弹和目标认为是同一平面内的两个运动的质点;
2) 炮弹所施加的加速度矢量仅为法向加速度,短时间内认为炮弹速度近似大小不变;
3) 不考虑自动驾驶仪和导引头的响应时间滞后。
基于此假设,在俯仰平面内以炮弹与目标的连线在水平面的投影为x轴建立惯性坐标系,弹目运动关系如图1所示。根据弹目基本几何关系可得到如下方程组。
(1)
式中:r为弹目的相对距离;q为弹目的视线角,当q满足q=qf(qf为期望落角)时,即满足期望弹目视线角时的q为落角;dq/dt为视线角速率;VM为炮弹运动速度;VT为目标运动速度;aM为加速度;θM和θT分别为炮弹弹道倾角和目标航向角。
图1 炮弹-目标的二维运动关系
假设目标做匀加速运动,制导炮弹的运动速度为VM,加速度为aM,且满足VM⊥aM。由于目标始终沿着水平方向运动,根据Razumikhin理论在制导炮弹的末制导阶段,前置角(q-θM)接近于零,所以式(1)弹目几何关系式可表示为
(2)
对式(2)进行相应变换可得炮弹与目标视线角速率的相对运动方程为
(3)
2 带落角约束的滑模制导律设计
对于滑模制导律的设计可分为两步[10]:首先是设计能使滑模运动稳定的滑模超平面;其次是设计能使系统实现滑模运动的滑模控制律。假设系统将切换面S=0上的点当作目标域,若系统状态偏离了切换面,则会在滑模控制律的作用下回到切换面上。为了满足以期望落角实现打击地面目标的要求,根据经典末制导问题可知[11],炮弹在理想状态下命中目标时,其视线角速率为零,又因为加入了最终落角的约束[12-14],所以末端还需要满足|q-qf|=0的条件。因此滑模面的设计以这两个条件作为目标量,设计滑模切换函数为
(4)
式中:K1>0;K2>0。切换函数的第一项使弹目视线角趋近于零,保证炮弹可以命中目标,第二项使炮弹能满足期望落角的约束。
为保证滑模切换函数在有限时间内到达滑模面[15],本文采用自适应趋近律为
(5)
式中:K3>0为趋近系数;ε>0为切换项增益;sgnS为符号函数。从式(5)可以看出,该趋近律与弹目距离有关,在炮弹末制导的初始阶段,因为与目标距离较远,趋近速率较慢,产生的制导指令较为适度,随着弹目距离不断趋近于零,自适应趋近律可以使S收敛到零,避免发散。
对式(4)进行求导得
(6)
(7)
(8)
由式(8)可知系统是稳定的。
尽管滑模控制对控制系统的参数摄动和外部抗干扰具有一定的稳定性[16],但固有的抖振问题将降低系统控制精度,破坏系统性能。因此为提高控制精度,目前较为常用的措施是采用饱和函数、滤波方法、神经网络方法等代替切换函数。因神经网络控制具有非线性、自适应性、自组织和自主学习能力等特点,本文利用神经网络控制的自主学习能力来对切换项增益进行实时控制,使炮弹能以期望落角实现弹目交汇。
3 基于均值聚类的RBF神经网络制导律
3.1 RBF神经网络滑模控制
(9)
式中:Bi是第i个隐藏层的基宽;ci是第i个隐藏层的中心点。
输出层对隐藏层的输出进行线性加权,作为整个神经网络的输出结果。本文中神经网络的输出关系是关于切换项增益的函数,即
ε=WTh(x)
(10)
式中:W是RBF神经网络权值;h(x)为高斯函数。
神经网络权值的学习算法为
(11)
(12)
由式(7)可得
(13)
由式(10)可得
(14)
因此,式(11)可表示为
(15)
由此可得RBF神经网络在滑模控制中的权值实时调整算法为
w(t)=w(t-1)+Δw(t)+δ(w(t)-w(t-1))
(16)
式中:η是网络学习速率,η∈(0,1);δ是动量因子,δ∈(0,1)。
3.2 均值聚类RBF神经网络滑模控制
均值聚类算法是一种基于误差平方和准则的聚类算法,首先在样本数据中选取k个对象作为聚类中心的初始值,之后,每个点都按照“就近原则”被分配到相应的聚类中心,同在一个聚类中心的点集被指定为一个分组,即形成了k个分组,不断重复分配和更新步骤,直到分组不发生任何变化后,具有共同特性的样本数据就形成了特定的组群。这些被分配的点均与炮弹弹目视线角的变化率、弹目距离等参数有紧密的关系,均值聚类算法能够根据炮弹的飞行状态的参数对中心点实现动态分组。从原理上讲,该算法可靠、计算简单、收敛速度较快,能很好地处理较大的数据样本。
4) 迭代结束后重新计算各类新的聚类中心点,即
(17)
式中:N为当前聚类域中的输入值。
4 数值仿真与结果分析
4.1 静目标仿真
设炮弹的初始位置为(0 m,5000 m),炮弹初始速度VM=350 m/s,弹道倾角为-30°,目标初始位置为(5000 m,0 m),目标初始速度VT=0 m/s;期望弹道落角qf=-75°,取K1=K2=K3=1;神经网络学习速率η=0.6,动量因子δ=0.05;取初始聚类中心点c=(-10,-10,-8,-8,-6,-6,-4,-4,-2,-2,0,0,2,2,4,4,6,6,8,8,10,10),k=500。仿真结果如图2、图3及表1所示。
表1 3种控制方法下炮弹的脱靶量(静目标)
图2 3种控制方法下的最终落角(静目标)
图3 2种神经网络控制方法下的切换项增益(静目标)
从表1可以看出,RBF神经网络控制和加入均值聚类的RBF神经网络控制下的脱靶量差距不大,可忽略这2种控制方法对于脱靶量的影响。由图2可以看出:滑模控制炮弹的最终落角在-60.82°~-68.26°内变动,不能以期望落角命中目标,且从表1可以看出滑模控制的脱靶量最大;RBF神经网络滑模控制和均值聚类RBF神经网络控制都是根据输入的炮弹飞行状态,通过对切换项增益的调节,求得一个稳定的且最接近落角要求的切换项增益;在RBF神经网络的调节下,炮弹的最终落角稳定在-78°,未能以期望落角命中目标;由于这2种控制方法的中心点不变,故切换项增益对炮弹落角的调整能力有限,因此对炮弹落角的控制力较差。由图3可得,弹目即将交汇时,RBF神经网络控制下的切换项增益变化较剧烈,产生抖振较大;而加入均值聚类方法之后,由于中心点的自适应性更好地调控炮弹的落角,减小了弹上过载和抖振问题,对炮弹的控制更加稳定,其最终落角为-75.25°,满足了落角要求。
4.2 动目标仿真
设炮弹的初始位置为(0 m,5000 m),炮弹初始速度VM=350 m/s,弹道倾角-30°;目标初始位置为(5000 m,0 m),目标做匀加速运动,aT=6 m/s2,期望弹道落角qf=-75°,取K1=K2=K3=1;神经网络学习速率η=0.6,动量因子δ=0.05;取初始聚类中心点为c=(-10,-10,-8,-8,-6,-6,-4,-4,-2,-2,0,0,2,2,4,4,6,6,8,8,10,10),k=500。仿真结果如图4、图5及表2所示。
图4 3种控制方法下的最终落角(动目标)
图5 2种神经网络控制方法下的切换项增益(动目标)
表2 3种控制方法下炮弹的脱靶量(动目标)
表2表明这3种控制方法下炮弹的脱靶量仅差0.1 m左右,故可忽略控制方法对脱靶量的影响。由图4可以看出:滑模制导律下炮弹的最终落角在-71.25°~-78.18°之间变动,并且随着切换项增益的变化而变化,不能稳定地以期望落角命中目标,对炮弹的落角控制效率较低;而对于RBF神经网络滑模控制和均值聚类RBF神经网络滑模控制,这2种方法都具备自主寻找最优切换项增益的能力(如图4所示),但由于均值聚类的加入,使得神经网络在学习过程中根据炮弹的实时飞行状态不断调整聚类中心,因而这种控制方法更具自适应性,对炮弹的控制更精准,在接近目标过程中(如图5所示),切换项增益变化较前两种方法更平稳,有效减小了抖振,且炮弹能以期望落角命中目标,误差在0.5°左右,较RBF神经网络滑模控制而言,命中精度提高了3°。
5 结束语
本文提出了一种基于均值聚类的RBF神经网络滑模制导律。在惯性坐标系中建立线性化导引运动方程,简化了问题的求解,加入了期望落角约束条件,得到了末制导炮弹带落角约束的滑模制导律。在此基础上,将均值聚类与BRF神经网络控制方法相结合,在末制导炮弹飞行过程中,通过有限次数的迭代使聚类中心点不断更新,实现对滑模切换项增益的实时调整,提高了末制导效率。数值仿真结果表明,所提出的均值聚类RBF神经网络滑模制导律对于静态目标和动态目标均能以更小的误差达到期望落角要求,有着较高的制导精度。