基于降阶ESO的微小型空地导弹改进LQR滚转控制
2018-03-24钟高伟陈东生王明光
钟高伟,陈东生,王明光
0 引 言
无人机挂载攻击型微小型空地导弹已成现代及未来战场趋势,为了进一步提高打击能力及打击精度,需将配备捷联、框架式导引头的微小型空地导弹滚转角快速稳定控制在零度,否则得到的导引头输出探测目标信息不精确;另外,弹体滚转稳定能减少俯仰、偏航三通道的强耦合,继而提高制导精度.
导弹滚转控制可视为高不确定性、非线性、快时变,强干扰的控制难题,以往工程所采用的常规PID控制器或其改进型开始显得力不从心,尤其是对于弹翼展弦小的气动轴对称微小型空地导弹,其结构特性的原因使得基于二回路PI的滚转控制参数取值小,从而导致系统鲁棒及抗扰性差.
近些年来国内外针对空地导弹滚转控制研究的文献主要分为3类,在实用性及理论性上各有优缺点.1)为滑模变结构结合智能算法思想,如神经网络、遗传算法结合变结构控制等,不仅能抑制变结构中的抖振现象并优化控制器参数,而且还能稳定且快速收敛到平衡点,但是由于其优化迭代过程复杂且需离散计算等缺点限制其工程应用;2)为鲁棒控制,如模型参考自适应、鲁棒最优控制等,能保证模型在高度不确定性下稳定跟踪指令,具有大范围飞行包络等优点,但是其复杂的控制公式使得计算机软件编程实现难度大,且系统可靠性不能得以保证;3)为现代控制论,如最优控制思想、极点配置及状态观测器等,此类方法具有较好的动态特性,且设计过程简单,但是其方法对模型约束严格,面对非线性时变控制对象时难以将其工程化.
因此,为了解决被控对象特性引发的控制难点以及满足工程应用性能指标,本文采用现代控制论中状态估计的思想,将控制对象未建模部分、内外干扰都归结为对象的未知扰动,利用降阶ESO[1]技术对其实时估计并进行前馈补偿,对对象进行线性化处理,在简化的标称模型基础上利用现代控制论状态反馈思想,结合最优控制[2]即LQR方法设计控制器,形成的复合控制来完成滚转通道稳定及指令跟踪.另外,传统的LQR[3]方法依靠人为经验及仿真试凑选择权阵会存在很大的随机性及次优解,而且模型状态空间中B阵参数存在的不确定性摄动,导致Raccati方程[3]求解的反馈K阵在某些飞行包络状态下使得系统响应发散,因此为了使得系统闭环稳定,且动态特性较好,采用了具有指定闭环区间的LQR最优稳定度设计方法,并为了实现无静差跟踪控制,在LQR中引入了积分环节.
1 滚转通道建模
滚转通道弹体姿态动力学方程[4]简化表示为
(1)
式中:Jx、Jy和Jz分别为滚转、偏航和俯仰的转动惯量;ωx、ωy和ωz分别为弹体角速度在弹体坐标系中的分量;(Jy-Jz)(ωy-ωz)为惯性交感耦合;q为动压;Sref为弹体参考面积;Lref为参考长度;mx为滚转力矩系数.
令滚转力矩为Mx=mxqSrefLref,由导弹的气动及结构特征可将其具体表示为
(2)
偏航运动对滚转运动带来的影响可以将其视为内部已知干扰项.综上所述,可将滚转力矩表示成
(3)
其中导弹结构偏差及内部扰动都存在于式(3)中的f中,Ma为马赫数,H为飞行高度,βx为侧滑角.
由小扰动假设及姿态运动学[3],滚转角扰动微分方程可简化表示为
(4)
由于在姿态控制设计过程中偏航、滚转运动分开独立设计,故对于气动轴对称导弹初步设计时,可将俯仰角ϑ视为足够小,并去掉小量乘积tanϑωy,这样处理也能保持好的精确性.因此,结合(1)、(3)和(4)得到滚转通道二阶模型:
(5)
式中,b17为滚转舵效,b11为滚转阻尼.
2 常规PID控制出现的“问题”
(6)
对于气动轴对称的导弹滚转通道控制来说,目前工程上采用的是二回路姿态控制.内回路是角速率反馈的阻尼回路,其反馈系数为kω;外回路采用基于角位置反馈的控制回路,为了使控制回路具有较充裕的裕度及较好的控制品质,控制器采用“比例控制为主,积分控制为辅”的控制策略,即PI控制.
(7)
基于某一特征点令外回路截止频率ωc为4 rad/s,由设计原则式(7)计算阻尼回路反馈系数kω,得到微小型导弹和大型导弹阻尼回路
继而设计前向串联PI控制器参数以此满足阶跃响应的稳定性和快速性要求,得到PI控制参数,如表1 所示.
表1 PI控制参数Tab.1 PI control parameters
根据反馈控制理论,在满足同样的频率及时域指标时,内回路反馈阻尼系数kω越大越能抑制被控对象的不确定性和外部扰动对控制品质的影响.因此,应用二回路姿态控制方法,常规型弹和微小型弹在控制品质上表现不同,面对同样的投弹条件、阵风干扰及气动数据拉偏,常规型导弹能保持较好的动态特性及抗扰能力,而微小型导弹抗扰能力及抑制不确定能力较差,大幅度脱离了控制指令.
由图1可知,在地面仿真下内部强干扰及外界干扰使得滚转角偏离指令响应,动态响应效果差,从而影响制导精度.在实际飞行过程中,由实验得到的气动数据与真实气动数据有差别,弹体受到环境制约的因素更大,再加上量测机构及执行机构带来的延时和噪声会对滚转通道控制带来更加严峻的影响,因而应用常规PID得到的控制品质很难满足工程需求,其鲁棒性差且抗干扰作用有限.针对该问题,自抗扰中的扩张状态观测器即ESO提供了很好的解决思路,利用降阶ESO估计出被控对象的内部扰动及外界扰动即“复合扰动”,然后进行前馈补偿,简化了被控对象模型,利于后续控制器设计.
图1 6DOF仿真微小型导弹指令响应Fig.1 6 DOF simulation of command response
3 降阶ESO设计与分析
由文献[1-2]可知,在某些状态量可测的情况下,线性降阶ESO更为实用,与非线性ESO相比,结构简单,其中的参数与实际工程中的带宽概念相匹配,有利于参数的调试与闭环控制系统带宽的匹配.
3.1 降阶ESO设计
考虑到微小型导弹滚转通道滚转角信息由陀螺输出,其值可测,因而将式(5)改写为
(8)
式中fωx=fMx+b11ωx+Δb17δx,表示作用为系统的复合干扰,包括内外干扰、弹体自身小阻尼项b11ωx及参数不确定范围Δb17δx乘积项.经此处理,可将式(8)中的b17可视为标称值.
由文献[1]可知,滚转通道的降阶ESO设计公式为
(9)
将式(8)~(9)进行拉式变换,化简可得
(10)
由此可见,降阶ESO可视为一阶惯性环节,其时间常数β-1可视为观测器带宽相关值,且能得出β与降阶ESO实际观测带宽具有相关性.
3.2 简化后的标称模型与实际模型对比
(11)
其中Δδxc为控制器输出的理论舵偏量.复合干扰进行前馈补偿后,且忽略执行机构的影响,被控对象转化为一个积分器,如图2所示,图中虚线部分即转化为一个积分器.
对式(9)进行拉氏变换,得到关于估计干扰的传递函数
(12)
图2 降阶ESO补偿干扰控制回路Fig.2 Reduced-order ESO compensation control loop
(13)
由式(13)可知,两者之间在整个频率段,幅值及相位存在一定的差别,且ESO参数β的取值也会给模型带来差异.代入相关的数据,降阶ESO参数β分别为10、20、30时其开环传递函数的幅相特性曲线与简化后线性模型作对比,如图3所示.
图3 开环模型幅相频域特性对比Fig.3 Open loop model amplitude and phase frequency
通过图3可知,简化模型与实际模型在中低频段幅值特性近似相同,但是相位特性存在较大差别,可以看出在观测器及执行机构的作用下在中低频段给系统带来了相位滞后,降低了相位裕度,使得系统稳定性降低.因此,需进一步考虑ESO及执行机构的存在给系统带来的延时,以及系统的实际稳定裕度要小于简化模型等问题.
4 控制器设计及稳定性分析
为了便于分析及设计,结合式(8)将式(5)改写为如下形式:
(14)
(15)
式(15)可视为标称的线性时不变系统,即简化后的线性二阶积分模型,其特性已做出具体分析.采用简化模型后,才能满足最优控制线性二次型LQR方法设计控制器的苛刻条件,其次为闭环系统的可控可观性、稳定性及鲁棒性提供更好的分析手段.
4.1 改进型LQR控制算法
针对标称系统(15)而言,采用线性二次型LQR进行控制,设计出控制舵偏量uc1,使得目标函数J取得最小值.其中矩阵Q和R用来平衡状态量和输入量的权重,对闭环系统的动态性能影响很大.一般Q、R阵取对角阵,目前普遍采用仿真试凑法来选择Q、R阵,这样解算出的K阵实际有人为因素的影响,容易陷入局部次优解.另外,基于单点调试下的控制参数在面对大范围投弹飞行包络容易失效,甚至响应发散.
因此,为了保证闭环稳定性,并且提高其动态性能,所以本文选择一种加权矩阵的最优稳定度设计,在这种策略中,希望所有的闭环极点均位于s负半平面的s=-α线的左侧,其中α>0,这样就定义了一个新的指标函数
(16)
其中Q为n×n半正定对称常数矩阵,R为r×r型正定时对称矩阵.引入一个新的状态变量φ(t),使得φ(t)=eαtx(t),且新的控制量ν(t)=eαtu(t),代入式(15),则原系统的状态方程为
(17)
此时指标函数式(16)变为
(18)
为了进一步提高系统动态性能,实现无静差跟踪控制,在上述LQR中再引入积分环节,其结构如图4所示.
图4 带积分项的LQR控制结构图(标称系统)Fig.4 LQR control loop with integralitem(nominal system)
此时,将式(17)模型进一步扩展为
(19)
指标函数式(18)继续变为
(20)
(21)
(22)
故得到标称状态下简化模型的控制舵偏量及基于降阶ESO的复合干扰补偿量后,闭环系统复合控制输入量为
(23)
4.2 闭环系统稳定性分析
容易判断式(14)中(Ap,Bp,Cp)可控可观测,根据文献[5],若被控系统可控可观测,由分离特性原理可知,闭环系统中状态反馈与降阶ESO观测器可以相互独立分开进行设计.
引理1.∀β>0,且(Ap,Cp)可观,使得闭环系统(14)引入降阶ESO作为观测器后系统BIBO稳定.
证明.
(24)
(25)
由线性系统原理即文献[6],引入如下定理.
定理1.针对于系统在李亚普诺夫意义下的稳定的充分必要条件是 阵的实部为零的特征值对应的若当块为一阶块,其余特征值均具有负实部.
定理2.系统BIBS稳定的充分必要条件是系统全体可控模式收敛,系统BIBO稳定的充分必要条件是系统全体可控可观模式收敛.
通常,时不变系统判断各种意义下的稳定性,一般要求出A的特征值,对其可控、可观性进行研究,再根据定理作判断.因为系统的可控性、可观性与传函阵零、极点的对消或约去模态有联系,因此可以不去判别各特征值的可控可观性,直接计算C(sI-A)-1,(sI-A)-1B,C(sI-A)-1B.由计算结果去判别.首先,考虑新系统式(24)是否可控,即(Apk,Bpc)是否为满秩。由可控性矩阵
可知,可控性矩阵其秩rank(Uk)=3,即当b17≠0时,新系统式(24)可控.
且由
(26)
5 计算与仿真
首先由单个特征点进行整个控制回路初步设计,得到相应的控制参数,进行合理的优化及调试,能满足阶跃响应稳定性及快速性要求,且能够留出足够的稳定裕度及延迟裕度.接着,在给定初始投弹条件下,进行全弹道下仿真,以此来测试设计完成的控制回路是否满足战术指标及控制性能要求.
5.1 基于单特征点的控制回路设计
表2 气动、结构参数Tab.2 Aerodynamic、structured parameters
为了使闭环极点都在负半平面s=-4的左侧,因此取α=4.将数据代入式(19),固定R=2 000,不断调整Q阵,得到一系列控制反馈参数,经过仿真,最后选取一组由较大稳定裕度及较好控制品质的参数.
有仿真结果可知,Q阵中对角线q1、q2数值的增加意味着对指令误差项约束增强,求解所对应的K阵中k1、k2数值也会变大,此时控制带宽增加,稳定裕度有所下降,而q3数值增加意味着对角速度约束增强,放宽角度约束,所解k3数值增加,此时控制带宽下降,稳定裕度有所增加.
综合考虑,遵循Q阵选取影响系统时域及频域指标的定性分析,经过多次调试,确定最终合适的加权阵后,经过式(18)黎卡提方程迭代计算后,得到控制反馈参数
图5 不同Q阵下的单位阶跃响应Fig.5 Step response with different Q matrix
由此进一步计算出状态反馈后被控对象的主导极点为p1,2=-9.689 9±i2.705 0.从时域角度来说,响应快速性和稳定性都得以保证;从频率角度来说,相位裕度71.8°,幅值裕度18.6 dB,稳定裕度满足设计要求.继而计算出闭环回路带宽为1.150 4 Hz.
对于降阶ESO参数β的取值应遵循观测器响应速度比状态反馈系统的响应速度快的原则,且线性ESO中β与观测带宽有直接联系.降阶ESO观测器估计带宽配置在8.301 6较为合适,便可由计算及仿真求得ESO参数β为10.5.
式(8)中内部总和干扰为ds=300sint,并在5~10 s内加入一个近似1°的外部滚转干扰力矩.另外,仿真时给系统加入30ms的延迟,以此测试控制回路抗延时特性,并与常规PID控制方法作对比.仿真结果如图6~8所示.
由图6和8可知,应用二回路PI控制法鲁棒性及抗干扰能力弱,扰动出现后,控制舵偏量小,易脱离响应指令,而基于降阶ESO的LQR控制在出现扰动后能迅速跟踪上响应指令,且能抑制内部出现的不确定性.图7中降阶ESO能快速估计出复合干扰量,收敛快,且误差小.
图7 降阶ESO估计干扰及估计误差Fig.7 Estimated interference and error of reduced-order ESO
图8 控制舵偏量Fig.8 Control rudder deviation
5.2 6DOF全弹道仿真验证
挂载在某无人机上进行投弹,其投弹条件为:投放速度90 m/s,投放高度5 000 m,微小弹距离目标6 000 m时投放.约束条件:存在顺风40 m/s,其所用气动参数均由风洞试验得到,仿真时对各气动及结构参数进行拉偏,得到的控制模型为偏差模型,且在不同风行高度加入侧向常值风干扰.
图9 降阶ESO估计干扰量Fig.9 Reduced-order ESO estimated interference
图10 滚转角响应Fig.10 Roll angle response
图11 控制舵偏量Fig.11 Control rudder deviation
具体数值为:初始姿态角ϑ0=5°,γ0=6°,ψ0=4°;舵效力矩系数拉偏30%;静稳定性拉偏-10%;动导数拉偏30%;常值拉偏-0.005;力系数拉偏10%;质心拉偏-15 mm、5 mm、5 mm;转动惯量分别拉偏-20%、-10%、-10%,并考虑量测器件和执行机构的延迟50 ms.
由上述仿真结果可以看出,在全弹道6DOF下基于降阶ESO的改进型LQR相较于二回路PI有很好的控制效果,其抑制不确定性及抗扰能力较之前都有提升,具有实际的工程价值.
6 结 论
本文针对小展弦比弹翼的轴对称微小型空地导弹滚转姿态控制问题,其结构特性如转动惯量较小等因素带来的常规PID控制应用的局限性,如鲁棒性差、抗干扰能力弱等缺点,设计了一种基于降阶ESO的滚转通道改进线性二次型复合控制方法.仿真结果表明,降阶ESO能很好的估计出系统的复合干扰并将其实时补偿掉,针对简化的标称系统来设计改进线性二次型的最优控制器,使得系统既能稳定且快速的跟踪指令响应,也能具有强鲁棒性及抗干扰能力,克服了常规PID控制的缺陷,且能应对不同飞行包络及多变环境下的不利影响.
[1] 薛文超. 自抗扰控制的理论研究[D]. 北京:中国科学院研究生院,2012.
[2] 王青,陈宇,张颖昕,等. 最优控制理论、方法与应用[M]. 北京:高等教育出版社,2010.
[3] 韩京清. 自抗扰控制技术[M]. 北京:国防工业出版社,2013.
[4] 钱杏芳,林瑞熊,赵亚男. 导弹飞行力学[M]. 北京:北京理工大学出版社,2012.
[5] 胡寿松. 自动控制原理[M]. 北京:科学出版社,2005.
[6] D’AZZOJ J,HOUPIS C H. Linear control system analysis and design[M]. Beijing:Tsinghua University Press,1975.
[7] 武俊峰,张继段. 两轮自平衡机器人的LQR改进控制[J]. 哈尔滨理工大学学报,2012(12):1-5.
WU J F,ZHANG J D. Improved control based on two-wheeled self-balancing robot LQR control[J]. Harbin University of Science and Technology,2012(12):1-5.
[8] 崔平远,郑建华,杨涤. 具有频域指标约束的BTT导弹自动驾驶仪二次型设计[J]. 宇航学报, 1995(2):6-12.
CUI P Y,ZHENG J H,YANG D. The design of linear quadratic of BTT missile autopilot with frequency domain index constraint[J]. Journal of Astronautics, 1995(2):6-12.
[9] 喻铁军,戴冠中. 指定闭环特征值的最优控制系统参数化设计[J]. 控制与决策, 1989(4):18-22.
YU T J,DAI G Z. Parametric design of optimal control system for specified closed-loop eigenvalues[J]. Control and Decision, 1989(4):18-22.
[10] 喻铁军,戴冠中. 指定闭环极点区域的鲁棒控制器设计[J]. 控制与决策, 1991(3):173-177.
YU T J,DAI G Z. The robust controller design of the specified closed-loop poles region[J]. Control and Decision , 1991(3):173-177.
[11] 袁延奇,胡峻岭,张三宝,等. 具有指定闭环极点的最优控制系统鲁棒稳定摄动界[J]. 航空学报,2000(5):414-416.
YUAN Y Q,HU J L,ZHANG S B,et al. Robust stable perturbation bounds of optimal control systems with design closed-loop poles[J]. Journal of Aeronautics, 2000(5):414-416.
[12] KUMAREANN,BALASUBRAMANIAM P. Optimal control for stochastic linear quadratic singular system using neural networks[J]. Journal of Process Control, 2009,19(7):482-488.
[13] TROTTEMANTE J,SCHERER C W,WEISS M,et al. Robust missile feedback control strategies[J]. Journal of Guidance,and Dynamics, 2010,33(6):1837-1846.