可重复使用飞行器的保性能姿态跟踪控制方法

2021-11-30罗世彬吴瑕魏才盛

航空学报 2021年11期

罗世彬,吴瑕,魏才盛

1.中南大学自动化学院,长沙 410083

2.中南大学航空航天学院,长沙 410083

可重复使用飞行器(Reusable Launch Vehicle, RLV)作为一类新型天地往返飞行器,在军事以及民用领域受到了广泛的关注,是近年来的研究热点,具有广阔的应用前景[1]。与传统飞行器相比,RLV承担着更为复杂的飞行任务,其再入飞行是一个大范围机动、快速域、强不确定性、强耦合的复杂运动过程,承受着如过载、动压、热流等多种约束,且飞行环境复杂,易受到多种外部扰动的影响,因此,RLV的控制系统设计具有极大的挑战性。

作为一类具有强非线性、快时变、强耦合、强不确定性的被控对象,RLV用于控制器设计的模型与其真实动力学模型之间存在着很多的不确定项,因此,对不确定项的估计是控制系统设计所必须面临的问题。神经网络和模糊控制技术由于对非线性函数具有很好的逼近能力,是估计模型不确定性常用的两种方法。文献[2]提出了一种鲁棒自适应非线性容错控制算法实现了对带执行器故障的RLV姿态的精确跟踪,其中引入模糊逻辑系统来实现对参数不确定性的估计；文献[3]提出一种神经自适应最优非线性控制方法实现对飞行器的跟踪控制,其中引入神经网络来逼近参数和不匹配的不确定性以及未建模动态。文献[4-6]同样通过神经网络/模糊控制技术实现了对飞行器不确定性的在线估计。然而,两种近似技术设计思想复杂,计算量大,且仅在一些紧集上有效,它们的引入增加了控制器设计的复杂性,提高了控制参数选择的难度,且神经网络/模糊控制技术仅能对不确定性进行在线逼近。

高增益观测器是非线性反馈控制设计中一种常用的方法,它可以在不依赖系统数学模型的情况下,通过系统的输出来实现对模型内部未知状态的精确估计。高增益观测器结构简单,鲁棒性强,已经成为不确定非线性系统进行输出反馈控制器设计的重要工具[7]。然而,当观测器增益足够高时,会产生峰化现象,造成闭环系统的不稳定,且作为一类状态观测器,高增益观测器仅能对系统的状态进行估计,在系统状态未知且存在模型不确定性时,需要分别设计神经网络/模糊控制技术以及高增益观测器同时估计系统不确定性和未建模状态,增加了控制器设计的复杂性。

在实际应用中,考虑到设备成本和传感器损坏的风险,设计输出反馈控制方法是很必要的。已有的研究工作表明,将高增益观测器与状态反馈控制器相结合,是设计输出反馈控制方法的一种常用思路,而对于高增益观测器所引起的峰化现象,可以利用饱和函数保证控制器的全局有界性,使得在峰化现象出现时控制器始终保持有界,避免了峰化现象引起的系统不稳定[8]。基于反步控制技术进行输出反馈控制器的设计是目前常用的设计思想[9-10]。作为经典的非线性控制方法之一,反步法已经被广泛应用于飞行器的控制器设计中。文献[11]提出了一种鲁棒自适应反步控制算法,实现了对RLV再入飞行过程飞行姿态的精确跟踪。文献[12]采用一种终端滑模反步控制策略,实现了对含参数不确定性和扰动的飞行器速度和高度的平稳控制。然而,传统的反步控制方法要求对虚拟控制律重复求导,随着系统阶数增加,会导致“微分爆炸”的问题,控制的复杂性也迅速增加,文献[13]利用动态面控制方法很好地解决了这个问题,它利用一阶低通滤波器对虚拟控制律进行滤波,避免了反步控制中复杂的微分运算。但是动态面控制方法没有实现对滤波误差的补偿,只能通过取尽可能小的滤波参数,来减小滤波误差,这对高精度再入飞行器控制提出了极大挑战。因此,寻找一种新型的反步控制算法,在无需对虚拟控制信号求导的情况下,就可以完成控制器设计,避免“微分爆炸”的问题,具有重要的意义。

从已有工作来看,在设计RLV跟踪控制器时,大多数非线性控制算法侧重于闭环系统的稳态性能,保证系统的跟踪误差衰减至稳态区域,而并没有同时关注系统的瞬态性能,如超调量和收敛速度等。预设性能控制算法的提出为上述问题的求解贡献了新的角度[14]。这里的预设性能是指在确保跟踪误差衰减至一个提前设置的任意小的包络内的时候,收敛速度和超调量可以同时达到预先规定的要求。预设性能控制算法兼顾了系统的瞬态和稳态性能,以改善系统性能为直接的控制目标[15-17]。常规的预设性能控制算法是指数形式的,只能保证闭环系统的渐进收敛, 显然, 如果能够设计一种预设性能控制算法使得系统的跟踪误差在指定时间内衰减至预设的包络内, 即实现有限时间镇定,是十分有意义的。

针对RLV再入段姿态回路数学模型,基于反步控制的框架,提出了一种保性能输出反馈控制算法,使得在存在气动参数摄动、外部扰动以及执行器饱和的情况下,实现对期望姿态指令的精确跟踪。其中,借助于扩张状态观测器的思想,引入了一种高增益扩张状态观测器实现对系统状态和未知不确定性的估计,取代了神经网络/模糊控制技术,降低了算法的计算复杂度；同时,为了避免“微分爆炸”的问题,控制器设计不在需要虚拟控制律的导数；此外,采用了一种有限时间预设性能函数,保证了姿态跟踪误差系统的有限时间收敛和跟踪精度。最后,仿真验证了所设计控制算法的性能。

1 RLV动力学模型

以文献[18]中的RLV再入飞行过程的数学模型为研究对象,不失一般性,假设RLV为无动力飞行,即在再入过程中,发动机关闭。

1.1 RLV再入过程数学模型

RLV 再入飞行动态过程的数学模型可由三自由度的质心平动模型和三自由度的绕质心转动模型完整的描述。其中,质心平动模型是描述RLV位置信息的数学模型,绕质心转动模型是描述RLV姿态信息的数学模型。本文主要研究的是RLV姿态跟踪控制系统,因此只针对绕质心转动模型进行分析。绕质心转动模型由绕质心转动运动学模型和绕质心转动动力学模型组成:

(1)

(2)

1.2 模型转换

(3)

式中：δa、δe、δr分别为RLV的副翼、升降舵和方向舵的偏转角。fp、fq、fr、Gu的表达式为

(4)

式中：Mx、My、Mz的表达式为

(5)

对式(2)求导可得

(6)

将式(3)代入式(6)可得

L(φ,θ)Gu[δa,δe,δr]T

(7)

式中：

(8)

式(7)表明绕质心转动动力学模型被转化成一个二阶非线性模型的形式,通过设计控制律获得δa、δe、δr的值就能实现对RLV姿态的跟踪控制。

为了便于设计姿态控制器,将式(7)中的姿态模型简化为二阶非线性系统的形式[18]：

(9)

式中：x=[φ,θ,ψ]T是系统的状态矢量；y∈3为系统输出；u=[δa,δe,δr]T为系统的控制输入；G(x)=[gij(x)]∈3×3,f(x)=[fi(x)]∈3(i,j=1,2,3)为函数矩阵,表达式为

(10)

由于RLV飞行环境复杂,存在大量的外部干扰,式(10)所示的动态模型无法准确描述模型的实际信息,为了尽可能描述飞行过程,一种更准确的数学模型可以表述为

(11)

式中：d∈3为外部扰动。除外部扰动外,为了更接近实际的再入过程,需要考虑可能出现的气动导数摄动因此与气动导数有关的量都是不确定的,需要进行在线估计,以便控制器设计。

2 基于反步控制的输出反馈控制算法设计

首先介绍相关预备知识,之后根据式(11)所得的控制模型,进行控制算法的设计,实现对RLV的姿态跟踪。

2.1 预备知识

为了便于对算法的理解以及后续分析,首先对算法中涉及的相关理论进行简单介绍。

2.1.1 初值问题

引入初值问题(Initial Value Problem-IVP)来辅助后续的稳定性分析：

(12)

式中：φ:+×Ωζ→n,Ωζ⊂n是非空开集。

定义1[8]如果式(12)在ζ(t)的右边没有其他解,则称ζ(t)为IVP的最大解。

引理1[8]如果φ(t,ζ)满足：① 对于所有t≥0,φ(t,ζ)关于ζ满足局部Lipschitz条件；② 对于每个固定的ζ∈Ωζ,φ(t,ζ)在t上分段连续且局部可积,则式(12)在时间区间[0,tf)上存在一个最大解ζ(t)使对于∀t∈[0,tf),ζ(t)∈Ωζ,tf>0。

2.1.2 预设性能函数

定义一个广义误差变量e(t),则根据定义2可知,若想实现预设性能控制,e(t)需要严格限制在ρ(t)包围的衰减区域内,即

-ρ(t)

(13)

通常,预设性能函数会选择满足定义1的指数形式的函数：

ρ(t)=(ρ0-ρ∞)exp(-lt)+ρ∞

(14)

(15)

式中：p0=((ρ0-ρ∞)1-ε)/((1-ε)T1)；ρ0、ρ∞∈+;ε∈(0.5,1)⊆为预先设计的正常数；T1>0是预先设置的收敛时间；显然,式(15)所提出的预设性能函数满足：

2)ρ(0)=ρ0>2ρ(t≥T1)=2ρ∞>0。

引理2[20]预设性能函数式(15)能够在规定时间T1内获得预期的跟踪精度。

注1从不等式(13)可以知道,当0≤|e(0)|<ρ0时,e(t)的性质将和预设性能函数ρ(t)息息相关。也就是说,ρ(t)的衰减速率决定了e(t)收敛速率的下界,ρ(t)决定了系统瞬态行为超调量的最大可允许值,ρ∞决定了e(t)在稳态时的上界。

2.2 控制算法设计

由于气动导数存在摄动问题,因此与气动导数有关的项都可以看作为系统的不确定项,若将气动参数摄动纳入式(11)所示的飞行器的姿态模型中,则式(11)可改写为

(16)

式中：

(17)

为了便于控制器设计,将式(16)改写为

(18)

针对式(18)所示的扩张后的姿态模型,可以设计高增益扩张状态观测器,如式(19)所示,来实现对系统未知状态、不确定性和扰动的估计。

(19)

式中：zi=[zi1,zi2,zi3]T∈3(i=1,2,3)是观测器的输出,表示状态xi的估计；eE1=x1-z1； 0<μ<1为增益参数；ai>0(i=1,2,3)是适当选取的参数,它的设计需满足式(20)所示的多项式：

(20)

式中：s表示多项式算子；ωo表示观测器的带宽。

根据观测器的估计值,基于反步控制的框架,针对RLV再入过程,一种保性能输出反馈姿态跟踪控制算法(Output feedback attitude tracking control with guaranteed performance-OFATC)设计过程为

步骤1受文献[21]启发,首先为第1个子系统即输出通道x1进行虚拟控制律设计。选择输出通道的预设性能函数ρ1(t)满足如下条件： ①ρ1(0)>|x1(0)-yd(0)|； ② 综合考虑稳态跟踪精度和收敛速度等预先设定性能要求,则可设计虚拟控制律：

(21)

式中：e=x1-yd=[e1,e2,e3]T表示跟踪误差；I=[1, 1, 1]T；k1=diag(k11,k12,k13)为虚拟控制律α1的增益；yd=[yd1,yd2,yd3]T=[φd,θd,ψd]T为参考输入,且假设yd有界。

注2为了实现有限时间跟踪控制,ρ1(t)选择式(15)所示的有限时间预设性能函数形式。

步骤2对第2个子系统x2进行虚拟控制律的设计。选择第二个性能函数ρ2(t)满足如下条件ρ2(0)>|z2(0)-α1(0)|,则第2个虚拟控制律可设计为

(22)

式中：k2=diag(k21,k22,k23)为待设计的虚拟控制律α2的增益。

步骤3为了保证所提出控制算法的抗干扰性能,最终的控制律设计为

(23)

考虑到RLV的执行机构具有动作幅值限制,即控制舵面不能提供无限大的偏转角,存在执行器饱和,实际的保性能输出反馈跟踪控制算法的控制律设计为

(24)

式中：um>0为控制输入的饱和边界。

注3式(15)所示的预设性能函数能够对跟踪误差施加有限时间预设性能约束,这意味着对于闭环系统来说,在不需要任何其他有限时间设计的情况下,就能够实现有限时间控制,超调量和稳态误差也能满足提前设定的性能要求。

注4由于第2个子系统无需实现有限时间跟踪性能,则第2个性能函数ρ2(t)选择指数形式,如式(14)所示。

注5算法设计过程可以看出,本文所设计的算法没有设计任何辅助系统对执行器饱和进行处理,而是利用饱和现象来避免高增益观测器设计引起的“峰化现象”,而饱和控制输入产生的非线性误差,可以归结到总扰动中,利用高增益扩张状态观测器进行估计,利用控制律进行补偿。

图1给出了所设计的保性能输出反馈跟踪控制算法的结构框图,其中,高增益扩张状态观测器用来估计系统的不确定性和外部扰动,并将估计值用于控制算法的设计中,用来实现对RLV的跟踪控制；引入了两种类型的预设性能函数来改善算法的瞬态和稳态特性；并利用饱和函数使控制输入始终保持有界。

图1 RLV姿态回路的控制框图

3 算法稳定性分析

进行算法稳定性分析,证明各状态变量的有界性以及跟踪误差的收敛性。

证明为便于稳定性分析,定义新的误差矢量Ξi∈3(i=1,2)：

(25)

对式(25)求导可得

(26)

式中：βi=ai/μi(i=1,2)。假设αik、Ξik、Ψik(i=1,2;k=1,2,3)分别表示αi、Ξi、Ψi中的第k个元素,Υi∈3(i=1,2)为新定义的矢量,其第k个元素Υik的表达式为且ρ1(0)>|x1(0)-yd(0)|,ρ2(0)>|z2(0)-α1(0)|,则|Ξik(0)|<1。即若定义一个非空开集则根据式(26)可得

(27)

∀t∈[0,tf),Ξik(t)∈(-1, 1)

i=1,2;k=1,2,3

(28)

在时间区间[0,tf)上定义一个新的矢量

Φi=ln(Ι+Ξi)-ln(Ι-Ξi)

(29)

则式(21)和式(22)中α1、α2表达式可写为

αi=-kiΦi

(30)

步骤 1定义如下Lyapunov函数：

(31)

则对式(31)求导可得

(32)

若假设x2k、ydk、z2k、k1k为矢量x2、yd、z2、k1的第k个元素,定义eEj=xj-zj为观测器估计误差,eEj,k为eEj的第k个元素(j,k=1,2,3),则根据式(19)、式(25)和式(26)可知：

(33)

(34)

∀t∈[0,tf)

(35)

根据式(29),可以得到∀t∈[0,tf)：

(36)

步骤 2定义如下Lyapunov函数：

(37)

则对式(37)求导可得

(38)

(39)

式中：Gk∈3为矩阵的第k(k=1,2,3)个元素；根据式(24)可知,u为饱和函数,因此需要分情况讨论。

(40)

(41)

则同样存在一个常数m2k,1>0使得

(42)

∀t∈[0,tf)

(43)

根据式(29),整理可得∀t∈[0,tf)：

(44)

2) 考虑到RLV的执行机构有动作幅值限制,存在执行器饱和,即实际的控制律为u=sat(uc),代入式(26)第2个子式有：

(45)

(46)

根据前面分析可知,在区间∀t∈[0,tf)上,sat(uc)-uc是有界的,则存在一个常数m2k,2>0使得：

(47)

(48)

同样地可以得到在区间∀t∈[0,tf)上：

(49)

根据式(36)、式(44)和式(49)可以得到,∀t∈[0,tf),Ξ(t)∈Ω′ζ⊂Ωζ,式中：

(50)

由式(50)可知,Ω′ζ是非空紧集。因此,假设tf<∞且Ω′ζ⊂Ωζ,根据推论1可知,存在一个时间常数t′∈[0,tf),使得Ξ(t′)∉Ω′ζ,这显然是不成立的,因此tf=∞,也就是说,对于任意时间t≥0,系统的所有信号始终保持有界,且根据式(36) 可知

(51)

式中：x1k为矢量x1的第k个元素。式(51)表示输出跟踪误差满足提前设置的性能函数要求,即跟踪误差在预设性能函数所设定的包络内演化。

4 仿真分析

为了验证所设计的算法的有效性,本节利用RLV再入过程的姿态模型,进行仿真分析,并将仿真结果和自抗扰控制(Active Disturbance Rejection Control-ADRC)算法进行对比,从而验证算法的性能。

4.1 不考虑参数不确定性和外部扰动

图2给出了RLV的姿态输出曲线及其估计值,图3给出了控制信号的响应曲线,图4给出了RLV姿态角的跟踪误差曲线。从图2和图4可以看出,当不存在参数不确定性和外部扰动时,两种算法都可以快速跟踪上指令信号。与ADRC控制算法相比,所设计的保性能输出反馈控制算法跟踪速度更快,且跟踪误差始终在预先设计的包络线内,稳态精度更好,这充分反映了所设计的算法具有良好的瞬态和稳态性能；由图3可以看出,两种算法的控制输入都能满足预先设定的饱和函数要求,与ADRC算法相比,RLV 在所提出算法的控制下能获得更加平滑的控制力矩。

图3 RLV执行器响应曲线

图4 RLV姿态跟踪误差曲线

4.2 同时考虑参数不确定项和外部扰动

图5 RLV姿态输出曲线

图5和图8是存在不确定性和扰动时RLV的姿态输出曲线,图6和图9是RLV控制输入曲线,图7和图10是RLV跟踪误差的输出曲线。从图5、图7、图8和图10中可以看出,即使存在气动导数摄动和外部扰动,在两种算法控制下,系统的输出依然能够跟踪其参考输入,相较于ADRC控制算法,RLV在所提出的姿态控制算法下响应速度更快,其跟踪误差在稳态时的精度更高,可以达到10-4度；图6和图9表明,即使存在不确定性和外部扰动,两种算法执行器的响应曲线仍未超过规定的饱和边界,仍满足执行器的饱和条件,与ADRC算法相比,所提出的算法执行器的响应曲线更为平滑。