火箭垂直返回双幂次固定时间收敛滑模控制方法

2020-06-23崔乃刚韦常柱徐大富

哈尔滨工业大学学报 2020年4期

崔乃刚，吴荣，韦常柱，徐大富

(1.哈尔滨工业大学航天学院，哈尔滨 150001； 2.上海宇航系统工程研究所，上海 201109)

垂直起降(vertical takeoff vertical landing，VTVL)可重复使用运载器(reusable launch vehicle，RLV)相较于其他起降方案具有仅需对传统火箭进行小幅改动，着陆场地需求弱、技术跨度小、研发成本相对较低等优点[1-2].随着SpaceX等多次成功实现垂直起降可重复使用火箭(VTVL-RLV)的子级垂直回收并复用，VTVL-RLV逐渐显现其在商业航天发射市场的竞争力[2].

典型的VTVL-RLV在火箭一二级分离后，一子级经过6个飞行段后垂直软着陆于预定着陆场(如图1所示)，返回飞行空域广、速域大，发动机多次开关机、不同飞行段执行机构切换工作，结构、气动、风干扰等不确定性和内外扰动强[2].在返回飞行时其姿态控制呈现出强非线性和高动态的特点.

图1 典型垂直起降火箭飞行剖面

对于复杂干扰和大不确定性下的非线性控制问题，滑模控制(sliding mode control，SMC)由于具有对匹配扰动和不确定性的不变性而被广泛应用[3].但由于实际应用中系统惯性和采样频率有限等原因，滑模控制中的不连续控制项将会引起系统的抖振(chattering).对于滑模抖振问题，一种可行的解决途径为自适应滑模控制方法[4-9]，即通过增益的自适应调整以匹配扰动变化，但自适应滑模方法的收敛速度将受限于增益的自适应调整过程.另一种可行的解决途径为基于观测器的控制方法(disturbance-observer-based control，DOBC)，即利用扰动观测器估计扰动进而补偿其影响[10]，其关键过程为对扰动观测器的合理设计.Zhang等[11]针对RLV返回的姿态控制问题，设计了基于四元数的自抗扰控制器(ADRC)，通过扩张状态观测器(ESO)来实现扰动观测.Hall等[12-13]基于有限时间收敛滑模观测器估计扰动进而补偿.Su等[14]设计了RLV非奇异终端滑模(non-singular terminal sliding mode control，NTSMC)姿态控制器，模型不确定性和外部扰动采用有限时间收敛扰动观测器进行估计.针对VTVL-RLV，钱默抒等[15]设计了自适应滑模观测器用于估计扰动和不确定性，进而设计了基于观测器的滑模动态面控制方法.在观测器的设计中需要权衡收敛速度、精度和鲁棒性，上述有限时间收敛观测器能够在有限时间内收敛，但其收敛时间取决于初始偏差并随着初始偏差范数趋近于无穷而趋于无穷[16]，而观测器的调节过程过长将对控制系统性能造成不利影响.为降低观测器的调节过程对系统的影响，可以采用收敛时间有常值上界且与初始偏差无关的固定时间收敛观测器[17-18].

考虑到VTVL-RLV返回飞行姿态跟踪控制的强非线性和高动态特性，以及气动减速段的制导机动需求，在控制器的设计中要求能够快速高精度跟踪制导指令姿态角，以避免控制动态过程和控制误差对制导系统造成影响.传统的有限时间收敛滑模控制方法由于其收敛时间随着初始偏差范数趋近于无穷而趋于无穷[16]，因此本文将进一步研究对初始偏差具有不变性的固定时间收敛方法设计滑模控制器.

本文针对复杂扰动影响下的VTVL-RLV返回飞行快速姿态跟踪控制问题进行研究，首先建立垂直起降火箭返回飞行的动力学模型，并考虑扰动和不确定性构建气动减速段姿态跟踪控制状态方程；进而设计基于固定时间收敛扰动观测器(fixed-time convergence disturbance observer，FxTDO)的快速姿态跟踪控制器，其中控制指令通过双幂次固定时间收敛滑模方法(double-order power fixed-time convergence sliding mode control，DPFxTSMC)生成，并采用FxTDO快速高精度的估计扰动以补偿扰动影响，从而去除不连续控制项以抑制抖振影响；最后通过气动减速段的仿真对固定时间收敛扰动观测器和基于观测器的双幂次固定时间收敛滑模控制器的性能进行了分析和讨论.

1 垂直起降可重复使用火箭动力学模型

VTVL-RLV一子级的返回全程可采用的执行机构为变推力可摇摆火箭发动机、栅格舵(grid fin)和反推力控制系统(RCS)，各段执行机构见表1.

表1 返回全程各段执行机构

返回飞行中的火箭一子级的执行机构具体如图2所示.本文研究的火箭一子级在返回过程中仅中间一台发动机点火工作，为双向“十”字形摆动；4个栅格舵为“×”字布局，安装在一子级头部，发射时收起紧贴箭体，在进入大气前栅格舵展开工作；8个RCS安装在一子级头部，分别负责俯仰、偏航和滚转通道.定义发动机的俯仰等效摆角为δφ、偏航等效摆角为δψ，则发动机等效摆角与实际摆角的关系可写为:

δφ=-δp1,δψ=δp2.

一子级进入大气后自尾部来流，定义δz,δy,δx分别为栅格舵的等效俯仰舵偏角、等效偏航舵偏角、等效滚转舵偏角，δz,δy,δx可表示为:

δz=(δ3+δ4-δ1-δ2)/4,
δy=(δ3+δ2-δ1-δ4)/4,
δx=(δ1+δ2+δ3+δ4)/4.

图2 一子级返回飞行执行机构示意图(后视图)

因此建立VTVL-RLV一子级返回飞行动力学模型，其中式(1)为发射坐标系下质心动力学方程，式(2)为箭体坐标系下绕质心动力学方程，各坐标系和坐标系转换关系详见文献[19].

(1)

(2)

对于轴对称的VTVL-RLV一子级，一般认为箭体坐标系为惯性主轴系，可认为火箭一子级对箭体坐标系各轴的惯量积为零.因此转动惯量矩阵可简化为

VTVL-RLV一子级在进入大气后的气动减速段采用栅格舵进行气动力控制，且该段面临的扰动特性在返回全程中较为突出，因此本文将主要建立气动减速段控制系统模型并以气动减速段为基础开展VTVL-RLV姿态跟踪控制方法研究.

基于火箭一子级绕质心动力学模型(2)建立如下的非线性系统模型：

式中：ω=[ωxωyωz]T为箭体转动角速度矢量；Ω=[φψγ]T为姿态角向量；Δf、Δd分别为系统各阶未建模的不确定性及内外干扰；其中，ω×和R分别为：

在气动减速段，控制矩阵B1和控制向量U分别为:

U=[δxδyδz]T.

由火箭姿态动力学方程式可得：

(3)

若VTVL-RLV一子级返回飞行的制导指令为ΩC=[φcψcγc]T，那么控制系统的目标是使火箭一子级的实际姿态快速稳定的跟踪制导指令，即:

式中,tF为有限的时间小量.

(4)

2 基于FxTDO的双幂次固定时间收敛滑模控制

针对式(4)所示的姿态控制系统，本文将三通道进行解耦设计各通道独立的单输入单输出(single input single output，SISO)控制器，各通道之间耦合量视作各通道总扰动的一部分，显然各通道的扰动均满足假设1，各通道(俯仰/偏航/滚转)的状态方程均可写为：

(5)

针对式(5)所示的二阶SISO系统，经典的滑模控制设计的滑模面为

s=kx1+x2,

(6)

式中，滑模面增益k>0.对应的滑模控制律为

u(t)=-b-1(kx2+λsign (s)),

(7)

式中，λsign (s)是用于补偿未知匹配扰动的不连续控制项，增益λ为设计参数. 在工程中，由于扰动边界值未知增益λ的取值较为保守，进而导致抖振.

2.1 非线性控制预备知识

考虑如下非线性动态系统：

(8)

式中，x=[x1,x2,…,xn]T∈n为系统状态向量；u=[u1,u2,…,um]T∈m为系统输入控制向量，假设原点是系统的一个稳定平衡点.

引理1[20]假设系统(8)存在连续可微正定函数V(x)∶n→+∪{0}，当且仅当V(0)=0.若存在正实数c>0和a∈(0,1)，在包含原点的开邻域N⊆n内满足：

则系统(8)在原点处有限时间收敛，且系统从初始状态x0收敛到原点的收敛时间T(x0)满足：

2.2 固定时间收敛扰动观测器

(9)

式中:z=[z1,z2,z3]T∈3为观测器的状态向量；ε为待设计的误差放大因子，满足ε∈(0,1);ki(i=1,2,3)为观测器设计增益，定义的矩阵A和Ar均满足Hurwitz条件，具体表示为：

式中:τ∈(0,1]；φi(·)(i=1,2,3)为设计的修正项，具体形式为：

φi(x)=「x」αi+「x」βi,i=1,2,3
αi=iα-(i-1),α∈(0.5,1.0)
βi=iβ-(i-1),β∈(1.0,1.5).

式中，函数「·」m=|·|msign(·),其中sign(·)为符号函数.观测器输出的估计误差变量为：

ei(t)=xi(t)-zi(t),i=1,2
e3(t)=x3(t)-z3(t)=h(t)-z3(t).

注1[21-22]定理1所示FxTDO在确定ki，α和β后，主要可通过调节ε得到满意的估计值.

2.3 双幂次固定时间收敛滑模面

针对式(5)所示的二阶SISO系统，为补偿系统扰动影响并消除抖振，考虑双幂次修正项的特性，本文给出了一种双幂次固定时间收敛滑模面(double-order power fixed-time convergence sliding mode surface)[23]为：

(10)

其中，指数γi(i=1,2)和χi(i=1,2)均满足：

0<γi<1,i=1,2

γ∈(1-ε1,1),γ3=1,γ2=γ,γ1=γ2γ3/(2γ3-γ2),

χi>1,i=1,2

χ∈(1,1+ε2),χ3=1,χ2=χ,χ1=χ2χ3/(2χ3-χ2).

式中,ε1>0，ε2>0，均为充分小的正数.由增益κi(i=1,2)可定义矩阵A1，增益Ki(i=1,2)可定义矩阵A2，均满足Hurwitz条件，具体表示为：

定理2[23]如果系统(5)达到式(10)所示的双幂次滑模面即s=0，则系统将沿着滑模面固定时间内收敛到原点.参考文献[23]给出如下证明.

证明令s=0，由式(10)可得:

(11)

将式(11)代入式(5)，有：

K1「x1」χ1-K2「x2」χ2.

(12)

这里将式(12)所示系统的低阶幂次和高阶幂次两部分进行分别讨论.

Step1考虑如下低阶幂次系统:

(13)

由于矩阵A1满足Hurwitz条件，因此满足如下Lyapunov方程:

式中:P1为正定对称矩阵，Q1为正定矩阵.

构造关于系统(13)的Lyapunov函数:

V1(γ,x)=V1(ζ)=ζTP1ζ,

(14)

V1(1,x)=xTP1x,

求V1(1,x)的全导数为

成立，式中0<(1+d1)<1.

Step2考虑如下高阶幂次系统:

(15)

由于矩阵A2满足Hurwitz条件，因此满足如下Lyapunov方程:

式中:P2为正定对称矩阵，Q2为正定矩阵.

构造关于系统(15)的Lyapunov函数:

V2(χ,x)=V2(ψ)=ψTP2ψ,

成立，式中d2=(χ-1)/χ>0,(1+d2)>1.

由于P2和P1为正定对称矩阵，根据关于二次型的Rayleigh不等式可得：

λmin(P2)‖ψ‖2≤V2≤λmax(P2)‖ψ‖2,

(16)

λmin(P1)‖ζ‖2≤V1≤λmax(P1)‖ψ‖2.

(17)

(18)

考虑到存在常数Θ满足0<Θ≤λmin(P2)，由式(18)可知，当初值V2|t=t0>Θ时，V2将从初始状态固定时间Ts2内收敛到Θ，收敛时间Ts2满足：

Ts2≤1/c2d2Θd2,

由于Θ≤λmin(P2)，根据式(16),可知当t>Ts2时：

‖ψ‖2≤V2/λmin(P2)≤Θ/λmin(P2)≤1.

考虑到χi>1和0<γi<1，i=1,2，根据ψ和ζ的定义可知，当系统状态x满足‖ψ‖2≤1时，‖x‖一致有界,则对应的‖ψ‖2≤Ξ(常数Ξ≥1).根据式(17)可得：

V1≤λmax(P1)‖ζ‖2≤λmax(P1),

(19)

由式(19)可知，V1将从V1=Ξ·λmax(P1)固定时间Ts1内收敛到原点，收敛时间Ts1满足：

Ts1≤|λmax(P1)||d1|/c1|d1|,

综上所述，式(12)所示系统状态x将固定时间Tf内收敛到原点，收敛时间Tf满足：

即系统(5)达到式(10)所示的双幂次滑模面后，系统将沿着滑模面固定时间内收敛到原点.

2.4 双幂次固定时间收敛滑模控制律

针对二阶SISO系统(5)，结合式(9)所示固定时间收敛扰动观测器(FxTDO)和式(10)所示双幂次固定时间收敛滑模面，设计的基于FxTDO的双幂次固定时间收敛滑模控制律(FxTDO-based double-order power fixed-time convergence sliding mode control，FxTDOB-DPFxTSMC)为

(20)

定理3对于式(5)所示系统，设计式(9)所示固定时间收敛扰动观测器、式(10)所示固定时间收敛双幂次滑模面以及相应的控制器(20)，系统(5)将固定时间内收敛到原点的邻域内.

证明对滑模面(10)求时间导数并沿系统(5)展开后将式(20)代入，有

(21)

定义如下Lyapunov函数：

当前仅当s=0时V=0；当s→∞时V→∞.

对V求时间导数并将式(21)代入，有

(22)

(23)

结合式(22)、(23)，当t>tf时，有

(24)

式(24)可分别表示为：

(25)

(26)

令：

则有：

V≥2-1(N/ζ)2/υ1V1,

(27)

V≥2-1(N/ζ)2/υ2V2.

(28)

Step1假设N/ζ≥1时，这种情况下V1≥V2，根据式(25)有：

由引理1可得，V从初值V0收敛到V1的收敛时间T1满足：

Step2假设N/ζ≤1时，这种情况下V1≤V2≤1，有

由引理1可得，V从初值V0收敛到V2的收敛时间T2满足：

因此，系统将在时间Ts内收敛到滑模面s=0的邻域Es内，具体可表示为：

Es={s∈|V(s)≤Vf},

进一步结合定理2及文献[22,26]可以认为，当系统到达滑模面s=0的邻域内后，系统将在固定时间内收敛到原点的邻域内.

注2由式(27)、(28)可知无不连续控制项的控制器的收敛域边界主要取决于观测器估计精度上界N，因此采用高精度观测器能够提高控制精度.

2.5 控制器结构

考虑到针对火箭一子级返回过程中飞行段及制导律切换等因素造成的姿态角指令突变，本文引入了如下跟踪微分器(tracking differentiator，TD)对参考输入(姿态角指令)安排过渡过程[27]，具体为：

图3 FxTDOB-DPFxTSMC的框图

3 仿真分析

考虑轴向气动力系数偏差15%，法力/侧向力系数偏差-15%，大气密度偏差15%，质量偏差800 kg，质心纵向偏差50 mm，转动惯量偏差10%，存在风干扰，姿态角(γ,ψ,φ)初始偏差(1°，3°，-3°)，考虑栅格舵的实际物理特性和偏差，且等效舵偏角限幅20°，仿真步长为0.001 s,仿真5 s的参数见表2.

表2 气动减速段仿真参数设定

Tab.2 Settings of simulation parameters of aerodynamic deceleration flight phase

参数数值参数数值质量/kg5 438特征长度/m20.0Jx/(kg·m2)5 290质心纵轴位置/m14.75Jy,Jz/(kg·m2)139 000mδyy,mδzz-0.245 0特征面积/m23.976mδxx-0.016 3

3.1 观测器对比

为了验证本文给出的固定时间收敛扰动观测器(FxTDO)，引入基于跟踪微分器拓展的经典扩张状态观测器(ESO)[27]进行比较，具体为：

仿真中，各通道ESO的各参数均为ρ=25，β01=1，β02=2，β03=4；观测器FxTDO的各通道增益均为k1=3，k2=3，k3=1，α=0.8，β=1.2，ε=0.1.通过进行零控(控制量为零)仿真对比观测器的一阶输出(以俯仰角为例)，结果如图4和表3所示.

图4 观测器估计值

表3 观测器估计俯仰角偏差的统计特征(3-4 s)

Tab.3 Statistic characteristics of pitch angle deviations estimated by observers (3-4 s)

参数均值标准差ESO0.021 96.155 8×10-4FxTDO8.183 9×10-132.102 9×10-12

由图4可得，在初始偏差条件下，固定时间收敛扰动观测器(FxTDO)相较于扩张状态观测器(ESO)具有更快的收敛速度和更小的超调；如表3所示，在稳态条件下FxTDO具有更高的收敛精度.因而，在有限的1 000 Hz采样频率下，FxTDO能够实现对状态和扰动的高精度估计.

3.2 控制器对比

为了验证本文给出的FxTDOB-DPFxTSMC，本文引入如式(6)、(7)不带观测器的经典滑模控制方法(SMC)和基于类super-twisting方法的双幂次固定时间收敛滑模控制方法(super-twisting based DPFxTSMC，STB-DPFxTSMC)，STB-DPFxTSMC采用的滑模面与本文给出的FxTDOB-DPFxTSMC相同，采用类高阶滑模super-twisting方法替换观测器输出，对应的控制律[28]为：

式中：η>0，λ1,λ2>0，p>1，增益α>0需要大于对应系统扰动的Lipschitz常数，即α>h1.

仿真中的参数选取具体为：SMC的三通道滑模面增益均为k=2.8，三通道不连续控制增益均为λ=0.05；STB-DPFxTSMC和FxTDOB-DPFxTSMC的滑模面参数中俯仰/偏航通道均为κ1=1,κ2=2.2,K1=K2=1,γ=0.6,χ=1.1，滚转通道为к1=0.3,к2=0.55,K1=K2=0.1,γ=0.6,χ=1.1；STB-DPFxTSMC的控制律参数中俯仰/偏航通道均为η=λ1=λ2=0.5,p=1.2,α=0.05，滚转通道为η=0.1,λ1=λ2=0.1,p=1.2,α=0.05；FxTDOB-DPFxTSMC的控制律参数中俯仰/偏航通道均为η=0.5,ζ=0.5,υ1=0.5,υ2=1.2，滚转通道为η=0.1,ζ=0.1,υ1=0.5,υ2=1.2；观测器FxTDO的各通道增益同观测器对比一致；各通道TD的参数均为R=25,β1=1,β2=2,β3=4.通过跟踪标称轨迹程序角仿真对比上述各控制器，结果如图5、6所示.

由图5、6可知，FxTDOB-DPFxTSMC的控制指令较为光滑，分析可知该方法虽然无不连续控制项，但通过FxTDO估计扰动以补偿扰动影响，降低了观测器动态过程对控制系统的影响并有效抑制了抖振.如图5的局部放大图，FxTDOB-DPFxTSMC的系统状态量并不能保证完全收敛于零，这正是由于通过去除不连续控制项抑制抖振造成的控制精度损失.理论分析可知去除了不连续控制项后的控制精度主要取决于观测器估计精度，由于FxTDO对扰动的高精度估计，系统的收敛精度仍能得到保证.通过权衡系统的收敛速度、精度和鲁棒性可以判断，为消除抖振损失一定的精度是可以容许的，并且通过合理设计观测器能够有效降低控制精度的损失.

图5 姿态角偏差响应曲线

图6 舵偏角响应曲线

4 结论

1)本文针对垂直起降火箭(VTVL-RLV)返回飞行的姿态跟踪控制问题设计了基于固定时间收敛扰动观测器(FxTDO)的双幂次固定时间收敛滑模控制方法(FxTDOB-DPFxTSMC).在有限的采样频率下，引入的FxTDO能够实现对扰动的快速高精度估计，进而在无不连续控制项的情况下利用双幂次修正项实现了固定时间收敛并有效抑制滑模抖振；同时，通过合理设计观测器参数，能够有效降低去除不连续控制项后的控制精度损失.

2)本文设计的FxTDOB-DPFxTSMC方法的设计参数较多，控制器参数整定难度较大；此外，固定时间收敛方法在保证快速收敛性时不可避免的带来的控制饱和问题，因此后续可进一步研究便于参数整定或参数自适应的控制方法和开展固定时间收敛方法的抗饱和控制研究.