APP下载

航天器全状态约束输出反馈控制

2020-04-11陈中天陈强孙明轩何熊熊

控制理论与应用 2020年2期
关键词:诺夫观测器角速度

陈中天陈 强孙明轩何熊熊

(1.浙江工业大学政治与公共管理学院,浙江杭州 310023;2.浙江工业大学信息工程学院,浙江杭州 310023)

1 引言

在编队飞行、卫星通信、太空站对接等许多关键任务中,航天器姿态跟踪控制是任务成功的关键因素.在角速度已知的情况下,常用的控制方法包括滑模控制[1]、反步控制[2]、自适应控制[3]和有限时间控制[4]等.然而,在实际中测量信号不可避免地含有噪声或传感器损坏均会导致航天器角速度信息无法准确获取.因此,有必要研究不依赖角速度信息的航天器输出反馈控制策略.

文献[5]较早地针对无角速度测量的航天器姿态控制问题进行研究,并设计非线性观测器估计未知角速度实现航天器的姿态跟踪控制.文献[6–7]分别基于四元数和罗德里格参数建立航天器姿态模型,并探讨姿态跟踪系统的无源性.文献[8]基于旋转矩阵建立航天器姿态模型,并利用无源滤波器设计一种无角速度测量控制律,保证系统姿态跟踪性能.文献[9]设计角速度观测器和姿态跟踪控制器,保证观测误差和跟踪误差在没有外部干扰的情况下渐近收敛.针对存在外部干扰情况的航天器姿态跟踪控制问题,文献[10]使用近似滤波器方法得到角速度的误差信息,用于保证外部干扰下的航天器姿态跟踪控制性能.文献[11]使用自适应模糊观测器估计未知量,并基于反步法设计输出反馈控制器,实现姿态跟踪误差的收敛.文献[12]设计一种时变增益扩张状态观测器对角速度和外部干扰进行估计,并结合互联和阻尼分配无源控制理论设计控制律.文献[13]针对存在外部干扰和输入饱和并且无角速度测量的航天器系统,通过设计有限时间状态观测器并结合积分滑模设计控制律,保证系统的渐近稳定.文献[14]基于超螺旋滑模设计有限时间观测器估计未知角速度,并设计多变量积分滑模控制器解决了角速度不可测情形下的柔性航天器振动抑制及鲁棒容错控制问题.以上文献主要致力于提高航天器姿态跟踪的稳态精度,却较少考虑其瞬态响应和状态约束问题.

为保证系统的瞬态性能和稳定性,通常会对系统状态和输出的幅值予以约束.在系统运行过程中,如果违反约束条件,可能会导致系统性能下降甚至出现安全问题.因此,对系统输出或者状态的约束控制是近年来的研究热点之一,常用方法有预设性能函数(prescribed performance function,PPF)[15–17]、Funnel控制方法[18–20]以及障碍李雅普诺夫函数(barrier Lyapunov function,BLF)[21–25]等.在航天器姿态控制过程中,由于工作场景或者传感器本身的限制以及考虑到安全因素,对系统各状态的约束十分必要.文献[26]提出一种基于对数型BLF的柔性航天器角速度有界鲁棒自适应控制器,保证航天器姿态跟踪误差的一致最终有界.文献[27]针对航天器接近和交汇问题,使用对数型BLF设计状态反馈控制器最终实现全状态约束.文献[28–31]基于预设性能函数和误差变换,设计包含预设性能边界的控制器,实现刚性和挠性航天器的姿态约束控制.然而,以上文献中控制律设计均需已知航天器角速度信息,而针对无角速度测量的航天器状态约束控制问题的研究成果则相对较少.

针对无角速度测量的航天器姿态约束问题,本文提出一种改进型对数障碍李雅普诺夫函数,可以在非约束情况下转化为二次型李雅普诺夫函数,因此所提改进型障碍李雅普诺夫函数能够适用于约束和非约束情况,拓展了传统对数障碍李雅普诺夫函数的适用范围.在此基础上,进一步提出非对称改进型障碍李雅普诺夫函数,实现更精确的非对称状态约束.基于修正罗德里格参数模型,设计状态观测器用于估计未知状态量,并结合改进型障碍李雅普诺夫函数和反步法设计输出反馈控制律,从而保证系统观测误差和跟踪误差能够达到一致最终有界,并给出数值仿真验证本文所提方法的有效性.

2 问题描述

航天器姿态的四元数描述方法已在工程上被广泛采用,四元数具有计算精度高,避免奇异性等特点,但四个元素由于存在约束条件而并不独立,因此在进行姿态计算时存在冗余.本文采用修正罗德里格参数(modified Rodrigues parameter,MRP)方法建立航天器模型,在实时性姿态解算计算量上比四元数小,且计算精度与四元数相近[32].修正罗德里格参数可以由四元数导出,即给出如下四元数:

其中:qv=[qv1qv2qv3]T为四元数的矢量部分,q4是四元数的标量部分,φ和n=[n1n2n3]T分别为欧拉角和欧拉轴,则相应的修正罗德里格参数为[33]

其中σ=[σ1σ2σ3]T.

基于修正罗德里格参数的航天器姿态模型为

其中σ×为σ的反对称矩阵,具体形式如下:

I3为3×3单位矩阵,ω=[ω1ω2ω3]T是航天器的角速度(本体坐标系下),ω×是ω的反对称矩阵,J∈R3×3是航天器正定对称的名义惯量矩阵,∆J为有界的转动惯量不确定性,d=[d1d2d3]T为有界外部干扰力矩,u=[u1u2u3]T为控制力矩,satu=[satu1satu2satu3]T为带有饱和约束的控制力矩,表达式如下:

根据文献[33],在定义域φ ∈(−2π,2π)内,修正罗德里格参数可以描述任意的姿态,但当φ接近±2π时,σ将趋于无穷,此时可将σ映射为变量σs=−σ/σTσ.变量σs随着φ增大而减小,而在φ接近0时将σs映射回σ,如此可保证系统状态量σ的有界性.由式(8)可得,函数G是有界的,即存在一个正常数µG满足∥G∥µG.

将式(4)中的含有∆J的项移到等式右边可得

化简式(9)可得

在式(10)两边同时左乘GJ−1可得

令L(σ)=G(σ)−1,在式(3)两边同时左乘L(σ)可得

对式(12)求导可得

将式(12)–(13)代入式(11)可得

令x1=σ,x2=,并且定义y=σ为航天器姿态输出,则原系统(3)–(4)可以被改写为

如文献[35]所述,satu可以表示为

其中∆u=[∆u1∆u2∆u3]T反映执行器受到饱和的程度.

本文的控制目标是针对带有干扰的航天器系统(3)和(4),设计无角速度测量(即ω和不可知)的状态观测器和姿态跟踪控制器,使得航天姿态观测误差和跟踪误差能够达到一致最终有界.

3 改进型障碍李雅普诺夫函数

3.1 对称改进型障碍李雅普诺夫函数

传统对数型BLF的表达形式为[22]

其中:ln(·)是自然对数,z为被约束的变量,满足|z(0)|

本文提出对称改进型障碍李雅普诺夫函数(symmetric modified barrier Lyapunov function,SMBLF),具体形式如下:

其中e是自然底数.当kb→∞,利用洛必达法则可得

从式(19)可以看出,在非约束情况,即kb→∞,SMBLF可以转换为二次型李雅普诺夫函数形式.因此,本文提出的改进型障碍李雅普诺夫函数(18)能够同时适用于约束与非约束(kb→∞)情况,因而拓展了传统对数型BLF的适用范围.文献[23]提出一种正切型障碍李雅普诺夫函数(tangential barrier Lyapunov function,TBLF),同样适用于非约束情况,其形式为

然而,分别对MBLF和TBLF求导可得

对比式(21)和式(22)不难发现,TBLF中三角函数的引入会增加控制器的复杂度,而本文提出的SMBLF则不存在此问题.

引理1对任意常数kb和向量z=[z1z2z3]T,当∥z∥

从式(24)中可知,F(xz)是一个增函数.且F(0)=0,由于xz=zTz0,则有F(xz)0成立,即

在不等式(25)两边同时增加zTz,整理可得

证毕.

3.2 非对称改进型障碍李雅普诺夫函数

由于现实系统中变量受约束的上界和下界不一定是对称的,因此为了达到不对称约束的控制目标,本文进一步提出非对改进型称障碍李雅普诺夫函数(asymmetric modified barrier Lyapunov function,AMBLF),其表达形式如下:

其中ka和kb为两个正常数,分别为约束的上界和下界,满足−kb

根据式(28),式(27)可以被改写为

从 式(29)可 见,Van在z ∈(−kb,0]和z ∈(0,ka)两个分段中都是光滑连续的,且在零点左右极限相等,因此Van是连续函数.并且,Van的左右导数在零点处相等,即因此Van的一阶导数也是连续的.

引理2对任意常数ka,kb和变量z,当z ∈(−kb,ka)时,则下式成立:

证当z >0时,根据式(29)和引理1可得

同理,当z0时,下式成立:

结合式(31)–(32)可得式(30)成立. 证毕.

对比式(18)(27)可知,当取ka=kb时,SMBLF和AMBLF相同,因此SMBLF可被认为是AMBLF的特例.与SMBLF相比,AMBLF的参数ka和kb可以分开设计,因此可以实现更为精确的约束效果.同时,相比AMBLF,SMBLF参数较少,因此在约束上下界对称的情况下应使用SMBLF,反之则使用AMBLF.

4 输出反馈控制器设计

4.1 观测器设计

在控制器设计之前,首先设计状态观测器估计未知状态量,将系统(15)改写为以下状态空间形式:

其中:A=选取适当的参数k1,k2使A是赫尔维茨矩阵,则根据李雅普诺夫定理,对于任意的对称正定矩阵Q,存在一个对称正定矩阵P满足

针对系统(33),设计状态观测器如下:

其中h1,h2,ϵ>0是可设计的参数.

设计如下李雅普诺夫函数:

根据式(34)和式(37),可得V0的导数为

其中λmax(P)是矩阵P的最大特征值.

将式(40)–(42)代入式(39),可得

通过解微分不等式(44)可得观测误差最终收敛到如下范围:

其中λmin(P)是矩阵P的最小特征值,因此可以通过选取适当的参数k1,k2和正定矩阵Q,使得λmin(Q)足够大,如此可以使得η足够大,从而保证观测误差e收敛到足够小的范围内.

4.2 控制器设计

定义跟踪误差eσ=σ −σd,其中σd是期望姿态,满足是两个正常数.为补偿执行器饱和引起的输入非线性,构建如下二阶辅助系统[35–36]:

其中:c1,c2>0为可设计参数,ξ1=[ξ11ξ12ξ13]T和ξ2=[ξ21ξ22ξ23]T为辅助变量.

设计如下虚拟变量z1和z2:

其中α是虚拟控制律,其形式在式(52)给出.

步骤1对z1求导可得

设计非对称改进型障碍李雅普诺夫函数

其中ka1i >z1i(0)>−kb1i,i=1,2,3,ka1i和kb1i是z1i的可设计的上下界参数.

由式(48),可得V1导数为

其中:ka2i>z2i(0)>−kb2i,i=1,2,3,ka2i和kb2i是z2i的可设计的上下界参数

对V2求导,并将式(43)(54)和式(55)代入可得

文献[22]指出,在障碍李雅普诺夫函数的约束作用下,当z1和z2初始条件满足z1i(0)∈(−kb1i,ka1i),z2i(0)∈(−kb2i,ka2i),i=1,2,3 时,z1i和z2i均不会到达边界,即z1i≠−kb1i或ka1i,z12i≠−kb2i或ka2i.则u,α和均有界且不会出现奇异值问题.

在实际应用中,系统的初始状态一般是给定的,参数ka1i和kb1i可根据所需约束要求预先设计.如初始状态未给定,可设计较大的ka1i和kb1i.由于本文提出的改进型障碍李雅普诺夫函数可以同时适用于约束和非约束情况,因此相比传统对数障碍李雅普诺夫方法,本文的方法有更大的参数选择范围,保证z1i的初始值属于(−kb1i,ka1i).

5 稳定性分析

定理1针对航天器系统(3)和(4),在状态观测器(35),虚拟控制律(52)和实际控制律(58)作用下,航天器姿态观测误差和跟踪误差能够达到一致最终有界.

证基于李雅普诺夫函数(56),

根据杨氏不等式性质可得

将式(46)(59)(60)代入式(57),可得

将实际控制律(58)代入式(61),则V2的导数满足

根据引理2,不等式(62)可以被改写成

令µ0=则解微分不等式(63)可得

结合式(49)和式(64),有

令µ1(t)=µ0+(V2(0)−µ0)e−Ct,通过解不等式(65)可得

以下进一步讨论辅助变量ξ1和ξ2的有界性,故设计如下雅普诺夫函数:

对Vξ求导并代入式(46),可得

根据杨氏不等式,有如下不等式成立:

将式(69)–(70)代入式(68),可得

其中Cξ=min{2c1−1,2c2−2}.

由于∆u有界,因此只要保证Cξ >0,则可证明虚拟变量ξ1和ξ2均一致最终有界.

取ξ1(0)=ξ2(0)=[0 0 0]T,则Vξ(0)=0,进而得到ξ1i的界满足

由于z1i=eσi−ξ1i,i=1,2,3,根据式(66)和(73),可得跟踪误差eσi,i=1,2,3满足

从式(74)可知,跟踪误差的界与MBLF 参数ka1,kb1以及饱和程度∆u相关,当时间t→∞时,如果∆u→[0 0 0]T,则µξ→0,且ξ1i→0.从而可得eσi→z1i,且µ1(t)→µ0,因此跟踪误差eσi,i=1,2,3将最终收敛至与参数ka1和kb1相关的界以内. 证毕.

在控制器(58)中,参数ka1i,kb1i,ka2i,kb2i,i=1,2,3需依据约束要求设置且保证−kb1i

6 数值仿真

本节给出数值仿真实例验证本文控制方法的有效性和优越性,其中期望轨迹为

σd=[sin(1.5t+π)sin(t+π)1.5 sint]T,

航天器系统(3)和(4)的名义惯量矩阵J,外部干扰d和状态量σ的初始值分别设置为[11]

转动惯量不确定性∆J设置为

M1:本文提出的全状态约束反步控制方法,包括状态观测器(35)、辅助系统(46)、控制器(52)和(58).其中:状态观测器的参数为k1=40,k2=2,h1=1,h2=4.5,ϵ=20;虚拟控制律和实际控制律的参数分别为c1=5,c2=2;MBLF 的参数为ka1i=0.2,kb1i=0.15,ka2i=4,kb2i=2.

M2:文献[35]中的反步控制方法,其中状态观测器与M1相同,虚拟控制律和实际控制律设计如下:

观测器和控制器的相关参数均与M1相同.

仿真结果如图1–6所示.图1和图2分别为航天器姿态输出跟踪效果和跟踪误差的笵数∥eσ∥,由图中可知,两种方法在无角速度测量情况下航天器输出均能跟踪给定期望轨迹,但本文给出的M1方法有更小的稳态误差即更高的控制精度.图3为虚拟变量z1的曲线,从图中可以明显看出,本文提出的M1方法使得z1受到约束,因此有了更快的收敛速度和更小的稳态误差.图4给出两种控制策略的饱和控制力矩satu,从图中可以看出两者的力矩没有太大的区别,而M1方法却能提供更好的控制效果体现其优越性.图5给出状态观测器的观测误差曲线,从图中可以看出观测器(35)能够较好地估计未知状态量.

图1 输出跟踪效果Fig.1 Output tracking performance

图2 跟踪误差的笵数∥eσ∥Fig.2 Norm of tracking error ∥eσ∥

图3 虚拟变量z1Fig.3 Virtual state z1

图4 饱和控制力矩sat uFig.4 Saturated control torque sat u

图5 观测误差e1和e2Fig.5 Observation errors e1and e2

M3:不含辅助系统(46)的全状态约束反步控制方法.其中状态观测器与M1相同,虚拟控制律和实际控制律设计如下:

其中虚拟变量z1和z2为

控制律所有的参数均与M1方法相同.

仿真对比结果如图6–9所示.图6和图7分别为航天器姿态输出跟踪效果和跟踪误差的笵数∥eσ∥,从图中可以看出,即使执行器只能提供很小的力矩,M1和M3方法依然可以跟踪上目标轨迹,但M1方法在相同的情况下比M3有更小的误差即更好的控制精度.图8为两种方法的饱和控制力矩satu,可见饱和比较严重,但是本文的M1方法可以更快脱离饱和状态也更加光滑.为了更好说明M1方法的优越性,本文引入能量消耗这一指标[37],具体形式为satu(τ)dτ,两种方法的能量消耗如图9中所示,从中可以看出M1方在拥有更好控制效果的同时也消耗更少的能量.以上仿真结果表明,本文所提的全状态约束输出反馈方法在输入饱和的情况下依然具有较高的控制精度和良好的鲁棒性.

图6 输出跟踪效果Fig.6 Output tracking performance

图7 跟踪误差的笵数∥eσ∥Fig.7 Norm of tracking error ∥eσ∥

图8 饱和控制力矩sat uFig.8 Saturated control torque sat u

图9 能量消耗EengFig.9 Energy consumption Eeng

7 结论

针对由修正罗德里格参数描述的航天器姿态跟踪模型,提出无角速度测量的全状态约束控制方法.设计状态观测器估计未知状态量用于反馈控制.提出可以适用于约束与非约束情况的改进型障碍李雅普诺夫函数,并引入辅助系统设计输出反馈控制器确保系统在输入饱和情况下的全状态约束以及航天器姿态跟踪性能.通过仿真对比验证了本文方法的有效性.

猜你喜欢

诺夫观测器角速度
智能辅助驾驶系统中横摆角速度信号估计方法的研究
基于滑模观测器的PMSM无位置传感器控制策略
基于非线性干扰观测器的航天器相对姿轨耦合控制
高中物理角速度矢量性问题的教学探究
基于滑模观测器的机翼颤振主动抑制设计
圆周运动角速度测量方法赏析
基于干扰观测器的船舶系统航向Backstepping 控制
半捷联雷达导引头视线角速度提取
Novoselova玛莎·诺夫斯洛娃【英国】
幽默与漫画