基于卡尔曼滤波的输出调节自适应无拖曳控制

2023-08-11孙笑云吴树范

深空探测学报 2023年3期

孙笑云，吴树范，沈强

（1.上海交通大学航空航天学院，上海 200240；2.上海市引力波探测前沿科学研究基地，上海 200240）

引言

无拖曳控制是航天器平台与其内部以检验质量为主的关键载荷用于保证超高精度相对运动关系的主要控制方法，为以空间引力波探测等为代表的先进空间探测任务提供超静、超稳的航天器平台。在空间低频引力波探测任务中[1]，无拖曳控制的引入要求惯性传感器的敏感轴残余扰动加速度在毫赫兹频段优于10–15m/s2/量级，位移控制精度优于[2]。考虑近地卫星受到的复杂外部及内部干扰等因素，这些性能指标的满足对航天器平台控制方法的设计及控制技术的实现提出极具挑战性的要求。

当前，针对无拖曳控制问题的研究主要集中于被动控制[3-4]和主动控制[5-9]两个方面。被动控制即通过设计具有强鲁棒性的控制器提高无拖曳控制各敏感轴控制稳定性，主动控制则针对系统潜在的各类干扰进行识别或估计，提高各自由度抗干扰能力。文献[3]基于定量反馈理论，根据性能指标转化成设计准则，在已解耦的无拖曳控制系统中设计控制器以满足不同的性能规范。文献[4]提出一种基于频率分离策略的H1混合灵敏度控制方案，在具有科学测量约束的无拖曳卫星中，满足稳定控制需求，实现全频段控制消耗的降低。

在主动控制问题中，基于状态观测或估计的方法是目前解决这一类时变不确定系统的主要手段[10-14]。考虑系统模型不确定性引起的状态不确定性，基于已知信息逼近或估计未知状态，并据此设计反馈控制器实现各闭环信号的稳定，仍是当前主动控制问题解决的主要思想。自适应控制是良好的不确定性估计方法，用于解决一类参数不确定性逼近问题[15-19]；除此之外，针对仅有输出信息可知的情况，基于观测器实现的输出跟踪方法也是解决这一类不确定逼近问题的有效手段。当前，状态观测器的设计方法主要基于模型[20-23]和数据[24-25]。基于模型的状态观测器往往建立于系统状态可观可测前提，而基于数据的状态估计方法多基于样本先验知识，依赖于样本数据的准确性，运用监督学习方法或数据优化策略实现模型整体的逼近和预测。

然而，针对无拖曳控制系统的研究中，往往忽略了无拖曳控制系统作为多体跟踪控制问题的本质，即航天器跟踪纯引力作用下的惯性传感器敏感轴，现有成果中多数采用的线性鲁棒控制方案建立在各控制通道解耦，且已假设不同控制通道间实现频率分离，忽略了多自由度无拖曳控制问题的通道间相互耦合作用；已有的无拖曳控制系统设计大多基于近似的线性动力学模型，忽略了因传感器电压驱动、微推力执行器内部扰动及外部环境扰动引起的非线性和参数不确定性，所设计的控制器针对实际非线性动力学系统的鲁棒性不足，从而位移跟踪精度尚有提高空间。文献[15]提出了一种惯性传感器自适应控制方法，研究了无拖曳控制系统的静电悬浮子系统控制方案设计问题，基于自适应控制手段考虑了系统的非线性和多自由度控制需求。然而，考虑到实际控制系统应利用量测输出而非状态信息设计反馈控制器，尤其在仅有降维输出信息可获取时，一般的自适应控制方法不可用，需予以改进。文献[17]提出一种输出调节自适应控制方案，用于解决上述降维输出反馈的自适应控制问题，为无拖曳控制系统提供了理论指导。其利用龙伯格观测器首先将降维输出信息扩展观测为全维状态信息，随后进行自适应控制方案设计，具有一定可行性。然而，当系统存在外界扰动及非线性时，所述龙伯格观测器的引入将对系统引起额外的观测误差，从而影响闭环系统位移控制精度，为使输出调节自适应控制方案应用于存在复杂非线性、参数不确定性及外界扰动的无拖曳控制系统中，状态观测手段需进行改进。

卡尔曼滤波是一种有效的基于数据的未知状态估计方法，利用卡尔曼滤波方法实现量测（输出）信息向状态信息的预测是其应用方向之一[26-28]。文献[26]基于卡尔曼滤波方法实现一类参数不确定系统的状态估计，并设计自适应控制器实现一种压电驱动微夹持器的精密运动控制；文献[27]提出一种自适应卡尔曼滤波无模型控制方案，应用于附加干扰存在下的连续机器人的稳定控制器设计中，同时避免了机器人运动的屈曲现象。

利用基于卡尔曼滤波的状态观测器改进输出调节控制方案，本文以空间引力波探测航天器[18]为研究对象，设计一种基于卡尔曼滤波的自适应无拖曳控制系统，利用基于输出调节的多变量模型参考自适应控制（Model Reference Adaptive Control，MRAC）方法实现各敏感轴自由度的精确与稳定控制。本文所述创新性如下：

1）在应对非线性不确定性时，该自适应控制方案额外考虑了输出信息降维的情况，相比一般线性鲁棒控制方案提高了系统对参考状态的自适应逼近能力及对外界非线性扰动的抑制能力；

2）基于卡尔曼滤波实现低轨卫星运行时外界与内部复杂干扰存在时系统输出向状态的快速预测及逼近，解决了传统观测器中因收敛速率及外界扰动引起的逼近误差对输出跟踪造成负面影响的问题。

本文内容安排如下：第1节给出包含6个敏感轴自由度的无拖曳航天器非线性模型建立过程；第2节给出控制器结构，设计基于卡尔曼滤波的状态估计器，并设计基于状态估计信息的输出调节多变量MRAC控制器，基于Lyapunov分析验证其闭环信号收敛性；第3节给出与常规方案对比的敏感轴各状态响应的数值仿真结果，第4节给出结论。

1 无拖曳控制系统建模

本节将对无拖曳控制系统进行动力学建模，并描述控制问题。

以LISA Pathfinder科学探测任务航天器为样例建立无拖曳控制系统动力学模型。执行探测任务的航天器构造如图1所示，由两个对置的惯性质量块TM1、TM2及航天器自身构成3个相互关联的物理实体。根据文献[19-20,28]，其多体动力学方程描述为

图1 LISA Pathfinder航天器构型[10]Fig.1 Diagram of the LISA Pathfinder spacecraft[10]

其中：E为单位矩阵；、为由roi=[roi,x,roi,y,roi,z]T,i=1,2定义的斜对称交叉矩阵，表述为

TiB,i=1,2为在标称位置下，航天器主体到检验质量块的变换矩阵。航天器和检验质量加速度则重新定义为

其中：m、m1、m2、I、I1、I2分别为航天器及检验质量块的质量及转动惯量。

根据LISA Pathfinder任务规则[21]，在执行科学探测模式时，选取检验质量1的3个平动自由度、1个转动自由度及检验质量2的两个平动自由度施行无拖曳控制。根据文献[6]给出的坐标选择矩阵DDF、DSUS，将无拖曳系统动力学模型重新表述为

其中：qDF、qSUS分别为无拖曳控制与静电悬浮控制坐标，qDF=DDFq，qSUS=DSUSq，B1、B2、BATT为更紧凑的参数矩阵，定义为

其中：aSC、aTM为航天器与质量块所受合外力及力矩，认为合外力及力矩由控制器输入uT,uS、外界干扰dSC,dTM及检验质量刚度变形构成，将系统开环动力学最终表达为

其中：BDF=DDFB1,BSUS=DSUSB1，控制器输入uS1=DDFB2uS,uS2=DSUSB2uS，无拖曳系统输入噪声。对角矩阵Ω2DF、Ω2SUS与交叉耦合矩阵 Ω2C为刚度矩阵。仅针对无拖曳控制回路进行分析，定义状态量x=则计及干扰的无拖曳控制回路标准形式可表述为

其中：dTM=B−1(uS1+dTM1)+dSC为系统总噪声；A=认为B、C已知，A为慢时变的矩阵；y为输出。由此给出无拖曳控制系统式（4）的频域输入输出描述

其中：u(t)=uT(t)+dTM(t)；y(t)=G(s)[u](t)则为一种结合时域和频域信号运算的简单符号[7]。给出如下引理[13]：

引理1对于任何M×M严格适当和满秩有理矩阵G(s)，存在下三角多项式矩阵ξm(s)，定义为G(s)的修正左相互作用矩阵，形式为

其中：(s),j=1,···,M−1,i=2,···,M是多项式，并且di(s) 是li>0次的单调稳定多项式，使得G(s)的高频增益矩阵，定义为是有限的和非奇异的。给出如下假设：

假设1G(s)=C(sI−A)−1B的所有零点都是稳定的，且A,B,C是稳定、可检测的。

假设2G(s)满秩且其修正左相互作用矩阵ξm(s)是已知的。

2 基于卡尔曼滤波的自适应控制器设计

本节将首先给出控制系统架构，描述基于卡尔曼滤波估计器改进的输出调节模型参考自适应控制方案结构，随后建立标称离散时间状态空间动力学模型，并依据此模型给出标称卡尔曼滤波估计器，引入基于多变量MRAC的输出反馈控制器，完成无拖曳控制系统的设计。

2.1 控制系统架构

在仅能获取降维输出信息的前提下，为实现存在系统不确定性时各闭环信号的稳定跟踪能力，依据卡尔曼滤波估计器替换一般输出调节自适应控制方案的状态观测器部分，考虑扰动影响，基于线性二次型得到状态的快速估计，并依据估计状态设计反馈控制器，表达为输出反馈形式，利用自适应律及模型匹配条件估计该输出反馈增益。闭环系统结构如图2所示。

图2 控制结构Fig.2 Control Framework.

2.2 基于卡尔曼滤波的状态估计

卡尔曼滤波是一种基于线性二次型的估计器，将其用于系统未知状态的估计中，相比传统状态观测器具有更快的收敛性。尽管本文的研究处于连续时间系统中，考虑到硬件实现的实际过程也为离散时间系统，首先将给出基于离散时间表述的状态空间方程

依据卡尔曼滤波方程，依据量测输出信息对状态进行估计，首先给出时间更新方程

随后给出下述量测更新方程

部分变量的定义已由文献[17]给出。根据得到的状态估计信息，进行自适应控制器设计。

2.3 控制结构

利用系统输出y(t)=Cx(t)首先观测系统状态，并基于观测状态设计反馈控制结构。给出包含干扰反馈的输出调节反馈控制律

其中：K1、K2∗为观测状态xˆ(t)及参考模型输入r(t)的反馈增益，该反馈控制设计目的是使控制对象跟踪参考模型

其中：ym为参考输出，同时抑制外界干扰。注意到在卡尔曼滤波估计器中，状态估计(t)与系统输入、附加干扰及系统输出有关，考虑到干扰dTM不可知，由此将控制器的状态反馈部分表达为

其中：A1(s)、A2(s)为表达在复数域中且与状态参数方程无关的卡尔曼滤波估计器参数，Θ∗1T、Θ∗2T为其各自相对应的反馈增益。基于上述推导与Θ∗3=K2∗，并忽略指数衰减项可以得到含有部分状态观测误差的参数化标称部分状态反馈控制器表述

其中：

2.4 自适应律设计

在进行自适应律设计之前，首先探讨模型的输出匹配条件，即自适应律的存在性。文献中已针对基于输出反馈控制器的对象模型输出匹配性做出探讨及证明，即认为由输出反馈推导得到的观测状态反馈控制器中，标称控制器参数K1∗和K2∗满足匹配条件

时，能够确保模型输出匹配

y(t)−ym(t)=e(t)

e(t)在任何初始条件下都能指数收敛至0，且闭环信号y(t)有界。

自适应控制方案的引入旨在解决系统状态参数矩阵A、B、C未知的问题。考虑时域模型中对3个状态矩阵的自适应估计会进一步增大自适应更新律的设计难度，在频域内对高频增益矩阵Kp进行LDS分解，从而简化自适应逼近过程，降低控制器设计难度。给出如下假设[21]：

假设3高频矩阵Kp的所有顺序主子式∆i，i=1,2,···,M都是非零的，并且它们的符号已知。这样的Kp具有非唯一的LDS矩阵分解

其中：S=ST>0；Ls是一个单位上三角矩阵，Ds=diag具有任意和选定的常数i=1,2,···,M。

将输出调节控制的自适应版本表述为γi>0，

其中：β为符号已知的系数；ϖ为在式（25）中定义的系统估计误差。将输出误差跟踪方程表述为

利用高频增益矩阵Kp的LDS分解对该跟踪误差各自适应变量实现参数化求解，同时根据式（17），将等式改写为

为将未知单位上三角矩阵Ls参数化，引入一个常数矩阵其中θ∗ij=0,i=1,2,···,M,j>i，同时定义参数矩阵估计误差变量(t)=Θ(t)−Θ∗(t)，将式(（18）进一步改写为

进一步将该方程进行参数化，引入一个稳定的单项多项式f(s)，其次数等于左相互作用矩阵ξm(s)的最大次数。利用滤波器h(s)=1/f(s)对估计误差方程进行修正，将等式表述为

令

则等式进一步改写为

为实现控制对象向参考模型的跟踪，除跟踪误差收敛需求外，还需实现模型的输出匹配，即要求高频增益矩阵及控制器参数向标称值的收敛。由此构建包含参数估计误差的方程

上述线性化的估计误差方程将应用于自适应律的推导。给出参数估计自适应律

其中：Γθi、ΓΨ为自适应增益矩阵，满足Γθi=ΓTθi>0,ΓΨ=ΓTΨ>0，同时有

2.5 稳定性分析

给出下述定理：

定理1以输出反馈控制器式（16）、自适应律式（25）、状态估计器式（9）及被控对象式（4）构成的无拖曳闭环控制系统，保证各闭环信号有界。

证明：首先设计Lyapunov函数验证基于自适应律设计的参数估计有界性。定义Lyapunov函数如下

对等式两边求取一阶微分，得到

由于DsSh(s)β符号确定，则当时，

则容易得到各自适应估计参数一致收敛。根据文献[21]中对各估计误差收敛性向系统输出误差收敛性的推导分析，也能得到闭环系统内各信号的一致稳定性。

3 仿真结果与分析

3.1 仿真参数设置

数值仿真验证基于样例无拖曳控制非线性动力学模型[11]。由于需考察闭环系统各状态响应的性能指标，部分数值仿真结果展示为频域形式。数值仿真通过与PID控制方案[5]的对比验证了该MRAC方案在两个分别代表平动和转动的敏感轴无拖曳自由度上针对位移噪声抑制的控制效果，设置仿真时间为100 s，步长为0.1 s。数值仿真结果如图3～5所示。

图3 三自由度滤波器估计与真值对比Fig.3 3-DOFs comparisons of the filter estimation and true value

执行器存在以如下成型滤波器表达的随机过程噪声

其中：作用于x1,θ1两敏感坐标轴上的噪声相关参数p1,p2,p3,p4,p5,z1,K1,K2的取值由文献[3]给出。

3.2 仿真结果

1）数值仿真结果验证该自适应卡尔曼滤波器用于状态估计的有界性。如图3所示，将3个平动自由度状态真值与滤波器估计值对比，能够得出估计值与真值均处于固定半径的球面内，以此说明自适应滤波器估计的有界性。2）该自适应控制方法具有良好的闭环性能。根据图4，在频域内对3个平动自由度进行数值仿真，根据仿真结果，应用该卡尔曼滤波–自适应控制方法后，敏感轴位移噪声控制精度优于移噪声控制精度优于这一噪声抑制水平非敏感轴位体现了该方法在低频段空间引力波探测任务中的较高可行性，在各自由度上均体现了良好的闭环控制性能。3）该方法相比于线性鲁棒控制方法具有更好的噪声抑制能力。根据图5及图6，该方案相比基于QFT理论的线性控制方法在各自由度上均体现了良好的噪声抑制水平。其原因是系统本身存在较为强烈的非线性及附加干扰，利用卡尔曼滤波和自适应控制的良好估计能力，可以实现上述不确定性的较好估计和抑制。

图4 KF-MRAC方案下闭环频域性能Fig.4 Closed-loop frequency domain performance under KF-MRAC scheme

图5 x1轴闭环时域性能对比Fig.5 Comparison of closed-loop time domain performance on x1 axis

图6 y1轴闭环时域性能对比Fig.6 Comparison of closed-loop time domain performance on y1 axis

4）卡尔曼滤波估计器相比传统龙伯格（Luenberger）观测器具有更好的估计效果。根据图7，在一个平动自由度上验证传统观测器与该估计器的性能对比，仿真结果表明，运用卡尔曼滤波估计器的控制方法拥有较好的闭环性能。这是由于卡尔曼滤波估计器基于线性二次规划，尽管非线性系统中并不能保证该估计器的全局最优性，但其良好的寻优能力相比于传统观测器在观测及闭环性能上均有较大优势；同时，传统观测器基于状态的前馈或反馈，尽管能够保证其指数收敛性，但收敛速率引起的惯性难以避免，因此在动态时变系统中，传统观测器的引入也将引起闭环跟踪误差的负面影响。

图7 z1轴闭环时域性能对比Fig.7 Comparison of closed-loop time domain performance on z1 axis

4 结论

本文设计了基于卡尔曼滤波状态估计器的输出调节MRAC方案，应用于空间引力波探测无拖曳控制问题中，提高了引力波探测多体闭环系统针对复杂非线性随机扰动项的逼近能力。卡尔曼滤波估计器的引入实现了仅有输出信息可以获得时全状态的估计，Lyapunov分析证明了各闭环信号全局一致渐进稳定及跟踪误差的收敛性，数值仿真验证了该控制方案的优良控制性能。