航天器姿态受限的协同势函数族设计方法

2024-02-03岳程斐陈雪芹曹喜滨

自动化学报 2024年1期

岳程斐霍涛陈雪芹沈强曹喜滨

姿态控制是一个非线性控制问题,在航空航天、机器人等领域受到了广泛关注和研究[1-2].用于描述刚体姿态的旋转矩阵构成了三维特殊正交群(Three-dimensional special orthogonal group,SO(3)).作为一个无边界的紧流形,S O(3) 不同胚于任何欧氏空间,这导致在S O(3) 上,不存在能够使姿态全局渐近收敛到目标姿态的连续时不变反馈控制律[3].受此拓扑性质约束,使用光滑的反馈控制律能实现的最好结果是基于单一势函数获得几乎全局的收敛性[4-5].而“几乎全局”意味着该势函数在SO(3)上存在一个测度为零的集合.该集合中的点称为临界点,当航天器初始姿态是临界点时,势函数无法控制姿态收敛到目标姿态.

为解决上述单一势函数存在的临界点问题,混合控制被引入姿态控制问题中[6-7].混合控制是一种具有滞回特性的切换控制系统,通过设计一族临界点互异的势函数,系统状态可在不同的势函数之间进行切换,从而改变系统状态和临界点的分布情况,实现姿态控制目标.具体而言,当系统运动到当前势函数上不期望的临界点时,会切换到另一个具有更低值且不处于临界点的势函数上进行控制.这一类势函数被称为协同势函数族.当单位矩阵是公共临界点时,称此类协同势函数族为共单位元的协同势函数族.文献[8]首次通过“角度扰动”方法构建了协同势函数,但并未给出协同性的证明.文献[9]进一步给出了协同性对势函数参数的要求.文献[10]给出了“角度扰动”方法中,协同势函数族存在的充要条件,并将协同势函数族应用到无角速度测量的航天器姿态控制系统中.以上文献均需要对临界点进行复杂计算.文献[11]放松了“共单位元”要求,通过选择固定的参考向量,设计出一族简单协同势函数族,但缺点是其物理意义不明确.此外,上述文献都没有考虑航天器姿态机动中的姿态约束.

在轨航天器姿态机动时,存在多种约束,其中一种典型约束是航天器的禁止或强制指向约束,即要求航天器在机动中始终避开或始终指向某个方向.例如,航天器光敏感器的指向应当始终避开明亮天体[12-13].指向约束下实现姿态机动的方案大致可分为基于规划的跟踪控制方法[14-15]和基于避障势函数方法[13,16]两种.基于规划的跟踪控制方法将原问题分解成2 个子问题进行单独解决.首先,利用优化方法规划出合理的姿态机动路径;然后,设计跟踪控制器跟踪所给路径.文献[15]整体性地考虑了姿态约束、机动过程的指向安全裕度和力矩饱和问题,提出预设性能的“规划+跟踪”控制方法,系统性地实现了航天器姿态受限机动.此类基于规划方法的姿态机动路径具备可预见性,但缺点是结构复杂,优化算法和控制器性能都会影响到航天器的实际指向.相比之下,基于避障势函数方法更加简单和有效.该方法将目标姿态设计为极小值点,并将势函数的梯度引入控制器设计,当靠近姿态限制时,势函数值和梯度急剧增加,以此规避姿态限制.文献[13]使用分数形式的避障势函数,处理禁止指向约束问题;文献[16]使用对数形式的避障势函数解决了同时具有禁止和强制指向约束的姿态机动问题.然而,势函数方法严重依赖势函数的凸性假设,机动路径不可预见且单一势函数控制存在临界点问题,航天器姿态可能会收敛到势函数的极小值,而非目标姿态.

为解决上述问题,本文在考虑姿态约束情形下,基于旋转矩阵设计用于混合控制的势函数族,该势函数族能够对任意的初始姿态保证姿态收敛到目标姿态.本文的主要贡献如下: 1)建立姿态禁止指向约束模型,考虑机动安全裕度,为每个指向约束设计软约束区域.在该区域内,将分数/对数形式排斥势函数引入协同势函数设计中,设计保证全局收敛的避障势函数.2)针对所设计的势函数,给出软约束区域内临界点分布情况和势函数参数的关系,指出当势函数参数满足给定不等式组时,航天器不会在避障过程中陷入非期望的临界点.3)将上述势函数引入控制器设计,实现姿态受限下的全局收敛.

本文内容结构如下: 第1 节对使用到的符号和性质进行说明,建立航天器的误差姿态运动模型和姿态约束模型;第2 节给出基于“角度扰动”构建协同势函数族的方法,将该协同势函数与受限制姿态机动问题结合,分别讨论分数形式和对数形式下,势函数在软约束区域内临界点分布和势函数参数的关系;第3 节以比例-微分控制为例,进行仿真验证.

1 相关理论基础

1.1 符号说明

本文以旋转矩阵R作为姿态参数展开研究,旋转矩阵形成的三维特殊正交群记作SO(3):={R∈R3×3|RTR=RRT=I,det(R)=1}.I∈R3×3是单位矩阵.SO(3) 以矩阵乘法作为群乘法时,是一个李群,其对应的李代数用 so(3) 表示,so(3) 的群元是三阶反对称矩阵,即so(3)={S∈R3×3:ST=-S}.对于任意向量x∈R3,定义线性映射[·]×:R3→so(3) 和它的逆映射 [· ]∨:so(3)→R3为:

对∀ R1,R2,R3∈SO(3),如果映射Φ:SO(3)×SO(3)→R≥0满足:

则映射 Φ 被称为S O(3) 上的度量.如果度量满足Φ(RR1,RR2)=Φ(R1,R2),∀R∈SO(3),则称之为左不变的;如果满足Φ(R1R,R2R)=Φ(R1,R2),∀R∈SO(3),则称之为右不变的.本文用到的SO(3)上的度量是角距离度量,即:

角距离度量是一种双平移不变度量[17].利用平移不变性,角距离度量也可以写为:

令集合D ⊂SO(3),如果连续可微的函数V:SO(3)→R≥0满足:

1)∀ R∈SO(3)D,V(R)＞0;

2)V(D)=0.

则V被称为S O(3) 上相对于集合D的势函数.

1.2 性质与引理

本节介绍对后续分析有帮助的性质和引理.令A是一个实对称矩阵,定义势函数:

下面列出在本文中使用的引理.

引理1.令0＜α＜α+Δα＜π/2,x∈(α,α+Δα],则函数f(x)=2 sinx/(cosα-cosx) 的取值范围为 [f(α+Δα),+∞).

1.3 问题描述

假设航天器本体系相对于惯性系的姿态用Rb∈SO(3) 表示,姿态机动的目标姿态用Rd∈SO(3) 表示.令ω表示航天器本体系下的角速度矢量,ω d表示期望角速度.假设惯性矩阵J是对角阵,则航天器的运动学和动力学方程为:

航天器姿态机动过程中存在各种限制,本文考虑一种几何视场约束,即航天器上某个指向需要避开特定区域.如图1 所示,图1 中下标B表示本体系,下标I表示惯性系.令单位向量r∈R3表示与航天器固连的敏感指向,单位向量v∈R3表示惯性系下固定的不期望指向(例如明亮的星体),航天器在姿态机动过程中,单位向量r和v夹角应满足:

图1 姿态限制示意图Fig.1 Illustration of attitude constraint

因此,本文中势函数设计的目标是在所设计的势函数指导下,航天器的姿态误差Re趋向于I,同时始终满足式(9).

2 协同势函数设计

2.1 势函数与临界点

利用内积的定义和性质2),势函数V(R(t)) 对时间的导数是:

例如,对于势函数(4),有下列结果:

通过解上述方程可知,势函数(4)共有4 个临界点[8]:

式中,E(A) 表示A的所有单位特征向量组成的集合.

对任意的势函数V,都存在至少4 个临界点[20],基于势函数梯度的反馈控制律在靠近临界点时,逐渐减小直至为零.为了实现全局收敛的结果,本文使用一族协同的共单位元势函数进行控制.给定一个有限的指标集Q⊂N,{Vq}q∈Q是一族势函数,如果单位元I是所有势函数公共的临界点,则称这样的一族势函数为共单位元的势函数.对于势函数族{Vq}q∈Q,如果存在一个常数δ＞0,使得:

则称势函数族 {Vq}q∈Q是协同的.粗略地,“共单位元”意味着在这一族势函数控制下,姿态有相同的收敛方向(单位元I);“协同”意味着在某个势函数临界时,存在另一个非临界且取值更低的势函数,如果切换为非临界的势函数进行控制,姿态将继续向目标姿态收敛.

为了说明协同势函数在姿态控制中的作用和切换逻辑,假设航天器的一条姿态轨迹经过2 个非期望临界点的邻域,这2 个临界点分别属于P1,A和P2,A,则势函数随时间变化曲线和切换时各势函数与临界点关系如图2 所示,其中状态N和M在第3 节定义.在单一势函数P1,A(或P2,A)的控制下,轨迹在t1(或t2)时刻,进入势函数所属的非期望临界点邻域,此后基于势函数梯度的姿态控制项将减小,甚至为零.为避免该问题导致收敛过慢,将在进入时刻进行切换.如图2 所示,在t3时刻,姿态轨迹处于势函数P1,A的非期望临界点,势函数停止收敛,此时存在势函数P2,A在该点不临界且其取值更低.因此,在混合控制中,根据势函数差值在t2时刻提前进行控制切换,由P1,A跳转到P2,A;同样在t1时刻,由P2,A跳转到P1,A,最终混合控制中势函数的变化曲线如图2 橙色粗线所示.

图3 kPA(R) 取值范围随 Φ R 的变化曲线Fig.3 The change curve of the range of kPA(R) with ΦR

为了构建协同势函数族,定义映射T:SO(3)→SO(3)为:

式中,k∈R,u∈S2.映射T的作用是对旋转矩阵R左乘“扰动”旋转矩阵,该“扰动”矩阵由指数映射生成,转轴u和转角kPA(R) 是待设计的轴角参数.因此,简记Rc=T(R,k,PA,u)=RT R,其中RT是足时,协同势函数族{Pq,A(R)}q∈Q“扰动”旋转矩阵.令Q={1,2},q∈Q,当参数k满可以按如下形式构建[8]:

2.2 受限制姿态控制的协同势函数族设计

假设航天器初始姿态位于姿态障碍以外,航天器误差运动模型和势函数设计目标如第1.2 节所述.定义SO(3) 的一个子集为:

该子集定义了姿态限制的软约束区域,进入该区域时势函数将进行避障切换.为在全局收敛情况下完成受限制姿态机动,本文设计了如下形式的势函数用于姿态机动问题:

式中,α+Δα＜π/2,Δα是待设计参数,Pq,A(Re)是针对目标姿态的吸引项势函数,PO(Re) 是待设计的用于避开姿态障碍的排斥项势函数,以分数形式的PO(Re) 为例:

式中,v d=RTdv;a和b是两个正的参数,文献[13,21-22]取a=1 或a=2,本文考虑更一般情况即只要求a＞0.在实际的姿态机动中,可能存在多个姿态限制,本文方法适用于单敏感轴多约束问题.具体来说,为每个指向约束设计了不相交的软约束区域,当航天器姿态进入软约束区域内,即敏感轴在惯性系下指向Rbr和禁止指向v夹角小于α+Δα时,切换为避障势函数,因此只需讨论单个约束下如何实现姿态机动即可.对于某个给定的姿态限制有下述引理成立.

引理5.对∀ Re∈E,ε=arccos〈Rdr,v〉-(α+Δα).

证明.旋转矩阵R作用于单位向量后,会使单位向量发生旋转.角距离的定义指出,旋转前/后向量的夹角不超过旋转矩阵R的角距离.对∀ Re∈E,敏感轴为了转动到目标指向,转角至少是 arccos〈Rdr,v〉-(α+Δα).因此引理5 成立.

集合E在引理5 中的性质如图4 所示.对∀Re∈/E,姿态的全局收敛性已经由协同势函数族{Pq,A(Re)}q∈Q保证[23].为保证全局收敛,本文讨论避障区域内势函数族 {Vq(Re)}q∈Q临界点分布情况.

图4 引理5 的图示Fig.4 Illustration of lemma 5

势函数族{Vq(Re)}q∈Q在避障区域内无临界点.在该势函数族控制下,航天器可以避开姿态障碍从任意的初始姿态机动到目标姿态.

证明.为简化书写,对证明中多次出现的符号简写如下:

对∀ Re∈E,根据势函数求导定义计算,可得:

利用性质1)和映射ψ的定义,有:

将Rc和式(28)代入式(26),可得:

1)对∀ Re∈E,证明‖y‖存在下限.

向量y的2 范数为:

利用性质3),有:

因此,对∀ Re∈E,势函数PA(Rc) 存在最小值,即:

利用引理1,可知:

2)对∀Re∈E,证明‖x‖存在上限.

将式(17)代入x,利用ψ(-B)=有:

利用范数三角不等式,有:

式中,uT[Reψ(ARc)]∈R,并且有:

式(38)可写为:

利用性质4),有:

因此,可得‖x‖的上限为:

3)讨论E内势函数的临界点.若:

则有:

对于∀ Re∈E,有:

首先,势函数族{Vq(Re)}q∈Q在避障区域内无临界点;然后,在姿态机动过程中,当惯性系下敏感轴指向Rbr和禁止指向v的夹角趋于α时,PO(Re)趋于无穷大,因此姿态机动过程可以避开障碍;最后,任给初始姿态Re(0),若该姿态是非临界点,则在势函数的控制下向单位元I收敛.若该姿态是临界点,则Re(0) ∈/E,在协同性要求下,利用混合控制可实现向单位元I收敛[23].因此,航天器可以避开姿态障碍,从任意的初始姿态机动到目标姿态.

2.3 对数形式排斥势函数的临界点分析

在基于势函数的受限制姿态机动问题中,除分数形式排斥势函数(21)外,还有对数形式的排斥势函数[16,24]:

式中,a、b、c是常数.在第2.2 节中,本文得出在考虑姿态受限情形下姿态全局收敛的参数设计要求(23).本节将证明对数形式排斥势函数也可以经过相似推导得出参数设计要求,以此说明本文方法的可拓展性.

对于式(49),利用势函数导数相关定义计算,可得:

因此,有:

取函数f(γ) 为:

因此,式(54)有最小值,利用和定理1 类似的推理方式,可得对数形式排斥势函数的参数设计要求.

文献[10,23]利用“角度扰动”方法构建协同势函数族,将其应用在无约束的姿态机动控制中,实现了姿态全局收敛.本文将这种构造方法应用到受限姿态机动任务的势函数设计中,实现了带有禁止指向约束的姿态全局收敛.与其他处理受限姿态机动问题的势函数方法[15-16,24]相比,本文方法的优点是不依赖势函数凸性假设,可避开非期望的临界点实现全局收敛;缺点是势函数切换会造成控制律突变,不能处理强制指向约束.第3 节将通过仿真分析具体讨论本文方法的优缺点.

3 方法验证

本节将建立航天器姿态受限情形下的混合控制模型,利用第2.2 节提出的协同势函数族{Vq(Re)}q∈Q进行控制,来验证方法有效性.

3.1 航天器混合控制模型

基于势函数族 {Vq(Re)}q∈Q,定义下列两个函数:

在混合控制中,系统状态 (Re,ωe,q) 被分成M,N∈SO(3)×R3×Q两个集合:

式中,δ为式(14)给定的协同间隙.令x=(Re,ωe),根据不同的系统状态,当 (x,q)∈M时,式(7)、式(8)航天器模型可写为连续模型:

当 (x,q)∈N时,可写为切换模型:

即系统状态位于集合M中时,势函数指标不变,航天器的状态遵循微分方程式(7)、式(8)连续变化.文献[23] 指出,协同势函数族的所有非单位元的临界点都落在集合N中,此时航天器状态不改变,势函数指标发生切换,切换到非临界且值最低的势函数进行控制.设计比例-微分反馈控制律如下:

在该控制律下的稳定性分析见文献[23].

3.2 参数设计和仿真结果

为了验证避障和切换控制,本节进行了3 种仿真案例分析.仿真中,姿态限制假定为3 个,具体信息如表1 所示.针对这3 个姿态限制,势函数中的参数 Δα分别为10°、5°和8°.假设航天器的转动惯量矩阵J=diag{4,5,4.5}kg·m2.根据式(23) 要求,势函数参数设计为w=[0.3,0.4,0.6]T,u=w/‖w‖,A=diag{0.3,0.4,0.6},k=0.25,a=0.7,b=1/20.在上述参数下,对于每一个姿态约束,不等式组(23)都能得到满足.根据式(13)、函数(4),在上述参数下的奇异点为 CritPA={I}∪R(π,ei),i=1,2,3,其中ei是3 维空间R3的标准正交基.协同势函数族{Pq,A(Re)}q∈Q的 6 个非单位元临界点可根据式(17)确定,当姿态误差处于这些临界点时,指向r在惯性系下的指向以三角符号表示,见图5～7.可以看出,这些指向都落在集合E之外.

表1 惯性系下姿态限制Table 1 Attitude constraints in the inertial frame

图5 无切换下姿态机动仿真Fig.5 Attitude maneuver simulation without switching

控制器参数设置如下: 在案例1 中,设置δ=0.06,k p=1,k d=5,仿真时间为 6 0 s;在案例2 和案例3 中,设置δ=0.06,k p=1,k d=3,仿真时间为40 s.在3 个案例中,都假定航天器存在力矩饱和,力矩饱和值为0.5 N·m.

案例1.无任何切换

假设航天器的目标姿态、初始姿态误差和航天器在本体下固连的指向分别为:

案例1 使用上述初始条件进行2 组仿真实验,航天器的初始指向位于姿态约束CZ2 下方,目标姿态位于姿态约束CZ2 和 CZ3 之间.航天器初始姿态误差Re(0) 位于势函数P1,A(Re) 的临界点邻域内,2 组仿真没有进行避障切换,分别在势函数P1,A(Re)和P2,A(Re) 控制下,绕过CZ3 运动至目标姿态.在2 组仿真实验中,向量r的指向轨迹如图5(a) 所示,势函数值变化曲线如图5(b) 所示.第1 组仿真实验从临界点邻域开始机动,机动路径更长,在t＜20 s 时,势函数基本保持不变;在t=50 s时,完成收敛.相比之下,第2 组仿真实验从非临界点邻域开始姿态机动,机动路径更短,势函数收敛更快,在t=30 s 时,完成收敛.2 组仿真实验的控制力矩和角速度误差变化曲线如图5(c)和5(d)所示.由于第1 组仿真从临界点邻域开始,导致收敛缓慢,因此图5(c)的峰值出现时间晚于图5(d).案例1 用于说明临界点问题的极端情况,当姿态靠近势函数的临界点时,收敛变慢.根据式(10),若恰好处于临界点,则会完全停止收敛.

案例2.避障切换

在案例2 中,本文进行了2 组仿真实验.在第1 组仿真实验中,假设航天器的目标姿态、初始姿态误差和航天器在本体下固连的指向分别为:

在第2 组仿真实验中,假设航天器的目标姿态、初始姿态误差和航天器在本体下固连的指向分别为:

在2 组仿真实验中,目标姿态下向量r的指向相同,位于CZ2 和CZ3 之间;而位于CZ1 下方的起始指向不同.在第1 组仿真初值下,向量r的指向轨迹如图6(a)中虚线所示,轨迹由CZ2 下方绕过CZ2,到达目标点.在绕过CZ2 时,存在1 次转折,这是由于势函数在t=6 s 时,进行了避障切换,规避姿态约束CZ2.势函数随时间变化趋势如图6(b)中虚线所示,在t=20 s 后,收敛到0,姿态机动完成.在第2 组实验条件下,向量r的指向轨迹如图6(a)中实线所示,轨迹穿过CZ1 和CZ2,到达目标点,分别在靠近CZ1 和CZ2 时有一次转折.这是因为势函数在t=1.6 s 时进行避障切换,规避CZ1;在t=7s 时进行避障切换,规避 CZ2.势函数变化趋势如图6(b)中实线所示,在t=20 s 后,收敛到0,姿态机动完成.2 组仿真的控制力矩和角速度误差变化曲线如图6(c)和6(d)所示,每次势函数切换都导致了控制力矩和角速度突变,控制力矩在切换时饱和.案例2 说明本文设计的势函数在规避姿态约束上的有效性,以及切换控制对航天器状态的影响.

图6 避障切换下姿态机动仿真Fig.6 Attitude maneuver simulation when avoiding attitude constraints

案例3.临界点切换

假设航天器的目标姿态、初始姿态误差和航天器在本体下固连的指向分别为:

如图7 所示,在上述初始条件下,向量r的初始指向位于CZ1 左下方,目标指向位于CZ2 和CZ3 之间.该指向从 CZ2 下方绕过CZ2,到达目标指向.航天器在12 s 前,基于势函数P2,A进行姿态控制;在t=12 s 时,姿态靠近临界点,满足切换控制模型式(61)和式(62),势函数发生切换,切换到值更低的势函数P1,A进行姿态控制.如图7(c)所示,控制力矩和角速度误差在势函数切换时突变.在t=25 s 后,势函数收敛到0,姿态机动完成.案例3 说明本文方法在规避非期望临界点时的一般情况,如图2 所示,在进入非期望临界点某一给定的邻域时,就通过切换势函数避开该邻域.

图7 临界点切换下姿态机动仿真Fig.7 Attitude maneuver simulation when avoiding critical points

综上所述,1)由上述仿真实验可知,为了规避非期望的临界点和姿态限制,势函数的切换会导致控制力矩发生突变,该突变值上限受势函数参数的影响,在势函数参数选取时,应在满足式(23)基础上,兼顾力矩突变大小.2)控制器的参数选取应兼顾力矩和机动时间与最终指向误差等收敛效果的需求.3)势函数非期望临界点的分布是其固有性质,仅与势函数参数有关,与动力学或运动学的不确定性无关.但不确定性的存在会影响航天器对本文算法所给出的期望控制力矩的执行,进而影响航天器的实际机动路径,此时无法保证航天器能够规避姿态约束和非期望临界点.

4 结束语

在姿态受约束情况下,基于旋转矩阵设计可规避临界点并实现姿态全局收敛的协同势函数.为每一个姿态约束设计软约束区域,在软约束区域内,避障势函数由相对目标姿态的吸引项和相对姿态约束的排斥项构成,当航天器姿态运动到该区域内,切换为避障势函数.针对常见的分数形式和对数形式排斥项,讨论了本文的避障势函数的临界点分布和势函数参数的关系,给出了避障区域内不存在临界点的参数要求.仿真实验结果表明,航天器能够在本文设计的势函数控制下规避姿态约束,收敛到目标姿态.由于本文进行了势函数切换,在切换时控制律不连续,未来将考虑如何改善控制律突变对系统的影响.