复杂不确定性下多无人机的抗扰时变编队控制
2020-04-15董朝阳张文强
董朝阳,张文强,王 青
(1. 北京航空航天大学航空科学与工程学院,北京 100191;2. 北京航空航天大学自动化科学与电气工程学院,北京 100191)
0 引 言
近些年来,多智能体编队控制的研究和应用吸引了很多学者和专家的关注。其广泛应用在无人机[1-2],航天器[3-4],移动机器人[5-6],水面舰艇[7-8],水下机器人[9-10]等领域。多智能体编队的核心问题是如何利用有限的邻域信息来构建控制律从而实现全局稳定编队[11]。Ren曾在文献[12]中提出基于协同理论的方法框架来解决编队问题。之后,基于这种框架的多智能体编队控制研究就成为了全新热点。
作为现代发展迅速的运载器,无人机作为应用对象广泛地出现在多智能体编队的研究成果中。文献[12-13]研究了飞行器二阶系统时不变编队控制问题。然而,在实际应用过程中,比如无人机合围或追踪任务,时不变编队显然无法满足任务需求。为此,文献[14-15]对无人机二阶系统的时变编队控制问题展开广泛研究。然而上述成果都是基于无向通信拓扑,这意味着无人机间的通信是双向的,这在编队控制过程中不仅是不必要的,而且也是对通信资源的极大浪费。为此,基于有向拓扑通信的无人机时变编队控制成为了更具有实际应用价值的研究方向[16-17]。
此外,无人机编队控制中另一个十分重要的问题就是如何处理编队过程中出现的不确定性。文献[18]针对多无人机时变编队问题,提出了在切换拓扑下的分布式编队控制律,然而该文献中的控制方法没有考虑不确定性带来的影响,因此在无人机集群编队的实际应用过程中会存在一些局限性。无人机在实际运行过程中可能遇到的不确定性十分复杂,具体可能包括无人机本身产生的未知非线性动态,或者外部产生的各种时变干扰。近来,一些学者注意到了这些问题,展开了一些研究[13,19-20]。文献[19]和文献[20]分别通过构建终端滑模观测器和扩张状态观测器(Extended state observer,ESO)来估计和补偿不确定性,然而他们研究的是编队跟踪问题,需要有领导者飞行器才能使编队得以实现。文献[13]利用反步控制方法和指令滤波器设计提出了一种鲁棒自适应控制策略,从而有效解决航天器受到的时不变干扰,但对于时变干扰和模型不确定动态难以奏效。基于上述问题,本文针对存在内部不确定非线性动态和外部时变干扰的多无人机系统,开展了基于有向通信拓扑的抗扰时变编队控制问题研究。
1 预备知识
1.1 符号约定
符号R代表实数集,Rn×n和Rn分别代表n阶方阵和n维列向量。IN代表N阶单位矩阵,1表示元素都为1的列向量,⊗代表克罗内克积。对于方阵A,λ(Α)代表方阵A的特征值,AT代表方阵A的转置。
1.2 图论
对于有向拓扑图G,其拉普拉斯矩阵L具有如下性质。
引理1[21]. 如果有向拓扑图G具有至少一个有向生成树,那么其拉普拉斯矩阵L具有一个对应特征向量为1的简单特征值1,并且其他非零特征值具有正实部。
1.3 问题描述
考虑如下N个带有不确定非线性动态和外部时变干扰的二阶无人机系统
(1)
式中:i∈{1,2,…,N},fi(xi,vi)∈R是连续可微的未知函数,代表多无人机系统的未知非线性动态。di(t)∈R是外部时变干扰,yi(t)∈R是系统输出。
di(t)+ui(t))
(2)
假设1.有向拓扑图G至少包含一条有向生成树。
定义多无人机系统(2)的扩张状态为
ζi(t)=fi(xi,vi)+di(t)
(3)
则分布式ESO可以设计为
(4)
(5)
根据多无人机系统(2)和扩张状态观测器(4),定义观测误差向量为ηi(t)=[ηx,i(t),ηv,i(t),ηζ,i(t)]T,i∈{1,2,…,N}
(6)
可以得到观测误差的动态为
(7)
为了实现基于有向拓扑通信的多无人机系统的抗扰时变编队,提出编队控制律
(8)
值得注意的是ESO的ε值为了观测器性能要取得尽量小,但是会导致“peaking”现象,严重影响系统稳定性。为避免这种影响,本文将控制律优化设计为sat(ui(t)),i∈{1,2,…,N},饱和函数sat(·)∈R为标准的饱和函数,定义为sat(ui(t))=sgn(ui(t))·min{Ui,|ui(t)|},i∈{1,2,…,N},其中Ui为第i个无人机的控制饱和限幅。
注释2.本文提出的控制律(8)是对多无人机系统而言更为一般形式的控制律,一些已有文献中的编队控制律可以看作是控制律(8)的一种不考虑干扰的特殊形式,例如文献[18]。
(9)
(10)
(11)
(12)
(13)
注释3.如果多无人机系统(9)能够实现抗扰时变编队h(t),从定义1可知,编队参照函数c(t)描述了编队整体的运行轨迹。通过文献[22]中的定理2可知,c(t)的具体表达式可以从式(12)直接得出。
2 主要结果
2.1 抗扰时变编队控制律设计
(14)
算法1.控制律(8)的参数确定可遵循以下四个步骤:
1)选择合适的参数矩阵K1来调整A+BK1的特征值,从而来设计编队参照函数c(t)的运动轨迹。为了让编队整体运行能够在可视范围内,K1的选取一般使得A+BK1是Hurwitz的。因为(A,B)的可控性,所以K1存在。
2) 给定一个正数κ,解下列线性矩阵不等式(LMI)得到对称正定矩阵E
(A+BK1)E+E(A+BK1)T-BBT+κE<0
(15)
值得注意的是E的存在也可以通过(A,B)的可控性来保证。
3)参数矩阵K2可以通过下式得到
K2=BTE-1
(16)
(17)
2.2 抗扰时变编队分析
根据算法1和引理1~2,多无人机系统(9)的编队实现充要条件在下列定理中提出。
定理1.考虑带有不确定非线性动态和外部时变干扰的多无人机系统(9),如果编队控制律按照算法1设计,假设1-3都满足,而且控制量饱和限幅Ui,i∈{1,2,…,N}可以合适选取。那么对于任意初始状态,整个多无人机闭环系统对于任意t*>0,在t∈[t*,∞)上满足
(18)
并且多无人机系统(9)可以实现时变编队h(t)的充要条件为:对于i,j∈{1,2,…,N},i≠j,
(19)
为了证明定理1,首先需要证明两个命题。
命题1.多无人机系统(9)实现抗扰时变编队当且仅当
(20)
(21)
其中
(22)
(23)
(Ue1)⊗φ1(t)=1N⊗φ1(t)
(24)
(25)
为了进一步分析,考虑下列准李雅普诺夫函数
(26)
(27)
(28)
扩张状态ζi(t)对时间的导数为
(29)
(30)
(31)
根据式(7),(30)和(31),Vi(ηi)在时间间隔[0,t2]内的导数可以写成
(32)
(33)
由式(32),Vη(η)的导数满足
(34)
(35)
有式(35)成立,那么在时间区间[0,t2]内有
(36)
(37)
将式(16)代入式(37)可以得到
(38)
(39)
从式(14),(15)和(39)可得
(40)
将式(17)代入式(40)中可得
(41)
注释4.从命题2的证明过程中可以发现,存在合适的控制输入限幅Ui,i∈{1,2,…,N}使得观测器导致的控制输入“Peaking”现象得以避免,同时该限幅在闭环系统稳定阶段可以不发挥作用。
定理1证.通过命题1知道多无人机系统(9)实现抗扰时变编队当且仅当式(20)成立。从式(13)可知,对于任意初始状态,式(20)成立当且仅当
(42)
(43)
同时成立并且线性系统(27)渐进稳定。
为了证明直观,式(42)可以等价地写成如下形式
(44)
式中:
充分性:如果式(19)成立,对于∀i∈{1,2,…,N}和j∈Qi,可以得到
(45)
进而可以得到
(46)
将L=UJU-1代入式(46)并且两边同时乘以U-1⊗I2可以得到
(47)
即条件(19)对于式(44)的成立是充分的。
(48)
(1N-1⊗I2)SN(t))=0
(49)
(50)
从式(50)可知,对于任意i∈{1,2,…,N}和j∈Qi有
(51)
所以结合αi(t)和βi(t)的结构,并考虑假设1,可以得到条件(19)成立,所以条件(19)是式(44)成立的必要条件。由此,条件(19)是式(42)的充要条件,即定理1得证。
注释 5.值得注意的是条件(19)的满足在理论上可以确保多无人机系统随着ε→0和t→∞是渐进稳定的,但是实际应用中参数ε可以取得很小但并不能取0。因此,该多无人机系统编队的稳定性收敛实际上是一种工程意义上的收敛。
3 仿真校验
3.1 有效性验证
这部分,通过对由6个无人机组成多无人机系统进行仿真来对上述理论进行验证。通信权重为0-1的有向通信拓扑G0结构如图1所示。
图1 通信有向拓扑G0Fig.1 Directed interaction topology G0
该仿真考虑在一个三维立体空间(XYZ)内进行。定义γi(t)=[xiX(t),viX(t),xiY(t),viY(t),xiZ(t),viZ(t)]T,每个无人机的动态可以重新写为
6个无人机的不确定性定义为
i∈{1,2,…,6}
该多无人机系统期望实现一个位置和速度都在三维空间绕时变编队参考函数c(t)旋转的六边形,并且该六边形随着c(t)的运动而运动。则时变编队函数定义为hi(t)=[hx,iX(t),hv,iX(t),hx,iY(t),hv,iY(t),hx,iZ(t),hv,iZ(t)]T,i∈{1,2,…,6}
多无人机系统的初始状态取xi(0)=[i(2Θ-1),i(2Θ-1),i(2Θ-1)]T,vi(0)=[0.5i(Θ-0.5),0.5i(Θ-0.5), 0.5i(Θ-0.5)]T,i∈{1,2,…,6},其中Θ是0~1之间的一个随机数。
图2是六个无人机的位置和速度分别在t=0 s,t=10 s,t=20 s时的编队情况。可以清楚地看到,多无人机系统在t=10 s和t=20 s时,位置和速度都已经稳定的实现了编队,并且六边形编队绕着编队中心不停旋转,因而该编队是时变的。图3是多无人机系统的编队误差曲线,从中可以清楚地看到多无人机系统的编队误差在3 s左右收敛到0附近,证明在本文提出的控制律下,存在不确定非线性动态和外部时变干扰的多无人机系统可以快速稳定地实现时变编队。图4是整个闭环多无人机系统的ESO真实观测误差曲线。从中可见,整个闭环多无人机系统的ESO观测误差在很短的时间内收敛,时间远远小于多无人机系统编队收敛时间,这也印证了本文的控制律设计基于ESO稳定的前提的正确性和合理性。
图2 多无人机系统的位置和速度分别在t=0 s,t=10 s,t=20 s时的编队情况Fig.2 Position and velocity trajectory snapshots of the six UAVs at t=0 s,t=10 s and t=20 s
综上,该仿真证明了存在复杂不确定性的多无人机系统(9),在提出的基于ESO的控制律(8)下,只要满足条件(19),就可以稳定实现抗扰时变编队。
3.2 对比验证
在文献[18]中,针对多无人机系统提出的时变编队控制律如下式所示
(52)
可见在上述编队控制律中,不包含任何抗扰因素,为了对比验证,结合文献[18]考虑具有下面动态特性的多无人机系统
图3 多无人机系统的编队误差曲线Fig.3 Formation error of the multi-UAV system
图4 多无人机系统的ESO真实观测误差Fig.4 The real observation error of ESOs
(53)
式中:di(t)取值与第3.1节中相同,α=[αx,αv]=K1=[-1,-1.2],K=K2=[1.0429,1.4787],其他仿真条件和第3.1节中完全相同。图5显示了存在外部扰动情况下控制律(53)的仿真结果。和图2对比可见,在存在外部干扰di(t)的情况下,控制律(53)无法实现预设的时变编队,而本文提出的控制律(8)则可以很好的实现。
图5 文献[18]在存在干扰的情况下分别在t=0 s,t=10 s,t=20 s时的编队情况Fig.5 The formation snapshots with external disturbance of the six UAVs at t=0 s,t=10 s and t=20 s under the protocol in [18]
4 结 论
本文针对存在不确定非线性动态和外部时变干扰的多无人机系统编队问题,提出了基于ESO的编队抗扰控制方法。首先建立分布式ESO对多无人机系统的不确定性进行估计,基于ESO的输出设计抗扰控制器,并提出算法对控制器进行参数选定。同时通过理论分析得出多无人机系统实现抗扰时变编队的充分必要条件,并给出严格的理论证明。最后给出的仿真实例说明了理论成果的正确性和有效性。