有向切换拓扑下多智能体系统编队控制
2021-11-18赵学远周绍磊祁亚辉王帅磊
赵学远,周绍磊,祁亚辉,王帅磊
(中国人民解放军海军航空大学,山东 烟台 264001)
1 引言
近年来,随着无人机技术的发展和多智能体系统控制广泛的应用前景,使得无人机编队在军事和民用领域都早已崭露头角,至今已经取得了大量的研究成果[1,2],无人机系统随着工作量的提高和难度的提升,无人机数量逐渐增多,因此对编队的控制提出了更高的要求[3]。目前相对成熟并运用较为广泛的控制方法有虚拟结构法[4]、leader-follower法[5]、基于行为法[6]。
众多学者在多智能体系统的一致性问题方面的研究,为无人机编队控制提供了新的解决思路,使得多无人机系统仅仅依靠邻居无人机的信息就能够形成编队。文献[7]利用了一种基于一致性反馈线性化的方法实现了多无人机系统快速形成编队,并且所形成的编队为时变编队。文献[8]利用一致性控制器解决了异构多智能体系统的编队控制问题,文献[9]通过设计一致性控制器,使得多无人机系统在形成编队的同时,具有一定的防碰撞能力。
设计一致性控制器实现编队控制问题,首先要关注的是多智能体系统的通信拓扑结构。文献[10]给出了拓扑图是连通的是多智能体系统一致收敛的充要条件,文献[11]证明了有向网络拓扑存在有向生成树,多智能体系统即可实现一致性。文献[12,13]研究了切换拓扑下多智能体的一致性问题。目前基于一致性理论实现编队控制的研究多集中于固定拓扑。文献[14]对离散系统设计了一致性控制器,使得离散多智能体系统形成编队。文献[15]研究了在有向通信拓扑条件下,多智能体系统的时变编队控制问题。文献[16]研究了二阶积分系统中利用一致性方法使得系统轨迹与编队队形一致。也有部分文献突破了固定拓扑图结构的限制,文献[17]在已知所有可能的拓扑集合条件下,设计一致性控制器,解决了一阶积分模型的多智能体编队控制问题。文献[18]的编队控制研究过程对有向切换拓扑提出了极为苛刻的限制条件,它要求有向拓扑集合内的所有拓扑图是强连通且平衡,显然所得结论不具有一般性。设计一致性控制器,使得多智能体系统在一般的有向切换拓扑条件形成编队的研究还并不深入。
在实际的多智能体系统当中,往往要建模成非线性系统,作为一种常见的非线性环节,Lur’e型非线性,在一致性研究过程中,文献[19]研究了包含Lur’e型非线性的系统在固定拓扑条件下的控制问题,文献[20]研究了具有Lur’e型非线性环节的多智能体系统追踪领导者的一致性问题。文献[21]研究了有向切换拓扑条件下Lur’e型非线性智能体系统的控制问题,设计了分布式控制器,使得系统达成一致。在基于一致性理论解决编队控制问题时,将Lur’e型非线性环节考虑在内的成果还较少。
本文在一致性理论研究基础上,设计了分布式控制器,用于解决有向切换拓扑条件下线性多智能体系统包含Lur’e型非线环节时的编队控制问题。所研究的拓扑图是随时间切换的,对通信要求更具一般性。设计的编队为时变编队,更具有实际意义。
2 预备知识和相关引理
2.1 图论
G=(V,E,A)用来表示多智能体系统的有向通信拓扑图,其中V={v1,v2,…,vN}是拓扑图的节点集合,E⊆V×V为拓扑图的边集合,A=[aij]N×N为拓扑图的具有非负元素aij的邻接矩,节点vi和vj之间的连接权重用aij表示,当aij=1时节点vi可以接收到节点vj的信息,当aij=0时则节点vi不能接收到节点vj的信息。如果G中存在一个节点vi,从这个点出发沿着有向边可以到达图中的任意其它点,称图G包含有一个有向生成树,该节点vi为根节点。图的Laplacian矩阵定义为L=[Lij]N×N,其中Lii=∑j≠iaijLij=-aij,i≠j。
智能体之间的拓扑关系随时间变换,Γ={G1,G2,…,Gp},p≥1为所有可能的有向拓扑的集合,切换信号σ(t):[0,+∞)→={1,2,…,p},切换时刻表示为0=t0 引理1[22]:对于任意给定的x,y∈n,和具有相容维数的矩阵P>0,D和S,可以得到 2xTDSy≤xTDPDTx+yTSTP-1Sy 根据文献[23]可得到类似的引理2。 引理2存在一个正数α0和与L1σ(t)同步切换的正定矩阵Qσ(t)使得 其中0<α0 考虑由N个具有Lur’e型非线性项的无人机构成的无人机系统,每个无人机的运动模型描述如下 yi(t)=Cxi(t) (1) xi(t)∈n,ui(t)∈p,yi=(yi1,…,yiq)T∈q分别是第i个智能体的状态、控制输入和测量输出。ABCD是合适维的系统矩。Lur’e型非线性项由非线性函数f(yi)描述,其满足斜率条件[0,Δ],Δ=diag{δ1,…,δq}即 0≤(fi(b)-fi(a))≤δi(b-a), fi(0)=0,∀b≠a,i=1,…,q. 针对此类问题,基于一致性方法,仅利用邻居智能体的状态信息,将控制器设计如下 ui=K1(xi(t)-hi(t))+wi(t) i=1,2,…,N (2) 将控制器(2)带入原系统可得到 +BK1(xi(t)-hi(t)) (3) 因此可以得到 +(L⊗BK2-IN⊗BK1)h(t) +(IN⊗B)w(t)+(IN⊗D)f(y) (4) 令ξi(t)=xi(t)-hi(t)故得到 +(IN⊗A)h(t)+(I⊗B)w(t) (5) 如果上式各状态量能够达成一致,则多无人机系统能够形成编队。 利用Laplacian矩阵的特殊性质,做如下的线性变换,令ηi(t)=ξi(t)-ξi+1(t) 因此可以得到 +(E⊗A)h(t)+(E⊗B)w(t) (6) 基于以上的分析,推导出多无人机系统能够形成编队h(t)的充要条件是 (7) +(IN-1⊗D)φ(y) (8) 是渐进稳定的。 根据系统(1)B为列满秩矩阵,因此对(7)两端同时乘以(I⊗),其中因此可以得到 (9) (10) 对于式(7),可以恰当的选取输入w(t)使其成立。欲所设计的控制器能够使得系统形成编队,对编队也是有要求的,即编队h(t)需满足式(8)。 定义于随时间变化的通信拓扑Gσ(t)=0,其在时间区间[t0,t)上的平均驻留时间τa定义为 其中Nδ(t0,t)表示Gσ(t)在时间区间[t0,t)上的切换次数。 结合平均驻留时间的定义,控制器设计算法如下 算法: 1)设w1(t)=0,求解方程,得到辅助函数w(t) 2)根据编队中心轨迹配置(A+BK1)的极点,求解K1 根据矩阵不等式(11),求解可行解P (11) 其中 H1=(A+BK1)TP+P(A+BK1)-2αPBBTP+βP 定理:按照如上算法设计的控制器,能够使得多无人机系统在切换拓扑时即使受到外部扰动也能够形成时变编队。 证明:构建Lyapunov函数 V(t)=ηT(t)(Qσ(t)⊗P)η(t) (12) 对上式沿着系统求导,整理可得 η(t)-ηT(t)(((EM)TQσ(t)+Qσ(t)EM) ⊗PBBTP)η(t)+2η(t)(Qσ(t)⊗PD)φ(y) (13) 由引理1得 2η(t)(Qσ(t)⊗PD)φ(y) =2η(t)(I⊗PD)(Qσ(t)⊗I)φ(y) ≤ηT(t)(I⊗PD)(R⊗I)(I⊗DTP)ηT(t) (R-1⊗I)(Qσ(t)⊗C)ηT(t) (14) 其中R>0为维数相容的特定矩阵,令R=Qσ(t),则可以得到 (15) 如前所述,当t∈[tk,tk+1)时,V(t)是连续的,求导可以得到(20),由(11)可以得到 (16) 考虑到Qσ(t)≤φ1I和Qσ(t)≥φ2I,所以在拓扑切换时刻tk有 (17) 通过迭代推导,因此 (18) 由(12)可得 (19) 其中ϑ1=φ1max{λ(P)},ϑ2=φ2min{λ(P)} 考虑多无人机系统的通信拓扑结构在如下的有向拓扑图中随机切换。 系统矩阵描述如下 将智能体状态分量理解为无人机位置,初始状态如下 编队定义为 因此编队形成后,4架无人机将构成一个平行四边形。 图1为有限的有向拓扑集合,按照图2的切换拓扑过程随意切换。 图1 有限的拓扑集合 图2 拓扑切换过程 首先将(A+BK1)极点配置在(-1+i,-1-i,-1),可得到 令α0=0.4求解不等式(12),得到可行解 所以可得到反馈矩阵 如图3所示,无人机的第一状态量与无人机编队第一状态量的误差曲线,从图中可以得出无人机状态和编队误差达成一致,编队即可以形成编队。 图3 无人机的第一状态量与无人机编队第一状态量的误差 第二状态量与第三状态量都与第一状态量具有类似的变化规律。图3分别为4架无人机在1s,4s时刻的三维状态值。 图4 无人机在1s时刻的三维状态值 图5 无人机在4s时刻的三维状态值 可以看出在4s之后,四架无人机形成平行四边形编队,且编队队形处于动态变化中,与预先设定的编队队形一致,验证了所设计的控制器的有效性。 利用一致性理论知识,用于解决多无人机系统编队控制问题,所研究的系统包含lur’e型非线性项,通信拓扑结构为有向切换拓扑。本文的主要创新点是考虑了外部扰动的影响,并降低了多无人机系统的通信要求,且利用Laplacian矩阵的特殊性质将其分解,从而将编队控制问题转化为低阶系统的稳定性问题,利用矩阵不等式求解反馈矩阵,使得设计控制器难度降低。2.2 相关引理
3 问题描述
4 控制器设计
5 仿真验证
6 结论