有领导者线性多智能体系统一致性的分析与设计
2017-05-19盖彦荣陈阳舟宋学君齐耀辉
盖彦荣,陈阳舟,宋学君,齐耀辉
有领导者线性多智能体系统一致性的分析与设计
盖彦荣1,陈阳舟2,宋学君1,齐耀辉1
(1.河北师范大学物理科学与信息工程学院,河北石家庄,050024;2.北京工业大学城市交通学院,北京,100124)
研究有向信息拓扑下有领导者线性多智能体系统的一致性分析与设计问题。利用提出的线性变换,将领导者有扰动输入的多智能体系统一致性问题转换为输入到状态稳定性问题。得到有向信息拓扑下有领导者线性多智能体系统达到一致的基于矩阵Hurw itz稳定的判据和误差估计函数,同时设计反馈增益矩阵,并将有领导者多智能体系统的一致性问题扩展到编队控制问题。数值实例验证表明:所得理论具有有效性。
多智能体系统;有领导者一致性;输入到状态稳定性;一致性判据;编队控制
多智能体系统的一致性问题是多智能体系统协作控制中的典型问题之一,受到了众多领域学者的广泛关注[1]。文献[1−6]研究了无领导者多智能体系统的一致性问题,其一致函数是所有智能体初始状态的加权平均值或加权幂平均值。但是当要求所有智能体达到一个指定的一致函数时,则需要研究有领导者的多智能体系统的一致性问题[7−14]。领导者作为特殊的智能体,其行为独立于其他的智能体;而其他智能体跟随该领导者,最终达到领导者确定的一致函数。文献[7]研究了一阶多智能体系统跟踪时变一致参考状态的问题,考虑了控制能力有界和有向切换信息拓扑下只有部分智能体可以获得参考状态的情况;文献[8,11]研究了有领导者一阶和二阶多智能体系统在领导者信息不可测量情况下的一致性问题;文献[15−17]对有领导者不同系统动态的高阶多智能体系统的一致性进行了研究。在分布式协作控制系统中,智能体多为高阶系统,而且领导者的运动状态在实际运行中难免会受到干扰。因此在领导者存在扰动输入的情况下,设计跟随者智能体的控制协议,在允许的有界范围内达到多智能体系统的一致是一个值得研究的问题。本文作者利用适当的线性变换[6],将有向信息拓扑下领导者有扰动输入的有领导者线性多智能体系统(leaderfollow ing linearmulti-agent systems,LLMASs)的一致问题转换为相应系统的输入到状态稳定问题。利用输入到状态稳定理论[18−19],得到有向信息拓扑下LLMASs一致性判据。同时设计反馈增益矩阵,使得LLMASs达到输入到状态稳定一致。与已有文献相比,本文具有以下优点:第一,提出的线性变换矩阵构造简单,推理过程简洁易懂;第二,利用该线性变换,将领导者有扰动输入的多智能体系统一致性问题转换为相应系统的输入到状态稳定性问题,得到的一致性判据更容易验证,只需要判断一个实数矩阵的Hurwitz稳定性即可;第三,利用Riccati方程,设计反馈增益矩阵,使得给定有向信息拓扑下有领导者多智能体系统达到输入到状态稳定一致;第四,将领导者输入有扰动的LLMASs一致性问题的研究成果应用于多智能体系统编队控制。
1 问题描述
为便于描述,给出如下定义:Rn和Rn×m分别表示n维实数向量和n×m维的实数矩阵;I和0分别表示合适维数的单位矩阵和零矩阵;1N表示所有元素为1的列向量;⊗表示矩阵或向量的Kronecker积[20],Kronecker积有2个性质:
考虑N个智能体构成的LLMASs,第1个智能体为领导者,其他智能体为跟随者,系统动态方程为:
其中:xi∈ Rn和ui∈ Rm分别为系统的状态变量和控制输入变量;r∈ Rm为第1个智能体的扰动输入变量,是满足||r||∞≤δ(|| r||∞=supt≥0|| r( t )||,δ∈ R)的光滑有界函数;A和B是合适维数的矩阵。
控制输入 ui的建立基于智能体i可以得到的信息,令Ni表示可以发送信息给智能体i的邻居智能体集合。我们称NT={ Ni: i=1,…, N}为LLMASs(1)和(2)的信息拓扑。众所周知,可以用有向加权图G=( V, E,W)来表示信息拓扑 NT,其中顶点V={1,…, N}是N个智能体的集合,E⊆ V× V描述智能体间信息交互的有向边集,即(j, i)∈ E⇔ j∈ Ni。基于有向边集可以构建与信息拓扑相关联的权值矩阵W=[wij]N×N。当j= i时,元素wij=0,当i≠ j时,若j∈ Ni,则wij≥0;若j∉ Ni,则wij=0。相应的加权入度矩阵和加权图Laplacian矩阵分别定义为Dw=diag{d1,…, dN}和Lw= Dw- W,其中di=是顶点i的入度。本文信息拓扑可以描述为以领导者1为根节点的有向图。
假定领导者的扰动输入r可以在线测量,则给定有向信息拓扑 NT下跟随者的控制协议为
其中:K为反馈增益矩阵;Ki描述智能体i能否在线直接测量领导者的扰动输入r,若1iN∈,则Ki>0;否则Ki=0。
LLMASs(1)和(2)在协议(3)下的矢量形式如下:
定义1给定有向信息拓扑 NT,若系统(4)存在KL类函数β:R+× R+→ R和K类函数γ:R+→ R使得式(5)成立,
则称LLMASs(1)和(2)在协议(3)下可达到输入到状态稳定一致。若γ(||r||∞)=0,则称LLMASs(1)和(2)在协议(3)下可达到(严格)一致。
2 输入到状态稳定一致性分析
下面分析LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致问题。首先利用选取的线性变换,等价地将有领导者多智能体系统的一致性问题转换为相应线性系统的输入到状态稳定性问题;然后依据稳定性理论,得到LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致的判据。
2.1 问题转换
根据文献[6]中线性变换的思想,为了简单起见,选取的线性变换矩阵T为
相应的逆矩阵1-T为
利用线性变换矩阵(6)对系统(4)进行线性变换
得到下面形式的线性系统
其中:
引理1线性系统(9)具有下面的形式
其中:
证明:由于线性变换矩阵T和图Laplacian矩阵满足3个条件:
利用这3个条件和Kronecker积的2个常用性质,得到线性系统(9)中的系数矩阵分别为因此系统(9)具有系统(10)的形式。
2.2 一致性判据
引理2 LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致的充分条件是系统(10)的平衡点y=0∈ R(N-1)n是李亚普诺夫意义下输入到状态稳定的。
证明:假设系统(10)的平衡点y=0是李亚普诺夫意义下输入到状态稳定的,即存在KL类函数β和K类函数γ,使得||y(t)||≤β(|| y(0)||,t)+γ(|| r ||∞)成立。由线性变换x= Tx得到xi= xi+1- x1,i=1,2,…, N-1。因此,如果平衡点y=0为李亚普诺夫意义下输入到状态稳定的,可以得到系统(4)满足式(5),即LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致。
综合引理1和引理2,得到如下定理。
定理1给定有向信息拓扑 NT,LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致的条件是系统(10a)的系数矩阵A1是Hurw itz稳定的。同时,如果矩阵A1是Hurwitz稳定的,对于给定正数c和σ,多智能体系统的跟踪误差由下面的不等式确定
其中:
证明:根据引理1和引理2,得到LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致等价于系统(10)的输入到状态稳定,而系统(10)的输入到状态稳定可以通过系数矩阵A1的Hurwitz稳定得到。同时,根据输入到状态稳定性理论[19],系统达到输入到状态稳定一致的跟踪误差由不等式(11)确定。
通过把矩阵A1转换为其约当标准型,可以得到下面的定理:
定理2给定信息拓扑 NT,LLMASs(1)和(2)在协议(3)下达到输入到状态稳定一致的条件是N-1个矩阵A-λiBK是Hurw itz稳定的,其中λi是矩阵T~0LwTˆ0的N-1个特征值。如果N-1个矩阵A-λiBK是Hurwitz稳定的,对于给定正数c和σ,多智能体系统的跟踪误差由不等式(11)确定。
注1:矩阵T~0LwTˆ0的N-1个特征值为矩阵 Lw的N-1个非零特征值。
注2:若领导者的扰动项r不可直接测量,则设计跟随者的控制协议为
利用同样的变换方法,LLMASs(1)和(2)在协议(12)下可以得到形如式(10)的系统,其中于是得到下面的推论。
推论1给定有向信息拓扑 NT,LLMASs(1)和(2)在协议(12)下达到输入到状态稳定一致的条件是线性系统(10a)的矩阵A1是Hurw itz稳定的;如果矩阵A1是Hurwitz稳定的,对于给定正数c和σ,多智能体系统的跟踪误差由不等式(11)确定。其中A1= IN-1⊗ A- T~0LwTˆ0⊗ BK,C1=[-1,…,-1]T⊗B。
推论2若领导者为确定系统,即r≡0,则给定有向信息拓扑 NT,LLMASs(1)和(2)在协议(3)或(12)下达到(严格)一致当且仅当线性系统(10)的矩阵A1是Hurwitz稳定的,且一致函数为ξ(t)=x1( t)。
3 反馈增益矩阵设计
根据定理2得到,矩阵A1是Hurwitz稳定的,等价于所有矩阵A-λiBK是Hurwitz稳定的,其中λi, i=1,…, N -1,是矩阵的N-1个特征值。当给定系统动态和信息拓扑后,只需设计反馈增益矩阵K,确保有领导者多智能体系统达到输入到状态稳定一致。受到文献[5]的启发,得到下面的定理。
定理3假定(A, B)可镇定,给定的有向信息拓扑 NT使得具有N-1个特征值-λi的矩阵-T~0LwTˆ0是Hurwitz稳定的,其中:i=1,…, N-1,那么反馈增益矩阵K=λ-1( BTP)可以确保LLMASs(1)和(2)在协议
min
(3)下达到输入到状态稳定一致,其中λmin= min(Re(λi)),PT= P≥ 0是下面Riccati方程的解。
证明:由于信息拓扑 NT是连通的,即矩阵T~0LwTˆ0的N-1个特征值λi都在复平面的右半平面,亦即Re(λi)>0,i=1,…, N-1。令λmin= min(Re(λi)),可以得到λmin>0。考虑下面的系统
构建如下的Lyapunov候选函数
即N-1个矩阵A-λiBK都是Hurw itz稳定的,所以LLMASs(1)和(2)在协议(3)下可以达到输入到状态稳定一致。
根据定理3,可以得到反馈增益矩阵K的算法,具体设计步骤如下:
步骤1)判断(A, B)的可镇定性和信息拓扑的连通性。若2个条件中的任一个不成立,则算法终止;
步骤2)求解Riccati方程(13),得到矩阵P;
步骤3)求得λmin= min{Re(λi)};
4 编队控制
在给定信息拓扑 NT下,以领导者为参照物,使得多智能体系统达到期望的队形h=。
构建跟随者分布式编队控制协议为
需要指出的是:当hj- hi=0,编队控制协议(14)变为一致性控制协议(3)。
定义2给定信息拓扑 NT,若存在KL类函数β:R+× R+→ R和K类函数γ:R+→ R使得下式成立,则称LLMASs(1)和(2)在协议(14)下可达到输入到状态稳定编队。
定理4给定信息拓扑 NT,LLMASs(1)和(2)在协议(14)下达到期望队形h,当且仅当线性系统(10)的A1是Hurw itz稳定的,且对于给定正数c和σ,多智能体系统的编队误差由不等式(11)确定。
证明当r=0时,令x~i= xi- hi,LLMASs(1)和(2)可以达到期望队形h当且仅当limt→∞x~i(t)- x~j( t)=0。
LLMASs(1)和(2)变为
LLMASs(1)和(2)的向量形式表示如下:
对上式进行线性变换x= Tx~,得到
因为y=0一定是平衡点,所以有(T~0⊗ A) h=0。且状态参考一致函数为ξ(t)=x1( t)。
当r≠0时,可参照定理1的方法来证明LLMASs(1)和(2)在协议(14)下达到输入到状态稳定编队。
类比于多智能体系统的一致性问题的研究,得到下面关于多智能体系统编队控制的推论。
推论3给定通信拓扑 NT,LLMASs(1)和(2)在协议(14)下达到期望队形h,当且仅当所有矩阵A-λiBK是Hurw itz稳定的,而且(T~0⊗ A) h=0,其中λi是矩阵的特征值,i=1,…, N-1。
注3:注意到LLMASs(1)和(2)在协议(14)下不是所有队形都可达的,可达的队形必须满足约束条件(T~0⊗ A) h=0。
注4:对于给定的可达队形,协议(14)中反馈增益矩阵可以利用第3节的算法进行设计。
5 数值实例
本节选用2个数值实例分别验证有领导者线性多智能体系统在有向信息拓扑下的输入到状态稳定一致问题和编队控制问题。
5.1 输入到状态稳定一致实例
假定LLMASs包含6个智能体,其中第1个智能体为领导者,则LLMASs的动态为
信息拓扑如图1所示。
图1 信息拓扑Fig.1 Information topology
信息拓扑对应的加权图Laplacian矩阵为
经检验,(A,B)是可镇定的,且信息拓扑是连通的。根据反馈增益矩阵设计算法,得到系统的反馈增益矩阵K=[3.289 6 2.788 8]。由于在给定的信息拓扑和设计的反馈增益矩阵下,系统(10)的系数矩阵A1是Hurwitz稳定的。根据定理1得到LLMASs(15)在给定信息拓扑(图1)和一致性控制协议(3)下可以达到输入到状态稳定一致。
情形1)r可测量时,
假定所有智能体起始于相同的初始状态xi1(0)=1,xi2(0)=4。LLMASs(15)在控制协议(3)和图1所示信息拓扑下的状态误差轨迹如图2所示。状态误差分别为yi1= xi1- x11,yi2= xi2- x12,其中i=1,…,6。从图2可以看出:LLMASs(15)达到输入到状态稳定一致,且状态误差是有界的。
情形2)r不可测量时,
所有智能体的初始状态同情形1),LLMASs(15)在协议(12)和图1所示信息拓扑下的状态误差轨迹如图3所示,其中状态误差的定义同情形1)。从图3可以看出:跟随者和领导者的误差在一定范围之内,即输入有界,系统状态也有界。所以LLMASs(15)在给定图1信息拓扑和不可测量扰动输入下,达到输入到状态稳定一致。
图2 多智能体系统在情形1)下的状态误差轨迹Fig.2 Error trajectoriesof LLMASs under situation 1)
图3 多智能体系统在情形2)下的状态误差轨迹Fig.3 Error trajectoriesof LLMASs under situation 2)
5.2 编队控制实例
LLMASs包含4个智能体,其中第1个智能体为领导者,多智能体系统的动态为
系统的信息拓扑为NT={∅,{1},{2},{3}},当智能体间有信息传递时,权值为0.5,否则权值为0。多智能体系统的期望队形h为h1=[0,0,0,0]T,h2=[−3,0,0,0]T,h3=[−3,0,−3,0]T,h4=[0,0,−3,0]T。
经检验,矩阵A1是Hurwitz稳定的。根据定理4,在给定的信息拓扑和权值矩阵以及增益矩阵K下,LLMASs(16)利用协议(14)可以达到期望队形h。给定领导者的扰动输入为r=[0.5sin t, 0. 5sin t]T,多智能体系统的初始状态x1(0)=[9,2.4,18,1.8]T,x2(0)= [3,1.8,27,0.9]T,x3(0)=[3,1.2,6,−1.5]T,x4(0)= [4.5,1.8,24,−1.2]T,得到多智能体系统的编队演化轨迹,如图4所示,图中“×”代表初始位置,“○”代表t=12 s时的位置。从图4可以看到:LLMASs(16)在编队控制协议(14)和给定信息拓扑及设计的反馈增益矩阵下达到期望队形。
图4 多智能体系统的编队轨迹Fig.4 Formation trajectoriesof LLMASs
6 结论
1)主要研究领导者有扰动输入情况下有领导者线性多智能体系统的一致性问题。首先定义了有领导者多智能体系统的输入到状态稳定一致;然后通过合适的线性变换,把有领导者的多智能体系统输入到状态稳定一致问题转化为相应线性系统的输入到状态稳定问题,从而得到了给定有向信息拓扑下有领导者线性多智能体系统达到输入到状态稳定一致的基于矩阵Hurwitz稳定的判据;同时利用Riccati方程,设计了反馈增益矩阵,使得给定信息拓扑下有领导者多智能体系统达到输入到状态稳定一致;进而研究了多智能体系统的编队控制问题。
2)实际情况下,由于传感器的检测范围受限或存在障碍物,使得通信链路断开或重连,由此导致信息拓扑结构发生变化;而且在网络环境下,通信时延是很普遍的现象。本文只是研究了固定信息拓扑下有领导者线性多智能体系统的一致性问题,复杂通信情况下的拓展研究将是下一步的研究目标。
[1]OLFATI-SABERR,FAX JA,MURRAY R M.Consensus and cooperation in networked multi-agent systems[J].Proceedings of the IEEE,2007,95(1):215−233.
[2]SUN Yuangong,WANG Long,XIE Guangm ing.Average consensus in networks of dynam ic agents w ith sw itching topologies and multip le time-varying delays[J].Systems& Control Letters,2008,57(2):175−183.
[3]谭拂晓,关新平,刘德荣.非平衡拓扑结构的多智能体网络系统一致性协议[J].控制理论与应用,2009,26(10): 1087−1092.
TAN Fuxiao,GUAN Xinping,LIU Derong.Consensus protocol in networkedmulti-agent systemsw ith non-balanced topology[J]. Control Theory&Applications,2009,26(10):1087−1092.
[4]XIJianxiang,CAINing,ZHONG Yisheng.Consensus problems for high-order linear time-invariant swarm systems[J].Physica A: Statistical M echanics and its Applications,2010,389(24): 5619−5627.
[5]MA Cuiqin,ZHANG Jifeng.Necessary and sufficient conditions for consensusability of linear multi-agent systems[J].IEEE Transactionson Automatic Control,2010,55(5):1263−1268.
[6]CHEN Yangzhou,GE Yanrong,ZHANG Yaxiao.Partial stability approach to consensus problem of linear multi-agent systems[J].Acta Automatica Sinica,2014,40(11):2573−2584.
[7]REN W ei.Consensus tracking under directed interaction topologies:algorithmsand experiments[J].IEEE Transactions on Control Systems Technology,2010,18(1):230−237.
[8]HONG Yiguang,HU Jiangping,GAO Linxin.Tracking control for multi-agent consensus with an active leader and variable topology[J].Automatica,2006,42(7):1177−1182.
[9]PENG Ke,YANG Yupu.Leader-follow ing consensus problem w ith a varying-velocity leader and time-varying delays[J]. Physica A:Statistical Mechanics and its Applications,2009, 388(2/3):193−208.
[10]MA Cuiqin,LI Tao,ZHANG Jifeng.Consensus control for leader-follow ing multi-agent systems w ith measurement[J]. Journalof Systems Science and Complexity,2010,23(1):35−49.
[11]HONG Y G,CHEN G R,BUSHNELL L.Distributed observers design for leader-follow ing control of multi-agent networks[J]. Automatica,2008,44(3):846−850.
[12]SONG Qiang,CAO Jinde,YU Wenwu.Second-order leader-follow ing consensus of nonlinearmulti-agent systems via pinning control[J].Systems&Control Letters,2010,59(9): 553−562.
[13]HU Guoqiang.Robust consensus tracking of a class of second-ordermultiagentdynamic systems[J].Systems&Control Letters,2012,61(1):134−142.
[14]ZHU Wei,CHENG Daizhan.Leader-follow ing consensus of second-order agents w ith multiple time-varying delays[J]. Automatica,2010,46(12):1994−1999.
[15]JIANG Fangcui,WANG Long.Consensus seeking of high-order dynamic multi-agent systems with fixed and sw itching topologies[J].International Journal of Control,2010,83(2): 404−420.
[16]NI Wei,CHENG Daizhan.Leader-follow ing consensus of multi-agent systems under fixed and sw itching topologies[J]. Systems&Control Letters,2010,59(3/4):209−217.
[17]NIWei,XIONG Chun,YANG Jie.Leader-follow ing consensus of high-order multi-agent linear systems w ith bounded transmission channels[J].International Journal of Systems Science,2013,44(9):1711−1725.
[18]TANNER H G,PAPPAS G J,KUMAR V.Input-to-state stability on formation graphs[C]//Proceedings of the 41st IEEE Conference on Decision and Control,NJ:IEEE,2002: 2439−2444.
[19]KHALIL H K,GRIZZLE JW.Nonlinear systems[M].3rd ed. Upper Saddle River:Prentice Hall,2002:174−180.
[20]HORN R A,JOHNSON C R.Topics in matrix analysis[M]. Cambridge,UK:Cambridge University Press,1991:242−254.
(编辑 赵俊)
Consensus analysisand design prob lem for leader-follow ing linearmulti-agent system s
GEYanrong1,CHEN Yangzhou2,SONG Xuejun1,QIYaohui1
(1.College of Physics Science and Information Engineering,HebeiNormalUniversity,Shijiazhuang 050024,China; 2.College of Metropolitan Transportation,Beijing University of Technology,Beijing 100124,China)
Consensus analysis and design problem for leader-follow ing linear multi-agent system s(LLMASs)w ith directed information topology was investigated.A proper linear transformation was proposed to transform the consensus problem of a leaderwith disturbance inputs to the input-to-state stability problem of a corresponding linear system.Then, a new consensus criterion in terms of Hurwitz stability of matrices was given for LLMASs achieving consensus w ith directed information topologies,and the tracking error was estimated.Moreover,a design process to determ ine the feedback gain matrix in the consensus protocol was proposed.Finally,the consensus was extended to the formation control.Numericalexamplesaregiven to validate the above theoretical results.
multi-agent systems;leader-following consensus;input-to-state stability;consensus criterion;formation control
TP13
A
1672−7207(2017)03−0735−07
10.11817/j.issn.1672-7207.2017.03.023
2016−03−29;
2016−06−12
国家自然科学基金资助项目(61573030,61511130044);河北省教育厅基金资助项目(ZC2016037);河北师范大学科研基金资助项目(L2015B06,L2015B07)(Projects(61573030,61511130044)supported by the National Natural Science Foundation of China; Project(ZC2016037)supported by the Foundation of Hebei Education Departm ent;Projects(L2015B06,L2015B07)supported by the Science and Research Foundation ofHebei NormalUniversity)
宋学君,博士,教授,从事多智能体系统协作控制、多传感器信息融合的研究;E-mail:sxj263@126.com