基于噪声的非线性多智能体系统的均方一致性*

2018-03-21邱丽过榴晓刘佳

动力学与控制学报 2018年1期

邱丽过榴晓刘佳

(江南大学理学院, 无锡 214122)

引言

近年来多智能体网络系统的合作与协调控制已成为众多领域研究的热点,在无人航天[1],传感器网络[2],卫星编队[3,4],数据融合,多机械臂的协同装备,以及鱼群或鸟群的行动方向[5,6],分布传感器的滤波值[7]等众多领域有着广泛的应用而引起的.文献[8,9]对于多智能体网络的基本问题进行了综述.另一方面,多智能体网络系统往往受到环境不确定性导致通信延迟[10,11],使它很难及时准确的获得相邻节点的信息.由于网络拓扑结构模型的建立与真实结构的差异[12,13]、环境的温度与湿度等外部条件的变化,节点之间通信的各种不确定因素的影响,复杂网络中的随机性因素是客观存在的,而且随机性因素对系统造成的影响是不可忽略的,因此造成的延迟通常是由有限的信号传输和记忆效应所引起的.主体之间的信息通讯自然相应与时滞效应[14].具有延迟非线性的复杂多智能体网络系统的一致性问题引起越来越多的关注[15].在非线性系统的一致性控制控制研究中,更多借鉴线性的分析时所用的代数图论[16],非负矩阵论[17]等工具来进行研究.陈关荣[18]运用这些工具介绍了带有延迟方法采样信息非线性多智能体网络的控制问题.最近的工作,Huang和Manton[19]研究在切换拓扑存在或不存在的情况下,使用算法从随机近似在离散时间情况下的随机一致性问题.Li和Zhang[20]将 Huang和Manton的工作扩展到连续时间设置,得到平衡网络和包含的一个生成树随机一致的充要条件.因此,建立与实际情况尽量接近的随机复杂动态网络模型,并在根据具体问题变换模型的基础上,研究采用不同的分析方法与控制策略是有必要的.另一方面,对于非线性动力学的多智能体系统,每个代理节点的内在动力会作为耦合项在最终的一致状态时将会消失.因此,一致性协议必须是一个孤立的系统.一致性协议可能是一个孤立的轨迹平衡点,周期轨道,或是一个混沌轨道[21-23].但是上述论文是基于一个共同的假设,即每个节点与邻居节点之间信号传递没有时间延迟,在许多情况下是不切实际的.

1 预备知识

1.1 基础图论知识[24,25]

令G(V,E,A)表示一个有向加权图,其中V={v1,v2,…vN}表示图G的顶点集合,E⊆V×V,V为图G的边集,节点的下标集合为Q={1,2,…,N}.定义节点vi的邻居集合为Ni={vj∈V|(vi,vj)∈E}.图G的邻接矩阵A=[aij]∈RN×N,其中矩阵元素aij为节点vi与节点vj的连接权重. 如果vj∈Ni,则aij>0.否则aij=0.假设图G中每个节点没有自连,即对于∀i∈Q,aii=0.

一个有向图叫做强连接的当且仅当任意两个不同的顶点之间存在一个有向的路径.此外,一个有向图包含一个有向生成树,如果存在一个顶点称为根,即存在着从这个根到每一个其他的顶点的有向路径.

引理1[24]: 假设一个有向图G(A)是强连接的,且它的拉普拉斯矩阵L不可约,且满足L1N=0,并且存在一个对应于零特征值的左特征向量ξ=(ξ1,ξ2,…ξN)T使得ξTL=0,ξT1N=1.

1.2 系统模型

这里xi∈Rn表示第i个节点的位置,L=(lij)n×n是通信拓扑G(A)的拉普拉斯矩阵,ui(t)∈Rn为设计的控制输入.然而,每个个体的动力学行为一般不是一个常数,是时变的.许多学者开始研究非线性多智能体网络系统[18]:

i=1,2,…N

(1)

注1: 本文在系统中充分考虑了环境噪声对多智能体一致性的影响.线性多智能体网络中处理噪声延迟已是很大挑战,目前较多的是离散系统下的噪声延迟,随机布朗运动的动力学对个体的动力学行为有很大影响.本文的模型主要用来描述外部随机噪声,且高斯白噪声过程满足dw(t)=n(t)dt,因此本文处理在噪声环境下的非线性连续多智能体网络是一个很大的进步.

考虑非线性动力系统的多智能体网络的延迟控制,那么给出如下的控制协议:

ui(t)= ∑vj∈Niaij[(xj(t-τ(t))-

xi(t-τ(t))]

(2)

其中τ(t)是在[0,τ](τ>0)的连续时间延迟.

为了证明定理,给出如下引理:

引理2: 假设x∈Rn,Γ=ΓT∈Rn×n,A∈Rm×n并且有Rank(A)=l

证明: ∵E(Ay)=0,即A(E(y))=0.

令y′=E(y),即Ay′=0.

由文献[26]引理2,有y′TΓy′<0,

又y′TΓy′=(E(y))TΓ(E(y))

=(E(y))TE(Γy)

=E(yTΓy)

∴E(yTΓy)≤0

注2: 本文的分布式控制协议基于延迟控制方法,考虑时变延迟采样信息,不仅简化控制方法,而且利用客观环境噪声下的动态延迟信息.能够很好的解释和理解非线性复杂性引起的动力学行为.

综合(1)和(2),非线性动力系统的多智能体网络一致性的随机延迟控制描述为:

xi(t-τ(t))]+σi(t,xi(t))n(t)

i=1,2,…,N

(3)

1.3 动力学模型

将(3)写成随机延迟矩阵形式:

dx(t)=[f(x(t))-Lx(t-τ(t))]dt+θdw(t)

(4)

其中w(t)是一维高斯白噪声过程,dw(t)=n(t)dt,L=(lij)n×n,是通信拓扑G(A)的拉普拉斯算子矩阵θ=diag(θ1,…,θn) ,θ=[σ1i,σ2i,…,σni] 是n维行向量.

得到主要结论前,给出如下假设:

假设1[27]: 对任意x,y∈Rn,存在常数α>0,β>0使得非线性函数f(·)满足:

(x-y)T[f(x)-f(y)-a(x-y)]

≤-β(x-y)T(x-y)

假设2:对于任意的x1,x2∈Rn,t≥0,存在一个非负常数ρ,使得:

‖f(x1,t)-f(x2,t)‖≤ρ‖x1-x2‖

2 主要结论

定理1假设网络图G是连通的,如果存在正数λ,α,β且存在对称矩阵Q,使得ETQE>0并且矩阵不等式成立:

(5)

其中:

Φ11=2τ2ETQE-ETE

Φ22=ET[λI+2(α-β)(I-F)+ρI]E-ETQE

Φ33=-2ETQE

Φ44=2τ2ETLTQLE-ETQE

则非线性多智能体系统(4)将均方有界一致.

证明:误差系统:

δ(t)=x(t)-1α(t)=(I-F)x(t)

这里1表示元素均为1的N维列向量,I是单位矩阵,

dδ(t) =(I-F)dx(t)

=(I-F)[f(x(t))-Lx(t-τ(t))]dt+

(I-F)θdω(t)

Lδ(t-τ(t))]dt+(I-F)θdw(t)

(6)

对系统(6)选取Lyapunov-Krasovskii函数:

V(t)=V1(t)+V2(t)

其中V1(t)=eλtδT(t)δ(t),

这里对于对称矩阵Q,有ETQE>0,其中:

ξ=(ξ1,ξ2,…ξN)T是拉普拉斯矩阵L的零特征值的左特征向量,有ξT1N=1.

dV(δ(t),t)= 2eλtδT(t)(I-F)θdw(t)+

(7)

这里LV1≤λeλtδT(t)δ(t)+2eλtδT(t)[(I-F)·

eλttrace(I-F)2θTθ

≤λeλtδT(t)δ(t)+2eλtδT(t)[(I-F)·

(α-β)δ(t)-Lδ(t-τ(t))]+

eλttrace(I-F)2θTθ

≤λeλtδT(t)δ(t)+2eλtδT(t)[(I-F)·

(α-β)δ(t)-Lδ(t-τ(t))]+

eλttrace(I-F)2θTθ-

eλtfT(x(t),t)f(x(t),t)+

eλtρδT(t)δ(t)

(8)

(9)

根据Jensen不等式:

≤-eλt[δ(t)-δ(t-τ)]TQ[δ(t)-δ(t-τ)],

≤-eλt[δ(t-τ(t))-δ(t-τ)]TQ

[δ(t-τ(t))-δ(t-τ)],

≤-eλt[δ(t)-δ(t-τ(t))]TQ

[δ(t)-δ(t-τ(t))]

令:

δ(t)-δ(t-τ)=v1(t)

δ(t-τ(t))-δ(t-τ)=v2(t)

δ(t)-δ(t-τ(t))=v3(t)

则综上可得:

dV(δ(t),t)≤ 2eλtδT(t)(I-F)θdw(t)+

eλtηT(t)Γη(t)dt+

eλtC0dt

(10)

其中:

其中,M=λI+2(α-β)(I-F)+ρI

C0=trace(I-F)2θTθ

T=1T

容易验证Ε(Aη(t))=0,

由条件:

A⊥TΓA⊥<0

(11)

其中:

则由条件(11)和引理2得E(ηT(t)Γη(t))≤0.

不等式(11)可以写成:

其中:

N=-2τ2ETLTQE

Φ11=2τ2ETQE-ETE

Φ22=ET[λI+2(α-β)(I-F)+ρI]E-ETQE

Φ33=-2ETQE

Φ44=2τ2ETLTQLE-ETQE

它与(5)等价.因为ETQE>0,因此对任意小的ε>0,ηT(t)Γη(t)<-ε‖δ(t)‖2.

所以(10)式可以转化为:

dV(δ(t),t)≤ 2eλtδT(t)(I-F)θdw(t)+eλtC0dt

(12)

由(12)式对不等式两边取期望可得:

从而:

E‖δ(t)‖2≤e-λtE(V(δ(0),0))+λ-1C0

(13)

对式(13)两侧取极限:

根据定义以及李雅普诺夫分析方法,误差系统是渐近稳定的,则多智能体网络系统(4)可达到均方有界一致.定理证毕.

注3: 由于在现实应用程序的多智能体的结构中,每个代理的速度通常不是一个常数而是一个时变变量, 且介于个体的通信拓扑结构可能动态改变,因此导致连接的失败或成功,结合这两个方面,考虑切换拓扑的结构.

dx(t)=[f(x(t))-Lpx(t-τ(t))]dt+θdw(t)

这里P和切换信号对应.

类似可得以下结论:

设多智能体网络系统(4)是切换拓扑网络,则如果存在正数λ,α,β且存在对称矩阵Q,使得ETQE>0并且矩阵不等式成立:

其中:

N1=-2τ2ETLPTQE

Φ11=2τ2ETQE-ETE

Φ22=ET[λI+2(α-β)(I-F)+ρI]E-ETQE

Φ33=-2ETQE

Φ44=2τ2ETLPTQLE-ETQE

那么在控制协议(3)下的多智能体非线性动力系统(5)实现均方有界一致.

3 仿真结果

该部分运用计算机数值仿真验证所得理论的正确性和有效性.考虑多智能体网络系统(3),网络节点f(xi(t),t)取2维为例.

例:

取f(xi(t),t)=[0.15sin(xi1(t)),0.15cos(xi2(t))]T∈R2,xi(t)=(xi1(t),xi2(t)).设有5个网络节点,每个节点取2维系统,网络通讯拓扑结构为强连接图,如图1所示.

随机取初始值为:

x1(0)=(1.25,0.05)T,

x2(0)=(-0.5,0.175)T,

x3(0)=(0,0)T,

x4(0)=(1.5,-0.75)T,

x5(0)=(3.0,-0.65)T.

图1 5个节点的强连接拓扑图Fig. 1 Strong connection topology of five nodes

动态延迟τ(t)=(|sinπt|,|cost|),随机噪声:

在随机噪声环境下非线性多智能体网络的两分量的状态图可以达到一致,见图2和图3.数值仿真得到延迟间隔τ≤0.7.图4为多智能体误差系统的状态.多智能体的一致性整体误差见图5,为:

图2 加入控制后每个个体第一个分量的状态图Fig. 2 State diagram of the first component of each individual under the control protocol

图3 加入控制后每个个体第二个分量的状态图Fig. 3 State diagram of the second component of each individualunder the control protocol

图4 系统(1)主体的两分量误差状态图Fig. 4 Error state diagram of two components of the system (1)

图5 系统(1)主体的一致性整体误差图Fig. 5 Graph of the consensus global error of the system (1)

4 结论

1 Paletta N, Dmytriv A, Belardo M. Landing gear concept and dynamic landing loads of the unmannedspace reentry vehicle USV3.ProcediaEngineering, 2015,114:38～45

2 Wang X F, Li J H. Control and flocking of networked systems via pinning.IEEECircuitsandSystemsMagazine, 2010,10(3):83～91

3 Beard R W, Lawton J, Hadaegh F Y. A coordination architecture for spacecraft formation control.IEEETransactionsonControlSystemsTechnology, 2001,9(6):777～790

4 余本嵩,文浩,金栋平. 绳系卫星编队动力学及控制研究进展. 动力学与控制学报, 2015,5:321～328 (Yu B S, Wen H, Jin D P. Research Progress on dynamics and control of tethered satellite formation.JournalofDynamicsandControl, 2015,13(5):321～328 (in Chinese))

5 Cao Y, Ren W, Egerstedt M. Distributed containment control with multiple stationary or dynamicleaders in fixed and switching directed networks.Automatica, 2012,48(8):1586～1597

6 Zhou J, Wu X, Yu W. Flocking of multi-agent dynamical systems based on pseudo-leader mech-anism.SystemsandControlLetters, 2012,61(1):195～202

7 Shen B, Wang Z, Liu X. A stochastic sampled-data approach to distributed filtering in sensor networks.IEEETransactionsonCircuitsandSystemsI:RegularPapers, 2011,58(9):2237～2246

8 闵海波,刘源,王仕成等. 多个体协调控制问题综述. 自动化学报, 2012,38(10):1557～1570 (Min H B,Liu Y, Wang S C, et al. Review on the problem of multi individual coordination control.JournalofAutomation, 2012,38(10):1557～1570 (in Chinese))

9 刘成林,田玉平. 具有不同通信时延的多个体系统的一致性. 东南大学学报, 2008,38(1):170～174 (Liu C L, Tian Y P. Consistency of multiple individual systems with different communication delays.JournalofSoutheastUniversity, 2008,38(1):170～174 (in Chinese))

10 Wang X, Saberi A, Stoorvogel A A. Consensus in the network with uniform constant communication delay.Automatica, 2013,49(8):2461～2467

11 Wu Q, Zhou J, Xiang L. Impulsive consensus seeking in directed networks of multi-agent systems with communication time delays.InternationalJournalofSystemsScience, 2012,43(8):1479～1491

12 Cheng L, Wang Y, Hou Z G. Sampled-data based average consensus of second-order integral multi-agent systems: switching topologies and comm-unication noises.Automatica, 2013,49(5):1458～1464

13 Xie D, Wang S. Consensus of second-order discrete-time multi-agent systems with fixed topology.JournalofMathematicalAnalysisandApplications, 2012,387(1):8～16

14 Wen G, Duan Z, Yu W. Consensus in multi-agentsystems with communication constraints.InternationalJournalofRobustandNonlinearControl, 2012,22(2):170～182

15 Li Z, Ren W, Liu X. Consensus of multi-agent systems with general linear and Lipschitz nonlinear dynamics using distributed adaptive protocols.IEEETransactionsonAutomaticControl, 2013,58(7):1786～1791

16 Liu Z W, Guan Z H, Shen X. Consensus of multi-agent networks with aperiodic sampled communication via impulsive algorithms using position-only measurements.IEEETransactionsonAutomaticControl, 2012,57(10):2639～2643

17 Li S, Du H, Lin X. Finite-time consensus algorithm for multi-agent systems with double-integrator dynamics.Automatica, 2011,47(8):1706～1712

18 Yu W, Zheng W X, Chen G. Second-order consensus in multi-agent dynamical systems with sampledposition data.Automatica, 2011,47(7):1496～1503

19 Huang M, Manton J H. Coordination and consensus of networked agents with noisy measurements: stochastic algorithms and asymptotic behavior.SIAMJournalonControlandOptimization, 2009,48: 134～161

20 Li T, Zhang, J F. Mean square average-consensus under measurement noises and fixed topologies: necessary and sufficient conditions.Automatica, 2009,45:1929～1939

21 Wu Z, Duan J, Fu X. Complex projective sync-hronization in coupled chaotic complex dynamical system.NonlinearDynamics, 2012,69(3):771～779

22 Yu W, Ren W, Zheng W X. Distributed control gains design for consensus in multi-agent systems with second-order nonlinear dynamics.Automatica, 2013,49(7):2107～2115

23 Wu Z, Duan J, Fu X. Complex projective synchronization in coupled chaotic complex dynamical systems.NonlinearDynamics, 2012,69(3):771～779

24 Yu W, Chen G, Cao M. Consensus in directed networks of agents with nonlinear dynamics.IEEETransactionsonAutomaticControl, 2011,56(6):1436～1441

25 Amelina N, Fradkov A, Amelin K. Approximate consensus in multi-agent stochastic systems with switched topology and noise.IEEEInternationalConferenceonControlApplications, 2012:445～450

26 Wen G, Duan Z, Yu W. Consensus of multi-agent systems with nonlinear dynamics and sampled-datd information: a delayed-input approach.InternationalJournalofRobustandNonlinearControl, 2013,23(6):602～619

27 Liu X, Chen T. Synchronization analysis for nonlinearly-coupled complex networks with an asymmetrical coupling matrix.PhysicaA, 2008,387:4429～4439