APP下载

动态拓扑下时变时延多智能体系统的协同输出调节问题研究

2019-07-03刘自理严卫生张守旭

西北工业大学学报 2019年3期
关键词:网络拓扑时变控制算法

刘自理, 严卫生, 张守旭

(西北工业大学 航海学院, 陕西 西安 710072)

由于在编队控制[1-2]、目标跟踪[3]、覆盖控制[4]、姿态控制[5]等领域的广泛应用,近年来多智能体系统的协同输出调节问题得到了越来越多的关注。

多智能体系统的协同控制问题可根据系统内有无领导者分为均匀一致性问题[6]和主从跟踪一致性问题[7]。本文研究的协同输出调节问题属于主从跟踪一致性问题,该问题的解决需要达成2个条件:①保证闭环多智能体系统的稳定性;②确保输出信号与外部信号之间的追踪误差趋近于零。该外部信号可代表外部输入或者外部干扰,由外部系统(即领导者系统)产生。经典的多智能体系统输出调节问题最初由Davison、Francis等[8-9]提出,但其控制器要求多智能体系统内的每个智能体不仅需要获知自身状态信息而且需要获知外部系统的状态变量信息。针对部分跟随者无法直接获知外部系统状态变量的多智能体系统,Huang等[7]提出了分布式协同控制算法以解决多智能体系统输出调节问题,该项研究可被看作经典输出调节问题的延伸。随后,文献 [10-12] 对多智能体系统协同输出调节问题进行了一系列扩展性研究,但是这些研究中多数没有考虑多智能体通信网络中的时延现象或者假设时延为固定时延。

事实上,大多数的多智能体系统都基于无线网络进行通信,因此在智能体通信过程中不可避免地会产生通信时延[13],文献[14]的研究对象为含有通信时延的多智能体系统,但解决的是无领导者的多智能体系统一致性问题,文献[15]研究了具有离散时间时延多智能体系统的输出调节问题,但其关注的是固定时延。由于每个智能体所处的外部环境和通信目标是时变的,智能体通信过程中发生的时延一般也为时变的。文献[16]研究了时变通信时延的多智能体一致性问题,但其关注的是平均一致性问题。由于多智能体通信网络中时变时延的存在,各智能体控制器将会无规律地异步更新邻居节点的状态信息,这将为分布式反馈控制算法设计增加难度,从而给多智能体系统协同输出调节问题的解决带来极大困难,这是本文所面临的第一个难点。

另外,在智能体通信过程中,产生时变通信时延的同时数据丢失现象也将随机出现[17],这将导致多智能体系统通信网络的拓扑结构动态地发生变化,从而给多智能体闭环控制系统的稳定性分析和跟踪误差的收敛性分析造成极大困难。文献[18]研究了通信网络中存在数据丢包的多智能体一致性问题,但其关注的是平均一致性问题。文献[11,19-21]研究了动态网络拓扑下的多智能体输出调节问题,但并未讨论数据丢包和通信时延同时存在时的一致性问题。文献[22]对多智能体系统动态网络拓扑下存在时延现象的输出调节问题进行了研究,但其关注的是固定时延。目前已发表文献中,对通信网络中同时存在数据包丢失和时变时延现象的多智能体系统协同输出调节问题的研究成果较少,这也是本文所面临的第二个难点。

基于上述研究现状分析,本文主要研究动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题。本文通过引入队列机制,将时变时延多智能体系统转化为具有固定时延和随机数据丢包的多智能体系统,随后设计出相应的状态观测器,进而提出分布式测量输出反馈控制算法。该算法能有效解决随机数据丢包和时变通信时延同时存在情况下的多智能体输出调节问题。针对不稳定和稳定外部系统,分别给出了解决多智能体系统输出调节问题需要满足的条件。

1 问题阐述

1.1 图论

若有向图G中存在一个边序列(v1,v2),(v2,v3),…,(vk-1,vk),则称vk由v1可达。若有向图G中的每一个智能体都由vi可达,则称图G中至少包含一个以vi为根的生成树。

1.2 队列机制

考虑引入文献 [15] 中的队列机制来处理多智能体通信过程中伴随的时变时延现象。

假设G内的所有智能体时钟同步并且数据包都以h为周期向外发送。令τ(dmin<τ

在t∈[kh,kh+τ)内,当有数据包到达vi的接收器时,vi将检查该数据包的时间戳,若该数据包在kh时刻被发送,则vi将其放入队列中,否则该数据包将被丢弃;在t=kh+τ时刻,vi将利用接收器队列中的数据更新其控制输入;在t∈[kh+τ,(k+1)h)内,所有到达vi的数据均被看为过时信息而被丢弃。通过引入队列机制,在每个周期内G内的所有智能体都将在t=kh+τ时刻同步更新控制输入。

假设1通信网络中,任意2个智能体的通信与其他智能体无关;独立同分布的时变通信时延服从均匀分布U[0,dmax],其中dmax为最大通信时延;随机丢包过程服从伯努利分布。

1.3 系统描述

一般情况下,固定拓扑下无时延的线性离散多智能体系统中的跟随者系统可表示为如下形式:

式中,i=1,…,n,xi∈Rp,ui∈Rq,ei∈Rc,υ∈Rd分别表示第i个智能体系统的状态,控制输入,追踪误差和外部信号;Ai∈Rp×p,Bi∈Rp×q,Ei∈Rp×d,Ci∈Rc×p,Di∈Rc×q和Fi∈Rc×d均为常数矩阵;ymi∈Rcm表示第i个智能体的测量输出,其中,角标中的m表示此变量为测量值,i指代第i个智能体;Cmi∈Rcm×p,Dmi∈Rcm×q,Fmi∈Rcm×d。

外部信号υ可以表示外部输入或外部干扰,它可由如下外部系统产生

υ(k+1)=Sυ(k)

式中,S∈Rd×d为常数矩阵。

为保证信息传输的时效性,假设本文研究的多智能体系统中只有邻居节点之间才有数据传输,并且各智能体不对外转发其所接收的各项信息。因此,若智能体vj是智能体vi的邻居节点,则vi只能将vj的状态信息作为vi自身的控制输入,而不能作为中继器将vj的信息转发给其他智能体vk。由于不能保证每个跟随者的邻居节点集合中都包含有领导者,为保证无法接收外部信号的跟随者也能实现对领导者的跟踪控制,可考虑设计如下分布式测量输出反馈控制算法

在队列机制下,针对通信网络中存在随机数据丢失和时变通信时延的多智能体系统,考虑描述跟随者系统如(1)式所示

(1)

外部系统如(2)式所示

υ((k+1)h)=Sυ(kh)

(2)

(1)式和(2)式共同构成了本文研究的动态网络拓扑环境下具有时变通信时延的多智能体系统,该系统包含n+1个多智能体,其中,(1)式表示跟随者系统,(2)式表示领导者系统。

在队列机制下,设计外部系统状态变量的动态观测器如下

(3)

针对智能体不能直接测量自身状态信息的情况,设计自身状态变量动态观测器如下

(4)

因此,结合(3)式和(4)式可设计分布式测量输出反馈控制算法如(5)式所示

(5)

结合(1)~(5)式可得智能体vi的闭环控制系统如下所示

(6)

式中,In⊗S表示单位矩阵In与矩阵S的克罗内克积,1n表示元素为1的n维列向量。

Al(k)=

定义1 给定多智能体系统(6),若存在分布式测量输出反馈控制算法(5)使得离散时间闭环多智能体系统满足:

1) 当外界输入为零时,闭环多智能体系统渐进稳定;

则表明动态网络拓扑环境下多智能体系统的协同输出控制问题可被反馈控制算法(5)解决。

2 主要结论

在保证一般性的前提下,首先给出解决多智能体协同输出调节问题的标准假设条件:

假设2外部系统的系统矩阵S的所有特征值的模均不小于1。

假设3(Ai,Bi) 是可镇定的,i=1,…,n。

假设4(Cmi,Ai) 是可观测的,i=1,…,n。

定理1若假设1~5同时成立,令增益矩阵Ki1和Li分别满足假设3和假设4,当且仅当参数φ(k)和Ki2在每个周期内同时满足以下2个条件:

1)

2) 矩阵方程

AiXi+BiKi1Xi+BiKi2+Ei=XiS

CiXi+DiKi1Xi+DiKi2+Fi=0

有解(Xi,Ki2);

则称反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统(6)的协同输出调节问题。

证明:

则可得

AiXi+BiKi1Xi+BiKi2+Ei=XiS

CiXi+DiKi1Xi+DiKi2+Fi=0

综上可得,在假设1~5同时成立的前提下,当且仅当参数φ(k)和Ki2在每个周期内均满足定理1的2个条件时,反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统协同输出调节问题。

假设6外部系统的系统矩阵S的所有特征值的模均小于1。

定理2若假设1和假设3~6同时成立,令增益矩阵Ki1和Li分别满足假设3和假设4,当且仅当参数φ(k)在每个周期内均满足

则称反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统(6)的协同输出调节问题。

证明:

同理定理1的证明过程可得,若选取满足假设3和假设4的增益矩阵Ki1和Li,当且仅当参数φ(k)在每个周期内均满足

综上可得,在假设1和假设3~6同时成立的前提下,当且仅当存在参数φ(k),使得定理2中给出的条件在每个周期内均成立,则测量输出反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体系统协同输出调节问题。

3 仿真结果与分析

本节以如下多智能体系统为例进行仿真分析。

假设跟踪者系统如下所示

其领导者系统为如下形式

若转换为(1)式和(2)式所示形式,可得

令Ki1=[-1.5,-0.5],Li=[-1.5,-3]T。显然,假设3和假设4成立。

本节所研究的多智能体系统中存在5个多智能体,其中节点0代表领导者,节点1~4代表跟随者。初始时刻的多智能体网络拓扑如图1所示,此拓扑结构中存在以0节点为根的有向生成树。

图1 初始网络拓扑

由于多智能体系统在通信过程中存在随机的数据丢包,多智能体的通信网络在[kh,kh+τ]内的不同时刻会具有不同形式的拓扑结构,在某些特定时刻其网络拓扑结构中将不再存在生成树,如图2所示。

图2 数据丢包时的网络拓扑集合

图3 期望网络拓扑

从图3a)中可得:

图4 外部系统不稳定时跟随者的追踪误差

由定理2可知,分布式测量测量输出反馈控制算法(5)可以解决动态网络拓扑环境下存在时变通信时延的多智能体协同输出调节问题,仿真结果如图5所示。

图5 外部系统稳定时跟随者的追踪误差

由图4和图5可得,针对不稳定和稳定的外部系统,测量输出反馈控制算法(5)均可使得其所有跟随者的跟踪误差渐进趋向于零,动态网络拓扑环境下存在时变通信时延的多智能体系统协同输出调节问题可以被有效解决。

4 结 论

本文研究了动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题。主要得到以下3项结论:①基于队列机制,设计了新的分布式测量输出反馈控制算法以解决具有随机数据丢包和时变通信时延的多智能体系统协同输出调节问题;②在标准假设成立的前提下,针对不稳定外部系统,给出了动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题的解决条件;③在标准假设成立的前提下,针对稳定外部系统,给出了动态网络拓扑下具有时变通信时延的多智能体系统协同输出调节问题的解决条件。仿真分析验证了本文所提出的测量输出反馈控制算法能够有效解决具有通信时延和数据丢失的多智能体系统协同输出调节问题。另外,在基于队列机制的多智能体系统协同输出调节问题中,队列时间的取值十分重要,因此,最优队列时间问题将是未来工作的重心之一。

猜你喜欢

网络拓扑时变控制算法
基于通联关系的通信网络拓扑发现方法
列车动力学模型时变环境参数自适应辨识
能量高效的无线传感器网络拓扑控制
基于ARM+FPGA的模块化同步控制算法研究
2017款捷豹F-PACE网络拓扑图及图注
高精度位置跟踪自适应增益调度滑模控制算法
基于时变Copula的股票市场相关性分析
基于时变Copula的股票市场相关性分析
劳斯莱斯古斯特与魅影网络拓扑图
基于MEP法的在役桥梁时变可靠度研究