通信受限的多智能体系统二分实用一致性
2022-06-18陈世明姜根兰
陈世明 姜根兰 张 正
多智能体系统控制在近些年发展迅速,广泛应用于无人机编队、传感器网络、机械臂装配、多导弹联合攻击等领域.一致性作为协同控制的基础,成为多智能体系统研究中的核心问题.近年来,学者们针对多智能体系统不同类型的一致性问题进行了大量研究,如完全一致性[1−4]、领导-跟随一致性[5]、群体一致性[6]、比例一致性[7−9]等.以上一致性成果主要集中在设计控制器使智能体状态误差最终趋于零.但是在实际系统中,由于执行器偏差、计算误差和恶劣环境,智能体系统会存在通信约束(如通信时滞[10−11]、数据量化[12]等)、外部干扰、未知耦合等情况,若仍要求每个智能体的真实运动状态之间的偏差趋于零,这在有限条件下往往难以实现.因此,Dong 等[13]提出使智能体状态偏差函数在某一确定有界区间内波动的实用一致性概念,可适用于更为复杂的实际系统.
为解决不同非理想网络环境中的一致性问题,学者们对基于实用一致性概念的多智能体控制算法进行了深度研究[13−17].文献[13]研究了有向通信拓扑下具有外部扰动、相互作用不确定和时变时滞的一般高阶线性时不变群系统实用一致性问题.在实际系统中,当采样周期变大时,若要使智能体状态误差趋于零,初始状态就须非常接近,显然限制了系统的有效性.基于文献[13],文献[14]进一步探讨了二阶多智能体系统齐次采样下的实用一致性.为解决初始控制输入量过大,出现输入饱和而导致削弱系统性能的问题,文献[15]利用时基发生器,提出多智能体系统的固定时间实用一致性框架.具有振荡器的系统,也难以实现智能体状态误差最终趋于零,因此文献[16]研究了异质网络上非线性非均匀Stuart-Landa 振子的实用动态一致性.文献[17]研究了带未知耦合权重的领导-跟随多智能体系统的实用一致性.以上已有的实用一致性研究只考虑非理想网络环境中智能体之间的合作关系,即用非负权重的通信拓扑来表示.在许多实际系统中,合作与竞争关系同时存在.
文献[18]率先设通信拓扑权重为负以表示智能体间的竞争关系,提出结构平衡图假设,利用拉普拉斯算子证明了智能体系统能实现二分一致.随后该结论被推广至更一般的线性多智能体系统[19−20].文献[21]研究了切换拓扑下多智能体系统的二分一致性,建立了智能体稳态与拉普拉斯矩阵间的联系.文献[22]引入正负生成树概念,得出矩阵加权网络实现二分一致的充要条件,但只适用于结构平衡图.对于结构不平衡下的矩阵加权网络,文献[23]通过矩阵耦合,得出了实现二分一致的代数条件.文献[24]针对含有对抗关系和时变拓扑的耦合离散系统,考虑了拓扑切换后出现结构不平衡或结构平衡的两个子系统成员随时间变化的情况,实现了有界双向同步.上述二分一致性的研究大部分考虑智能体间的误差最终能趋于零,本文将着重考虑受到通信时延、数据量化影响下智能体间的误差收敛于可控区间的二分实用一致性.
量化一致性概念最早由文献[25]提出,随后文献[26]基于矩阵谱理论分别研究了通讯信息在一致量化和对数量化下多智能体系统的一致性问题.文献[27]构建了基于磁滞效应量化的多智能体网络的混杂系统模型,该混杂系统能够有效避免震颤现象,并进一步分析了系统解的有限时间收敛性.文献[28]考虑竞争关系和通信量化下多智能体系统的二分一致性.文献[29]研究了具有量化通信约束的非线性多智能体系统分布式二分一致性问题.以上论文对通信量化做了大量研究,但均未考虑通信时滞,而时滞也是影响多智能体系统一致性的重要因素.
综合考虑上述因素,本文将以带有通信时滞和量化数据等通信约束且同时存在合作、竞争关系的实际系统为对象,研究其二分实用一致性问题,提出了基于融合时滞项、取整函数、符号函数的量化器的右端不连续控制协议.根据微分包含理论和菲利波夫解的框架证明了控制器在右端不连续情况下仍能求得系统的全局解,实现智能体位置状态收敛至模相同但符号不同的可控区间.相较于文献[17],本文同时考虑了智能体间的合作与竞争关系.相较于文献[18,20],本文考虑了通信时滞、量化数据等通信约束对智能体系统的影响.在文献[25,28]的基础上,本文将渐近一致性推广至实用一致性,使智能体间的误差收敛于一个可控区间,且收敛上界值与任何全局信息和初始值无关.
1 预备知识及问题描述
1.1 图论
1.2 规范变换
引入一类正交矩阵C,其定义如下:
易得,C满足CTC=CCT=I,且C−1=C.diag{σ1,σ2,···,σn}表示对角矩阵,其对角线元素为{σ1,σ2,···,σn}.对于固定无向网络拓扑和零通信时延的多智能体系统,常采用控制协议x˙(t)=u(t)=−Lx(t),对其规范变换.令z=Cx,C ∈C,由C−1=C,x=Cz,则
其中,LD=CLC=D −CAC为规范变换后拉普拉斯矩阵,
引理 1[18].L与LD等谱,即具有相同的特征值集合sp(L)=sp(LD).
1.3 右端不连续微分方程与微分包含Filippov 解
针对右端不连续微分方程,在微分包含理论和菲利波夫解的框架基础下求全局解.考虑如下m维微分方程
1.4 问题陈述
考虑包含n个智能体的系统,智能体i的动力学方程为
其中xi(t)∈R 表示智能体i的位置状态变量,ui(t)∈R表示智能体i的控制输入.
定义 3.给定的控制器ui,i=1,2,···,n,若对任意初始值xi(0),i=1,2,···,n,都存在一个不依赖任何全局信息和初始值的正数ε,使得
则称系统(6)能实现二分实用一致.
2 通信受限的多智能体系统二分实用一致性
针对多智能体系统(6),提出如下控制器,
其中Q(x) 为 量化函数,定义Q(x)=⎿(x/ηγ)+0.5」γ,i=1,2,···,n,γ为量化水平参数,η ∈(0,1] 为量化器精度,τ为智能体j向智能体i通信传输时发生的通信延迟,⎿·」为向下取整函数,s ign(·) 为符号函数.
本文讨论的是有向强连通符号图下多智能体系统二分实用一致性问题,系统邻接矩阵中存在负元素,由式(2)得变换后的邻接矩阵为,
其中σi,σj={−1,1}.
上述量化器是将连续状态空间映射到离散信息符号码集合,智能体状态仅取整数,在控制器(8)作用下,系统(6)本质上是一个右端不连续的非光滑系统,其解需要在菲利波夫意义下讨论.
定义 4.如果函数x(t):[−τ,T)→Rn满足:
则 [x(t),w(t),w′(t)]:[−τ,T)→Rn×Rn为系统(6)满足初始条件 (ϕ(t),ψ(t),ψ′(t)) 的解.
定理 1.对任意初始向量函数ϕ(t) 和任意可测向量输出函数ψ(t)、ψ′(t),系统(11)存在全局解.
证明.1)局部解的存在性
基于参考文献[2]对引理1 的证明,易得系统(11)在 [ 0,T) 上存在局部解.依据泛函微分方程理论,通过局部解的有界性可得存在全局解.故进一步证明局部解的有界性.
2)设系统(11)的解为[x(t),w(t),w′(t)]:[−τ,T)→Rn×Rn,令
若能证明Y(t) 对t为非增函数,y(t) 对t为非减函数,则上述解有界.我们将利用反证法证明该解的有界性.首先分四步证明Y(t) 对t为非增函数.
定理 2.假设多智能体系统的固定有向通信拓扑G为强连通符号图,考虑存在通信时延和量化数据通信约束的多智能体系统(6),在控制器(8)的作用下,系统在任意初始条件下均能实现二分实用一致,即
其中,∀ε>0.
证明.构造如下Lyapunov 函数:
由式(1),对∀ε>0,有
由此可得,对任意一个智能体i的状态xi(t) 都能收敛到集合 [ (θ −0.5)γη,(θ+0.5)γη] 中.由此可得,
3 仿真实例
实例 1.考虑由6个智能体构成的多智能体系统,其有向通信拓扑结构如图1 所示.该拓扑图满足结构平衡,图中两个子群分别为V1={1,2,3}和V2={4,5,6},子群之间为竞争关系,子群内部为合作关系.
图1 拓扑图Fig.1 Topological graph
由通信拓扑图不难得到邻接矩阵A,对邻接矩阵A规范变换,取转换矩阵为C=diag{1,1,1,−1,−1,−1}. 其中,转换矩阵C为正交矩阵,C=diag{σ1,σ2,···,σn},σi={−1,1},满足CTC=CCT=I,C−1=C; d iag{σ1,σ2,···,σn}表示对角矩阵,其对角线元素为{σ1,σ2,···,σn}.
取η=1,γ=3,τ=0.1,各智能体初始值x(t)=[1 2.5 6−1−4−3],t ∈[−0.1,0).由式(29)易得,l imt→∞(|xi(t)|−|xj(t)|)=γη=3.
图2 为系统(6)在控制器(8)的作用下各智能体位置状态变化曲线,由图可知各智能体位置状态绝对值的误差收敛于可控区间 [0,3],存在竞争关系的两个子群最终能实现收敛,即通信受限的多智能体系统能实现二分实用一致.
图2 γ =3, η =1 智能体位置状态轨迹Fig.2 γ =3, η =1 The trajectories of all agents
图3、图4 为在相同初始值状态下分别取γ=1、γ=0.1时的各智能体位置状态曲线,表明通过改变γ值可以控制智能体位置状态绝对值误差的波动区间,所设计的γ值越小,智能体位置状态绝对值的误差波动区间也越小.
图3 γ =1, η =1 智能体位置状态轨迹Fig.3 γ =1, η =1 The trajectories of all agents
图4 γ =0.1,η =1 智能体位置状态轨迹Fig.4 γ =0.1,η =1 The trajectories of all agents
实例 2.为了进一步说明本文的研究意义,选用8个智能体组成的最邻近耦合小世界网络系统,智能体互连构成的有向拓扑图如图5 所示,此处无向图为一种特殊的有向图,图中未标权重的连边权重设为1.其中,两个子群V1={1,2,3,4}、V2={5,6,7,8},取η=1,γ=0.5,τ=0.1,智能体初始状态分别为x(t)=[1 2 4 5−1−2−4−5],t ∈[−0.1,0).
图5 最邻近耦合小世界网络Fig.5 Nearest-neighbor coupled network
对邻接矩阵A规范变换,取转换矩阵为C=diag{1,1,1,1,−1,−1,−1,−1}.由式(29) 易得,limt→∞(|xi(t)|−|xj(t)|)≤ε=γη=0.5.
图6 为系统(6)在控制器(8)的作用下各智能体位置状态变化曲线.由图可知,各智能体位置状态绝对值的误差收敛于可控区间 [ 2.8,3.2],存在竞争关系的两个子群最终能实现收敛,运用本文所设计的控制策略,最邻近耦合小世界网络系统能实现二分实用一致.
图6 γ =0.5,η =1 智能体位置状态轨迹Fig.6 γ =0.5,η =1 The trajectories of all agents
4 结论
本文研究了有向强连通符号图下通信受限的多智能体子群系统二分实用一致性问题,设计了一种基于量化器的分布式控制协议,使智能体位置状态绝对值的误差收敛于可控区间,并得到了误差收敛上界值,该上界值不依赖于任何全局信息和初始状态,仅与量化器参数有关,所设计量化水平参数越小,收敛区间也越小.后续工作将考虑推广至离散系统和高阶系统.