APP下载

基于牵制控制的异质多智能体系统的群一致性研究

2019-04-10陈世明邱昀黄跃江冀海

智能系统学报 2019年2期
关键词:拓扑图二阶异质

陈世明,邱昀,黄跃,江冀海

(华东交通大学 电气与自动化工程学院,江西 南昌 330013)

近年来,多智能体系统的一致性在生物系统、机器人编队、传感器网络、无人机编队、水下驱动装置和群决策等问题中都具有潜在的应用,所以吸引了从物理、数学、工程、生物学和社会学等各个领域的研究人员的广泛关注。现有的多智能体系统的一致性问题的研究成果大多建立在同质多智能体的基础上,即所有的多智能体都具有相同的动力学行为。然而,在实际中,因为外部的影响或交互的限制需要具有不同动态行为的多智能体完成一个共同的目标。因此,异质多智能体系统的一致性问题的研究具有更加重要的现实意义。

最近,异质多智能体的一致性问题得到了越来越多的关注。现有的研究异质多智能体系统的一致性主要考虑的是一阶和二阶结构的结合,而文献[1]中针对一阶智能体、二阶智能体和EL智能体组成的异质多智能体系统中分别对EL智能体参数确定和不确定情况下的一致性进行了研究。在协调控制中,根据发生的变化每个群体中的智能体必须达成一致。但是,由于环境、情形、合作的任务或者是时间的变化可能导致一致的状态不同。譬如对深陷火灾的多名人员进行搜救需要多智能体系统进行分工配合完成多个目标任务,因此,一个关键的问题就是设计合适的协议,使网络中的智能体达成多个共识状态。这就是多智能体系统的群一致性问题,关于系统中包含相同动力学特性智能体的群一致性问题取得了优秀的成果[2-6],文献[5-6]提出当各个子群满足入度平衡这个前提才能实现一阶智能体系统的群一致性,即允许拓扑结构中节点之间权重存在负值的情况,但是这个条件过于苛刻。近年来,异质多智能体系统的群一致性也取得了一定的进展。文献[7]中研究了在固定拓扑下的异质多智能体系统的群一致性;文献[8]中基于图论、矩阵理论和动力学理论研究了异质多智能体系统的群一致性问题,并且推广到了有向和切换拓扑中。文献[9]中考虑了部分的一阶智能体具有输入饱和,基于牵制控制提出了具有输入饱和的异质多智能体系统的群一致性;文献[10]中研究了具有输入延时的异质多智能体系统的动态分组一致性;文献[11]中利用自适应控制对不确定非线性动态结构进行线性化处理,利用牵制控制实现了多智能体系统的群一致性。

以上主要是研究线性的异质多智能体系统或者是具有相同非线性动态结构的群一致性,但是对于包含线性和非线性智能体组成的多智能体系统的群一致性却研究甚少,设计合适的控制协议实现包含非线性结构的异质多智能体系统的群一致性更具挑战,本文主要研究由一阶智能体、二阶智能体和非线性的EL结构智能体组成的异质多智能体系统的群一致性,针对无向的固定的通信拓扑情况,提出了基于牵制控制的群一致性控制协议。

1 预备知识和问题描述

1.1 代数图论

假设 G =(v,ε,A)是 一个包含 n 个节点的加权无向 拓 扑 图 , 其 中 v =([v1,v2,···,vn)表 示 节 点 集 ;ε=v×v 表 示边集; A =aijn×n是加权邻接矩阵,如果 eij∈ ε, 则 a(ij>0 , 否则, aij=0 , 并且 aij=aji。如果存在边 eij=vi,v{j,则说明} 节点 vi可 以从节点 vj中获得 信 息 。 Ni=vjeji∈ ε 表 示 节 点 vi的 邻 居 节 点集。节点vi和 vk之 间存在一系列的边(vi,v2),(vi,v2),···,(vk-1,vk),则说明两节点之间存在一条路径[12],如果无向拓扑图中任意两个节点之间存在一条路径,则说明无向拓扑图是连通的。 L =D-A表示拓扑图的拉普拉斯矩阵,其中 D =diag(d1,d2,···,dn)表示拓扑图的度矩阵,aij表 示节点i的 度。L=可定义为

式中 i, j=1,2,···,n。

1.2 问题描述

考虑一个具有 n个多智能体的异质多智能体系统,其中包含 l 个一阶多智能体、 m 个二阶多智能体和 n -m-l个EL智能体。一阶结构的多智能体满足:

式中: xi(t)∈Rn表示智能体的位置向量,ui(t)∈Rn表示第i个智能体的控制输入。二阶结构的多智能体的动力学方程满足:

式中: i =l+1,l+2,···,m; xi(t)∈ Rn表示智能体的位置向量, vi(t)∈Rn表 示智能体的速度向量,ui(t)∈Rn表示第i个智能体的控制输入。EL智能体的动力学方程满足:

式中: i =m+1,m+2,···,n; xi(t)∈ Rq×1、 vi(t)∈ Rq×1和ui(t)∈ Rq×1分 别表示第i个智能体的位置信息、速度 信 息 和 控 制 输 入 ; Mi(xi) ∈ Rp×q为 惯 性 矩 阵 ;Ci(xi,vi)为柯式力矩阵;EL智能体满足如下性质[13]。

性质1惯性矩阵 Mi(xi)具有上下界,即

性质2矩阵(x)-2C(x,v)是一个斜对称iiii矩阵,对于任意给定的向量 r ∈Rp,有:

假定将异质多智能体网络分成 k (k≥2)群,如果智能体属于第 t个群,则记 σi=t,xσi是对智能体进行分群的常数,且当 σi=σj时,即表示同一个子群,并且有 xσi=xσj,否则, xσi≠ xσj。

定义1 对于任意给定的初始状态 xi(0),vi(0),若异质智能体系统满足如下条件:

则说明异质多智能体系统实现了 k群一致性。

注1 本文是基于二维空间,所得结果都可以利用克罗内克积(Kronecker product)推广到 n维空间。

引理1[14]对于定义在 Rn上的动态系统 x˙ =f(x),其中 f (x)为 连续函数,设 V (x):Rn→R是一阶光滑函数,且满足:

1)当 ‖ x‖→ ∞时 , V (x)→ ∞;

2)对于任意的{ x ∈Rn,V.(x)≤0。}

定义集合 S =x∈Rn:V.(x)=0, M 是 S中的最大不变集,则对于∀ x0∈Rn, 当 t → ∞时 , x (t)趋 于不变集 M 。

2 异质多智能体系统的群一致性控制

根据邻居个体之间的信息交互和EL动力学结构的性质,设计如下控制协议:

式中: κ ,λ 是 正定对角矩阵,当智能体i为牵制个体,则可以获得静态虚拟领导者的状态信息,则bi=1, 否则( bi=)0。各个群中的静态虚拟领导者的状态设为 xσi,0,σi=1,2,···,k , xσi为该群智能体期望的状态。

定理1设智能体间的通信拓扑图是无向连通的,由式(1)~(3)组成的异质多智能体系统在控制协议(7)的作用下可实现群一致性,并且各群中智能体的状态都能够趋于期望的状态。

证明根据控制器(7),可以将式(1)~(3)改写为

令ei=xi-xσi,i=1,2,···,n, 则有:

根据式(9),系统(8)可写为

根据EL智能体性质1可选择李雅普诺夫函数如下:

对李雅普诺夫函数进行求导:

根据EL智能体的性质2,可知:

由于异质多智能体系统的通信拓扑是无向的, aij=aji,则有:

将式(15)代入式(14)可得:

将式(13)、式(16)代入到式(12)可得:

由引理1,最大不变集 M 满足:

由式(10)和(18)可得,最大不变集 M 满足:

显然有

联立式(20)和式(21)可得

由式(22)可得最大不变集 M 为

将ei=xi-xσi代入到式(23),可以知道对于 x (0)、v(0), 当 t →有:

综上所述,由式(1)~(3)组成的异质多智能体系统在控制协议(7)的作用下可实现群一致性,并且各个子群的最终状态趋于该子群虚拟领导者的状态。

推论1通信拓扑图是无向连通的,控制协议(7)中不考虑牵制策略的作用下,由(1)~(3)组成的异质多智能体系统也能够实现群一致性。

证明考虑李雅普诺夫函数:

对李雅普诺夫函数求导化简后可得˙V=0

同理由引理1可知,当 时,有

由式(27)可得:

式(28)、式(29)相加可得:

由式(27)和式(30)可知,最大不变集 M 可化为

将ei=xi-xσi代入到式(31)中,可以得到:

综上所述,推论1得证。

注2 所提控制协议中只需满足无向固定拓扑是连通的条件就能实现异质多智能体系统的群一致性,从而放宽了文献[5-6]中实现群一致性的条件。

3 数值仿真

通过MATLAB仿真平台来验证所提群一致性控制协议的可行性,考虑一个由两个一阶结构的智能体(智能体1、2)、两个二阶结构的智能体(智能体3、4)和两个EL智能体(智能体5、6)构成的异质多智能体系统,它们的通信拓扑结构图如图1所示,将通信拓扑图分成两个群体 G1和 G2,每个群体中都包含不同结构的智能体。多智能体的状态信息 [xi(1)]T,xi=vi=[vi(1)vi(2)]T;控制输入为ui=[ui(1)ui(2)]T,初始状态信息为

图1 异质多智能体系统的通信拓扑图Fig.1 Conmmunication topology of heterogeneous multiagent systems

在各群中任意选择智能体为牵制节点,以智能体1、2为例。 G1中的虚拟领导者的状态信息为(5,0), G2中的虚拟领导者的状态信息为 (3 ,0)。在牵制节点的作用下异质多智能体系统的群一致性的仿真结果如图2所示。

图2 牵制控制作用下的仿真结果Fig.2 Simulation restults under the effect of pinning control

在同样的初始条件下,不考虑具有牵制控制的群一致性策略的仿真结果如图3所示。

图3 未加牵制控制的仿真结果Fig.3 Simulation results of without pinning control

由图2(a)和(c)可以看出,群 G1中的智能体1、3和5位置状态最终都趋于5,群 G2中的智能体2、4和6位置状态最终都趋于3,从图2(b)和(d)可以看出,群 G1和 G2中的智能体速度最终都趋于0。说明存在复杂的非线性结构的EL智能体构成的异质多智能体系统在基于牵制控制的控制协议作用下,在同一个群中的智能体的位置状态趋于同一个状态值,不同群的智能体的位置状态趋于不同的状态值,异质多智能体系统实现了群一致性,并且各群智能体状态最终收敛到虚拟领导者的状态,即期望的状态。由图3(a)和(c)可以看出,两个群体趋于不同的状态,实现了群一致,但相对于具有牵制控制的群一致性仿真结果相比,施加牵制控制的各个子群可以到达先前设定的预先期望状态,而未施加牵制控制的各个子群体最终的一致平衡状态不能趋于一个预先期望的状态。

4 结束语

本文研究了由一阶智能体、二阶智能体和EL智能体组成的异质多智能体系统的群一致性,为了实现各群中智能体状态能够趋于期望的状态,提出基于牵制控制的分布式控制协议,通过代数图论、李雅普诺夫和拉塞尔不变集原理证明了该种控制协议的充分条件,通过MATLAB仿真平台进行数值仿真,各群中智能体的状态信息趋于虚拟领导者的状态,即各群期望的状态信息。实现了由线性智能体和非线性智能体构成的异质多智能体系统的群一致性,从而实现对以往研究线性智能体构成的异质多智能体系统的群一致性的扩展。

猜你喜欢

拓扑图二阶异质
简单拓扑图及几乎交错链环补中的闭曲面
基于异质分组的信息技术差异化教学
二阶整线性递归数列的性质及应用
“对赌”语境下异质股东间及其与债权人间的利益平衡
基于含圈非连通图优美性的拓扑图密码
二阶线性微分方程的解法
一类二阶中立随机偏微分方程的吸引集和拟不变集
校园网络规划设计
Ag2CO3/Ag2O异质p-n结光催化剂的制备及其可见光光催化性能
非线性m点边值问题的多重正解