基于周期事件触发的多智能体系统平均一致性
2021-12-01张忠艺徐冬梅
张忠艺,徐冬梅
(上海工程技术大学 电子电气工程学院,上海 201620)
0 引言
在过去的10 年中,网络化控制系统在学术研究和工程领域中受到广泛研究。网络化控制系统的一个重要分类就是多智能体系统,是由多个具有感知、通信、计算和执行能力的智能体组成的系统,所有智能体通过网络拓扑进行信息交互,从而完成复杂的任务。该领域的研究方向包括平均一致性、群集问题、编队控制、区域覆盖问题等[1-3]。
一致性是指通过设计合理的控制协议,所有智能体的状态和速度都逐渐达到一个共同的值,这是多智能体系统协调控制的基础。在实际系统中,智能体的资源,通信和执行能力通常受到限制,因此设计适当的控制协议,尽可能减少资源消耗非常重要。为了解决上述问题,传统的处理方式是周期采样控制,即事先确定好采样时刻,而不是动态的根据智能体的状态、时间确定,这种方式在一定程度上降低了计算和通信成本,具有局限性,当连续两次采样数据间仅有微小变化或者临近收敛状态时刻时,会造成不必要的资源浪费,从而缩短系统的使用寿命,而且基于周期采样控制得到的大多数采样数据都是多余的,对多智能体系统达到一致性没有什么帮助,为了解决上述不足,事件触发控制方法应运而生[4-5]。基于上述的优点,事件触发控制被广泛应用到多智能体一致性的研究中,其中主要分为集中式事件触发和分布式事件触发两种算法。集中式事件触发机制的本质就是为系统里的所有智能体设计一个共同的误差和阈值,也就是共用相同的事件触发条件。当系统的整体误差达到设定的阈值时,所有智能体同时触发一次事件,并且同时更新所有智能体的控制输入,可以看出每个智能体的触发时刻都是相同的,即共用一套触发时刻序列[6]。然而分布式事件触发机制的本质就是为系统里的每个智能体设计一个事件触发条件,每个智能体自己判断决定是否触发一次事件,并且仅仅更新自己的控制输入,至于邻居的控制输入则保持不变。可以看出分布式事件触发机制中每个智能体都拥有一套特有的触发时刻序列。与集中式事件触发机制相比而言,分布式事件触发机制可以有效地减少智能体之间的通讯交流,进一步减少了通信资源的消耗[7-9]。Zhu 等人通过事件触发机制研究了二阶多智能体系统的一致性问题[10];随后研究学者们开始运用事件触发机制来分析一般线性多智能体系统的一致性问题[11-12];Zhu等人考虑了一般线性多智能体系统在具有输入时间延迟的情况下,对于每个智能体的控制输入更新设置都是基于事件的,并且为了实现领导-跟随一致性提出了一个必要条件和两个充分条件[13];Wang等人研究了基于事件触发机制的混合多智能体系统的一致性问题,即在离散时间和连续时间下的动态个体构成了一个混合多智能体群,同时也提出一个自触发控制算法来避免对事件触发条件的连续监测[14]。
在事件触发控制中,触发条件设计得是否合理往往取决于能否有效地避免Zeno 现象,Zeno 现象是指事件在有限时间内被触发无数次,这在现实中是不可行的。因此周期事件触发控制应运而生,其是一种结合周期采样和事件触发控制的机制,周期性的对事件触发条件进行检测,任意两次触发时刻的间隔存在一个正的下界,避免了Zeno 现象。Meng 等人研究了基于周期事件触发机制的一阶多智能体系统平均一致性问题,所提出的事件触发条件需要在所有检测时刻进行状态信息更新。在此过程中,每个智能体需要接收其邻居智能体的状态信息,并将其自身的状态信息发送给其邻居智能体,从而导致了大量的通信次数和系统资源消耗[15]。
基于上述,本文研究了基于周期事件触发机制的一阶多智能体系统的平均一致性问题,设计一个新的事件触发条件,使用事件触发状态作为阈值,缩小每个智能体在每个采样瞬间都必须与其邻居智能体通信的需求。因此,只有在事件发生的瞬间,一个智能体才会把其状态信息传递给其邻居,进而减少了控制输入的更新次数,减少了资源消耗,并且采样周期选择范围更小,提高采样精确性。
1 相关知识
1.1 图论知识
在多智能体系统的协调控制中,通常假设每个智能体通过智能体之间的通信来获得其它智能体的状态信息,通信网络可以用通信图来表示。记G =(V,E,A)表示有n个智能体的无向通信图,其中V={1,2,…,n} 表示n个智能体,E⊆V × V表示智能体之间的通信连接。如果vi vj∈E是一条边,则智能体vi和vj是相邻的,或者说智能体vj是vi的一个邻居。类似的,智能体vi的邻居Ni可以定义为Ni={j |vi vj∈E,j≠i},在无向图G中,如果对于任意两个智能体v1,v2总存在一条路径从v1到v2且从v2到v1,就称该无向图为无向连通图。
矩阵A =(aij)∈Rn×n是无向图G的相邻矩阵,表示各智能体之间的连接关系,定义为式(1):
根据智能体vi的度di定义图G的度矩阵D,式(2):
度矩阵D是一个对角矩阵,其对角元素di是智能体vi的邻居总数。在图论中,一个重要工具是Laplacian 矩阵L,定义为:L =D- A。在无向图G中,Laplacian 矩阵L是对称且半正定矩阵,即L =LT≥0,因此其特征值都是非负数,记为0 ≤λ1≤λ2≤…≤λn,而且至少有一个特征值λ1=0,且其对应的特征向量是全1 向量,即=,其中1n =(1,1,…1)T,0n =(0,0,…0)T。如果图G是无向连通图,则λ2>0,记为0=λ1<λ2≤…≤λn,第二个特征值λ2又称为图的代数连通度,λn是Laplacian 矩阵L的最大特征值。
1.2 相关引理
引理1[8]
其中λ2(L)和λn(L)分别是Laplacian 矩阵L的第二小特征值和最大特征值。
引理2[15]对于半正定矩阵A∈Rn×n,∀a,b∈Rn,有,其中,Rn表示n维实向量构成的集合。
1.3 系统模型
考虑具有n个智能体的系统,其中每个智能体都有能力进行计算,移动和相互通信。每个智能体的状态遵循动态方程(4):
式中:xi(t)∈Rn表示第i个 智 能体的状态,ui(t) 表示第i个智能体的控制输入。
系统中智能体之间的通信拓扑结构可以由一个无向图G =(V,E,A)来表示,在许多现有的关于一致性问题的著作中,一个简单的控制律设计如式(5):
则系统的闭环控制方程(6)为:
写成向量形式有,其中x =(x1,x2,…,xN)T是所有智能体的列向量,L是图G的Laplacian 矩阵。如果图G是连通的,则系统中的所有智能体状态将逐渐收敛到每个智能体的初始状态的平均值,即为。
2 周期事件触发一致性
基于周期事件触发机制研究一阶多智能体系统的平均一致性问题,其触发原理流程图如图1 所示。
图1 周期事件触发控制Fig.1 Periodic event-triggered control
即预先设定一个固定采样周期为h的采样点,所有智能体的采样时间是同步的,并且每个智能体仅在采样点进行检测,所以事件触发时刻也就仅发生在采样点上,因此该驱动机制保证了≥h,h >0,有效地避免了Zeno 行为,并且符合数字设备带有采样周期的特性。该机制减少相邻智能体之间的通信,降低每个智能体的事件检测能耗,并且保持了平均一致性。因此,在每个智能体上都配置了一个事件检测器,用于确定何时应该使用采样的本地信息来更新其自身及其邻居的控制操作。采样时刻设计如下:t =mh,m =0,1,… 在控制器设计中,采用了事件触发方案,减少了资源消耗,进一步要求每个智能体只在指定的事件时间瞬间更新其控制输入,,…。由于采用了周期采样策略,事件只能在采样时间瞬间发生,也就是0,1,…。其一致性协议(7):
系统的闭环控制方程(8)为:
系统的测量误差为式(9):
测量误差表示智能体i的最新事件触发状态与最新采样状态之间的差值。为了便于事件设计,定义列向量x(t)=(x1(t),…,xN(t) )T,e(t)=(e1(t),…,eN(t) )T,结合的定义,在内,系统的闭环控制方程(10)可以定义如下:
L是通信图G的Laplacian 矩阵,上式的等式可以写成这样的紧凑形式(11):
因为控制输入在两个连续的采样时间内为常数,可以得到式(12):
当智能体的测量误差的绝对值达到预设定的阈值时,就会引起事件触发,并且引起智能体控制器更新。提出事件触发条件(13):
根据本文提出的事件触发条件,可以看出这个阈值是非连续的,仅在事件触发时刻更新,避免了对其邻居状态的连续测量,在实际中极大地减少了资源消耗。智能体i仅仅在自身的事件触发时刻发送状态和在邻居的事件触发时刻接收邻居状态时与其邻居通信。如果事件触发条件(13)不满足时,那么智能体i不需要进行任何操作,忽略当前采样状态;如果满足事件触发条件(13)时,智能体i将执行控制输入更新,并且发送自己的状态信息给邻居智能体,更新其控制输入,同时重置测量误差为0,即,事件触发判断条件得以再次满足。
定义多智能体的平均状态为式(14):
考虑图G是无向连通图,因为Laplacian 矩阵的特征值λ1=0 对应的特征向量为全1 向量,即=,将其应用在公式(11)和(14)得到多智能体的平均状态的导数为式(15):
所以多智能体的平均状态是不变的常数,且等于初始状态的平均值,即式(16):
为了描述多智能体系统的平均一致性收敛性能,定义非一致向量σ(t),式(17):
当t→∞时,如果xi(t)→(i =1,2,…,n),则,所以多智能体系统是平均一致收敛的。
考虑一个无向连通图G,现在将使用Lyapunov函数方法为多智能体系统设计出适当的事件。考虑如下Lyapunov函数(18):
定理1考虑一组具有动态方程(4)的n个智能体组成的系统,假设系统对应的通信图G是无向连通图时,若条件(19)成立,其中λn是Laplacian矩阵L的最大特征值,则采用一致性协议(7)的系统(4)在事件触发条件(13)下,所有智能体状态将渐进收敛至其初始平均状态。
证明考虑函数(18)在t∈[mh,mh +h) 时间段内得到V(t) 的导数:
因为在t∈[mh,mh +h) 上,(t- mh) ≤h,再由引理1 得,式(20):
现在设是最新采样时间mh之上或者之前的智能体i的最新事件触发时刻,定义事件触发状态,则有式(21):
将(22)代入到(20)中,得:
由引理2 得式(24):
将不等式(24)代入(23)中,得式(25):
结合事件触发条件(13)得到式(26):
因为这是个无向连通图,E ={x∈Rn |(t)=0}=span{1n},由于Lasalle 不变定理可知,闭环控制方程(8)是渐进稳定的,所以多智能体系统是平均一致收敛的。
3 仿真实例
通过一些仿真实验对得出的结论进行验证。
考虑在固定无向连通图下一个由4 个智能体组成的多智能体系统。图2 是通信拓扑图,其对应的拉普拉斯矩阵为:
图2 通讯拓扑图Fig.2 Communication topology
通过计算,矩阵L的最大特征值λn =4,为满足条件(19),多智能体系统的检测周期设置为h =0.002,每个智能体的事件触发条件参数分别设置为:β1=0.06,β2=0.02,β3=β4=0.033。智能体的初始状态设置为x0=[0.3-0.2 0.2-0.3]T。
在基于一致性协议(7)下,图3 是多智能体状态轨迹,可以看出所有多智能体的状态随着时间的推移会渐进收敛到一致,实现了平均一致性。
图3 多智能体状态轨迹Fig.3 The state trajectory of multi-agent
多智能体的事件触发时刻,由于采用了周期事件触发机制,可以看出智能体的触发时刻是异步的,并且每个智能体的触发时刻也是非周期的,如图4所示。
图4 多智能体事件触发时刻Fig.4 Event-triggered times of multi-agent
多智能体非一致向量范数的变化曲线如图5 所示,可以看出当t→∞时,0,可以看出所有智能体都趋于其初始状态的平均值,实现了平均一致性。
图5 非一致向量范数Fig.5 Norm of the disagreement vector
智能体1 的事件触发条件曲线如图6 所示,其它3 个智能体的事件触发条件曲线与图6 类似。在内,随着测量误差越来越大,当满足触发条件(13)的时候,一个事件触发了,则当前采样状态成为新的触发状态,即,同时将测量误差置于0。
图6 智能体1 的事件触发条件Fig.6 Event-triggered condition of agent 1
多智能体事件触发次数见表1,可以看出在相同的系统中,相比较传统使用的事件触发条件,采用本文提出的事件触发条件能显著减少每个智能体的事件触发次数,进而减少了控制输入的更新次数和系统对资源的消耗。
表1 多智能体事件触发次数Tab.1 Event-triggered number of multi-agent
4 结束语
本文针对一阶多智能体系统,其通信拓扑结构为无向连通图,通过引入了周期事件触发机制及其一致性协议,避免了Zeno 现象,同时提出了一个新颖的事件触发条件,其触发条件的阈值是依赖于事件触发状态而不是采样状态,所以不用在每个采样时刻对阈值进行更新,进而减少了智能体之间的通信次数和控制输入的更新次数,在实际系统中极大地减少了资源消耗。今后将在二阶动力学方程和线性动力学方程下继续研究周期事件触发机制。