基于重置控制的一般线性多智能体系统无领导者一致性问题
2022-12-09江雨龙胡文峰阳春华
江雨龙,胡文峰,彭 涛,阳春华
(中南大学自动化学院,湖南长沙410083)
近年来,随着计算机和通信技术的飞速发展,多智能体系统协同控制技术广泛应用于许多领域,比如智能电网故障诊断[1]、强化学习[2]、无人机编队飞行[3]等. 因此,多智能体系统协同控制的研究具有十分重要的理论和实践意义. 本文研究协同控制中的无领导者一致性问题,即通过设计分布式控制器,使得所有智能体的状态收敛到一个共同值,目前一些典型的无领导者一致性研究成果包括二阶系统[4]、一般线性系统[5]和非线性系统[6]等.
在实际应用中,除了稳态性能,闭环系统的暂态性能也是关注的重点,比如收敛速度、超调等一些性能指标. 如何提高多智能体系统的暂态性能,是近年来的研究热点.Olfati-saber等[7]针对单积分器多智能体系统设计了一类线性一致性控制协议,并揭示了拓扑的代数连通度与收敛速度的关系,代数连通度越大,收敛速度越快.Macellari等[8]和Karayiannidis等[9]提出的预设性能控制是另一种重点关注暂态性能的控制方法,它的原理是将相对误差限制在一类性能函数边界内变化,从而达到任意改变收敛速度和限制超调的目的. 然而,这种方法通常会导致非自治非线性闭环系统的产生. 得益于有限时间控制理论的发展,有限时间控制策略被用于加快多智能体系统的收敛速度[10-11],但这会带来控制输入过大的问题. 除了上述控制策略,重置控制近年来逐渐受到人们的关注.
本文将通过引入重置控制策略来改善多智能体系统的暂态性能,比如加快收敛速度,减小控制代价. 重置控制最早出现在文献[12]中,Clegg设计了一种特殊的积分器,当被积变量过零时就将积分器输出置零,用于解决一类非线性系统的伺服问题,并验证了该积分器可以提高控制效果. 一般来讲,重置控制器包含一个重置部分,当满足某种触发条件时,就将该部分重置为零. 例如,Beker等[13]研究了在一类场景下重置积分器可以突破线性反馈的局限性,提高系统的暂态性能,实现阶跃响应下没有超调的控制目标.Nesic等[14]设计了一类一阶重置控制器,并实现了L-2 鲁棒性. 之后,有更多关于单系统加入重置机制的研究结果出现[15].Yucelen等[16]将重置控制策略首次引入到多智能体系统的研究中,针对单积分器系统设计了基于准重置机制的一致性控制器.Meng等[17-18]分别针对单积分系统的有领导者一致性和无领导者一致性问题提出了基于重置控制策略的控制协议,并在文献[18]中考虑了排除芝诺行为.Hu等[19]将重置控制推广到二阶多智能体系统,严格证明了正则性和收敛性,并通过理论分析和仿真对比突出重置一致协议相比其他协议具有更好的暂态性能. 目前将重置机制应用于一般线性多智能体系统的研究集中在有领导者一致性问题,均采用混杂系统方法分析系统的收敛性能[20-21].值得注意的是,Cheng等[20]针对每个智能体的动力学方程,假设输入矩阵满足行满秩,这限制了该结果应用于许多线性多智能体系统.Zhao等[21]对控制器参数的设计依赖于一些线性矩阵不等式(LMI)的求解,这甚至带来了解的存在性问题.
不同于文献[20-21],本文考虑一般线性系统的无领导者一致性问题,提出了一种新颖的带有时变增益的重置一致协议,放宽了对输入矩阵的限制. 不同于文献[17-21]中传统的过零点重置触发条件,本文提出了基于耦合误差的重置环重置条件,并通过Lyapunov稳定性理论证明闭环系统实现渐近一致. 另外,本文将提出的重置控制器与现存的静态控制器以及动态控制器进行了对比分析,证明了重置控制器具有更快的收敛速度,并通过仿真进行了验证.
1 准备工作和问题描述
1.1 符号和代数图论
给定一个实对称矩阵M,用λmin(M)和λmax(M)分别代表M的最小和最大的特征值.In代表n维单位矩阵;A⊗B表示矩阵A和B的克罗内克积. 公式col{x1,x2,…,xn}代表元素为x1,x2,…,xn的列向量. 符号1N表示元素全为1的N维列向量;符号0N表示元素全为0的N维列向量. 符号0n×n表示一个n阶零矩阵.
1.2 问题描述
考虑N个智能体组成的一般线性多智能体系统,第i个智能体的动力学模型如下:
(1)
其中:xi∈Rn是智能体i的状态向量,ui∈Rm是智能体i的控制输入;A∈Rn×n为系统矩阵,B∈Rn×m为输入矩阵,且A和B均为常值矩阵.
对于无领导者的多智能体系统, 智能体i的控制器ui只依赖于自身和邻居智能体的状态信息即
ui=f(xi,xj∈Ni),
(2)
其中f为线性或非线性函数.
在一个多智能体系统中, 如果对于任意的i,j∈V,i≠j,都有
则可以认为系统状态实现了渐近一致.
我们的目标是在无向通信拓扑下,设计一类基于重置的一致协议使得多智能体系统实现一致,改善闭环系统的暂态性能.
假设1(A,B)可镇定.
在假设1满足的前提下,有以下引理:
引理1[23]若(A,B)可镇定,则下列代数黎卡提方程存在唯一正定的解矩阵P=PT,
ATP+PA-PBBTP+In=0.
2 主要工作
2.1 控制器设计
ui=σpKξi+σIKHi(t)ηi,
(3)
其中K∈Rm×n是需要设计的反馈矩阵,系数σp>0,σI>0,ηi=col{ηi1,ηi2,…,ηin}∈Rn是智能体i的重置部分.
ηi的设计如下:
(4)
ηi的初值ηi(0)=0n,Fij和Jij分别表示重置未发生时的流集和重置触发时的跳跃集,这两个集合定义了重置的触发机制.Fij和Jij设计如下:
(5)
时变增益矩阵Hi(t)=diag{hi1(t),hi2(t),…,hin(t)}定义如下:
Hi(t)=
(6)
本文所提出的重置机制具有以下两个优点:
1) 与文献[18-19]中的一维重置机制不同,本文中提出的重置机制是多维的,适用于多输入多输出的多智能体系统;2) 不同于传统的零穿越触发条件(=0的情况),本文采用误差进入包含0的重置环时触发,即误差绝对值小于某个阈值时触发. 实际应用中检测零点要求较高,有可能出现检测失误的情况,所以本文的触发方式更易于应用.
2.2 一致性证明
首先给出多智能体系统实现一致的条件.
证明将控制器(3)代入系统(1)可以得到:
Axi+σpBKξi+σIBKHi(t)ηi,
因为Hi(t)ηi(t)=βi(t)ξi(t),所以有
(7)
定义向量x=col{x1,x2,…,xN},ξ=col{ξ1,ξ2,…,ξN},不难得到
ξ=-(L⊗In)x.
定义对角矩阵β=diag{β1(t),β2(t),…,βN(t)},闭环系统(7)可以写成如下形式:
σI(IN⊗BK)(β⊗In)ξ=(IN⊗A)x-
σp(L⊗BK)x+σI(IN⊗BK)(β⊗In)ξ.
(8)
选取下列Lyapunov函数:
(9)
定义变量eij=(xi-xj),则有
(10)
因为P为正定矩阵,所以式(9)是关于变量eij的有效的Lyapunov函数.
σpxT(L⊗KTBT)+σIξT(β⊗In)(IN⊗
2σp(L2⊗PBBTP)]x+σIxT(L⊗PBBTP)(β⊗
[(PA+ATP)-2σpλ2(L)PBBTP])x-σIξT(β⊗
σIξT(β⊗PBBTP)ξ.
因为对任意i∈{1,2,…,N}都有βi(t)≥0,所以在任意时刻β的特征值均为非负实数,已知PBBTP是对称半正定矩阵或正定矩阵,其特征值均为非负实数,由克罗内克积的性质可得β⊗PBBTP为对称矩阵且特征值均为非负实数,所以有-σIξT(β⊗PBBTP)ξ≤0,因此
(11)
注1Cheng等[20]研究线性多智能体系统的有领导者一致性问题,提出的重置协议需要输入矩阵B具有行满秩,这大大限制了该协议的适用范围,本文则取消了这个限制.
注2本文设计的重置一致控制器(3)可以直接应用于单积分器系统和双积分器系统.
对于一个单积分器系统
xi∈R.重置一致控制器设计如下:
ui=σpξi+σIηi,
(12)
控制器(12)和文献[18]中的重置控制器触发方式不同.
对于一个双积分器系统
xi∈R.重置一致控制器如下:
ui=σpKξi+σIKHi(t)ηi.
(13)
ui=kζi+μφi+hai,
(14)
其中:
其中:ai为重置部分,ai(0)=0,k,μ,h,ϖ是需要设计的系数. 可以看出控制器(13)和(14)的形式和重置机制都不同.
2.3 性能分析
围绕本文中所研究的线性多智能体系统无领导者一致性问题,已有学者提出了许多经典的控制方法,包括静态一致性控制方法[5]和动态控制方法[25],具体形式如下:
静态一致控制器:
ui=σpKξi,
(15)
动态一致控制器:
ui=σpKξi+σIKzi,
(16)
推论1选取相同的系数σp,重置一致控制器(3)作用下Lyapunov函数(9)轨迹变化的上界比静态控制器(15)作用下的小.
证明在控制器(15)作用下,系统(1)的闭环形式如下:
(17)
σIξT(β⊗PBBTP)ξ=σIxT(LβL⊗PBBTP)x≥
σIλmin(β)λ2(L)λmin(PBBTP)xT(L⊗In)x.
令θ(t)=σIλmin(β)λ2(L)λmin(PBBTP)≥0,则
注3通过对Lyapunov函数V(x(t))轨迹的上界的分析,可以得到静态控制器和重置控制器作用下闭环系统均为指数收敛,且收敛速度均与1/λmax(P)相关,不过这是一种保守的估计,并不能用来量化系统实际的收敛速度. 针对静态控制器,通常的做法是利用无向图拉普拉斯矩阵L的对称性质,将一致性问题转化为整个闭环系统的镇定问题,进而得到指数收敛的结论,且收敛速度是由矩阵A-λ2(L)σpBBTP特征值的最大实部决定. 然而该方法不适用重置控制器的证明中,因为重置控制器通常带来时变系数,即ui(t)=(σp+σIβi(t))Kξi(t),因此很难描述系统的实际收敛速度,在文献[18]的Remark6中也指出这一点. 动态一致控制器与之类似,利用Lyapunov稳定性理论和不变集原理可以证明系统实现一致,但是实际收敛速度很难得到.
从控制器的形式出发,可以直接对3种控制策略的收敛速度进行比较. 由推论1知,在静态控制器(15)作用下多智能体系统可以实现一致,重置控制器(3)比静态控制器(15)多了一项σIKHi(t)ηi,重置机制的存在使得该项可以提供与σpKξi相同方向的控制量,因为Hi(t)ηi(t)=βi(t)ξi(t),βi(t)≥0,这会加速系统朝着一致的方向收敛.
动态一致控制器则不具备上述特性. 动态控制器(16)可以写成如下形式
积分项zi与比例项ξi符号不能一直保持相同,这意味着比例项ξi产生的控制作用会被积分项抵消掉一部分,这会减慢系统朝着一致的方向收敛,而重置控制器(3)会提供很多有效的控制量,加速一致收敛,所以当选取相同的σp和σI时,动态控制器收敛速度比重置一致控制器慢.
3 仿真部分
本小节将通过仿真实验对比3种一致协议(重置控制器(3)、静态控制器(15)以及动态控制器(16))的控制性能,来证明所提出重置一致协议的有效性.
考虑一个包含4个智能体的多智能体系统,智能体动力学模型中系统矩阵和输入矩阵分别为:
代数黎卡提方程的解为
智能体之间的通信连接为
E={(1,2),(2,1),(2,3),(3,2),(3,4),(4,3)},系统的拉普拉斯矩阵为
代数连通度λ2(L)=0.585 8.
3种一致控制器参数设置相同,均取σp=1.707 1,σI=1,另外重置控制器设置=0.01.
图1展示了在重置一致协议(3)作用下的系统状态的变化曲线,xij代表第i个智能体第j维状态,从图中可以看出智能体状态实现了一致.
图1 重置一致控制器下系统状态轨迹Fig.1System state trajectories with the reset consensus controller
如图2和图3所示,另外两种控制器也可以实现一致.对比3幅图可以看出,重置控制器作用下闭环系统收敛最快.图4展示了重置一致协议的控制信号,可以明显看到有重置行为产生.
图2 静态一致控制器下系统状态轨迹Fig.2System state trajectories with the static consensus controller
图3 动态一致控制器下系统状态轨迹Fig.3System state trajectories with the dynamic consensus controller
图4 重置一致控制器控制信号Fig.4Control signal with the reset consensus controller
从表1中可以得到重置一致控制器的调节时间最小,说明其收敛速度最快. 相比静态控制器,重置控制器增加了大约12.6%的控制代价,减少了11.9%的调节时间.与动态控制器相比,重置一致控制器减少了71.7%的调节时间,却只需要更小的控制代价,这显示出重置控制器的优越性.综上对比,说明加入重置机制能够加快多智能体系统实现一致,并仅需要较小的控制代价.
表1 不同控制器的调节时间和控制代价
4 结 论
本文研究了无向图下一般线性多智能体系统无领导者一致性问题,提出了基于重置控制策略的一致性协议. 基于Lyapunov稳定性理论证明了给出的一致性协议能够保证系统达到一致. 通过仿真对比表明重置一致协议可以改善系统的暂态性能,加快收敛速率的同时只需要相对较少的控制代价.