可变脉冲控制下的多智能体系统固定时间一致性研究
2023-01-27隆腾杨莎莎王茜竹
隆腾,杨莎莎,王茜竹
(1.重庆邮电大学 通信与信息工程学院,重庆 400065;2.重庆邮电大学 计算机科学与技术学院,重庆 400065)
0 概述
近年来,多智能体系统(Multi-Agent Systems,MASs)的分布式控制与优化广泛应用于无人机、机器人集群的协同作业[1-3],但在已有研究中MASs 通信环境通常为理想状态,然而在真实网络环境中系统可能会受到环境干扰的随机变化[4-5],例如信息传输的随机噪声干扰、随机故障等。而且由于外部工作环境复杂,智能体之间在传输过程中往往会受到外部随机波动等概率因素引起的随机扰动[6-7],因此一致性问题随着研究的深入逐渐引起关注[8]。
目前,有许多控制方法可以实现MASs 一致性,如自适应控制[9]、牵引控制[10]、鲁棒控制[11]等。脉冲控制作为一种有效的非连续控制策略,只允许每个节点在脉冲瞬间传输信息,这大大降低了网络的通信负载。文献[12]提出基于固定拓扑、切换拓扑和外部干扰的3 种脉冲控制协议,以实现连续时间网络的一致性。文献[13]研究具有输入饱和度的分布式脉冲一致协议,以渐近地保证动态系统的动态一致。但是,上述研究对于脉冲间隔的设定比较固定,也就是预先设定脉冲间隔。由于实际系统的物理约束,因此智能体之间的信息交换不能准确地在预先设定好的脉冲采样时间内发生。为了获得更灵活的脉冲采样时刻,文献[14]提出在脉冲时间窗内约束脉冲输入的可变脉冲控制策略。文献[15]研究了有向网络拓扑中MASs 具有领导-跟随者一致的可变脉冲控制策略,这种策略允许脉冲采样时间随机发生在脉冲时间窗内,从而使得系统更加适用于现实场景。
虽然上述工作研究了如何降低系统的通信负载并使其更加适用于现实情况,但是所用方法为渐近一致性,忽略了系统达到一致时所需要的时间。与渐近一致性相比,有限时间一致性提高了系统的收敛速度[16-17]。但是,有限时间一致性的时间计算需要依赖于系统的初始状态。因此,有研究人员提出了固定时间一致性,使系统的一致性时间不再依赖于初始条件[18-19]。另外,在实际的通信环境中,由于外部干扰或链路故障,智能体之间的通信拓扑结构可能会改变[20-21],因此可以引入切换拓扑结构。目前,关于脉冲控制与固定时间一致相结合的研究采用单阶控制,然而由于MASs 应用场景的复杂性和多样化,单阶控制的收敛状态相对单一,灵活性较差。
受到上述工作的启发,本文研究可变脉冲控制和固定时间一致性相结合的双阶控制(Two-Stage Control,TSC)策略。TSC 策略根据实际应用需求进行动态调整收敛周期,通过增加脉冲个数来应对通信资源稀缺的问题,但如果系统需要获得更快的收敛速度且网络条件良好,则可以适当减少脉冲数量。通过在领导-跟随者情况下的具有切换拓扑的MASs数值仿真案例以验证理论结果的有效性。
1 预备知识与系统模型
假设1在Gσ(t)中存在有向生成树并且领导者节点为根节点。
假设2设φ(·)和h(·)为非线性函数并满足以下Lipschi tz 条件:
在式(5)中:Γ和Σ为已知常数矩阵;‖ · ‖表示欧氏范数。
假设3 可变脉冲控制阶段遵循如下规则:
2 理论分析与主要结果
本文设计将可变脉冲控制和固定时间一致相结合的TSC 策略,因此给出如下有效的TSC 协议:
在式(11)中:δ(t-tn)为冲激函数;bn为脉冲控制增益;脉冲序列0 <t0<t1<…<tn<…并且+∞;定 义并设xi(t) 为右连续;ϖ表示固定时间阶段的控制参数;ς、k、p、q都为奇数并满足ς<k和p>q;T1表示脉冲控制阶段和固定时间阶段的分界时间,也表示固定时间阶段的初始时间;T2表示系统达到一致时具体的预设时间。
如图1 所示,系统收敛周期分为两个阶段,分别是可变脉冲控制阶段和固定时间连续控制阶段。为了进一步提升系统收敛速度,并准确计算出系统的预设时间,本文在有限时间一致控制器的基础上进行改进引入了固定时间一致性理论,与文献[16-17]相比,本文采用的固定时间一致的预设时间与系统的初始条件无关,该方法能够根据相关参数准确地计算出系统达到一致时的时间,比有限时间一致更准确。此外,本文中的固定时间一致控制协议没有使用会引起系统颤振的符号函数,这对系统的稳定性会有较大的提升。
图1 TSC 示意图Fig.1 Schematic diagram of TSC
在第一个控制阶段,结合控制器式(11)和系统式(1),可以将脉冲控制系统定义如下:
若上述条件满足,则系统式(1)可以通过控制器式(11)达到具有领导-跟随者的固定时间一致。
证明在第一个控制阶段t∈[t0,T1),定义如下Lyapunov 函数:
在式(33)中:tω表示脉冲发生的次数;T1是固定时间阶段的起始时间和在整个脉冲周期中所经过的时间,为中的随机值;V(T1,ε(T1))表示固定时间阶段的初始状态。本文根据实际应用场景设置ω的个数,则脉冲个数可以决定T1的大小。
不等式(26)中的特征值θn表示系统中的全局信息会有n次脉冲采样。从式(27)到式(29)可以看出,当系统时间达到tn时,则系统会得到特征值θ,也就意味着系统会触发脉冲采样;如果系统时间没有超过脉冲时间窗口的脉冲控制时间,则系统不会触发脉冲采样。例如,若选择5 个脉冲采样,则ω=5,则通过式(33)脉冲推导过程可以改写为:那么第5 个脉冲就会在第5 个脉冲时间窗的左端点到第6 个脉冲时间窗的左端点,也就是在内发生,利用条件进行反 推,可得该式中特征值θ有5 个,则系统在达到第6 个脉冲时间窗的左端点时发生5 个脉冲采样。
本文主要是利用TSC 策略对收敛周期进行动态调整,脉冲数量减少的触发条件可以依据式(26)~式(33)的推导过程进行判定,主要是对ω的大小进行设定。此外,本文主要根据现实应用要求进行选择脉冲采样数量以应对系统网络条件:若网络通信资源比较丰富,则可以减少脉冲数量以更快地提升系统的收敛速度;若通信资源较稀缺,则可以适当增加脉冲数量以减少通信量。因此,本文研究内容主要为减少系统通信成本的同时提升一致性速度提供一种新思路。
在固定时间控制阶段的系统误差可以表示如下:
根据定理1 和式(23)得到式(37)。进一步地,根据(37)可以得到式(38)。根据引理1~引理5 可得式(39)。
因此,根据引理1,可以得到系统式(1)的一致时间:
在式(43)中:T2是脉冲控制阶段和固定时间阶段的整个收敛时间。当t≥T2时,可以得到EV(t,ε(t)) ≡0。因此,具有随机扰动的MASs 能够达到全局固定时间稳定。
3 数值仿真
本节给出一个领导-跟随者的仿真案例,证明了控制协议式(11)的有效性和可靠性。
考虑具有5 个智能体的MASs 参数设置如下:
从上述公式中可以得出Γ=diag{0.5,0.5,0.8}以及Σ=diag{0.2,0.4,0.6}。设伯努利分布的随机变量α(t)和β(t)满足α=β=0.5。设ϕ=2,那么通过简单的计算得到λmax(Φ)=23.415 9,λmax(Ψ)=31.740 2。
系统的通信拓扑图如图2 所示,其中,0 节点为领导者,其他节点为跟随者。
图2 通信拓扑图Fig.2 Communication topology
根据定理1 以及已知参数,设bn=-0.4,ζ=1.01。通过简单的计算得到θn=0.866 5,则脉冲时间窗上限为简单起见,选用=0.005 5。如图3 所示,脉冲采样时刻在脉冲时间窗内随机发生,并分别设定6 个和9 个脉冲采样时刻,即ω=6 和ω=9。设切换信号为σ(t)=(nmod 4),t∈[tn,tn+1)。
图3 脉冲时间窗与脉冲数量的关系Fig.3 Relationship of the impulsive time window and the number of impulsive
设定所有智能体的初始状态值x0=[0.1,0.2,-0.3]T、x1=[5.5,3,4.6]T、x2=[-3.9,-2.8,4.3]T、x3=[ -5.7,3.5,-6.2]T、x4=[4.9,-3.2,-2.4]T。TSC 收敛过程如图4、图5 所示(彩色效果见《计算机工程》官网HTML 版),可以看出t6=T1=0.034 4,t9=T1=0.050 8。在固定时间控制阶段,设ϖ=35、κ1=2、κ2=2.5、ς=1、k=3、p=5、q=3。根据式(43)可以计算出系统的一致时间为T2=2.354 1,从图4 和图5 的结果可以看出,系统的收敛时间要远小于T2,并且可以根据脉冲个数对收敛周期进行动态调整。当设定的脉冲采样数量较多时,系统的收敛时间会更长,但是减少的通信量更多,通信资源的消耗更少;当设定的脉冲采样数量较少时,则收敛周期会更快地进入第二阶段,随之收敛时间也会更短。这也进一步验证了双阶控制对于动态调整系统收敛周期的有效性和准确性,因此,具有随机扰动的领导-跟随者MASs 可以在控制协议式(11)下达到固定时间一致。
单阶控制、可变脉冲控制和固定时间连续控制下得到的三维状态值以及状态误差如图6~图8 所示(彩色效果见《计算机工程》官网HTML 版)。由图6 可以看出,单阶控制收敛速度要稍快,但单阶控制的收敛状态比较单一,无法改变脉冲采样个数。由图7 可以看出,单一的脉冲控制可以减少通信成本,但是渐近一致性使得该方案不适用于现实场景,而TSC 策略的收敛时间相比于单一可变脉冲控制减少了0.07 s。由图8 可以看出,单一固定时间连续控制有较快的收敛速度,但是连续不断的通信交互使得通信资源的消耗也不断增加,而TSC 策略的通信次数相比于单一固定时间连续控制分别减少了6~9。
因此,通过与图4 和图5 的双阶控制以及图6~图8的单阶和单一控0 制的对比可以看出,本文提出的TSC策略是有效的,符合实际应用场景。
图4 6 个脉冲控制下得到的三维状态值以及状态误差Fig.4 3D state value and state error obtained via the six impulsive controls
图5 9 个脉冲控制下得到的三维状态值以及状态误差Fig.5 3D state value and state error obtained via the nine impulsive controls
图6 单阶控制下得到的三维状态值以及状态误差Fig.6 3D state value and state error obtained via single-stage control
图7 可变脉冲控制下得到的三维状态值以及状态误差Fig.7 3D state value and state error obtained via variable impulsive control
图8 固定时间连续控制下得到的三维状态值以及状态误差Fig.8 3D state value and state error obtained via fixed-time continuous control
4 结束语
本文通过分析并研究具有随机扰动的多智能体系统的固定时间一致性问题提出TSC 策略,将整个控制周期分为可变脉冲控制阶段和固定时间一致控制阶段。通过数值仿真案例验证了TSC 策略的有效性,并表明其为不同通信网络条件下的应用场景提供了一个新的研究视角。由于本文引入可变脉冲控制,这对脉冲采样的灵活性有较大提升,但是脉冲触发时间主要是在脉冲时间窗范围内随机发生,可变脉冲控制难以估计脉冲采样时间,对于最终结果的可控程度会产生一定的影响,因此后续将进一步探索可控性更高的脉冲控制策略以及二阶多智能体系统。