二阶非线性多智能体系统的分布式编队控制
2021-07-15王平,刘畅
王 平,刘 畅
(1.海鹰航空通用装备有限责任公司,北京 100074;2.北京自动化控制设备研究所,北京 100074)
1 引 言
近年来,多智能体系统的编队控制引起各个领域研究人员的广泛关注。智能体之间通过编队协同工作充分发挥单个智能体的优势,提高任务的完成率、拓宽其使用范围等,在民生、军事等领域均有巨大的应用潜力[1-5]。例如,在执行侦察任务时,单架无人机受到传感器的角度限制,不能从多个方位对目标区域进行观测,多架无人机编队飞行,通过分工协作可实现目标区域的多方位观测,缩短任务完成时间,提高任务完成效率[6]。编队保持作为编队控制的基本问题,是编队有效执行任务的基本保障。编队保持的核心问题是通过设计恰当的控制协议,借助邻居智能体之间的局部交互形成并保持期望的队形。目前编队保持和控制的方法主要包括领航—跟随法[7]、虚拟结构法[8]、行为控制法[9]及一致性控制方法[10]。Ren[11]论证了领航—跟随法、虚拟结构法及行为控制法都可以归入一致性的统一框架内。
许多物理系统,特别是机械系统,通常表示为二阶积分器模型。然而工程实践中的物理系统往往具有非线性特性,导致系统模型无法简化为线性积分系统的形式。针对有向网络拓扑情形,Yu等[12]研究了具有非线性动态的二阶多智能体系统的一致性,得到了系统达到一致的条件。在此基础上,Song等[13]考虑了带有领航者的情形,利用牵引控制方法研究了二阶非线性多智能体系统的协调跟踪问题。针对跟随者之间的通信拓扑图为无向图和有向图两种情形,Wen等[14]给出了控制增益满足的条件,确保系统实现目标跟踪。然而上述控制增益均依赖智能体的非线性特性以及通信拓扑图等全局信息,并没有实现真正意义上的分布式。注意到鸟群、鱼群、羊群等在集群运动过程中,只需调整自身与相邻智能体的相对位置即可维持整体队形。为此,设计仅依赖自身与邻居智能体之间相对状态的控制协议实现群体分布式控制更符合实际且更具有挑战性。
基于以上分析,本文研究二阶非线性多智能体系统的分布式编队控制问题。利用邻居智能体之间的相对状态信息,提出了具有时变增益的自适应控制协议,确保实现多智能体系统编队控制。本文的创新主要体现在以下两个方面:(1)考虑了智能体自身的非线性动态特性,更符合工程实际;(2)设计的自适应编队控制协议不依赖智能体的非线性动态及通信拓扑图信息,实现了真正意义上的分布式,可满足大规模的多智能体编队控制需求。
2 代数图论
本节简要介绍代数图论的相关概念(详细内容参考文献[15]),采用拓扑图G(υ,ε,A)表示智能体之间的通信关系,其中υ= {υ1,υ2,… ,υN}表示参与编队的N个智能体,表示编队中各有向信息路径组成的集合。连接权重表示智能体之间的通信状态,当智能体i收到智能体j的信息时,aij> 0,否则aij= 0,并且规定aii= 0,对应邻接矩阵。如果对任意的(υi,υj)∈ε均有(υj,υi)∈ε,则图G为无向图,反之则图G为有向图。图G的一条有向路径是指一组有限的节点序列υ1,υ2,… ,υl,满 足(υi-1,υi) ∈υ,i= 1,2,…,l。定义拉普拉斯矩阵为
采用G表示有领航者的通信拓扑图,节点υ0表示领航者,υ1,υ2,… ,υN为跟随者。对角矩阵表示领航者的邻接矩阵,若υ0是υi的邻居时,bi=ai0> 0,否则bi= 0。
假设1.对于每一个跟随者,均存在一条由领航者到跟随者的有向路径。此外,跟随者之间的通信拓扑图为无向图。
引理1[16].在假设1成立的条件下,矩阵M=L+B正定。
3 系统模型
考虑包含N个跟随者和1个领航者的多智能体系统,其通信拓扑图为G,节点υ0表示领航者,υ1,υ2,… ,υN为跟随者。第i个智能体的动态方程表示如下:
其中:xi(t),vi(t),ui(t) ∈Rm分别表示第i个智能体的位置、速度和控制输入(或者控制协议),u0=0。f(t,xi(t),vi(t))表示第i个智能体的非线性动态,为一致连续可微的向量函数并且满足利普希茨条件:
∀x1,x2,v1,v2∈Rm,t≥0成立,其中ρ1≥0,ρ2≥ 0为利普希茨常数。
定义1.称控制协议iu能够解决系统的编队控制问题,当且仅当对于任意的初始状态,所有智能体渐近形成期望的编队,即
本文的目标是设计分布式控制协议iu以解决多智能体系统(2)的编队控制问题。
4 自适应控制协议设计
注意到文献[11-13]控制协议中的控制增益均为常值,且依赖智能体的非线性特性及通信拓扑图等全局信息。然而集群运动过程中,各智能体只需调整自身与相邻智能体的相对位置即可维持整体队形。为进一步提升系统的智能程度,本文基于相邻智能体之间的相对状态信息,提出了如下具有时变增益的自适应控制协议:
其中:k1,k2,τi均为正数,αi(t)为对应于第i个跟随者的时变控制增益。
定义编队误差:
记:
编队误差系统(6)可描述为如下矩阵形式:
定理1.在假设1成立的条件下,自适应控制协议(5)无须借助任何全局信息即可解决多智能体系统(2)的编队控制问题。此外,控制增益αi(t)收敛于有限值。
证.考虑如下的李雅普诺夫函数:
V(t)沿着系统(7)对时间t求导,得
注意到非线性动态F(t,ξ,ζ)满足利普希茨条件(3),则有
从而:
此外:
将式(11)、式(12)代入式(9)得
注.文献[12-14]中确定静态控制增益需要事先知道通信拓扑图的拉普拉斯矩阵及智能体自身的非线性特性,然后根据系统稳定性理论确定静态控制增益的取值范围。本文提出的自适应控制协议(5)的参数自主调节,不依赖智能体自身的非线性动态及通信拓扑图信息,可满足大规模的多智能体编队控制需求。然而,控制协议(5)中的控制增益需要不断更新,相比于静态控制协议更复杂,对硬件设备计算性能提出更高的要求。
5 仿真结果
本节通过仿真实例验证自适应控制协议的有效性。考虑包含6个跟随者和1个领航者的多智能体系统,节点υ0表示领航者,υ1,υ2,… ,υ6表示跟随者,其通信拓扑图如图1所示。显然该通信拓扑图满足假设1。假设所有的非零权重均为1。
图1 通信拓扑图Fig.1 The communication graph
所有智能体的动态方程均由系统(2)给出,非线性动态由下列Chua's 电路[17]给出:
当p=10,q=18, a= 4/3, b=-3 /4时,系统呈现混沌状态。选取k1=3,k2=2。
6个跟随者的初始位置和速度状态分别从[0,10]×[-6 ,6]×[-1 0,0]和[-4 ,4]×[-4,4]×[-4 ,4]中随机选取,领航者的初始位置和速度分别为[1,2,3]T和 [0.6,-0 .2,0.3]T。此外,时变控制增益的初值设置为 αi( 0) =0和τi= 0.01,i = 1,2,…, 6。假设期望的一字队形为其中:
在自适应控制协议(5)作用下多智能体系统的位置和速度曲线分别如图2~3所示,可以看出多智能体系统形成并保持期望的一字队形,且速度渐近达到一致。图4描述了自适应控制协议(5)中时变增益 αi(t), i= 1,2,… ,6的轨迹曲线。显然,αi(t), i= 1,2,… ,6渐近趋于某个有限值。
图2 自适应控制协议(5)作用下的位置曲线Fig.2 Position trajectories of the network under the adaptive control protocol (5)
图3 自适应控制协议(5)作用下的速度曲线Fig.3 Velocity trajectories of the network under the adaptive control protocol (5)
图4 时变控制增益 αi(t), i= 1,2,… ,6Fig.4 Time-varying control gains αi(t), i= 1,2,… ,6
6 结 论
本文针对二阶非线性多智能体系统的编队控制问题,设计了具有时变增益的自适应控制协议。该控制协议仅依赖邻居智能体之间的相对状态信息,无须知道智能体自身的非线性动态特性或通信拓扑图的特征值等全局信息,从而实现了真正意义上的分布式。通过对包含6个跟随者和1个领航者的多智能体系统的编队控制进行数值仿真,证实了该控制协议的有效性。值得注意的是,本文假设跟随者之间的通信拓扑图为无向图,未来将持续研究跟随者之间的通信拓扑图为有向图的情形。