基于内模原理的多智能体蜂拥编队跟踪控制

2022-05-14黄浩乾

计算机仿真 2022年4期

黄蓉，周军，黄浩乾

(河海大学能源与电气学院，江苏南京 211100)

1 引言

蜂拥是指大量有共同运动目标且可相互作用个体群的集结行为。自然界中大雁迁徙、蜜蜂筑巢等都属于蜂拥现象。研究表明，虽然单个个体能力有限，但是个体互相交流和协作，却能使生物种群完成个体无法或难以完成的复杂任务。具有蜂拥行为的生物群体可建模为多智能体系统，而编队控制是多智能体控制的主要课题之一。基于蜂拥控制的多智能体系统协同与优化方面表现出了良好的应用前景。蜂拥控制研究中，Reynolds通过计算机仿真模拟出了鸟群、鱼群的运动状态，提出了著名的Boid模型[1]，为多智能体蜂拥问题研究奠定了基础。Boid模型描述的多智能体蜂拥是指其运动遵守：①避碰，所有智能体间保持一定距离，避免碰撞；②速度匹配，所有智能体速度趋于一致；③聚合，所有智能体保持紧凑，避免分离。这三条行为规则也用来描述多智能体编队的个体间关系，与定义于坐标框架上的刚性编队[2]相比，基于蜂拥拓扑的多智能体编队并不要求达成严格精准的坐标关系，而是应满足Reynolds行为规则，属于柔性编队。以下称符合Reynolds行为规则的多智能体聚集形态为多智能体蜂拥编队。

多智能体编队与轨迹跟踪控制(简称编队跟踪)是指智能体群体在形成编队的同时跟踪期望目标或轨迹的多目标控制问题，是多智能体控制领域的热点问题。事实上，多智能体编队跟踪控制的理论与技术在实际工程中有着广泛应用前景。如无人机编队飞行，交通路网中无人车辆自主行驶，救援移动机器人路径规划，卫星数据通讯组网等。编队跟踪控制的关注点在于如何处理多智能体编队形成/保持/变形及其轨迹跟踪的协同控制，特别地，输入/输出受扰动、模型不确定性、群体运动特性局限、环境因素约束等也是需要顾及的问题。

对于跟踪控制和扰动抑制问题[3]，内模原理控制器简单，参数整定直观，鲁棒性强。在多智能体控制已有关于内模原理研究[4-14]。如文献[4]研究了有(无)领导两情形下异构多智能体输出一致性；文献[5]结合预测控制和内模原理，研究了多智能体协同全局最优预测跟踪问题，得到了预测跟踪一致性充分条件，并给出全局最优预测控制器；针对非线性系统，文献[12]提出基于Lyapunov函数的内模输出反馈协议，研究了异构最小相位非线性智能体输出一致性；文献[13]引入分散内模，通过分散状态反馈解决了下三角非线性不确定多智能体的协同全局鲁棒输出调节。以上研究均未考虑编队问题。文献[14]考虑具不确定性异构离散非线性多智能体的编队控制，通过引入内部模型，使闭环系统对模型不确定性具鲁棒性，但编队形态是刚性的。研究仅考虑位置跟踪而未考虑速度一致性，容易引起智能体碰撞且未考虑扰动，从而限制了实际应用。

利用内模原理，本文研究具外部扰动和期望轨迹的二阶粒子型多智能体的基于虚拟领导者-平均值模型的编队跟踪控制问题，实现了蜂拥编队的同时，使平均位置渐近跟踪期望轨迹并抑制扰动，即“编队形成”和“编队跟踪”的协同解决。方法的优势在于，编队控制参数与跟踪控制参数可分别设计；且多智能体队列可通过权重矩阵做一定范围的调整。数值仿真证实了方法的有效性。

2 预备知识

首先，考虑N个二阶积分粒子组成的多智能体系统，每个个体都的状态空间方程描述为：

(1)

式中，i∈={1，2，…，N}，即是所有智能体标号集合；qi(t)，pi(t)，ui(t)∈n分别代表智能体i在t时刻的位置、速度和加速度向量。为简化符号，在不引起混乱前提下，时间变量t略去不写。

其次，矩阵M∈n×n是范数加权矩阵，即

‖MΔqij‖=‖M(qi-qj)‖

基于此，多智能体间的γ-邻域集定义为

i=：{j∈：if‖MΔqij‖<γ}

其中，γ>0是给定邻域半径，i是与智能体i有邻接关系(数据交换)的所有智能体的下标集合。

3 多智能体蜂拥编队特性

3.1 多智能体蜂拥编队控制算法

多智能体编队控制是指设计分散控制律ui，使满足Reynolds准则。对此，构造文献[15]的具虚拟领导者的蜂拥控制算法：

ui=-∑j∈Ni～φ(M(qj-qi))MTnij(M(qi-qj))

-∑j∈Niaij(M(qj-qi))MTM(pi-pj)

-[ΦTΦ(qi-qr)+Ψ(pi-pr)]

(2)

其中，Φ∈n×n非奇异， 0<Ψ=ΨT∈n×n，qr，pr，ur∈n代表虚拟领导者位置、速度和加速度控制向量。虚拟领导者非实际智能体，仅为多智能体提供跟随其运动的导引。

为简化描述(2)，定义z=：qi-qj。于是

其中，ε>0是给定常数。

标量脉冲函数ρ(·，·)定义为

其中，η∈(0，1)为给定值，ρ(z，η)∈[0，1]是光滑函数。另外，对于所有i，j∈，有

定义智能体i和j间的邻接系数为

aij(M(qj-qi))

(3)

定义智能体平均位置和速度向量

简单代数运算可以给出

(4)

称为闭环多智能体的平均值模型。需将其转换为平均值坐标系下的等价关系。定义

3.2 多智能体编队蜂拥的存在与性质

引理1：假设M≠0∈n×n，Φ∈n×n非奇异，且0<ΨT=Ψ∈n×n。考虑式(1)定义的多智能体，对其各个体分散施加扩展蜂拥控制算法(2)。若和则成立：

i) 多智能体以平均位置qa为中心保持聚合，即对任意t≥0，存在0<Υ<∞，使|qi-qa|<Υ。

ii) 所有智能体t→∞时速度趋向于一致，即

limt→∞p1=…=limt→∞pN=p*

这里p*为稳态速度，且p*=limt→∞pa∈Rn。

iii) 多智能体从几乎所有初始状态出发的解轨迹都渐近收敛于加权矩阵M定义的广义晶格结构。

iv) 假设多智能体的初始动能严格小于某阈值条件，则对于所有t≥0，均无智能体碰撞发生。

引理1证明见文献[15]的Appendix 1，此略。

引理1说明，在控制算法(2)下，多智能体稳态能达到蜂拥编队且保持稳定。特别地，队列形态可通过加权矩阵M进行一定调整。例如，稳态关系式‖Mz‖=d，当取rank(M)

3.3 领导者-平均值模型及其轨迹特点

当多智能体进入稳态后，个体位置和速度都在平均位置qa和速度pa附近。有鉴于此，考虑建立qa和pa与虚拟领导者控制ur的关系。由此，多智能体编队的平均位置和速度就可由领导者通过ur设计来决定。为此，定义虚拟领导者状态空间模型为

(5)

或简洁地表达为

(6)

考虑存在控制输入和外部扰动影响的虚拟领导者-平均值模型，其状态空间描述为

(7)

这里，ω≠0是n维的确定性扰动，Bω∈4n×n是扰动输入矩阵。设(7)对应的输出方程为：

y=Cς

(8)

其中，y∈Rn×1是输出向量。输出矩阵为

关于由虚拟领导者-平均值方程(7)与输出方程(8)组成增广系统的可控性/可观性，有

ii) 若β≠0，矩阵对(Λ(Φ，Ψ)， [In，0，0，0])是可观测的。这里(0)是n×n的全零块。

命题1证明见附录A。增广系统可控性/可观测性是实现基于内模跟踪控制的必要条件。

4 基于内模原理的多智能体编队跟踪

4.1 虚拟领导者-平均值模型轨迹跟踪问题设定

设式(7)与(8)的增广系统输出y(t)要跟踪的期望轨迹为y0(t)∈Rn，则跟踪误差定义为：

e(t)=y0(t)-y(t)

于是，多智能体蜂拥编队与轨迹跟踪控制的问题设定为：对各智能体和虚拟领导者设计分散控制律{ui}i=1，2，…N和虚拟控制输入ur，满足

(9)

备注1：式(9)前三式是蜂拥编队条件，引理1保证了式(2)控制律下的蜂拥编队；下面只考虑设计虚拟领导者控制向量ur以满足式(9)的稳态轨迹跟踪。

4.2 内模控制方程的形成

引入内模，是为了消除外部扰动对控制系统的影响，实现对给定参考输入信号的无误差跟踪。由于y0(t)和ω(t)的稳定振型随时间收敛于零，不会对稳态偏差产生影响，所以内模设计只需考虑y0(t)和ω(t)中当t→∞时不趋于零(不稳定)的部分。

将跟踪误差e作为内模方程的输入，对应的内模状态方程可构造为：

(10)

内模方程构造可基于参考输入与外部扰动的状态空间实现来完成，具体步骤如文献[3，16]。

4.3 内模跟踪控制系统的增益设计

图1 基于内模原理的多智能编队轨迹跟踪控制

将图1的镇定补偿器取为虚拟领导者-平均值增广向量的状态反馈，即

u2=Keς

而设内模补偿器对虚拟领导者-平均值模型输入为

u1=Kcxc

这样，图1系统的控制输入ur即为引入对增广系统的状态反馈，具体形式有

(11)

从而，相应的增广系统ΣT的状态空间模型是

(12)

引理2：对于式(12)定义的增广虚拟领导者-平均值模型的闭环系统ΣT，假设

i) 在L-A模型系统(6)中，(Λ(Φ，Ψ)，Θ)是可控的，而(Λ(Φ，Ψ)， [In，0，0，0])是可观测的；

ii) 虚拟领导者输入向量维数与期望位置轨迹向量维数满足dim(ur)=dim(y0)=n；

iii) 对期望轨迹和扰动信号的不稳定内模的代数方程φ(s)=0的根λi(即矩阵Ac的特征值)有

(13)

则存在形如式(11)的静态状态反馈K使闭环系统(12)实现无静差跟踪。

引理2的证明可参见文献[2](312-313页)。

4.4 多智能体编队轨迹跟踪设计

将式(2)的蜂拥控制与(12)式的轨迹跟踪控制结合，多智能体群编队跟踪控制就得到了解决。

定理1：考虑由式(1)描述的多智能体系统，其虚拟领导者由式(5)定义。对各智能体分散作用的扩展蜂拥控制算法(2)中，假设M≠0∈n×n，Φ∈n×n非奇异和0<ΨT=Ψ∈n×n。进一步假设多智能体相对初始位置与速度满足引理1的条件。最后，假设β≠0且，且内模方程(10)的所有特征值满足

det{μ(s)}≠0，∀s∈λi(Ac)

这里η(s)和μ(s)定义见命题1。在上述条件下，存在静态状态反馈增益K，使多智能体从几乎所有初始状态出发的解轨迹都渐近收敛于由加权矩阵M定义的蜂拥编队，且以平均位置轨迹qa为中心聚合。特别地，qa(∞)=y0(∞)，即稳态蜂拥编队实现对期望轨迹的无静差跟踪。

证明：结论是引理1与2结合的结果。给定β≠0，η(s)和μ(s)，命题1说明式(7)与(8)的增广虚拟领导者-平均值模型是可控和可观测的。所以要完成证明，只需要证明增广虚拟领导者-平均值模型的特征值满足引理2的秩条件(13)即可。为此，注意到

=4n+rank{μ(s)}

即，在给定条件下对内模方程(10)的所有特征值均满足秩等于4n+n的条件。证毕

5 算例描述与数值仿真

圆点为多智能体位置，箭头方向和长短代表智能体速度方向和大小，圆点间连线为邻域关系。绿色实线为期望轨迹，绿色虚线为平均位置轨迹。

考虑6个三维智能体，初始位置给定，初始速度在[-1，1]×[-1，1]×[-1，1]的范围随机生成。领导者初始位置为[10；10；10]，初始速度为[1；1；1]。

情况1：给“蝴蝶结”型期望轨迹和扰动分别为

给定如下的4n+nl=24个期望闭环极点

从图2可以看出，初始时刻各智能体是混乱的，未形成蜂拥编队，平均位置也未跟踪参考输入。到第18秒左右，平均位置跟踪上了参考轨迹。到第60秒，平均位置跟踪上了期望轨迹，群体也达成并保持着期望编队，实现了蜂拥编队和稳态无静差跟踪。

图2 多智能体的编队跟踪情况1

情况2：为了验证提案控制方案的鲁棒性，在外部扰动中加入未建模干扰，即设扰动为

仍取φ(s)=s4+5s2+4，且其余参数和情况1一致。数值仿真结果如图3所示。

情况2的条件下，多智能体群依然可形成蜂拥编队，且外部扰动有内模方程未建模随机干扰时，其编队平均位置也依然能很好地跟踪期望轨迹。这反映了内模控制对干扰具有鲁棒性。

图3 多智能体的编队跟踪情况2

6 总结

本文针对多智能体蜂拥编队与轨迹跟踪控制问题，基于扩展蜂拥控制策略结合内模原理进行了讨论。方案中，蜂拥控制参数与跟踪控制参数两者的控制律设计互不影响，控制器设计过程无需反复调整修正。数值仿真说明，提案控制策略能抑制外部扰动并实现稳态无静差跟踪参考轨迹，且对未建模噪声有鲁棒性。作为今后的研究课题，考虑实现多智能体蜂拥编队的路径在线规划和跟踪控制设计有着重要的工程意义。