基于障碍Lyapunov 函数的多智能体系统误差约束同步

2020-06-22吴慕兰

网络安全与数据管理 2020年6期

吴慕兰

(中国科学技术大学自动化系，安徽合肥230026)

0 引言

近年来，多智能体系统由于在编队控制、无线传感器、机器人协作装备等领域的广泛应用而受到越来越多的关注。作为多智能体系统研究中的基础问题，同步指所有智能体在某些变量例如位置或速度上达到一致的动态过程。目前存在的有关同步问题的工作主要分为两类：一类是无领航者的同步问题[1]，一类是领航-追随者同步问题[2]，并且其中大多数工作是关于线性系统的。但是在实际情况中系统不可避免地会出现各种非线性和不确定性项，因此未知非线性多智能体系统的同步已成为一个研究的热点。

由于神经网络方法[3-4]具有可以从样本集学习复杂映射的能力，其可以在线学习对未知非线性动力学系统的识别。基于神经网络固有的非线性逼近能力和内在的自适应学习特征，原始的控制问题常常可以转化为神经网络自适应控制问题[5-6]。这类控制策略能保证系统的一致性误差最终可以稳定在一个较小的界内，其大小取决于模型中的一些显式参数和未知但有界的项，然而并没有系统的方法去计算这些上界，因此无法去准确地评估最终的稳定状态性能。同时，不确定性使得控制过程中误差的收敛速度也难以准确地评估。实际控制过程中，希望系统在各项参数设计好后满足给定的稳态性能和瞬态性能，即系统的误差最终收敛到给定的较小的界内，同时收敛的速度不小于给定的值。KATSOUKIS T 等通过使用预设性能控制的方法来实现这一同步误差约束[7]，其最终目标是使得每个智能体的同步误差严格地在预设区域内演化。关键思想是通过转换后的同步误差将每个智能体的约束误差放宽为不受约束的误差，但是转换后的误差会增加需要处理的变量的数量且控制效果不稳定。

本文采用障碍Lyapunov 函数方法[8]解决误差约束问题从而避免引入转换误差，设计了新的分布式障碍Lyapunov 用以研究多智能体系统问题，实验结果表明同步误差能够被严格限制在预设范围内演化。

1 预备知识

1.1 图论

1.2 投影算子

投影运算常被用于自适应控制中约束被估计的参数，下面给出一类投影算子的定义。

对于N 维实向量θ，y ∈RN，投影算子Proj 的定义如下：其中标量函数φ：RN→R 是一个连续的凸函数，φ′(θ)是φ(θ)关于θ 的偏导数。

定义凸集合Ω0≜{θ ∈RN|φ(θ)≤0}以及Ω1≜{θ∈RN|φ(θ)≤1}。由文献[10]可知，在上文定义的投影算子Proj(θ，y)和初始值θ(t=0)=θ0∈Ω1下，θ永远不会超出集合Ω1。同时对于任意的θ*∈Ω0和任意的y∈RN，下面的不等式成立：

2 问题描述

给定一个由N 个追随者和一个标记为0 的领航者组成的多智能体系统。第i 个追随者的动力学方程如下：

其中，xi∈R 是追随者i 的状态，ui∈R 表示施加在追随者i 上的控制输入，δi∈R 是外界干扰因素，fi(xi)∈R 是满足局部Lipschitz 条件的非线性函数。

领航者根据以下动力学方程演变：

其中x0∈R 是领航者的状态。

本文的目的在于实现多智能体的同步，同时同步误差限定在给定的范围内以满足预期的瞬态和稳态性能。为此，定义了邻居同步误差：

和与时间有关的性能函数：

其中ρi0、ρi∞、mi是根据初始条件和期望性能选择的合适参数，期待达到的误差约束可以通过以下不等式说明：

即希望误差ei的最大超调量不超过ρi0，最终收敛值小于ρi∞，收敛的速率不小于mi。

3 主要结果

3.1 人工神经网络

其中神经元的个数为vi，Wi∈Rvi是一个未知的理想权重列向量，其定义如下：

其中Si(xi)∈Rvi是一组基函数向量，多种类型的基函数如sigmoid 函数、高斯函数都可以使用在神经网络中[5]。

真实的权重向量Wi值常常难以获得，采用估计值代替则有：

3.2 分布式障碍Lyapunov 函数

障碍Lyapunov 函数是自适应控制系统中常用来限制变量的工具。它是一类定义在包含原点的开区域上的标量函数，一旦变量趋向于给定的边界，障碍Lyapunov 函数便会趋向于无穷大。若能够设计合理的控制器保证障碍Lyapunov 函数是有界的，那么变量就会永远限制在给定的区域。在介绍分布式障碍Lyapunov 函数之前，先给出一个相关的正定矩阵性质[11]。

令(L+B)是一个非奇异M-矩阵。定义向量