基于DMPC的多无人机轨迹跟踪与避碰切换控制

2023-02-24赵超轮戴邵武何云风赵国荣

航空兵器 2023年6期

赵超轮, 戴邵武*, 何云风, 刘帅, 赵国荣

(1. 海军航空大学, 山东烟台 264000; 2. 海军航空大学青岛校区, 山东青岛 266000)

0 引言

当前, 多无人机系统在众多领域展现出巨大的应用潜力, 如搜索救援[1]、海洋勘测[2]、物资配送[3]、移动边缘计算[4]、军事作战[5]等。关于多无人机系统的研究越来越受到人们的重视。多无人机系统的一个核心问题是编队跟踪控制, 它要求无人机在跟踪参考轨迹的同时保持指定的队形。根据无人机间信息交互情况的不同, 编队跟踪控制算法可分为集中式、分布式、分散式; 根据编队控制策略的不同, 其可分为领航跟随法[6]、虚拟结构法[7]、基于行为法[8]、虚拟领航法[9]等; 根据具体的生成控制量的方法不同, 其可分为反步法[10]、滑模控制[11]、 PID控制[12]、一致性算法[13]、人工势场法[14]、模型预测控制(Model Predictive Control, MPC)[15]等。

然而, 对于多无人机系统, 大多数控制方法在各种约束条件下, 如输入饱和、速度限制、安全约束等, 不能达到最优的控制性能。相比之下, MPC[16]被认为是少数几种能够显式处理约束并优化控制性能的方法之一。而分布式模型预测控制(Distributed Model Predictive Control, DMPC)[17-18]是MPC与分布式结构的有机结合, 它兼顾了MPC滚动优化、显式处理约束的特点与分布式结构可扩展性强、计算量小的优势。因此, DMPC被广泛应用于各种场景, 如船舶编队[19]、车辆队列[20]、无人机编队[15]等。

在DMPC研究成果中, 对于编队跟踪或轨迹跟踪问题, 一般是通过在目标函数中考虑轨迹跟踪代价来解决的[21-28]。为了保证编队的安全, 编队控制器设计时必须考虑避碰问题。避碰主要包括编队系统内部单机与单机间的避碰、单机与外部障碍间的避碰, 这两者的差异在于获取避碰对象状态的方式不同, 前者可利用通信的方式进行信息的双向交互, 或利用探测的方式彼此感知, 而后者只能利用探测的方式单向感知。对于避碰问题, 主要有两种解决思路: 一是在目标函数中增加避碰代价[21-24]; 二是在约束条件中增加避碰约束[25-28]。其中, 仅增加避碰代价的优势是计算成本低, 能解决大多数的避碰问题, 但由于其本质是一种软约束, 故无法保证严格避碰; 仅增加避碰约束的优势是能保证严格避碰, 不足是计算成本较高。本文采用第2种思路。

在DMPC方法中, 对于编队内的单机而言, 其在每个采样时刻控制量的求解一般需要用到本机和邻机的状态信息。 DMPC的控制量求解方式可分为顺序式、同步式, 信息交互方式可分为迭代式、非迭代式。考虑到无人机飞行速度快, 对计算时间要求高, 这里重点研究同步式、非迭代的DMPC方法, 即在每个采样周期内, 无人机间只交互一次信息, 各无人机并行求解一次最优控制问题。

在同步式、非迭代式DMPC的研究中, Wang等[26]在考虑智能体间避碰的情况下, 设计出一种能保证系统渐近稳定的控制算法, 实现了编队的轨迹跟踪。 Yang等[27]则在文献[26]的基础上研究了智能体与静止障碍间的避碰问题。 Dai等[28]则在考虑智能体间避碰、智能体与静止障碍避碰的情况下, 实现了多智能体定点编队控制。上述文献[26-28]通过引入终端集约束、相容性约束等, 实现了在满足避碰条件下的系统渐近稳定, 因为与系统稳定性有关的参数是离线整定的, 所以上述文献要求障碍是预先已知的, 且参考轨迹上不能有障碍。

然而, 在复杂空域中飞行的多无人机系统必然要面对预先未知的障碍, 且无法确保参考轨迹上没有障碍。为此, 在假设无人机具备实时探测能力的基础上, 提出一种带有模式切换的DMPC算法。具体地, 算法中以多四旋翼无人机为研究对象, 以虚拟领航法为控制策略, 通过实时探测无人机与障碍间的距离, 判断有无碰撞风险, 进而设计出两种控制模式: 跟踪模式和避碰模式, 无人机可根据风险情况进行模式的切换。不同模式对应不同的DMPC控制器, 其中, 跟踪模式, 即无人机在无碰撞风险时所采用的模式, 是以实现轨迹跟踪为目标, 相应控制算法能保证编队跟踪控制系统渐近稳定; 避碰模式, 是以保证无人机安全为首要目标, 相应控制算法中去掉了终端代价、终端集约束, 增加了避碰约束、位置相容性约束。在避碰时, 通过暂时舍弃无人机跟踪误差的渐近收敛性来换取无人机的安全性。仿真结果表明, 该算法能够实现多无人机系统的轨迹跟踪, 并且具备无人机之间、无人机与预先未知障碍之间的避碰能力。

相比于文献[26-28], 本文DMPC方法有以下优势:

(1) 使无人机不仅能够有效规避系统内部无人机、预先已知的障碍, 也能够有效规避预先未知的静态/动态障碍, 其中包括大型障碍;

(2) 采用切换控制的思路, 根据有无碰撞风险选择合适的控制模式。相比于单一控制模式, 降低了问题求解的保守性, 减少了计算时间。

1 系统运动模型

本文重点研究多四旋翼系统的运动协调问题, 且侧重其三维平移运动过程, 因此, 在系统建模时对四旋翼模型合理简化, 重点描述其平移运动的运动学特征。

基于地球固连坐标系oexeyeze研究多无人机系统相对地面的运动状态。在地球固连坐标系中, 将地球表面假设为平面, 原点oe为地面上指定的一点,oexe轴指向地理东,oeye轴指向地理北,oeze轴垂直地面向上。

1.1 单机运动模型

假设编队中共有Nv(Nv={1, 2, …,Nv})架四旋翼无人机, 无人机间动力学解耦, 且忽略风的阻力。假设无人机配备了自动驾驶仪, 该自动驾驶仪可实现无人机的速度控制, 即把速度指令输入给自动驾驶仪后, 它能够自动控制无人机跟踪给定的速度指令。在此基础上, 第i架无人机的质心运动模型可以近似描述为如下连续时间线性时不变形式[29]:

(1)

(2)

采用零阶保持法[30]对式(2)进行离散化, 得到

xi(k+1)=Gxi(k)+Hui(k)

(3)

状态和控制输入满足如下约束:

(4)

(5)

在虚拟领航策略中, 虚拟领航机UAVr的作用是为所有真实无人机预先提供参考状态序列和参考输入, 即真实无人机可根据UAVr的状态序列以及给定的期望相对状态, 得到自身期望状态序列。 UAVr具有与真实无人机相同的数学模型, 即

xr(k+1)=Gxr(k)+Hur(k)

(6)

式中:xr=[(pr)T, (vr)T]T;xr,ur需分别满足约束式(4)～(5)。

1.2 编队运动模型

(7)

2 问题描述

假设1: 有真实无人机预知虚拟领航机的状态信息、参考输入, 以及期望的相对状态信息。

假设2: 无人机具备一定的探测能力和通信能力。在一个采样周期内, 真实无人机能够实时获取进入其探测范围内的障碍物的当前位置、速度信息, 能够实时获取进入其通信范围的无人机所发送的信息。

假设3: 不考虑外界干扰、噪声、空气阻力等对无人机动态的影响。

控制目标: 无人机编队系统在满足自身状态、输入约束的情况下, 能够按照期望的相对位置和相对速度跟踪虚拟领航机, 且具备与系统内部无人机、系统外部预先未知静态/动态障碍的避碰能力。

考虑到无人机计算资源有限, 且并不是空域内所有障碍物都会给无人机带来威胁, 只有当障碍物与无人机的距离较近时, 才有发生碰撞的风险, 因此, 基于无人机能够实时探测障碍物的能力, 根据有无碰撞风险, 设计出跟踪、避碰两种控制模式及模式切换策略。

3 控制算法设计

图1是以双机为例的带有模式切换的DMPC控制结构图。控制算法的实现是同步的、非迭代的。

图1 带有模式切换的DMPC控制结构Fig.1 DMPC control structure with mode switching

3.1 模式切换策略

图2 无人机的几个半径Fig.2 Several radii of the UAV

设k时刻UAVi所能探测到的障碍物集合为Nim, k={m|(Dim(k)-Rm)≤Rd,m∈No∪(Nv{i})},Nv{i}表示除UAVi以外的其他所有无人机集合,No={o1,o2, …}表示所有外部障碍的集合,o特指“外部障碍”。设k时刻进入UAVi避碰触发半径Ra内的障碍物集合为Nia, k={m|(Dim(k)-Rm)≤Ra,m∈Nim, k}。

假设初始时刻Nia, 0=∅, 则UAVi处于跟踪模式; 随着时间推移, 若在k时刻∃m∈Nia, k, 则UAVi切换至避碰模式,Ra是UAVi由跟踪模式切换至避碰模式的阈值。为避免模式的频繁切换, 设置UAVi由避碰模式切换至跟踪模式的阈值为Ra+Rε, 即当无人机进入避碰模式后, 只有在满足{m|(Dim(k)-Rm)≥Ra+Rε,m∈Nim, k}=∅时, 才能重新切换到跟踪模式。模式切换策略如图3所示, 其中, 横坐标为时间、纵坐标为障碍物m中心与UAVi中心间的距离。

图3 模式切换策略示意图Fig.3 Schematic diagram of mode switching strategy

3.2 跟踪模式

DMPC本质上是一种优化算法, 因此相应的问题被描述为优化问题形式。 UAVi在没有碰撞风险时, 采用跟踪模式, 其优化问题可描述为问题1。

问题1在采样时刻k, UAVi从xi(k|k)出发求解预测时域长度为N的优化控制问题, 可表示为

(8)

s.t.xi(k+l+1|k)=Gxi(k+l|k)+Hui(k+l|k),

l=0, …,N-1;xi(k|k)=xi(k);

xi(k+l|k)∈Xi,l=1, …,N;

ui(k+l|k)∈Ui,l=0, …,N-1;

xi(k+N|k)∈Ωi

(9)

求解问题1, 即要求解出满足式(9)的控制输入序列Ui(k)={ui(k|k),ui(k+1|k), …,ui(k+N-1|k)}, 使得目标函数式(8)最小。

目标函数式(8)中各项的具体形式如下:

(1)Ji, x为UAVi跟踪参考状态轨迹的代价, 形式为

(10)

(2)Ji, u为UAVi跟踪参考输入的代价, 形式为

(11)

式中:uir(k+l|k)=ui(k+l|k)-ur(k+l), 权重Si为对称正定矩阵。式(11)直观上是使无人机的控制指令尽可能接近虚拟领航机的控制指令, 其作用是抑制控制量的剧烈变化。

(3)Jif为终端代价, 形式为

(12)

该项仅存在于跟踪模式对应的问题1中, 是为保证跟踪控制系统渐近稳定而引入的, 用来近似k+N时刻以后优化问题的性能指标。其中, 权重Pi为对称正定矩阵。

约束条件式(9)中第1项为无人机预测模型, 第2项为将k时刻当前状态作为该时刻优化问题的初始状态, 第3、 4项分别为无人机自身状态、输入约束, 具体形式见式(4)～(5)。第5项为终端集约束, 设计终端集为

(13)

注1:终端集约束是为保证系统渐近稳定而引入的, 由其形式易知, 该约束要求UAVi终端状态距离参考轨迹不能太远, 而UAVi在避碰过程中经常会遇到需要远离参考轨迹的情形, 终端集约束的引入将不可避免地增加优化问题求解的保守性, 因此, 在避碰模式中去掉该约束后可增大解的可行域, 降低保守性。

值得注意的是, 在MPC方法中, 终端部分设计是保证系统渐近稳定的关键, 其包括终端代价函数、局部控制器(或局部反馈控制律)、终端集约束等3个要素的设计。其中, 终端代价函数见式(12), 终端集约束见式(13), 设计局部反馈控制律如下:

(14)

式中:Ki一般被称为终端反馈增益; 上标κ表示进入终端集的状态和相应的控制输入。

下面给出针对问题1的定理1。

定理1在满足上述假设1～3的条件下, 对多无人机系统式(7), 若单机目标函数采用式(8), 终端部分采用式(12)～(14), 通过设计Pi,Ki,δi, 使得对∀l≥N, 满足下列条件:

(15)

(16)

证明

(17)

(18)

(19)

(3) 对∀l≥N, 证明终端集(13)为正不变集。

xir(k+1)=Gxir(k)+Huir(k)

(20)

将终端控制输入式(14)代入式(20)得到

xir(k+1)=(G+HKi)xir(k)

(21)

若能够找到满足关系式(22)的正定对称阵Pi, 则

(G+HKi)TPi(G+HKi)-Pi≤0

(22)

那么, 对于∀l≥N,Ωi为系统式(21)的正不变集。易知, 若式(15)成立, 则可以保证Ωi为正不变集。

(4) 对∀l≥N, 证明关系式(16)成立。

若式(15)成立, 则式(16)成立。式(15)可转化为LMI问题, 通过选取合适的Qi,Si, 不难得到可行解。用Xi,Yi代替Pi,Ki, 则式(15)的LMI形式为

(23)

定理1证毕。

为了获取最大范围的终端域, 可通过求解下述LMI优化问题[26]得到Xi,Yi,δi, 从而得到Pi,Ki:

(24)

s.t. 式(18), (19), (23)

3.3 避碰模式

当UAVi有碰撞风险时, 采用避碰模式, 其优化问题可初步描述为问题2, 在对约束条件完成具体设计后, 将该优化问题最终描述为问题3。

问题2在采样时刻k, UAVi从xi(k|k)出发求解预测时域长度为N的优化控制问题, 可表示为

(25)

s.t.xi(k+l+1|k)=Gxi(k+l|k)+Hui(k+l|k),

l=0, …,N-1;xi(k|k)=xi(k);

xi(k+l|k)∈Xi,l=1, …,N;

ui(k+l|k)∈Ui,l=0, …,N-1;

∀o∈No,l=1, 2, …,N-1;

∀j∈Nv{i},l=1, 2, …,N-1

(26)

其中, 目标函数式(25)中两项的具体形式与式(10)、式(11)相同, 与问题1相比, 问题2的目标函数式(25)去掉了终端代价Jif。约束条件式(26)前4项与问题1的式(9)相同, 不同的是增加了与系统外部障碍的避碰约束(式(26)第5项)以及与系统内部无人机的避碰约束(式(26)第6项), 去掉了终端集约束(式(9)第5项)。其中,po,Ro分别为外部障碍o的位置与半径,Rs为无人机安全半径。

两项避碰约束的细节设计如下。

(1) 与系统外部障碍的避碰约束

式(26)给出的UAVi与系统外部障碍的避碰约束为

∀o∈No,l=1, 2, …,N-1

(27)

实际上, 正如模式切换策略所述, 只有当UAVi中心与障碍物o球面间的最短距离(Dio(k)-Ro)≤Ra时, 才引入UAVi与该障碍的避碰约束。因此, 在算法实施时, 式(27)中可取o∈No∩Nia, k。po(k+l)是障碍物o在k+l时刻的实际位置值。根据上述假设2, 对于外部障碍, 在k时刻, UAVi可通过主动探测获得其当前位置po(k)与速度vo(k)。为简便起见, 假设外部障碍的速度是慢变或不变的, 且UAVi探测到的po(k)和vo(k)是准确的, 那么, 利用式(28)对k时刻外部障碍o的位置进行预测, 则

(28)

综上, 在算法实施时, 用式(29)代替式(27)。

∀o∈No∩Nia, k,l=1, 2, …,N-1

(29)

注2:在预测障碍物的位置变化时, 采用匀速假设, 这一预测方法较为简单, 适用于障碍物速度不变或者变化较慢的情形。对于速度变化较快的障碍物, 应采用符合目标运动特性的状态模型以及状态估计算法。

(2) 与系统内部无人机的避碰约束

约束式(26)所给出的UAVi与系统内部无人机的避碰约束为

∀j∈Nv{i},l=1, 2, …,N-1

(30)

实际上, 正如上述模式切换策略所述, 只有当UAVi中心与UAVj球面间的最短距离(Dij(k)-Rs)≤Ra时, 才引入UAVi与UAVj间的避碰约束, 因此, 式(30)中可取j∈(Nv{i})∩Nia, k。

需要注意的是,pj(k+l|k)是UAVj在k时刻对自身的位置预测值, UAVi并不能在k时刻获取该值。为此, 引入假设预测状态。为避免混淆, 在预测时域[k,k+N]内, 所使用的UAVi状态、输入符号命名见表1。

表1 输入、状态符号表Table 1 Symbol table of inputs and states

一般地, 假设的预测控制输入序列由上一时刻最优预测控制输入序列与终端控制输入构成, 即

(31)

ur(k-1+N)

(32)

(33)

∃j∈(Nv{i})∩Nia, k,l=1, 2, …,N-1

(34)

式中:μ(l)=λ·l,λ为常数。注意, 若j∈(Nv{i})∩Nia, k, 则i∈(Nv{j})∩Nja, k。

另外, 为避免系统内部多个无人机同时执行避碰操作时可能引起的冲突问题, 这里采用优先级策略, 即按照某一规则, 为系统内的每个无人机赋予唯一的编号, 编号越小, 优先级越高。当某两个无人机存在碰撞风险时, 优先级高的无人机不进行规避操作, 即不引入避碰约束, 而优先级低的无人机则引入避碰约束, 进行规避操作。

因此在算法实施时, 设计无人机间避碰约束为

∀j∈Ni∩Nia, k,l=1, 2, …,N-1

(35)

式中:Ni={j|j

根据以上分析, 将避碰模式对应的优化问题最终描述为问题3。

问题3在采样时刻k, UAVi从xi(k|k)出发求解预测时域长度为N的优化控制问题, 可表示为

(36)

s.t.xi(k+l+1|k)=Gxi(k+l|k)+Hui(k+l|k),

l=0, 1, …,N-1;

xi(k|k)=xi(k);

xi(k+l|k)∈Xi,l=1, 2, …,N;

ui(k+l|k)∈Ui,l=0, 1, …,N-1;

∀o∈No∩Nia, k,l=1, 2, …,N-1;

∀j∈Ni∩Nia, k,l=1, 2, …,N-1;

∃j∈(Nv{i})∩Nia, k,l=1, 2, …,N-1

(37)

3.4 算法流程

带有模式切换的DMPC算法见算法1。

4 性质分析

在对基于DMPC方法的控制系统进行稳定性分析时, 一般是利用目标函数构造Lyapunov函数并证明其递减。为证明其递减性, 一般需要构造可行解。跟踪模式下编队控制系统的稳定性分析见定理2。

定理2在满足假设1～3且所有无人机均处于跟踪模式的情况下, 对于编队系统式(7)中的每个UAVi, 若在k时刻, 通过应用算法1, 问题1具有可行解, 那么对于后续时刻, 问题1均是可行的; 编队系统式(7)中的所有无人机能够在满足自身状态、输入约束的前提下, 渐近收敛于各自的期望状态, 即所有无人机能够按照期望的相对状态跟踪虚拟领航机。

在k+1时刻, 按照式(31)构造控制输入序列:

Ui(k+1)=ui(k+1|k+1), …,ui(k+N-1|k+1),

(38)

相应的状态序列为

Xi(k+1)=xi(k+2|k+1), …,xi(k+N|k+1),

(39)

下面讨论式(38)和式(39)所述Ui(k+1)和Xi(k+1)是否为可行解, 即其是否满足约束(9)。

对于输入、状态约束, 由构造方法知,Ui(k+1)和Xi(k+1)的前N-1项满足这2个约束; 根据定理1知,Ui(k+1)和Xi(k+1)的第N项亦满足这2个约束。

综上,Ui(k+1)和Xi(k+1)满足k+1时刻问题1的所有约束(9), 是问题1的一个可行解。以此递推, 对于后续时刻, 问题1均是可行的。

稳定性证明将k时刻所有无人机最优目标函数的和作为Lyapunov函数, 即

用可行解Ui(k+1)和Xi(k+1)构造k+1时刻的目标函数之和, 即为JΣ(k+1)。

定理2证毕。

5 数值仿真分析

5.1 仿真参数设置

采用6架四旋翼无人机进行仿真实验。

(1) 虚拟领航机UAVr初始状态、参考输入为

xr(0)=[16, 0, 50, 0, 0, 0]T

(2) 真实无人机相关参数: 初始速度均为vi(0)=[0, 0, 0]Tm/s, 初始位置pi(0)、与虚拟领航机的期望相对位置dir, 见表2。

表2 无人机初始位置、期望相对位置Table 2 Initial position and desired relative position of UAV

(3) 外部障碍物参数: 共4个球形障碍物, 参数见表3。障碍物o1为匀速运动, 速度为(0, 0.5, 0)Tm/s, 障碍物o2～o4静止; 假设只有障碍物o2是预先已知的。

表3 外部障碍物初始位置、半径Table 3 Initial position and radius of external obstacles

(4) 其他参数: 采样周期T=0.5 s, 预测时域N=6, 仿真时间为60 s, 求解优化问题的算法采用序列二次规划法。

5.2 结果分析

以UAV2为例, 离线求解LMI问题(24)得到参数:

δ2=998.36。

图4为6架真实无人机及1架虚拟领航机UAVr的三维轨迹图, 图5为该三维轨迹的俯视图。用黄色虚线表示UAVr的轨迹pr, 其他颜色的虚线表示真实无人机UAVi的期望轨迹pides。用实心方形表示无人机的初始位置, 实线为实际轨迹pi, 将无人机第2 s, 12 s, 42 s, 60 s所在的实际位置用小球表示。 3个深蓝色球分别表示静态障碍o2～o4, 2个橙色球表示动态障碍o1在第0 s和42s的位置。从图4～5中可见, 各无人机能够在避开障碍物的情况下跟踪上各自的期望轨迹, 并保持预定的队形, 而且避障的路径较短。

图4 三维轨迹Fig.4 Three-dimensional trajectory

图5 三维轨迹的俯视图Fig.5 Top view of the three-dimensional trajectory

图6 轨迹跟踪误差Fig.6 Error of track tracking

图7 无人机模式切换图Fig.7 Mode switching diagram of UAVs

图8 两两无人机间的距离Fig.8 Distance between two UAVs

图9 UAV1与UAV2间距离的局部放大图Fig.9 Partial enlarged view of the distance between UAV1 and UAV2

图10 各无人机与外部障碍物o1的距离Fig.10 Distance between UAV and external obstacle o1

图11 各无人机与外部障碍o3的距离Fig.11 Distance between UAV and external obstacle o3

在图8～11中有3条虚线, 其中, 红色虚线为安全临界线, 其值为Rm+Rs, 曲线在红色虚线以上表明无人机未与障碍发生碰撞; 黑色虚线为无人机进入避碰模式的临界线, 其值为Ra+Rm; 黄色虚线为退出避碰模式的临界线, 其值为Ra+Rm+Rε。

结合上述模式切换策略, 以UAV2为例对图6～11的仿真结果进行具体分析。图6中的绿色线表示UAV2的跟踪误差, 图7中绿色线代表UAV2的模式切换过程, 可见, UAV2有两个时间段处于避碰模式, 分别为9.5～16.5 s期间与38.5～48 s期间。结合图9与图11分析可知, 在第9.5 s时, UAV2与障碍物o3的距离为11.49 m, 小于Ra+Ro3的12 m, 故UAV2由跟踪模式切换至避碰模式, 此时引入与障碍物o3间的避碰约束式(35), 在第11 s时, UAV2与UAV1间的距离为5.48 m, 小于Ra+Rs的6 m, 此时引入与UAV1间的避碰约束式(35), 直到第16.5 s时, UAV2与障碍物o3间的距离为13.02 m, 大于Ra+Ro3+Rε的13 m, 达到退出避碰模式的阈值, 故UAV2重新切换至跟踪模式。在38.5～48 s期间, 由图10分析可知, UAV2因规避障碍物o1而再次切换为避碰模式。因此, 仿真结果符合本文模式切换策略的设计, 且不存在频繁切换模式的现象。

以UAV2为例, 在9.5～16.5 s期间, 结合图9和图11可知, UAV2为规避UAV1以及障碍物o3, 而远离期望轨迹; 在38.5～48 s期间, 结合图10可知, UAV2因规避外部障碍物o1而再次远离期望轨迹, 致使跟踪误差增大, 在避开障碍后无人机能够再次跟踪上各自的期望轨迹, 从图6中第45～58 s的局部放大图中可见, 在46 s后, UAV2的跟踪误差小于0.05 m。

图12为UAV2三个轴向的控制输入与实际速度曲线。可见, 所设计的带模式切换的DMPC算法没有出现控制量剧烈抖动的现象。所求解的控制输入、实际速度满足所设置的约束, 均小于4 m/s。

图12 UAV2控制输入与实际速度Fig.12 Control input and actual velocity of UAV2

为说明本文算法优势, 与文献[27]所述的单一控制模式下的DMPC算法进行对比实验。仿真参数设置不变。图13为对比实验的三维轨迹俯视图, 从图中可看出, 多无人机系统能够规避预先已知的障碍物o2, 也能规避预先未知的障碍物o1,o3,o4, 但是观察UAV6轨迹可见, UAV6规避障碍物o4时的轨迹较为混乱, 其原因是障碍物o4较大且处于期望轨迹上, 此时终端集约束与避碰约束间的冲突使UAV6的优化问题难以求解。而在本文算法下, 避碰轨迹明显平滑, 见图5。

图13 文献[27]算法下的三维轨迹俯视图Fig.13 Top view of the three-dimensional trajectory obtained by the algorithm of the literature [27]

采用处理器配置为Intel Core i7-9750H、主频2.60 GHz的计算机进行仿真, 两种算法求解优化问题的平均用时见表4。用σ表示优化求解的迭代终止门限, 即当目标函数值与上一次目标函数值的差值小于σ时, 迭代终止。可见, 本文算法的求解时间明显减少, 例如当σ=1×10-5时, 本文算法的求解时间相较对比实验算法减少了46.81%。