通信带宽受限条件下的无人机集群协同搜索

2022-11-03赵飞虎梁晓龙

电光与控制 2022年10期

赵飞虎，李哲，梁晓龙，王宁，张楠

(空军工程大学,a.空管领航学院; b.陕西省电子信息系统综合集成重点实验室,西安 710000)

0 引言

现代战争的作战环境瞬息万变，作战任务日益复杂，单架无人机受自身所带载荷、探测范围等因素的影响，往往难以完成复杂的作战任务，而无人机集群可通过机间协同、信息交互等实现能力的涌现[1-2]，从而完成对敌搜索侦察、目标分配、目标打击等一系列作战任务。无人机协同搜索是未来获取战场环境信息、执行任务分配、有效打击敌方的重要手段，能够为作战中的OODA循环提供有效的信息支撑[3-4]。

针对无人机集群的协同搜索问题，传统的搜索方法主要有“Z”字型搜索[5-6]、光栅式搜索[7]和Zamboni式搜索[8]，这些方法能有效地实现对区域的覆盖，但难以适应动态复杂的战场环境，其飞行路线容易被敌方掌握，造成被击毁的风险，因此，学者们从环境建模和搜索策略两方面对协同搜索动态规划问题展开了深入研究。在环境建模方面，文献[9]引入几何学中的Laguerre图生成UAV的初始航路集,并给出了一种基于Delaunay图的Laguerre图构造算法，实现了在线航路规划；文献[10]通过将环境区域正六边形栅格化，建立搜索概率图描述目标的不确定性，并给出了基于贝叶斯准则的概率图更新方法，采用GA算法进行求解得到了最优控制输入。在协同搜索策略方面，文献[11]提出了基于模型预测控制(MPC)和动态图的协同搜索算法，将连续搜索问题简化为有限动态更新图上的一系列路径点优化，与传统固定长度、固定时间的路径点生成策略相比，明显改善了搜索算法性能；文献[12]在分布式模型预测控制(DMPC)框架下，采用粒子群和基于纳什最优相结合的算法实现了多UAV协同搜索决策计算的分散化，提高了实时应对能力和自主控制能力；文献[13]针对未知环境中无先验信息条件下的搜索问题，将任务分为搜索、通信、决策3个阶段，提出了一种以信息素为决策机制的无人机集群协同搜索算法；文献[14]建立了信息素地图，在分布式滚动时域优化框架下，保证较强的回访能力，使无人机能够尽早搜索到更多的目标。

从上述研究来看，当前学者们通过设计相应的算法和搜索策略，使无人机集群具备一定的协同搜索能力，但其研究重点是引导无人机优先搜索目标存在概率大的区域，而忽略了整个任务区域的覆盖搜索，存在覆盖率较低的问题，对于动态战场环境存在威胁、禁飞区等情况考虑较少；另外，未考虑在复杂战场环境下，无人机集群通信受干扰情况下应如何去搜索规划。

针对上述问题，本文考虑动态通信拓扑下通信带宽对搜索效率的影响，建立了意图交互机制下的无人机集群协同搜索决策框架；在分布式决策的基础上，通过引入模型预测控制实现了对禁飞区域的规避；通过获取各无人机的预决策信息，设计了多无人机的意图融合算子，保证了无人机集群高覆盖率的搜索效能。

1 问题描述与模型构建

1.1 问题描述

无人机集群协同搜索如图1所示。

图1 无人机集群协同搜索示意图

无人机集群对未知战场区域进行协同搜索，搭载探测设备和通信模块，通过传感器持续探测以及集群间的信息交互，逐步建立局部地图，并依靠地图规划航迹，完成搜索任务。战场环境中存在部分目标以及火力打击、雷达探测等威胁区域，要求在较短的时间内，引导无人机集群覆盖战场区域并规避威胁。

1.2 环境建模

针对任务区域，考虑到传统几何图形的易分割求解的优点，将其栅格化[15]，如图2所示，待搜索区域为长L、宽W的矩形区域，按照分割粒度Δd，将任务区域离散成M×N的栅格，任意一个栅格用Gxy表示，即第x列、第y行的栅格状态信息。

图2 任务区域栅格化

1.3 无人机运动模型

为了简化分析，假设无人机都在同一高度上以固定的速度飞行，通过调整航向角来改变自身航迹，其运动方程为

(1)

式中：(xi(t),yi(t))为无人机在栅格坐标系下的位置；Ιn[·]表示取整；ψi(t)为当前航向角；ui(t)为控制量，即下一时刻所需改变航向角大小，考虑了无人机转弯机动角度的限制，即ui(t)∈[-umax,umax]。

记无人机t时刻状态为

oi(t)=(xi(t),yi(t),ψi(t))

(2)

则t+1时刻状态可以通过状态转移函数f(·)表示为

oi(t+1)=f(oi(t),ui(t))。

(3)

另外，基于文献[16]，对当前无人机航向进行离散编号，假定无人机某时刻只能向相邻栅格移动，由于转弯角度的限制，并考虑到小转弯角度的偏航会节省无人机的能耗，则t时刻和t+1时刻的航向决策集如图3所示，Ω={0，1,2,3,4,5,6,7}，表示无人机可飞行的航向编号集，且下一时刻航向为{ψ(t),ψ(t)+1,ψ(t)-1}。

图3 无人机航向决策集

2 环境态势感知图模型与搜索回报函数

为了将无人机所搭载传感器获取的信息抽象出来，建立环境态势感知图来记录当前环境信息，环境态势感知图是无人机集群协同搜索的重要信息支撑，其主要功能包含两部分：1) 记录历史探测信息，供其他无人机进行信息共享，形成全局信息图；2) 根据无人机当前定位坐标和传感器感知信息，引导无人机航路规划。

2.1 环境确定度图

引入环境确定度χ(x,y,t)∈[0,1]，表示当前时刻无人机对战场环境态势的掌握情况，χ(x,y,t)=1，表示无人机对当前栅格状态完全掌握，χ(x,y,t)=0，表示无人机不了解当前栅格态势情况，定义其更新方式为

(4)

式中，λ∈[0,1]，为环境确定度的衰减因子。当没有无人机访问时，其所在栅格确定度不断衰减；无人机每访问一次，环境确定度按式(4)叠加。

2.2 搜索状态图

随着搜索任务的不断进行，逐渐掌握战场环境态势，为了避免无人机之间出现重复搜索的情况，同时也避免无人机进入敌方火力覆盖区，引入环境状态值s(x,y,t)∈{0,1,-1}来表示环境态势掌握情况，即

(5)

式中：T为威胁区；Ωs(t)为t时刻已经搜索过的区域；Ωns(t)为t时刻未搜索的区域。从降低计算量的角度出发，提出了如下更新方法。

假设无人机只对t时刻所处栅格进行更新，并且其自身携带更新变量

(6)

定义环境更新算子，对搜索状态图中无人机所处栅格更新如下

s(x,y,t+1)=s(x,y,t)⊙βxy(t+1)=min(s(x,y,t),βxy(t+1))

(7)

式中，⊙为环境更新算子，用于对当前搜索状态图动态更新。

2.3 环境态势收益函数

环境态势是当前无人机对战场环境的掌握情况，用环境确定度来描述，随着无人机探测范围的扩大，环境确定度逐步增大，应尽可能地引导无人机向着环境确定度大的方向飞行搜索，定义环境态势收益函数为

(8)

2.4 期望探测收益函数

根据搜索状态图中的环境状态值，定义期望探测收益函数，用来表示环境覆盖率的增量，设t时刻的环境覆盖率为

(9)

当s(x,y,t)>0时，ls(x,y,t)=1；当s(x,y,t)≤0时，ls(x,y,t)=0，从而引入期望探测收益函数

(10)

将上述收益函数进行加权[17]，即可得到单架无人机的总体搜索回报函数为

J(t)=λ1Jr+λ2Je

(11)

3 动态通信拓扑

传统的无人机集群之间的通信只是考虑了距离的约束，只要任意两架无人机的距离小于通信距离，即认为可以进行相互通信，实现信息共享。本章面向不同通信干扰下的战场环境，考虑了通信带宽、通信距离的影响，建立如下多无人机通信拓扑。

假设t时刻无人机Vi与Vj之间距离为di j，则有

di j(t)=‖[xi(t)yi(t)]T-[xj(t)yj(t)]T‖。

(12)

建立t时刻表征无人机集群之间距离关系的距离属性矩阵

(13)

由于战场环境的复杂性，无人机之间信息交互可能受到各种干扰，定性地来讲，一般机间距离越小越有利于各自的通信交互，定义通信可靠度为αi j,j=1,2,…,Nuav，表示当前Vi与其他无人机的通信可靠性，αi j越大，表示越能够及时准确地完成传递、交换信息的任务，反之，信息交互会受到影响。下面对通信可靠度的计算方法进行说明。

取矩阵D(t)第i行的元素组成向量βi，即

βi=(di1,di2,…,diNuav)

(14)

式中，βi表示Vi与其他无人机的距离属性向量。假设集群中所有无人机都是同构的，引入有效通信距离Dc，若

di j>Dc

(15)

则αi j=0，表示无人机不在通信范围内，无法进行通信。若

0≤di j≤Dc

(16)

则有

(17)

式中：K∈(0,1)，为噪声因子；‖·‖∞为向量的∞-范数；αi j≠αj i，αi j实际表征以Vi为中心，依据与其他无人机的距离做出的通信可靠性判断，而αj i是以Vj为中心做出的可靠性分析。

根据αi j得到通信可靠度矩阵

(18)

假设每两架无人机通信所需要的通信带宽为f，则在给定全局通信带宽Ncf的情况下，Vi的可交互成员集合为

(19)

式(19)表示，在通信带宽的约束下，Vi选择与其通信可靠度最大的第Nc架无人机进行通信交互。

4 分布式协同搜索航迹规划方法

4.1 基于模型预测控制(MPC)的路径规避方法

在实际飞行搜索中，为了避免进入敌方的火力覆盖、雷达探测等威胁区域内，需要实时进行规避，通常采用的方法是设计惩罚函数，但并不能保证无人机一定不会进入到威胁区。

威胁区域规避如图4所示。假如无人机t时刻选择a1到b2这条路径，则t+1时刻由于转弯角度的约束，只能选择b2至c3,c4,c5的任意一条路径，则t+1时刻必定进入威胁区。所以，当在a1位置时，就必须进行正确的决策，基于此，对无人机当前位置的后两个步长进行预测，并设计多步长的回报函数。

图4 威胁区域规避示意图

根据模型预测控制[17]相关理论，建立N步的无人机决策滚动优化模型，设t时刻N步的决策为Upre(t)，预测状态为O(t)，借鉴强化学习理论中的折扣率γ∈(0,1)，表示当前的搜索回报与长期搜索回报的重要程度[18]。得到N步的总体性能回报函数为

(20)

对t时刻的最优决策模型求解，即

(21)

s.t.

式中:M为输入控制的约束集;G(o(t),u(t))为其他的各类约束，如任务区域边界约束，无人机同一时刻不能处于同一栅格等。求解得N步最优预决策为

(22)

4.2 搜索意图融合与交互决策机制

(23)

式中，Nc为可以进行通信交互的无人机数量，满足第3章所建立的多无人机通信拓扑。

另外，对搜索状态图进行融合，定义融合方法为

Si(x,y,t)=Si(x,y,t)∘Sj(x,y,t)

(24)

式中，“∘”为融合更新算子[19]。运算结果如表1所示。

表1 搜索状态图融合机制

对处于Vi通信拓扑内所有无人机的预测搜索状态图进行融合更新，得到t时刻Vi的决策搜索状态图为

(25)

所以，无人机Vi的决策优化模型可以描述为

(26)

利用DE算法对上述模型进行求解，得到Vi的t时刻的决策输入，根据运动方程确定下一步路径，进而更新其位置以及环境态势感知图，以此循环。Vi完整的搜索决策框架如图5所示。

图5 Vi搜索决策框架图

考虑到多无人机在进行决策时可能会出现冲突的情况，定义了决策优先级的概念，用来表征无人机之间的决策先后顺序，优先级越高的越先进行决策，对具体步骤进行说明如下：

1) 采用随机生成规则产生无人机决策序列；

4) 重复上述步骤，直到处于通信拓扑内的所有无人机做出决策，对于不满足通信条件的无人机，根据其历史预决策信息Upre进行动态规划；

5) 此轮决策结束，返回2)，进行下一轮决策。

5 仿真实验

5.1 任务想定和参数设置

设搜索区域大小为50 km×60 km的矩形区域，采用单元网格大小为1 km×1 km的栅格对其进行均匀划分，无人机的数量为5架，其初始状态及性能约束见表2，搜索回报参数λ1为0.4,λ2为0.6,N为2。区域内存在一定数量的目标，设仿真总时长为10 000 s，将其离散为时间间隔为10 s的1000个规则步长，初始时刻的环境确定度和搜索状态如图6所示。

表2 无人机初始状态及性能约束

图6 初始环境态势感知图

5.2 协同搜索规划结果

针对通信带宽受限条件下的无人机集群协同搜索任务，首先，采用4架无人机对未知区域的覆盖率作为评价指标进行仿真验证，如图7所示，分别为100，300，700以及1000步长的无人机集群搜索路径图。

图7 无人机集群搜索路径

由图7可以看出，任务刚开始时，无人机随机进行飞行探测，随着时间的推进，在300步长时，部分区域已被针对性覆盖，到700步长时，无人机被引导向环境确定度低的区域运动，实现了对未知区域大面积覆盖，当任务执行到1000步长时，基本完成搜索任务，实现了高覆盖率的效果，并且在整个任务中，各无人机能够实时规避威胁区域，体现了第4章所提预测未来态势来进行规避的方法的有效性。

5.3 通信带宽限制下的搜索结果

根据所提的不同通信带宽下的多无人机交互机制，以覆盖率作为搜索效能的主要评价指标，采用控制变量法对不同通信带宽下的多无人机搜索效能进行分析，设仿真步长为1000，通信带宽分别为2f，4f以及无带宽限制，其仿真结果经过平滑处理如图8所示。

图8 搜索效能结果对比

由图8可以看出，无人机的搜索效能受不同通信带宽的影响，如图8(d)所示，刚开始时，各无人机受通信带宽影响不大，能够实现覆盖率稳定增长，800步长以后，覆盖率趋于平缓。在400步长时，无带宽限制的搜索效能明显优于有带宽限制的搜索效能，在600步长时，由于通信受限，无人机无法实时进行交互，出现大量重复搜索，导致2f带宽下的搜索覆盖率低于4f带宽下的覆盖率。

为了确定本文方法的有效性，在相同仿真条件下，对传统的静态平行式搜索和本文搜索策略进行仿真对比，得到如图9所示的覆盖结果。

图9 不同搜索策略覆盖效果对比

由图9可以看出，任务开始时，两种搜索策略的覆盖效果区别不大，在某个时间点有无人机出现故障时，其覆盖率曲线斜率随之降低。采用平行式搜索策略，当未出现故障的无人机执行完任务后，其覆盖率不再变化；而采用本文搜索策略，即使有无人机出现故障，其他无人机也会通过信息交互，完成对未覆盖区域的搜索，保持覆盖率稳定增长。

6 总结

本文面向通信带宽受限条件下的战场环境，建立了不同的环境态势感知图来描述环境信息，并将威胁区域的规避考虑在内，设计了搜索引导函数以及意图交互机制来动态规划无人机搜索航迹，实现了对任务区域的高覆盖率，并分析了不同通信带宽对搜索效能的影响，与传统搜索方法进行了对比，结果证明了本文所提算法的有效性和合理性。