基于一致性协议的多无人机协同围捕控制方法
2021-08-24符小卫陈子浩
符小卫,陈子浩
(1.西北工业大学电子信息学院,陕西 西安 710129;2.湖北航天技术研究院总体设计所,湖北 武汉 430040)
0 引 言
无人机因为其独特的优势被充分运用于各种作战任务,典型的任务场景有:目标围捕[1-3]、目标追踪[4-6]、协同目标探测打击[7-9]等,研究这类问题可以极大地提升无人机作战智能化程度。其中目标围捕问题[10-11]主要研究如何控制无人机编队自主协调地利用队形去合围捕获个体或群体目标,在军事领域具有重要的研究价值,因此很多专家投入到相关的研究中[12-13]。
文献[14]通过游戏平台建模,基于图论针对围捕问题展开了研究,提出了两个追捕者对单目标的围捕方法。文献[15]在文献[14]场景上进行了提升,提出了一种自适应围捕控制方法,可适用于多种环境。文献[16]在目标位置、数量未知的前提下,基于改进合同网协议,提出了一种动态联盟的围捕控制方法。文献[17]提出了基于改进合同网协议的围捕任务分配策略,对围捕场景下的任务分配问题进行了讨论。文献[18-19]研究了在二维平面下多个追捕者对单个目标的追逃问题,得出了成功实现捕获目标的约束条件。文献[20]提出了一种新颖的捕食者-猎物模型,在猎物身上加入了状态属性,捕获猎物后捕食者数量会增加,捕食者通过不同状态属性采取不同的合作策略捕获猎物。文献[21]对多机器人的分散捕获行为展开了研究,分别设计了包围行为和抓取行为,通过考虑分散形式力的闭合条件来设计控制策略。文献[22]主要研究了在复杂三维多边形环境下的追逃博弈,利用改进的边值问题进行统一决策,在逃逸者发现追击者位置的情况下,研究了逃逸者与追击者之间的策略。文献[23]研究了一类合作运动路径跟踪问题,提出了一种非奇异控制律,使无人机沿期望的运动路径行驶,避免了以往的运动路径跟踪策略中的奇异性问题,对研究无人机的追踪策略具有一定的参考价值。
现有的文献从各种角度研究设计了目标围捕方法,但仍然存在一些问题。首先,研究的场景大多是二维平面,在无人机任务场景中,飞行的过程无法一直维持在二维平面内运动,研究在三维空间下的无人机围捕问题更适用于实际。其次,目标的运动方式比较单一,很多情况下只是简单假设目标做匀速直线运动,而在真实场景下,目标很可能对无人机编队的围捕行为作出反馈,需要合理地设计目标运动规律才能更好地验证围捕方法的有效性。最后,围捕队形的设计比较简单,大多数情况下的围捕队形被设计为围绕目标的圆形队形,当目标展开机动逃离包围圈时,需要合理的队形设计才能避免目标的逃脱。因此,本文为了更贴近实际无人机围捕情形,实现多无人机编队对目标的快速围捕,基于一致性协议设计了多无人机编队协同围捕算法。
本文在三维场景下,首先通过在无人机与目标之间构建人工势场函数,设计了目标对无人机的反围捕控制律,实现了两者的动态博弈关系。然后根据无人机与目标速度关系得出的阿波罗尼奥斯圆,将其扩展至三维,构建出当前速度关系下目标不可逃逸的阿波罗尼奥斯球,并据此设计了无人机编队围捕队形。最后,利用无人机在其探测范围内所获得的目标信息,基于一致性算法,利用二跳网络收敛速度快的优势,设计了无人机编队协同围捕控制律,实现了无人机编队对动态目标的快速围捕。
1 多无人机系统模型
1.1 无人机运动模型
假设三维空间中有n个无人机编队飞行,并按照1,2,…,n的顺序对其编号,并且系统中所有无人机都是相同的机械结构,将三维空间下多无人机系统描述为被控对象[24]:
(1)
式中:ri,vi,ui∈Rm(m=2),ri表示第i架无人机在惯性坐标系中的三维坐标,vi表示第i架无人机的速度。
1.2 通信网络拓扑结构
基于图论,本文使用有向图来代表多无人机系统通信网络的拓扑结构,每个顶点与无人机一一对应。为了使多无人机系统更快地收敛,本文在系统的通信网络拓扑结构中引入了二跳网络,每架无人机不仅发送自身信息,还会发送其邻机的信息,等于在通信网络拓扑图中增加了一条虚拟的通信链路,增加了其通信网络的联通性。图1(a)表示单跳网络的通信拓扑图,用实有向线段表示,图中有4个节点,有节点1指向节点2的有向线段,即代表节点1向节点2发送信息。图1(b)表示仅有二跳网络的通信拓扑图,用虚有向线段表示。图1(c)为两者叠加的通信网络拓扑图,基于文献[25]的结论,在不改变原有通信网络拓扑结构的情况下增加了通信网络的联通性,使系统更快地收敛。以节点1为例,其不仅接受来自节点3的信息,还会接收节点4的信息。这样的信息传输规则提高了各架无人机信息的利用率,与此同时降低了通信过程中信息缺失所引发的控制失效问题发生的可能性。但引入n(n>2)跳网络后,多无人机系统通信网络拓扑结构的虚拟通信链路可能会出现重叠,从而浪费编队的通信网络带宽[26]。
图1 多无人机编队系统的通信网络拓扑图Fig.1 Topology of communication network for multi unmanned aerial vehicles formation system
2 多无人机围捕控制
2.1 目标运动模型
在无人机协同编队围捕控制研究中,有关目标运动行为的控制律设计也非常重要,良好的目标运动控制律既能如实地反映围捕控制中目标逃跑的行为策略,也能更好地验证编队围捕算法的有效性。首先将三维空间下运动目标描述为被控对象:
(2)
式中:rt=(xt,yt,zt)表示目标在惯性坐标系中的三维坐标;vt=(vx t,vy t,vz t)表示目标的速度;ut表示目标运动的控制律。
2.2 目标运动控制律
(3)
据此,目标的控制律设计为
(4)
式中:kt为目标控制增益;χ为常数;dmin表示无人机与目标之间的最小距离;ati为无人机与目标的邻接矩阵,表示无人机与目标之间的探测关系,如果无人机处于目标探测范围,则ati=1,否则ati=0。用Nt代表目标发现的无人机集,在该集合内的无人机表明已被目标发现并对目标产生斥力迫使目标逃脱,其具体定义为
(5)
2.3 无人机编队围捕队形设计
编队队形围捕的想法最初起源于自然界中的动物行为,如狼群会悄无声息地组成围捕队形,队形完成后对猎物展开攻击,极大提升了对猎物的猎杀率。对于本节中的无人机编队而言,一个好的围捕队形设计将直接影响到任务的成功率,因此本节将依照无人机与目标之间的速度关系,进行无人机编队围捕队形的设计,达到目标被无人机合围后无法逃脱的效果。为此本节引入阿波罗尼奥斯圆的概念[28]。
如图2所示,P和E为阿波罗尼奥斯圆的两个定点,点M1到P、E距离之比为常数k,则点M1的轨迹则为圆。
图2 阿波罗尼奥斯圆Fig.2 Apollonius circle
引理1[29]追捕者与逃跑者恒定速度运动时,追捕者能够捕获逃跑者的范围为两者间的阿波罗尼奥斯圆,且捕获位置处于圆内,当逃跑者的运动路径不穿越两者间的阿波罗尼奥斯圆时才能成功逃脱。
将其代入到围捕问题中,假设P点为无人机位置,E点为目标位置。点M1到P、E距离之比k也表示无人机与目标的速度之比,即k=vi/vt,表明圆的相关参数与无人机和目标的速度相关。
上述有关阿波罗尼奥斯圆的研究都在二维空间下,本文将引理1扩充至三维空间,可得阿波罗尼奥斯球(以下简称阿波罗球),详见定理1。
定理1在三维空间下无人机追捕某一目标时,无人机能够捕获逃跑者的范围为两者间的阿波罗球,当目标的逃跑路径不穿越两者间的阿波罗球时才能成功逃脱,如图3所示。
图3 阿波罗球Fig.3 Apollonius ball
证明M1为球面上的点,取M1PE所在平面,由于O在直线EP上,所以平面M1PE经过圆心,平面与球的交线为圆,该圆即为阿波罗尼奥斯圆。由引理1可知,目标的逃跑路径必须经过阿波罗尼奥斯圆才有可能被无人机捕获,并且被捕获点位于阿波罗尼奥斯圆内,球面上任意一点M1所在平面M1PE与球的交点都满足引理1,所以目标的逃跑路径必须经过阿波罗球才有可能被无人机捕获,并且被捕获点位于阿波罗球内。
证毕
根据定理1,如果无人机编队最终的围捕队形是由阿波罗球所围成,那么目标无论做何种机动都无法逃离围捕球队形。阿波罗球的相关参数可根据无人机与目标的相关参数求得,阿波罗球的半径R计算公式[30]为
(6)
假设目标被围捕后即无人机编队完成围捕球队形后,经过一定的反应时间Tr将自身速度提升至无人机速度的两倍,以此来试图逃离围捕球队形,所以得k=vi/vt=1/2。而且队形达成后未达到反应时间Tr时无人机相对目标的距离不变,所以队形达成后的所有无人机的阿波罗球的半径都一致。为了达到使用阿波罗球把目标合围起来的目的,无人机编队将采用围捕球队形将目标包围,相当于用若干个阿波罗球紧密围绕成一个大球型,而这个围捕球队形的半径则为合围后无人机与目标之间的期望距离d。为了达到紧密合围的效果,设定以下几类阿波罗球。
(1)基准阿波罗球:位于球型队形顶端和底端的阿波罗球,相当于队形的南北两极,用于定位起点阿波罗球,如图4所示,标识为红色。
(2)起点阿波罗球:以基准阿波罗球为起点,在围捕球队形过球心的垂直切面上顺时针相切地增加阿波罗球直到添加到围捕球队形中心的正上方。如果末尾的位置不足以放下一个阿波罗球,则末尾阿波罗球放置于围捕球队形中心的正上方,用于定位各层阿波罗球在球型队形的环绕高度,在图4中标识为绿色。基准阿波罗球也是起点阿波罗球。
图4 基准阿波罗球和起点阿波罗球位置Fig.4 Position of reference Apollo ball and starting Apollo ball
(3)环绕阿波罗球:以起点阿波罗球为初始点,在各起点阿波罗球高度上水平相切的环绕于围捕球队形上。
图4中,P11,P21,…,Pnd1分别代表基准阿波罗圆、起点阿波罗圆对应的无人机位置,编号1,2,…,nd,O11,O21,…,Ond1分别表示各阿波罗球的球心点。设∠P11EP21=β1=2α1,∠P21EP31=β2=2α2,…,∠Pnd-11EPnd1=βnd-1=2αnd-1,由几何关系得
(7)
(8)
所以在当前场景下,只需要2个起点阿波罗球,一个靠近“南极”基准球,一个靠近“北极”基准球,根据基准阿波罗球、起点阿波罗球的位置可推算出对应无人机位置:
(10)
根据起点阿波罗球的位置,可推算出各起点阿波罗球高度上的环绕阿波罗球位置。
如图5所示,取当前高度下的圆面,让环绕阿波罗球环绕其圆心,O′E′=OE·dsinβ,E′P′=dsinβ,∠O′E′A=arcsin(O′A/O′E)=ε,所以在该高度上阿波罗球的个数是:
(11)
图5 环绕阿波罗球俯视示意图Fig.5 Top view of around Apollo ball
所以在该高度下各环绕阿波罗球的无人机的位置为
(12)
综上所述,可以用过式(10)~式(12)计算围捕球队形中各个无人机的位置偏差,然后将该偏差输入到下一节的围捕控制律中以此来达成围捕球队形的形成。
2.4 基于一致性协议的无人机编队围捕控制律
现设定有n个无人机对目标展开围捕任务,无人机自身也携带针对目标的探测器,在探测范围ρ内可发现目标存在,如果无人机发现目标aρ i=1,否则aρ i=0。用Nρ代表无人机发现目标的集,表明已发现目标的无人机集合,其具体定义为
(13)
由此,基于一致性协议,设计出无人机编队围捕控制律:
(14)
(15)
在控制律(14)的控制下,最终是否围捕成功的判定标准为
(16)
可以看出当无人机的速度达成一致、位置达成偏移量一致的条件下,无人机编队最终达到了围捕成功的效果。
3 仿真分析
仿真实验在三维空间下,设定合围后无人机与目标之间的期望距离d=10 m,根据式(6)可得阿波罗球半径R=(20/3)m,所以通过第2.3节的式(10)~式(12)计算,可得无人机围捕队形如图6所示,根据其中半径R和无人机与中心的角度关系,可计算出无人机编队形成围捕球队形的相对位置偏差为
(17)
无人机编队开始围捕任务前的采用巡航队形飞行,在未发现目标时无人机编队将使用控制律式(17)巡航飞行,发现目标后将使用控制律式(14),队形变换为图6的围捕队形。
图6 围捕队形和通信网络结构Fig.6 Capture formation and communication network structure
10架无人机的初始位置(rx,ry,rz)在[-10,35]×[-30,10]×[-5,40]、初始速度(vx,vy,vz)在[-10,10]×[-10,15]×[0,10]的范围内取值。目标初始位置为(-200,7,-2)m,初始速度为(20,5,5)m/s。在无人机协同编队围捕控制仿真中,无人机编队控制律(14)和目标控制律(4)参数设置为k1=1、k2=1.5、kt=5、dt=15、χ=2、dmin=2、ρ=12。仿真步长为0.002 s。仿真时长T设置为15 s。
在控制律式(14)下,无人机编队的位置及形成的围捕球队形如图7所示,图中蓝色五角星表示无人机当前所在位置,无人机前的箭头表示无人机当前的速度方向,无人机尾后线条表示无人机运动后的轨迹,图上数字表示仿真时长,黄色圆圈表示目标,亮绿色线条表示目标运动轨迹。图7显示的是无人机编队从初始状态到形成巡航队形,然后巡航过程中发现目标变换队形,最后形成围捕队形的过程。当所有无人机到达预设围捕队形位置后,仿真停止,由此可见整个围捕仿真过程耗时16.48 s。
图7 无人机编队围捕仿真Fig.7 Unmanned aerial vehicle formation capture simulation
无人机编队、目标的速度及相对目标位置偏差的情况如图8所示。
图8 无人机编队围捕收敛指标Fig.8 Convergence index of unmanned aerial vehicle formation capture
由图8所示为无人机编队的收敛指标,图8(a)~图8(c)显示的是仿真过程编队中各架无人机在各个坐标轴上的速度变化曲线,图中的亮绿色的线条表示目标信息,可以观察到无人机编队最终收敛至速度vd=(-4.7,-24.9,8.1)m/s。收敛时间为16.48 s左右,图8(d)显示的是无人机编队相对目标位置偏差的变化曲线,可以观察到无人机编队大约在16.48 s左右达到了期望编队的预设位置,并且各个无人机与目标之间的距离保持在期望距离d,说明整个无人机编队的稳定时间是在16.48 s左右。
4 结 论
本文针对无人机围捕目标问题进行了研究。基于人工势场法设计了无人机与目标的动态博弈关系,使得目标的运动行为更加智能,然后将阿波罗尼奥斯圆扩展至三维阿波罗尼奥斯球,基于此设计了无人机编队围捕队形,通过目标信息与无人机编队信息交互的一致性控制方法完成对目标的协同编队围捕,并引入二跳网络加快围捕队形收敛,提高了无人机编队的任务执行效率。最后通过仿真实验证明了算法的有效性。