基于改进量子粒子群算法的多无人机任务分配*

2018-10-18连振江周德云李枭扬

指挥控制与仿真 2018年5期

邓可，连振江，周德云，李枭扬

(1. 海军大连舰艇学院，辽宁大连 116018；2. 西北工业大学，陕西西安 710072)

随着计算机技术、人工智能的发展，无人机在军事领域取得了众多成功应用，在可预见的未来，多无人机协同执行作战任务是无人机技术的一个重要发展方向[1]。美军多所科研单位、军事机构都曾以全球鹰、捕食者、X-45、X-47为研究对象，进行了多无人机协同任务分配问题研究，探讨了多无人机协同任务分配在真实战场下的作战效能[2]，并将多无人机协同作战融入一体化作战构想中[3]。多无人机协同作战是一个复杂化、多样化、智能化的作战过程，协同侦察攻击任务作为协同作战热点研究问题，指在作战区域中对目标实行协同侦察，对确定目标进行协同攻击与毁伤评估任务[4]，多无人机任务分配是协同作战的基础与保障。

文献[5]将QPSO算法应用于复合结构的无人机编队分配问题，文献[6]提出了改进的MRS与MAS系统框架针对无人机对地任务分配，但是这些框架模型存在控制参数多且难以确定的缺点；文献[7]提出了一种基于MQABC算法求解无人机任务分配问题的方法，文献[8]利用Memetic算法求解协同分配模型，文献[9]设计了一种蝗虫仿生算法针对多无人机搜救任务。但是这些算法存在收敛时间不稳定的缺陷，在多无人机协同执行单一类型任务性能优异，面对多类型任务有所欠缺。

综上所述，研究一种适用于多无人机的多目标任务分配算法具有重要意义，为多无人机协同作战奠定基础并提供保障。本文综合考虑多无人机协同任务分配问题中的各类约束，结合多目标优化理论，构建了多无人机协同任务分配模型，在QPSO(Quantum-behaved Particle Swarm Optimization)算法基础上，借鉴变异的思想，设计了变异量子门克服了多无人机协同任务分配问题中解空间狭长导致求解算法陷入局部最优的缺点，且改进了QPSO算法下的惯性权重，自适应惯性权重使得该算法具有收敛速度快，搜索能力强的优点。

1 协同多任务分配模型

1.1 问题描述

近年来，许多学者对无人机协同任务分配模型进行了研究，但大多模型为单目标优化任务分配，面对多无人机多目标优化任务分配存在收敛慢、多目标函数优化性能差的不足，针对多无人机协同任务分配的特征，本文基于CMTAP[10]通用协同任务分配模型，结合多目标优化理论，融合多无人机协同作战环境下的多种任务协同约束，构建多无人机任务协同分配模型。

广域搜索空对地战场场景下，假定敌方目标位置与战场环境已经预先获得。U={U1,U2,…,Un}为执行任务的UCAV集合，n为参与任务的UCAV架次，T={T1,T2,…,Tm}为敌方m个目标；M={MT1,MT2,…,MTm}为待执行的Mi×m个任务，对于每个目标Ti需要完成三种作战任务，分别为侦察(Classify)、攻击(Attack)和毁伤评估(Verify)，因此任务集可写为

(1)

为适当简化问题，无人机UCAVi在t时刻的位置由(xUi(t),yUi(t))(i∈1,2,…,n)表示，目标位置Ti由(xTi(t),yTi(t))(i∈1,2,…,m)表示。多无人机任务分配结果即为每一架无人机分配一条任务执行序列，即

DUAVi={(xT0,yT0,MT0),(xT1,yT1,MT1),…,(xTk,yTk,MTk)}

(2)

其中，(xTi,yTi,MTij)为Ti目标下的任务合集中的第j类任务，每一架无人机须在执行完任务序列后返回出发基地。

1.2 任务约束

多无人机协同执行任务在实际战场环境中，首先无人机受限于自身的航程以及负载，其次对目标执行侦察、攻击、毁伤评估三类任务内在包含时序要求，最后需要充分考虑协同作战的效率性，因此多无人机协同任务分配问题的多类复杂约束条件可主要归为三种，分别是任务时序约束、任务协同约束以及无人机能力约束。

2)任务时序约束是指执行侦察、攻击、毁伤评估任务具有内在先后顺序要求。假定对于敌方目标i，执行侦察任务时刻为t1，执行攻击任务时刻为t2，执行毁伤评估任务时刻为t3，t1、t2、t3必须满足：t1

1.3 问题描述

多UCAV总飞行航程指标能有效反映分配方案的作战耗损，即实际战场下多UCAV的耗油量、飞行时长等无人机自身属性约束，多UCAV的总飞行时间能直接反映分配方案的作战效率，即实际战场中多UCAV快速完成任务的能力，本文多无人机任务分配问题主要通过UCAV总飞行航程与UCAV总飞行时间这两项评价指标来评价不同任务分配方案的优劣。

假定每架无人机飞行速度恒定为V。本文的多无人机任务协同分配模型目标函数定义为：

minJ=[J1,J2]

(3)

式中J1为UCAV总飞行航程指标，其中Li为每一架UCAV的飞行航程，DUAVij为第i架UCAV任务序列中相邻目标间距离；J2为UCAV总飞行时间指标。

2 改进的量子粒子群算法

2.1 QPSO算法描述

粒子群算法是由Kennedy和Eberhart在1995年提出的，该算法本质粒子在解空间追随最优的粒子进行搜索最优解，但是粒子群优化算法不是一个全局收敛算法，且全局搜索能力对速度上限过度依靠导致算法的鲁棒性较差。由于粒子群算法的劣势，Sun等根据量子力学中的粒子行为，假设粒子具有量子效应，提出了量子粒子群算法。在量子空间中，粒子状态X=[x1,x2,…,xn]由波函数ψ(x,t)来描述，波函数为粒子在量子空间的统计概率表述，实质上波函数模的平方即为粒子的概率密度函数，因此通过求解波函数可得到粒子在量子空间下出现位置的统计概率，以随机数模拟的方式类比波函数的观测坍缩即可得到粒子位置[11]。

QPSO算法的粒子进化方程为：

(4)

其中：

P=αPi+(1-α)Pg

(5)

(6)

式中，α、μ为[0,1]上服从均匀分布的随机数；Pi为第t次迭代时粒子个体的最优位置，Pg为第t次迭代时粒子群体最优位置；P为第t次迭代时粒子个体最优位置与粒子群体最优位置之间一个随机位置；Pmbest为粒子群平均最好位置；M为粒子群中粒子的数目。

其中β为惯性权重，是影响QPSO算法收敛速度的一个重要参数，它可取为固定值，也可随着算法迭代动态变化，惯性权重一般采用线性递减策略。

(7)

通过设置惯性权重的上下边界βmax与βmin，根据式(7)按当前迭代次数t与设定迭代次数tmax的线性关系进行线性递减。通常情况下，β从1线性递减至0.5时能取得较好的结果。

2.2 变异量子门算子

QPSO算法在狭长且离散的解空间下进行全局搜索，在算法后期容易陷入局部最优解。为改进QPSO算法这一缺陷，提高对多无人机任务分配问题的适用性，本文借鉴遗传算法中的变异算子思想，设计了变异量子门算子。每次迭代后，根据粒子状态计算每个粒子的目标函数值，判断每个粒子是否处于支配状态，并将非支配解置入Pareto解集，维护并更新Pareto解集，使得Pareto解集中始终保持非支配Pareto最优解；若连续多次迭代过程中，Pareto解集未发生更新，则将粒子群按一定概率对密集程度高的部分粒子进行变异。

针对多无人机任务分配问题中解空间狭长的特点，采用通用量子门形式进行变异操作，以保证寻优过程中解的多样性。通用量子门包括量子旋转门与量子非门，其中量子旋转门使得粒子的原有量子编码进行旋转，获得新的角动量方向，量子非门则使得粒子编码位进行变异，若进行随机变异，粒子易出现飞离解空间边界的情况，将减弱算法寻优能力减缓收敛速度，因此本文根据解空间狭长的特点，以全局最优粒子位置与当前粒子最优位置取代量子非门下的随机变异操作，该种变异形式能提高算法的局部搜索能力，并且避免在狭长解空间下随机变异带来的退化现象，变异量子门算子如下所示：

(8)

式中，γ1、γ2为[0,1]上服务均匀分布的随机数。通过把变异量子门算子的引入，实现了粒子群在局部最优解中的跳变，使得QPSO算法在多无人机任务分配问题下能保证广域的搜索空间，并保证后期的局部搜索能力。实验表明，变异概率随迭代次数线性递增，上界取0.2-0.3之间的值，可获得较好的效果。

2.3 自适应惯性权重

在QPSO算法中惯性权重的大小影响全局搜索能力与局部搜索能力。实验表明，惯性权重增大可加强全局搜索减弱局部搜索，惯性权重减小时反之。对于QPSO算法中粒子群而言，粒子群当前粒子位置与全局最优粒子位置间的距离表明了算法在解空间内搜索范围的覆盖尺度。为使得QPSO算法在搜索最优解过程中的自适应机制，对于离全局最佳位置点近的粒子，应适当增大β，以保证粒子群更大的覆盖范围；而对离全局最佳位置点远的粒子，应适当缩小β，防止粒子过度分散，减弱算法的局部搜索能力。此外，在算法早期，粒子搜索域需要保持较大的覆盖范围，若粒子群过度分散，则会导致算法收敛慢的问题，此时需要控制粒子群的分散程度，防止粒子群搜索发散；随着算法迭代的进行，算法后期需要更为精确的搜索，若粒子群过于集中时，容易陷入局部最优点，使得算法陷入局部最优解，因此需要根据迭代次数与粒子群集中程度调整惯性权重，适当放大粒子群的搜索范围。

基于以上讨论，本文采用当前粒子状态与全局最优粒子状态差值来衡量粒子群的集中程度，结合算法的迭代时期来动态调节惯性权重，即

(9)

其中，t为当前迭代次数，tmax为最大迭代次数，P为当前粒子状态，Pg为全局最优粒子状态。

2.4 改进QPSO算法流程

本文提出的改进QPSO算法流程如下：

步骤1没置迭代次数t=0，设置基本参数，如总迭代次数、粒子数量等。初始化每一个粒子的波函数，计算粒子的位置概率密度函数获得粒子位置，Xi中储存最优的粒子，Pi(0)=Xi(0)。

步骤2根据式(6)计算粒子群的平均最好位置。

步骤3循环执行步骤4-9，直到粒子群所有粒子均完成更新。

步骤4对粒子i的每一维，根据式(5)计算得到一个当前位置与全局最优位置间的一个随机点位置。

步骤5计算粒子的新位置。

步骤6根据多无人机任务分配模型指标，计算粒子i当前位置X(t)的适应度f(X(t))，并根据步骤5获得的粒子新位置X(t+1)计算适应度f(X(t+1))，根据两适应度的支配关系更新最优个体值，若无支配关系则按设定概率判定是否更新。

步骤7对于粒子i，将该粒子适应值与全局最好位置的适应值比较，若支配则更新。

步骤8根据Pareto占优理论评价更新后的粒子群并维护Pareto最优解集。

步骤9根据Pareto解集更新情况与变异概率，对粒子群进行量子门变异操作，产生新个体计算适应度后重组种群。

步骤10直至满足循环条件，输出Pareto解集，否则返回步骤4。

3 仿真实验

为验证本文所提出的改进QPSO算法相比标准QPSO算法针对多无人机任务分配问题更具有有效性，本文在表1下的假定环境中，将QPSO算法与改进QPSO算法进行仿真实验对比，分析改进粒子群算法在求解多无人机任务分配问题上的可靠性与优越性。

假定作战环境为我方须对敌方5个目标区域执行作战任务，共出动5架无人机。5个目标区域所执行的任务集均为Classify、Attack、Verify三类任务，即总任务数M=15；我方无人机均具有侦察、打击、毁伤评估能力，且各个无人机出发基地位置不同，须在执行任务后返回出发基地，基地位置与目标位置见表1。

表1 UCAV与目标属性

QPSO算法和改进QPSO算法均设置粒子数量为50，最大迭代次数为2000；改进QPSO算法主要参数设置如下：Pareto解集更新不变次数为30次，变异量子门概率设为0.25。两算法分别独立运行30次，各算法的分配方案如表2所示。

图1与图2分别给出了改进QPSO算法迭代过程中，总飞行航程指标与任务完成时间指标每一代更新中最优值迭代图。由图可以看出，随着算法的迭代次数递增，目标函数均得到了优化，最后收敛至稳定值。并且从收敛曲线可以看出，改进后的惯性权重能根据算法的收敛程度，在粒子群聚集搜索空间小时，增大粒子的搜索范围，使得算法避免过早收敛，而在粒子群过于分散时，惯性权重自适应减小，防止算法收敛缓慢。

图1 航程代价变化曲线

图2 任务执行时间变化曲线

由表2可以看出，改进QPSO算法在Pareto解的前沿上搜索能力总体优于基本QPSO算法。其中改进QPSO算法下的方案1、2、3均支配QPSO算法下的方案1、2、3解集；此外，改进QPSO算法的方案1对QPSO算法下的方案1与3是支配的，并且改进QPSO算法下方案2解也对QPSO下方案2、3、4支配。由此可以看出，在两种算法获得的Pareto解集上，改进的QPSO算法能更有效地进行局部搜索，使得算法跳出局部最优解，且能保证解集的多样性。因此改进QPSO算法相比基本QPSO算法在多无人机任务分配问题上更有效。将改进QPSO算法任务分配方案2转换为UCAV任务对应表与任务执行序列，如表3与表4所示。

表2 分配方案

表3 UCAV对应任务

表4 任务执行序列

4 结束语

本文通过综合考虑多无人机任务分配约束条件，以多UCAV总飞行航程和多UCAV总飞行时间两个关键指标作为任务分配方案的评价标准，构建多无人机任务分配模型，采用改进的QPSO算法进行优化求解多无人机任务分配问题。通过仿真得到的多无人机协同任务分配方案显示，改进的QPSO算法能更好地搜索Pareto前沿，更为有效地解决多无人机任务分配问题。