动态环境下的多UCAV协同任务分配研究

2012-07-04杨尚君王社伟周维杰

电光与控制 2012年7期

杨尚君，王社伟，陶军，温攀，周维杰

(空军航空大学航空控制工程系，长春 130022)

0 引言

近年来，多无人作战飞机(Unmanned Combat Aerial Vehicle，UCAV)协同控制已经成为UCAV领域的一个研究热点，而任务分配是多机协同控制的保障和基础［1-3］。虽然任务开始前通过预先规划为参战的UCAV分配了初始任务，但在战场环境中，由于作战的动态性和不确定性以及协同控制的复杂性，使得任务开始后会出现许多无法预料的情况，因此，必须根据战场态势和编队状态的变化快速调整UCAV编队的任务计划，通过动态重调度实现 UCAV之间的任务重分配，以真正适应复杂的作战环境。目前，已有学者应用拍卖机制［4-5］、在线滚动策略［6］、遗传算法［7-8］等对多UCAV的任务重分配问题进行了求解，文献［4-5］对动态环境中的突发事件利用拍卖机制进行任务重分配，但并没有对动态环境中不同性质的事件进行分类处理;文献［6］提出的在线滚动策略只是在任务层次上解决了动态环境中的任务分配问题，对动态环境中任务分配的方法研究不够。因此，现有的研究虽然取得了一定的成果，但只从动态任务分配策略或者动态任务分配方法进行单方面的研究，由于动态环境的复杂性和不确定性，动态环境中的任务分配研究应该从重调度策略和重调度方法两个方面进行研究。本文首先建立了多机协同目标分配的数学模型，提出一种改进的动态重调度策略，然后利用混合细菌觅食算法对UCAV的作战任务进行任务重分配，对动态任务分配问题在策略和方法上进行了深入研究，并通过仿真实验验证了本文提出的策略和方法的有效性。

1 多机协同目标分配的数学模型

1.1 问题的提出

本文以UCAV编队执行空对地任务为背景，战场地形以及存在于战场中的一系列目标位置在UCAV执行任务之前已经预先获得。V={V1，V2，…，VNV}为执行任务的UCAV集合，NV为对应的目标集合，NT为目标数量;M={Mt1，Mt2，…，MtNtype}为各目标 Ti上需要完成的任务类型集合，Ntype为任务类型数;考虑到未来UCAV作战使用的发展趋势，每个目标Ti包含3类待执行任务，分别为侦察、攻击和毁伤评估，即任务集合M={Classify，Attack，Verify}，由此可将任务集合表达为

其中，Nm=NTNtype为任务总数量。

为简化问题，假设UCAV编队在一个二维空间执行任务，在任意时刻 t时，UACV Vi的位置表示为((t)(t))(i∈1，2，…，NV)，目标 Ti的位置表示为()(j∈1，2，…，NT)，设 P 为 UCAV 编队的执行路线集合，任务分配的结果就是为每架无人机分配一条任务执行路线Pi，Pi={((0)，(0)，()，…，()，((t)，(t))}，其中((0)，(0))表示UCAV Vi的出发位置，((t)，(t))表示UCAV Vi的返回位置，并且((0)，(0))=((t)(t))。

1.2 决策变量的设计

1.3 协同多任务分配模型

在多UCAV协同任务分配问题中，任务分配结果的优劣程度可以通过多种评价指标予以表达。本模型将重点考虑3个指标:任务总飞行航程指标、任务完成时间最短指标、目标价值收益最大指标。为降低模型中次要因素对问题复杂度带来的影响，本模型假设无人机Vi执行任务时的速度恒定为si。本文的协同多任务分配模型定义为

式中:Pi=sixi，j;Lixi，j表示无人机 Vi执行任务 Mj所获得的收益。

本文建模重点考虑以下4种约束条件。

1)多机协同约束。

多机协同约束是指UCAV编队在执行任务时要保证任务的执行效率和UCAV执行编队任务的方式，主要包括3个方面。

①每一个任务都只能被完成一次，表示为

②每架飞机一次只能执行一个任务，表示为

③所有的任务都应该被执行，表示为

2)任务时序约束。

任务时序约束是指同一目标的不同任务Mi和Mj之间必须按照特定顺序完成，表示为

3)无人机任务类型及能力约束。

UCAV任务类型约束是指对单架UCAV，其续航能力和携带的任务载荷是有限的，表示为

2 一种改进的混合重调度策略

在多UCAV编队执行任务的过程中，由于作战的动态性和不确定性以及协同控制的复杂性，可能会出现许多无法预料的突发情况，预订的执行方案将不能适应改变的战场环境，因此，必须对原来的预订方案进行改进，对现有方案的改进就属于动态重调度问题。对于重调度问题的研究，首先应该确定重调度策略，再根据确定的策略制定重调度方法。

在动态重调度相关的研究工作中，通常采用3种类型的动态重调度策略:周期性重调度策略、事件驱动重调度策略以及混合重调度策略。由于周期性重调度和事件驱动重调度策略存在着一定的不足，因此本文选择将两种策略有效地结合，提出一种改进的混合型重调度策略。

目前，关于混合型重调度策略大多是将周期性重调度策略和事件驱动重调度策略简单地叠加到一起，为了让混合性重调度更加有效，本文设计了一种混合重调度策略。首先给出3个定义。

定义1 根据不确定事件对系统干扰的严重程度和紧急程度，设置重调度请求的响应方式有两种，分别记为有序集合Pr、De;Pr表示立即型重调度，当不确定事件对系统干扰严重或紧急程度高时，比如无人机失效，应当进行此种重调度响应;De表示可延迟型重调度，当不确定事件对系统的干扰程度和紧急程度适中时，比如发现不影响其他任务执行的新目标，可考虑延迟重调度响应，以获得良好的系统稳定性，并减少重调度次数。

定义2 为避免过度重复地启动重调度策略，设置最小重调度时间为ΔTmin，如果当前调度结束后的ΔTmin时间内，除发生紧急任务，否则待执行任务延迟到下一次重调度启动时执行。

定义3 设Lq为重调度请求表，其中按照时间顺序，依次存放等待响应重调度请求。由于立即型重调度会被立即执行，所以Lq中仅存放可延迟型重调度任务。

基于以上定义，现设计混合重调度策略执行步骤如下。1)无人机执行任务开始时，启动周期性重调度的策略。2)如果在执行任务中出现新任务Mi，对Mi进行判断，如果Mi∈Pr，立即启动重调度策略，此时，无论周期性重调度执行是否到达一个执行周期，都重新开始周期性重调度策略;如果Mi∈De，若上一次重调度到本次任务的时间间隔Δt＞ΔTmin，则启动一次重调度，同时重新执行周期性重调度;若Δt＜ΔTmin，则将Mi加入Lq列表中，等待下一次重调度启动时执行。3)当周期性重调度策略到达时间周期T时，检查Lq列表中是否有待执行的任务，如果有待执行任务，则对列表中的任务进行任务重调度，将新任务以目标价值收益最大的原则分配给无人机。

本文设计的混合重调度策略如图1所示。

图1 混合重调度策略Fig.1 The mixed re-schedule strategy

图中:M1∈De，M2∈Pr。

3 动态重调度方法

在决定了重调度策略之后，下面是选择重调度方法。现在在重调度领域中，主要有3种方式:1)生成式重调度，即根据当前状态重新生成调度方案;2)右移式重调度，它是对已有的调度方案进行整体的移动，以消除不确定事件的影响;3)修正式重调度，即根据干扰情况，对已有的调度方案进行针对性调整。由于战场环境的瞬息万变，必须选择一种反应快且能得到相对最优的方法，修正式重调度可以满足战场的快速实时性要求，因此，本文选择修正式重调度方法。

无人机编队执行任务的动态任务重调度需要解决的问题是:当有新的任务出现时，如何对任务进行实时合理的分配，使得所获得的目标收益最大，在上一节提出的混合优化策略的前提下，动态重分配可描述为:如何把新出现的任务分配给无人机，使得收益最大，这属于组合优化问题，且待执行任务不多，利用群智能算法完全可以满足实时性要求。因此，本文设计一种混合细菌觅食算法来解决动态重分配问题。

3.1 混合细菌觅食算法

基本粒子群算法(PSO)优点是算法实现简单，收敛速度快，缺点是易早熟，陷入局部最优值。基本细菌觅食算法优点［9-10］是能够较好地找到全局最优解，缺点是收敛速度慢。本文结合这两种算法的优点，提出了一种混合细菌觅食优化算法(PBFO)。

细菌觅食算法共有3步操作，分别是趋向、复制和迁徙操作，对细菌觅食算法的改进描述如下:1)用粒子群来代替细菌觅食的趋向操作，趋向操作替换为粒子群寻优的迭代过程;2)将复制操作与迁徙操作合并为以适应度作为判断条件的迁徙操作，若细菌个体适应度小于菌群的平均适应度，则对该细菌个体执行迁徙操作，即对该个体进行初始化;3)借鉴粒子群寻优思想，保留迁徙细菌个体的历史极值，以便迁徙后的细菌个体在下一次搜索中依然朝着最优的方向寻找，保证算法的快速性;4)在每一迭代过程中保留细菌个体的历史最优解和菌群的全局最优解。

这样的设计既保持了粒子群的优点能够快速收敛，又保持了细菌觅食的优点能够找到全局最优值。

3.2 算法设计

3.2.1 任务分配问题的编码方式

与遗传算法类似，编码是应用PBFO算法要解决的首要问题，鉴于多UCAV协同任务分配问题的约束性和复杂性，综合考虑编码方法的合法性和可行性，本文中的细菌个体使用的两层编码方式及其解码过程如图2所示。图中，第1行表示执行任务的UCAV Vi(i∈NV)，第2行表示与第1行UCAV序列所对应的执行目标Tj(j∈NT)序列。目标出现的次序表示对应的UCAV执行的任务类型。图中表示的两架无人机执行3个目标任务的任务分配计划具体如下所述。

首先无人机1对目标2实施侦察然后转到目标3实施攻击任务，与此同时，无人机2对目标3进行侦察然后转到1对其实施侦察。在无人机2已对目标1执行完侦察任务之后，无人机1对其发起攻击，此时无人机2对目标3实施评估，然后转到目标2对其进行攻击;待无人机1对目标1完成攻击后，无人机1对目标2进行评估，无人机2对目标1进行评估。

图2 菌体的编码及解码过程Fig.2 Bacterial encoding and decoding process

3.2.2 菌群更新机制

因为任务分配问题属于离散优化问题，因此对菌群速度和位置更新采用类似遗传算法的策略，交叉策略:在第2个串选取1个随机交叉区域，替换掉第1个串中对应的位置，并对第1个串进行修复，使其满足约束条件。变异策略:对第1行编码进行单点变异策略。

3.2.3 适应度函数

根据协同多任务分配模型建立适应度函数为

3.3 PBFO算法流程

PBFO算法流程如图3所示。

图3 PBFO算法流程图Fig.3 The flow chart of PBFO

4 仿真实验

由于本文建立的多UCAV任务分配模型是一个多目标问题，根据决策者不同的决策要求，会有多个Pareto最优解，但如何求解多目标优化问题不是本文研究的重点内容，并且介于多个Pareto最优解代表的任务分配计划在该问题的研究分析中具有相似性，本文在不影响研究分析的前提下简化仿真实验过程，将任务的价值设为常矩阵，以满足既要尽量降低作战风险，又要用尽量短的时间完成作战任务为仿真实验和分析的评价标准，即要求任务总飞行航程最短且任务完成时间最短。

假定飞行前任务控制站给UCAV编队制定了3架UCAV对5个目标执行作战任务的作战计划，需要对各个目标进行侦察、攻击以及毁伤评估3类共计15个待执行任务，分别采用CL、AT、VE标识上述3类不同任务;出于在不影响任务分配算法验证的前提下简化仿真过程的目的，本仿真实验取飞行航路为直线，其预先任务分配方案如表1所示。

表1 预订任务分配方案Table 1 The reserved task allocation plan

UCAV编队在进入战区执行预定任务过程中发生了动态事件，一种是UCAV失效，另一种是发现了新的目标。PBFO算法主要参数设置如下:菌群规模N=15，趋化操作次数L=50，迁徙操作次数S=2，菌群的趋化操作采用粒子群的迭代更新策略，设置更新参数，惯性权重 ω =0.6，加速参数 c1=0.5，c2=0.7。混合重调度策略参数设置如下:周期性重调度的周期T=45 s，最小重调度时间ΔTmin=25 s。UCAV成员性能参数、任务参数见表2和表3。

表2 任务目标设置信息表Table 2 The information of the targets

表3 无人机性能参数表Table 3 The parameters of the UCAVs’performance

1)t=80 s时，UCAV V1失效。

按照混合重调度策略，当UCAV编队开始执行任务的同时，启动周期性重调度，到达周期性重调度的调度周期时，即t=45 s时，重调度请求表Lq为空，因此，不进行重调度，UCAV编队按原任务分配方案继续执行，到达t=80 s时，UCAV V1失效，由于UCAV失效属于立即型重调度，因此立即执行任务重调度，同时重新启动周期性重调度，在t=80 s时，任务重调度的执行过程描述如下。

按照飞行前规划的分配方案，t=80 s时，UCAV编队的即时状态为:V1正在由目标T4飞往目标T5执行侦察任务，预定t=120.8 s时完成该任务，t=80 s时V1位置(310 m，220 m)，V1的剩余任务集{5-CL，3-CL，3AT}，由于 V1失效，V1的剩余任务集{5-CL，3-CL，3AT}都未被执行。

V2正在对目标T2执行侦察任务，预定t=80.6 s时完成该任务，t=80 s时V2位置(776 m，433 m)，V2的剩余任务集{2-CL，4-AT，2-VE};

V3正在等待对目标T2执行攻击任务，预定t=80.6 s时完成该任务，t=80 s时 V3位置(776 m，433 m)，V3的剩余任务集{2-AT，1-VE，3-VE，5-AT，5-VE};

则整个UCAV编队待执行任务集G={1-VE，2-CL，2-AT，2-VE，3-CL，3-AT，3-VE，4-VE，5-CL，5-AT，5-VE}，其当前态势如图 4 所示，利用PBFO算法所得到的新的任务分配方案如表4所示，计算耗时 3.1 s。

图4 t=80 s时的态势图Fig.4 The situation on time t=80 s

2)t=100 s时，新增目标T6。

首先确定UCAV编队的当前状态，在t=80 s时，由于UCAV V2失效进行了一次任务重调度，周期性重调度从t=80 s时重新启动，在t=100 s时，新增目标T6(884 m，752 m)，其侦察、攻击和评估任务的价值分别为1、4、4，由于目标突然出现事件属于可延迟型任务，因此，需要判断重调度时间间隔与最小重调度时间ΔTmin之间的关系，由于重调度时间间隔 Δt=20 s，Δt＜ ΔTmin不满足重调度条件，所以重调度将在下一个周期到来时刻t=125 s执行，在t=125 s重调度执行过程描述如下。

科玛嘉显色培养基、单核细胞增生李氏特菌、金黄色葡萄球菌等VITEK生化鉴定卡购自法国梅里埃公司。MYP显色养基、培缓冲蛋白胨水、SC、HE、肠道增菌肉汤（2μg/ml新生霉素）、碱性蛋白胨水、TCBS、TSI|、SIM动力培养基和生化管由北京陆桥技术有限公司生产。沙门氏菌诊断血清由兰州生物制品研究所生产，致泻性大肠埃希氏菌标准菌株由甘肃省疾控中心微生物检验科提供，均在有效期内。

表4 混合重调度策略下生成的任务分配方案Table 4 The task allocation plan using mixed reschedule strategy

按照上一次重调度得到的任务分配方案，t=125 s时，UCAV编队的即时状态为:V2正飞向目标T2执行评估任务，预定t=147.7 s时完成该任务，此时 V2位置(565 m，516 m)，V2的剩余任务集{2-VE};

V3正在飞向目标T5执行攻击任务，预定t=159.8 s时完成该任务，此时 V3位置(477 m，450 m)，V3的剩余任务集{5-AT，5-VE};

此时由于发现新目标T6，所以需进行任务的重新分配，整个UCAV编队待执行任务集G={2-VE，5-AT，5-VE，6-CL，6-AT，6-VE}，其当前态势如图 5所示，利用PBFO算法所得到的新的任务分配方案如表5所示，计算耗时2.7 s。

图5 t=125 s时的态势图Fig.5 The situation on time t=125 s

表5 混合重调度策略下生成的任务分配方案Table 5 The task allocation plan using mixed re-schedule strategy

从该实例可以看出，基于混合重调度策略的任务重调度能够用较少的时间计算出较满意的新任务分配方案，满足战场环境下的实时性要求。在仿真实验中，如果采用周期性重调度策略，则在t=80 s时将不会对UCAV的失效情况作处理，导致其他UCAV的后续任务无法执行，整个编队将不能按时完成任务;如果采用事件驱动重调度策略，则在t=100 s时将进行一次重调度，但由于Δt=20 s，如果进行重调度，则重调度过于频繁，不能满足实时性要求，因此混合重调度策略有效地避免了这种情况的发生。

通过以上两组仿真可知，改进的混合重调度策略根据任务的紧急程度判断是否执行重调度策略，避免了频繁地进行任务重调度，节约了系统的资源，并通过混合细菌觅食算法对动态环境中的突发任务进行了合理的分配。

5 结论

本文建立了多UCAV任务分配模型，对动态重分配策略进行研究并做出改进，将周期性重调度和事件驱动重调度进行有机结合，提出了一种改进的混合重调度策略，增加了对突发事件的处理能力，并结合粒子群算法和细菌觅食算法的优缺点，提出了混合细菌觅食算法解决多UCAV的动态任务分配问题，通过仿真分析验证了混合重调度策略和混合细菌觅食算法的有效性。

［1］王辉，陈红林.一种改进的基于时间约束的无人机任务分配模型［J］.电光与控制，2010，17(2):92-94.

［2］朱华勇，张庆杰，沈林成.提高无人作战飞机协同作战能力的关键技术［J］.控制工程，2010，17(s):52-55.

［3］AN L T H,THUAN N Q.A robust approach for nonlinear UAV task assignment problem under uncertainty［J］.Lecture Notes in Computer Science,2010，6450:147-159.

［4］CHOI H J,KIM Y D.Decentralized task assignment of multiple UAVs based on the communication strategy for dynamic Environments［C］//The Proceedings of 2010 Asia-Pacific International Symposium on Aerospace Technology,2010:522-525.

［5］施展，陈庆伟.突发情况下多UAV协同任务重分配方法研究［C］//2009中国智能自动化会议论文集，2009:331-336.

［6］霍霄华，彭辉，沈林成.动态环境中多UCAV协同控制的滚动优化［J］.计算机工程，2008，34(4):22-27.

［7］TIAN Jing,SHEN Lincheng,ZHENG Yanxing.Genetic algorithm based approach for multi-UAV cooperative reconnaissance mission planning problem［J］.Computer Science,2006(4203):101-110.

［8］袁伟东，唐敦兵，王雷，等.基于遗传算法的动态任务分配研究［J］.中国制造业信息化，2010，39(3):57-60.

［9］梁艳春，吴春国，时小虎，等.群智能优化算法理论与应用［M］.北京:科学出版社，2009:157-159.

［10］李亚楠.菌群优化算法的研究［D］.哈尔滨:哈尔滨工业大学，2009.