考虑目标期望摧毁概率的多无人机任务分配方法

2021-07-12周谦高社生高朝辉夏娟洪根元

西北工业大学学报 2021年3期

周谦, 高社生, 高朝辉, 夏娟, 洪根元

(1.西北工业大学深圳研究院, 广东深圳 518057; 2.西北工业大学自动化学院, 陕西西安 710072;3.长安大学地质工程与测绘学院, 陕西西安 710054)

在现代、信息化作战系统中，传感器(雷达)和武器(导弹、火炮)的合理高效利用对作战任务效果具有重要影响。如何快速、有效地分配RUAVs和UCAVs实现对大规模目标进行监测以及攻击是目前作战规划中一项极具挑战性的热点问题[1-4]。通常可将此类分配问题分为侦查无人机-目标(RUAVs-Target,RUAVs-T)分配问题以及攻击无人机-目标(UCAVs-Target,UCAVs-T)分配问题。RUAVs-T与UCAVs-T分配问题同属任务分配，多目标协同侦查、监测和追踪任务为典型的RUAVs-T分配问题[5-6]；火力打击任务分配即为UCAVs-T分配问题[2-3]。本文针对RUAVs和UCAVs对敌作战的任务分配问题进行研究，将侦查无人机、目标、攻击无人机结合起来统一考虑，采用协同分配模型，实现RUAVs、UCAVs以及目标的协同高效、快速分配。

目前，求解任务分配的算法大致可分为数学规划方法[7-8]、基于合同网的任务分配方法[4,9]以及启发式智能优化算法[3,10]三大类。

数学规划方法作为一种确定性算法，可以给出任务分配问题的最优解。然而，求解大规模分配问题时，由于求解难度剧增会导致耗时增加，在有限时间内该方法无法保证给出满意的规划结果[1]。

基于合同网的方法将任务分配视为一个协商过程，买卖双方以出价的形式竞争获得任务的执行权。但基于合同网的任务分配方法需任务执行主体间多次协商，在问题规模较大时势必造成通信量增大以及耗时增加的问题。

以遗传算法、蚁群算法等为代表的智能优化算法，由于其不要求目标函数的连续性以及可导性，在任务分配方面引起了许多学者的研究兴趣[10-11]。智能优化算法在优化过程中，整个种群中的所有个体同时向全局最优逐渐收敛。但由于智能优化算法存有大量随机性搜索尝试，致使在求解任务分配问题时会出现效率和精度不高的现象[1]。

任务分配过程中不确定性事件是不可避免的，追求全局最优的方法势必很难满足任务分配实时性的要求[12]。因此，次优、快速的任务分配方法在解决大规模任务规划问题时的实时性优势会更加明显。文献[12]提出了一种高效的基于边缘收益构造的启发式方法(an efficient marginal-return-based constructive heuristic,MRBCH)用于解决传感器-武器任务分配问题，该算法可快速解决任务分配问题。然而任务分配问题，除实时性要求外，分配结果的合理性也至关重要。本文侧重提高任务分配结果。在以作战收益最大化的目标函数中，加入调节因子与期望摧毁概率的约束条件[13]，使任务分配结果既满足作战效能又注重经济效能。

综上所述，本文提出了一种考虑目标期望摧毁概率的RUAVs/UCAVs快速、次优任务分配方法。该方法通过改进设计分配模型的目标函数以及约束条件，保证资源的均衡分配以及避免过度分配，提高分配结果质量。改进设计了基于边缘受益最大化的贪婪算法(greedy algorithm based on maximum marginal-return,GA-MMR)对提出的分配模型进行求解。仿真结果表明，所提算法可快速高效地进行任务分配，并且明显改善了资源分配不均与资源过度分配的情形。

1 RUAV、UCAV任务分配模型

1.1 问题描述

本文考虑如下作战场景。在T时刻监测到有Nt个具有不同威胁程度的目标来袭，防御者拥有RUAVs和UCAVs拦截目标。Ns个RUAVs用来捕获跟踪目标，从而引导Nw个UCAVs对其进行摧毁。不同RUAV、UCAV对不同目标的捕获跟踪、摧毁能力不同。如何将这些RUAVs和UCAVs协同高效进行分配，达到有效抵御的目的是本文研究的关键问题。

假设每个RUAV与UCAV同时只能侦查和攻击一个目标,且UAVs具有单一的侦查或者攻击功能。用Y=[yik]Ns×Nt和Z=[zjk]Nw×Nt分别表示RUAV和UCAV与目标之间的分配集合(RUAV-T,UCAV-T),当yik/zjk为1时表示第i(i=1,2,3,…,Ns)个RUAV或第j(j=1,2,3,…,Nw)个UCAV分配给第k(k=1,2, 3,…,Nt)个目标,为0则相反。

Ps(k)表示目标k被RUAV捕获及追踪的概率,Pdes(k)表示目标k被摧毁的概率,Pw(k)表示目标k在RUAV引导下被UCAV摧毁的条件概率。则三者满足以下公式

Pdes(k)=Ps(k)×Pw(k)

(1)

假设不同RUAV和UCAV对目标的成功捕获和摧毁事件是相互独立的事件。则目标k被成功捕获追踪的概率可通过(2)式计算

(2)

式中，pik为目标k被第i个RUAV成功捕获追踪的概率。同样目标k被成功摧毁的概率计算公式为

(3)

式中，qjk为目标k被第j个UCAV摧毁的概率[13]。于是可得目标k被RUAV成功捕获追踪,且在指导下被UCAV成功摧毁的概率为

Pdes(k)=

(4)

1.2 分配模型收益函数

本文设计了一种高效的RUAVs/UCAVs、目标任务分配模型,目标函数为最大化摧毁敌方目标的价值(或最大化减少敌对目标威胁值)。

(5)

式中：R为分配方案对应收益值;vk表示目标k的威胁值(目标价值);α(k)为目标k的资源分配调节因子,其用于指导分配过程,确保资源分配的均衡性。

1.3 约束条件

该分配模型中单一RUAV只能用于捕获追踪一个敌方目标;同样单一UCAV只能用于攻击一个敌方目标。

(6)

(7)

为提高分配结果的经济效能,引入目标期望摧毁概率约束。若某一目标已分配资源(RUAVs、UCAVs)满足摧毁该目标的概率不低于其摧毁期望值(expected probability of destruction,Pd),则停止对该目标分配资源,避免造成资源的浪费;否则根据分配规则继续参与分配过程,直到分配结束。

(8)

式中：a(i,j,k)为任务所包含分配方案集合,表示将第i个RUAV和第j个UCAV分配给目标k;Pd(k)为第k个目标期望摧毁概率;remove(a(*,*,k))表示将分配方案a(*,*,k)从集合A中删除。

2 RUAV、UCAV任务分配方法

2.1 辅助决策矩阵

本文研究RUAVs/UCAVs的目标分配问题,对作战任务而言,RUAVs与UCAVs分配相互依赖。RUAVs提供目标的位置信息,UCAVs对目标进行攻击,消除威胁。本文采用三维矩阵X=[xijk]Ns×Nw×Nt表示任务分配方案集合[12],xijk为1时表示RUAV(i)与UCAV(j)分配给目标k,xijk为0则相反。在三维矩阵的辅助下,可以更清楚描述RUAVs和UCAVs与目标三者之间的关系。

2.2 约束处理方法

为保证分配方案满足约束条件(6)、(7)式,分别用变量NUs、NUw表示每个RUAV以及UCAV的使用次数。在任务分配过程中,若出现RUAV(i)/

UCAV(j)的使用次数NUs(i)/NUw(j)大于1时,则停止对RUAV(i)/UCAV(j)进行分配,将涉及RUAV(i)/UCAV(j)的分配集合从集合A中删除。既满足约束条件又可加快分配进程,减少时间消耗。

同样在分配过程中,当目标k的摧毁概率满足期望摧毁概率Pd(k)时,将涉及目标k的分配方案从分配集合中删除,加快分配进程实现高效任务分配。

2.3 任务分配规则

本文在建立目标函数基础上,采用边缘收益最大的贪心原则进行任务分配。同时为保证资源分配的均衡性,在目标函数中增加了调节因子α。

1) 边缘受益最大原则

在计算边缘收益之前,需定义概率更新规则。对于目标k而言,若无RUAVs分配则该目标未被成功捕获追踪的概率就为1;若分配的RUAVs越多,则该目标未被捕获追踪的概率就应越小,定义如下Pmis(k)更新规则[12]。

(9)

同理,定义如下Qmis(k)更新规则

(10)

式中：Pmis(k)表示目标k未被其已分配RUAVs成功捕获的概率；Qmis(k)表示目标k未被其已分配UCAVs成功摧毁的概率。{Sk},{Wk}分别为分配给目标k的RUAVs和UCAVs集合。

在任务分配开始阶段,任务分配的受益为0。当新增加任务分配方案xijk时,由于增加的xijk所带来的收益增加ΔRijk计算方法如下所示

式中：R1为xijk增加之前分配方案的收益值；R2为增加xijk之后的收益值；ΔRijk为前后分配方案的收益差值。按照边缘受益最大原则,优先选择给分配方案带来最大收益max{ΔRijk}的分配组合xijk,直到任务分配结束。

2)调节因子α

α(k)=

(14)

式中：sum(NUs+NUw)为已参与分配任务的RUAVs、UCAVs数量总和;min(Ns,Nw,Nt)为三者中的最小值;NUw(ε)和NUw(k)为目标ε和k已分配的武器个数,ε=1,2,…,k-1,k+1,…,Nt。当所有目标均未被分配武器或分配达到最小轮次时,调节因子全为1;当某一目标k已被分配RUAV/UCAV,且存有仍未被分配RUAV/UCAV的目标时,将k所对应的调节因子α(k)赋值为0。通过调节因子修正,可避免出现资源分配不均匀的情形,达到资源均衡分配。

2.4 任务分配流程

本文提出一种改进的基于边缘受益最大的贪婪算法(GA-MMR)用于解决RUAVs/UCAVs、目标分配问题,具体步骤如下所示:

Input:Ns,Nw,Nt,NUs,NUw,{v}1*Nt,{pik}Ns*Nt,{qjk}Nw*Nt;

Output:X,Y,Z,R;

1.Initialization:X←0,Y←0,Z←0,α←1,Pmis(k)←1,Qmis(k)←1;

2.Set upA=[a(i,j,k)]o*3,o=Ns*Nw*Nt,i=1 toNs,j=1 toNw,k=1 toNt;

3.while(～is empty(A))

3.1 fork=1 toNt

CalculateR1(k)

end

3.2.ifa(i,j,k) violates (6)(7)

Deletea(i,j,k);

end

3.3.ifPdes(k)>Pd

Deletea(*, *,k);

end

3.4.fork=1 toNt

CalculateR2(k) and ΔRi,j,k;

end

End while

3 仿真算例与分析

3.1 仿真数据产生

本文中所有算例数据均在允许范围内随机产生,目标威胁程度(价值)产生方法如(15)式所示

vk=vl+(vu-vl)×rand

(15)

式中，vl与vu分别为目标价值的上下限值。RUAVs成功捕获追踪目标的概率和UCAVs成功摧毁目标的概率均采用上述方法产生,其范围如表1所示。

表1 数据上下限值

3.2 仿真算例

1) 对比算法

为验证所提模型以及算法的有效性,本文选择、设计了以下对比算法。文献[12]中的MRBCH算法、加入目标期望摧毁概率的MRBCH-Pd算法以及加入调节因子(revision factor,RF)α的MRBCH-RF算法。

2) 仿真算例

根据RUAV/UCAV的数量和目标数量,本文设计了3种情况的仿真算例。情形一:RUAV/UCAV组合数量小于目标数量;情形二:RUAV/UCAV组合数量与目标数量相同;情形三:RUAV/UCAV组合数量大于目标数量。为了验证目标期望概率对分配结果的影响,特在情形三中额外设置了一组对比实验。仿真算例采用的数据如表2所示。

表2 仿真数据

3.3 仿真结果与分析

为验证所提模型方法的有效性,从算例运行时间、分配结果以及影响因素三方面对结果进行统计分析。

1) 算例仿真时间与结果

不同情形下仿真算例的运行时间如表3所示,目标期望摧毁概率设置为0.85。每种算法独立运行11次,算法运行时间取11次平均值,单位为s。从表3可以看出,文中4种算法所用时间在一定程度内均可满足任务实时性的要求。

表3 算例1～6仿真运行时间表 s

在求解算例1,3时，本文所提算法GA-MMR与MRBCH-Pd算法在运行时间上表现相近，且在求解算例2,4,5～8时GA-MMR算法比MRBCH、MRBCH-Pd及MRBCH-RF算法所需运行时间少;在算例5、6中,当RUAV/UCAV数量大于100时,所提算法相比改进前算法,运行时间分别减少27.5%和46.80%。

从表4可以看出,MRBCH算法求出分配方案的收益值最高。MRBCH-Pd、MRBCH-RF与GA-MMR 3种算法在求解算例2,4,5～8时,由于调节因子或目标期望概率约束条件的原因,未能得到收益值最大的分配方案。

表4 算例1～6分配方案收益值

图1为算例2分配方案中中各目标摧毁概率的箱线图。算例2中MRBCH-Pd与GA-MMR算法得到的RUAVs/UCAVs分配方案与其它算法相比,目标摧毁概率值更均匀。

图1 算例2不同算法分配方案中各目标摧毁概率的箱线图

由于算例2中的目标期望摧毁概率设置为0.85,当目标1,5,6,39,41,45的摧毁概率大于0.85后,其不再参与分配过程。因此,MRBCH-Pd 与GA-MMR算法未能选择收益较大的方法,将资源分给目标2,3,7,13,15以及目标23,避免了资源的过度分配,其各目标的摧毁概率如图2所示。

图2 算例2不同算法分配方案部分目标摧毁概率值

以MRBCH和MRBCH-Pd算法为参考基准, 图3为算例4各算法获得分配方案的摧毁概率差异图。MRBCH和MRBCH-Pd算法求解的分配方案中目标10和30所分配资源为0,加入分配调节因子的MRBCH-RF与GA-MMR算法放弃高收益的分配方案将6和11的资源分配给目标10和30,加强了资源分配的均匀性。针对算例5～8,RUAV/UCAV数量远大于目标数。此时,MRBCH算法将所有资源全部分配给目标,因此该算法所得分配方案具有高收益值;而GA-MMR算法引入了目标期望摧毁概率的约束,当目标摧毁概率满足设置期望摧毁概率时就会停止任务分配,避免了资源的过度分配。

图3 算例4不同算法分配方案中各目标摧毁概率的差异图

2) 目标期望摧毁概率对任务分配结果的影响

任务分配方案经济性指标与方案总收益、资源消耗成本以及作战效能均有关。为了定量对分配方案进行衡量,本文设计、提出了一种资源分配方案经济性指标用来衡量分配结果的质量。计算方式如公式(16)～(19)所示

(16)

C=w1*NUs+w2*NUw

(17)

(18)

(19)

表5 算例6～8 GA-MMR和MRBCH分配方案结果

其中min(Pdes)为分配结果中各目标摧毁概率的最小值。据表5可知,随着目标期望摧毁概率的增大,参与任务的RUAV/UCAV数量以及仿真运行时间也不断增加。另外,分配结果中所有目标摧毁概率最小值均满足设置的目标期望摧毁概率,验证了分配模型的有效性。当目标期望摧毁概率设置为0.85,0.9以及0.95时,GA-MMR算法所得分配方案的经济指标分别比MRBCH高68.4%,25.75%以及3.34%。由于任务分配初期等量RUAV/UCAV给总方案带来的收益比后期等量资源带来的收益高,因此当期望摧毁概率为0.85时,经济效能最高。通过本文所提模型与算法,任务规划者通过设置不同的目标期望摧毁概率,可以为任务决策者提供更多可供选择的任务分配方案,在满足作战效能的基础上提高了经济效能。