基于对抗的突击武器与支援武器协同火力打击决策方法

2019-04-17孔德鹏常天庆郝娜张雷郭理彬

兵工学报 2019年3期

孔德鹏，常天庆，郝娜，张雷，郭理彬

(陆军装甲兵学院兵器与控制系，北京 100072)

0 引言

多武器对多目标的协同火力打击(CFS)能够有效地提高作战集群的整体作战效能[1]。不同于传统多武器对多目标的协同打击，多类型武器的协同既能充分发挥不同类型武器的作战优势，又能减少武器所受的战场威胁。突击武器和支援武器的协同打击是陆地战场协同作战的重要方式之一，突击武器位于作战前沿，距离目标近，遭受威胁大，通常执行“点对点”打击任务[2]；远程火力支援武器位于战场后方，负责远距离火力压制，通常执行“面杀伤”任务[3]。突击武器对目标的打击决策主要研究武器- 目标分配(WTA)问题，获得最佳的打击效能；远程支援火力对目标的打击决策主要是确定炮弹的落点位置，以获得最大的火力压制和毁伤效果。

研究WTA是解决多武器CFS的有效途径之一[4-5]。目前，WTA问题主要针对同类型的武器对目标的打击过程，研究作战要素之间的协同打击决策，如目标- 导弹- 防卫武器之间的协同决策[6]，传感器- 武器- 目标之间的协同决策[7]以及不同作战阶段的协同打击决策[8]。但是，由于作战运用方式不同，不同类型武器之间的火力协同仍缺乏有效的定量分析方法。WTA问题的实质是约束组合优化问题，属于非确定性多项式(NP)问题[9]，WTA问题的求解方法也是目前的一个研究热点，如大规模邻域搜索算法[10]、离散粒子群算法[11]、离散差分进化算法[12]、蚁群算法[13]等，这些优化方法能够获得WTA问题的满意解，为研究CFS问题提供了重要基础。

突击武器进行“点对点”打击，支援武器进行“面杀伤”的火力覆盖，因此如何进行突击武器与支援武器有效的CFS是本文主要研究内容。此外，双方作战对抗过程具有非零和博弈的对抗特性[14]，在考虑武器对目标进行打击决策优化过程中，也需要考虑目标对武器打击决策的优化。因此，针对不同类型武器的协同打击决策，只有将双方的博弈对抗特性加入到决策优化过程中[15-16]，才能获得合理的CFS决策结果。

本文针对不同类型武器CFS的决策问题，以作战双方对抗为基础，首先分析了协同武器作用下双方的火力打击决策模型；在此基础上，以双方剩余价值的比值作为决策优化的目标函数建立CFS决策模型；然后基于人工蜂群(ABC)算法，提出一种双层迭代的模型求解算法；最后通过一个算例对本文方法的有效性进行验证。

1 突击武器与支援武器CFS决策模型

1.1 突击武器和目标的火力打击决策模型

本文主要针对以直瞄武器为主的地面突击武器进行研究，突击武器对目标的命中概率可以通过(1)式进行确定。

f(x)=r1xl+r2xl-1+…+rlx+rl+1,

(1)

式中：r1,r2,…,rl+1为多项式参数；x为武器与目标之间的距离。

突击武器W对目标T在距离为x的毁伤概率P(W,T)可以通过命中概率f(x)和毁伤效能E(W,T)计算得到：

P(W,T)=f(x)E(W,T).

(2)

根据战场态势信息可以获得突击武器和目标的位置信息，因此，突击武器对目标的毁伤概率可以根据(2)式计算获得。

(3)

(4)

合理分配我方突击武器对目标的打击决策，使得目标剩余的战场价值最小，则可以建立如下突击武器打击目标的决策模型(5)式和(6)式：

(5)

(6)

同样，由于作战的对抗特点可知，目标也对突击武器进行打击决策优化，使得突击武器剩余的战场价值最小，于是建立如下目标打击突击武器的决策模型(7)式和(8)式：

(7)

(8)

1.2 支援武器协同的突击武器和目标的打击决策模型

1.2.1 支援武器的协同打击对目标影响

k个远程支援武器S1,S2,…,Sk协同打击n个目标T1,T2,…,Tn，n个目标的位置(考虑二维情况)Pos(T)为

(9)

设k个远程支援武器炮弹落点位置为Pos(S)，D为目标区域，Pos(S)⊆D.

(10)

(11)

式中：zij为支援火力覆盖变量，zij∈{0,1}，zij=0表示支援火力Si的火力没有覆盖到目标Tj，zij=1表示支援火力Si的火力覆盖了目标Tj.

支援火力覆盖矩阵Z=(zij)k×n，支援火力覆盖变量zij为

(12)

1.2.2 支援武器协同下突击武器和目标火力打击的决策模型

在支援火力的协同打击下(炮弹落点位置为Pos(S))，突击武器对目标的打击决策模型如(13)式和(14)式所示。通过优化打击决策变量X，在给定支援火力协同打击火力覆盖方案为Z时，使得目标剩余的战场价值最小。

(13)

(14)

目标打击突击武器的决策优化模型如(15)式和(16)式所示，通过优化打击决策变量Y，当支援武器CFS的炮弹落点为Pos(S)时，使得对方武器战场剩余的价值最小。

(15)

(16)

式中：Js(W)(Y,Pos(S))为武器战场剩余价值。

1.3 CFS决策模型

突击武器对目标打击和目标对突击武器的打击具有对抗博弈的特点，武器和目标都希望在其有限资源中能够获得最大的毁伤效果。因此，合理分配我方突击武器，使得突击武器对目标的毁伤最大而目标对突击武器的毁伤最小，以达到协同打击的作战目标。

作战对抗过程中，双方作战武器剩余价值都因受到火力打击而减小，当一方的剩余价值远远大于另一方时，则可判定作战胜负。因此，采用双方剩余价值的比值作为目标函数，满足战场双方对抗博弈的决策需要。目标和突击武器在支援武器的协同打击下，都对自身的决策进行优化，获得对对方的最优毁伤效果，协同打击决策模型如(17)式和(18)式所示：

(17)

(18)

模型(17)式和(18)式中需要优化协同打击的支援武器的炮弹落点位置Pos(S)，突击武器对目标的打击决策X，目标对突击武器的打击决策Y，使得在该种打击决策方式下，突击武器和支援武器对目标的协同打击能够获得最优的打击效果。

2 CFS决策求解算法

模型(17)式和(18)式属于双层优化模型，即模型的约束也是一个优化问题。因此，本文采用基于双层迭代的ABC算法进行求解。

2.1 ABC算法

ABC算法是一种模拟蜜蜂采蜜行为的群智能优化方法，具有寻优效果好、控制参数少、实现简单等特点[17-18]。ABC由3种蜂组成：采蜜蜂、观察蜂、侦察蜂，采蜜蜂和观察蜂的种群数量都为SN，每个蜜蜂所在的食物源位置为优化问题的解，食物源的质量为解的评价值。

2.1.1 初始化

每个食物源的位置用D维向量表示：xi=[xi1,xi2,…,xiD]，i=1,2,…,SN. 食物源的初始位置随机产生，解空间上限UB=[UB1,UB2,…,UBD]，下限LB=[LB1,LB2,…,LBD]，则初始的食物源位置即初始解为

xid=LBd+(UBd-LBd)rand(0,1),

(19)

式中：i=1,2,…,SN；d=1,2,…,D；rand(0,1)是[0,1]上均匀分布的随机数。

2.1.2 采蜜蜂

每一个食物源xi对应一个采蜜蜂，每个采蜜蜂随机选择一个邻居进行邻域搜索更新食物源，获得新的食物源为vi，

vid=xid+φid(xid-xkd),

(20)

式中：vid为vi的第d维变量；φid为[-1,1]上均匀分布的随机数；k∈{1,2,…,SN},k≠i是随机选择的一个邻居。获得新食物源后，按照贪婪选择的方式更新食物源。

2.1.3 观察蜂

当所有采蜜蜂进行邻域搜索后，将所在食物源信息共享给观察蜂，观察蜂根据各食物源的质量进行概率选择。第i个食物源被观察蜂选择的概率为

(21)

食物源的适应度值fiti按照(22)式进行计算：

(22)

式中：fi是第i个食物源的评价值，由所求解问题的目标函数计算得到。

观察蜂根据选择概率pi选择一个食物源后，与采蜜蜂相同，按照(20)式更新食物源位置。

2.1.4 侦察蜂

当采蜜蜂或观察蜂多次搜索同一食物源却没有获得更好的食物源，则放弃该食物源，变为侦察蜂，并按照(19)式随机搜索一个新食物源xi替代该食物源。

2.2 基于双层迭代人工蜂群算法的模型求解方法

2.2.1 基于罚函数的约束处理方法

针对(13)式和(14)式所示的模型约束问题，本文采用罚函数方法，将约束变为惩罚项加入模型中。以模型(13)式和(14)式为例，约束处理后的模型变为

(23)

(24)

式中：α1和α2为罚因子；zij∈{0,1}可由落点覆盖范围计算得到。

(25)

(26)

同理，模型(15)式和(16)式约束处理后可转化为模型(27)式和(28)式：

(27)

(28)

2.2.2 基于ABC算法的突击武器打击目标的决策模型求解方法

通过基于罚函数的约束处理，突击武器打击目标的决策模型转化为无约束整数优化，利用ABC算法良好的寻优能力，对模型进行求解。基于ABC算法求解模型(25)式和(26)式的伪代码如算法1所示。模型(27)式和(28)式求解方法与模型(25)式和(26)式相同。

算法1基于ABC算法求解模型(25)式和(26)式：

01:Initialization:根据(20)式随机产生SN个初始解x1,x2,…,xSN;

02: 根据(25)式和(22)式计算初始解的适应度值fit(x1),fit(x2),…,fit(xSN);

03:whileFES

04:fori=1:SN// 采蜜蜂阶段

05: 根据(20)式产生一个新的解vi并根据(25)式和(22)式计算新解的适应度值fit(vi);

06:iffit(vi)>fit(xi)

07: Setxi=vi,fit(xi)=fit(vi),trial(i)=0;

08:else

09:trial(i)=trial(i)+1;

10:endif

11:FES=FES+SN;

12:endfor// 采蜜蜂阶段结束

13: 根据(21)式计算观察蜂的选择概率P;

14:whilet<=SN// 观察蜂阶段

15: 根据概率P选择一个解xi，根据(20)式产生一个新的解vi;

16: 根据(25)式和(22)式计算新解的适应度值fit(vi);

17:iffit(vi)>fit(xi)

18: Setxi=vi,fit(xi)=fit(vi),trial(i)=0;

19:else

20:trial(i)=trial(i)+1;

21:endif

22:FES=FES+SN;

23:t=t+1;

24:endwhile// 观察蜂阶段结束

25: 记录当前最优解x;

26: 找出当前最大的trial值trial(i); //侦察蜂阶段

27:iftrial(i)>limit

28: 根据式随机生成一个解替换xi;

29:trial(i)=0,FES=FES+1;

30:endif//侦察蜂阶段结束

31:endwhile

32:Output:全局最优解x.

2.2.3 基于双层迭代ABC算法的CFS决策模型求解方法

CFS模型(17)式和(18)式的约束也为一个优化问题，因此，模型(17)式和(18)式为双层规划问题[19]。本文采用双层迭代ABC算法进行求解。双层迭代ABC算法是针对双层规划问题，上下层规划问题都通过ABC算法进行求解，然后通过上下层之间的多次迭代寻优，获得优化结果。主要步骤如下：

1)设定上下层ABC算法的参数；

2)随机产生一个支援武器的炮弹落点(上层优化变量)；

3)计算炮弹落点对目标价值和目标对突击武器毁伤概率的影响，更新相应的决策参数；

4)基于更新的决策参数，利用算法1计算最优下层决策；

5)基于最优下层决策，计算评价指标值J(X,Y,Pos(S))；

6)根据评价指标，更新上层的炮弹落点位置，返回步骤3，直到满足迭代要求。

经过多次迭代计算可以获得最优协同打击决策。支援火力落点Pos1,Pos2,…,Posk的编码为[x1,x2,…,xk,y1,y2,…,yk]. 求解CFS决策模型(17)式和(18)式的伪代码如算法2所示。

算法2基于双层迭代ABC算法求解CFS决策模型(17)式和(18)式：

01:Initialization:根据(19)式随机产生SN个初始解Pos1,Pos2,…,PosSN;

02: 基于算法1计算初始解的适应度值fit(Pos1),fit(Pos2),…,fit(PosSN);

03:whileFES

04:fori=1:SN// 采蜜蜂阶段

05: 根据(20)式产生一个新的解newPosi;

06: 基于算法1，计算新解的适应度值fit(newPosi);

07:iffit(newPosi)>fit(Posi)

08: SetPosi=newPosi,fit(Posi)=fit(newPosi),trial(i)=0;

09:else

10:trial(i)=trial(i)+1;

11:endif

12:FES=FES+SN;

13:endfor// 采蜜蜂阶段结束

14: 计算观察蜂的选择概率P;

15:whilet<=SN// 观察蜂阶段

16: 根据概率P选择一个解xi，并根据式产生一个新的解newPosi;

17: 基于算法1，计算新解的适应度值fit(newPosi);

18:iffit(newPosi)>fit(Posi)

19:SetPosi=newPosi,fit(Posi)=fit(newPosi),trial(i)=0;

20:else

21:trial(i)=trial(i)+1;

22:endif

23:FES=FES+SN;

24:t=t+1;

25:endwhile// 观察蜂阶段结束

26: 记录当前最优解Pos以及基于算法1的最优解x,y;

27:iftrial(i)>limit//侦察蜂阶段

28: 根据(19)式随机生成一个解替换Posi;

29:trial(i)=0,FES=FES+1;

30:endif//侦察蜂阶段结束

31:endwhile

32:Output:全局最优解Pos,x,y.

2.3 双层迭代求解算法的计算复杂度分析

种群数量为SN，变量维度为D的ABC算法计算复杂度为O(SN·D)[20]。支援武器炮弹的落点位置编码长度为2k，武器打击目标的编码长度为m，目标打击武器的编码长度为n，设每个算法的种群个体数相同，都为SN，则3个优化方法的复杂度分别为O(SN·2k)、O(SN·m)和O(SN·n). 由于计算最优解过程中，每给定一个落点位置，都需要计算武器和目标的打击最优决策，复杂度为O(SN·m)+O(SN·n). 因此，三者融合在一起的算法复杂度为O(SN(SN·m+SN·n)2k)，记为O(SN2(m+n)2k).

3 CFS决策算例分析

本文通过一个协同打击的算例，验证CFS决策模型和算法的有效性和合理性。

3.1 协同打击算例参数设置

10个突击武器打击7个目标。已知突击武器和目标的战场坐标位置为Pos(W)和Pos(T).

Pos(W)={(98 m,1 601 m),(205 m,770 m),

(400 m,1 130 m),(640 m,1 390 m),

(830 m,720 m),(972 m,1 408 m),

(1 140 m,260 m),(1 353 m,1 150 m),

(1 500 m,501 m),(1 670 m,1 301 m)},

Pos(T)={(323 m,4 010 m),(435 m,3 300 m),

(620 m,3 930 m),(912 m,4 220 m),
(1 153 m,3 208 m),(1 380 m,3 960 m),
(1 531 m,3 400 m)}.

突击武器和目标的战场价值V(W)和V(T)分别为

V(W)=[0.55,0.74,0.66,0.42,0.53,0.73,0.9,0.55,0.48,0.65],
V(T)=[0.45,0.54,0.76,0.88,0.43,0.55,0.75].

突击武器的命中概率参数为Par1，目标的命中概率参数为Par2. 设突击武器对目标的毁伤能力都为E(Wi,Tj)=0.7，目标对突击武器的毁伤能力都为E(Tj,Wi)=0.8.

Par1=
[1.598×10-11-1.408×10-71.199×10-49.460×10-1],
Par2=
[1.566×10-11-1.331×10-78.627×10-59.122×10-1].

首先计算突击武器与目标之间的距离，然后根据(1)式计算命中概率，最后根据(2)式计算毁伤概率，结果分别如表1和表2所示。

表1 突击武器对目标的毁伤概率

3.2 协同打击对毁伤概率矩阵的影响

Pos(S)={(627 m,3 899 m),
(1 363 m,3 690 m),(1 140 m,3 372 m)}.

表2 目标对突击武器的毁伤概率

根据(12)式可以计算得到覆盖变量矩阵Z为

根据(11)式计算得到：协同打击下目标对突击武器的毁伤概率为表3所示；支援武器炮弹打击下的目标战场价值V′(T)，

V′(T)=
[0.383,0.540,0.646,0.748,0.366,0.468,0.542].

从表3和表2中数据对比以及目标战场价值的变化可以看出，支援武器的协同打击下，使得目标战场价值和对突击武器毁伤概率都有一定程度的降低。支援武器的协同能够提升整体打击效能，同时也能减少我方突击武器所受的威胁。

表3 协同打击下目标对突击武器毁伤概率

3.3 基于双层迭代ABC算法的模型求解

由于双层迭代的ABC算法复杂度较高，因此必须保证每次下层获得的为最优解，否则上层的迭代将没有意义。因此，本节首先测试下层的求解能力，再验证整体的优化效果。设置ABC算法的参数如表4所示。

表4 ABC算法参数设置

3.3.1 测试ABC算法求解下层模型的收敛能力

从图1中可以看出，ABS算法求解模型(17)式和(18)式和(25)式和(26)式在迭代2 000次时算法收敛，算法的鲁棒性较高，能够满足双层迭代的求解需求。此外，在图1所示的4种条件下算法独立运行30次，获得的最大值、最小值、平均值和标准差如表5所示。从图1和表5可以看出，算法具有较好的寻优能力，能够获得满意解。

图1 不同条件下平均收敛曲线和最优值对比Fig.1 Comparison of average convergence curves and optimal values under different cases

3.3.2 计算CFS决策

根据算法2，设置上层迭代次数FES=2 000，下层迭代次数FES=4 000. 由于下层算法的结果是上层计算的基础，从3.3.1节的结果可以看出，当FES=2 000时算法接近收敛，为了保证下层算法具有足够的精度同时考虑算法的复杂度限制，设置下层算法的迭代次数FES=4 000. 经过迭代计算，算法的每次迭代过程中，目标剩余价值和突击武器剩余价值如图2所示。目标剩余价值与突击武器剩余价值随迭代过程不断变化，二者比值(目标函数)的迭代变化曲线如图3所示。由于目标受支援武器的打击仅考虑被火力覆盖和没有被火力覆盖，因此图3所示的迭代变化曲线呈阶梯状下降而不是连续平滑曲线。目标剩余价值与突击武器剩余价值随着不断变化，并有增加的情况，但是二者比值始终减小，满足作战需要。

图2 目标剩余价值和突击武器剩余价值变化关系Fig.2 Relationship of residual values of targets and assault weapons

图3 目标剩余价值与突击武器剩余价值的比值变化关系Fig.3 Ratio of residual values of targets and assault weapons

经过基于双层迭代ABC算法的计算，获得的最终结果为：支援武器炮弹的最优落点Pos(S)={(634 m,4 220 m),(927 m,3 860 m),(758 m,3 847 m)}，在最优炮弹的落点下，突击武器打击目标的最优决策Sol(W)=[3 1 2 4 2 6 5 7 5 7]，目标打击突击武器的最优决策Sol(T)=[1 3 2 8 6 1 10]，双方对抗态势图如图4所示。

图4支援武器打击区域以圆圈表示。支援武器的炮弹覆盖了大部分目标，且目标距离我方突击武器较远，使得突击武器可以集中火力打击较近距离的目标，使得整体的作战效果最优。突击武器和目标都是以最优的决策打击对方，反映了战场对抗的特性。结合图3可以看出，通过迭代优化计算，目标和突击武器剩余战场价值的比值明显减小，提升了整体的协同作战效果。

图4 双方对抗态势图Fig.4 Confrontation situation map of both sides

3.4 求解算法对比

风驱动优化(WDO)算法是基于大气中空气质点运动的优化方法。文献[19]提出了一种层次WDO算法，能够有效求解双层规划问题，因此，本文将其作为对比算法。层次WDO算法的具体求解过程简单介绍如下：

1)设定两层WDO算法的种群规模、迭代次数等参数；

2)初始化上层、下层最优解Xo、Yo；

3) 基于上层优化变量Xo，在满足约束条件的同时，利用WDO算法对下层规划进行优化求解，更新下层最优解Yo；

4)基于下层优化变量Yo，在满足约束条件的同时，利用WDO算法对上层规划进行优化求解，更新上层最优解Xo；

5) 完成迭代次数后，输出最优解Xo、Yo.

对比算法采用与本文相同基于罚函数的约束处理方法和相同编码方法。由于对比算法是交互迭代，与本文的双层迭代不同，无法单独对比上层和下层的优化能力，因此仅对比算法最终的寻优结果(目标函数J(X,Y,Pos(S)))。设置与本文算法相同的迭代次数：下层迭代FES=4 000，上层交互迭代FES=2 000. 层次WDO算法的参数α=0.8，g=0.7，RT=2，c=0.4. 交互迭代过程中，算法收敛曲线如图5所示。

图5 层次WDO算法求解模型收敛曲线Fig.5 Convergence curve of solving the model by hierarchical WDO algorithm

从图5可以看出，层次WDO算法求解算法在交互迭代1 500次时收敛，能够对CFS决策进行有效优化。为了克服对比过程中的随机因素影响，两种算法分别运行30次，获得的最优结果对比如图6所示。

图6 ABC算法和WDO算法求解模型的结果对比Fig.6 Comparison of results of solving the model by ABC and WDO algorithms

从图6的结果可以看出，双层迭代ABC算法在求解CFS决策模型时，算法的精度和稳定性都明显优于层次WDO算法，说明了本文求解算法的有效性。层次WDO算法的结果较差原因主要是：WDO算法的参数较多，且参数对结果影响较大，不同的问题需要设置不同的参数，找出最优参数并不容易。本文需要同时优化炮弹落点位置、突击武器对目标的打击决策和目标对突击武器的打击决策，是实数和整数混合的优化问题，层次WDO算法难以同时获得最优的效果；而ABC算法的参数较少，算法鲁棒性较高，因此获得的结果更好。此外，本文CFS决策优化模型与普通双层规划问题也有区别，本文求解模型下层为两个子优化模型，而上层是子优化模型最优值的比值，进行交互迭代过程中，当确定突击武器和目标打击决策时，优化上层炮弹落点位置并不能很好地优化模型的目标函数；相反，本文双层迭代ABC算法在上层迭代计算中调用下层迭代计算的结果，可以有效地克服这一问题，因此，本文方法求解效率更高，结果更优。

通过系统火力打击的算例可以看出，通过引入支援武器的协同打击，使得突击武器对目标的打击效果提升，同时目标对突击武器的打击效果下降，二者之间的比值达到最优。本文提出的CFS决策优化模型能够优化突击武器对目标的打击决策、目标对突击武器的打击决策和支援武器对目标打击的炮弹落点位置。目标打击突击武器的实际效果不会优于最优决策下的打击效果。通过本文方式进行突击武器和支援武器协同打击的决策优化，提高了协同打击的效果，使得目标剩余的战场价值与突击武器剩余的战场价值之比最小，达到了消灭敌人保存自己的目的。

4 结论

本文针对突击武器和支援武器的CFS决策问题，考虑作战双方的对抗特性，提出了一种基于对抗的CFS决策优化方法。分析了突击武器和支援火力以及目标的打击决策模型，以对抗双方战场剩余价值的比值作为目标函数，建立了CFS决策模型。针对CFS模型的求解问题，提出了基于双层迭代ABC算法的求解方法。通过仿真算例说明了CFS决策优化方法的合理性和有效性。本文的协同打击方法可为战场不同类型武器CFS提供一种定量的决策方法。