APP下载

一种用于弹目分配的决策方法*

2023-05-19吴亚楠

火力与指挥控制 2023年3期
关键词:赋权分配专家

吴亚楠,张 剑

(武汉数字工程研究所武汉 430205)

0 引言

武器目标分配(weapon target assignment,WTA)问题起源于20 世纪50 年代[1],是作战指挥控制系统所要解决的重点问题,武器目标分配方案的优劣将直接影响实际作战的效果。

目前针对WTA 问题已有大量研究成果,但仍存在部分不足之处。从问题建模来看,已有成果多研究静态WTA 问题[2-4],对考虑时间维度的动态WTA 问题研究较少。从求解方法来看,以遗传算法等为代表的启发式优化算法[5-7],以及由这些算法组合而成的混合优化算法[8-9],是目前WTA 问题的主流求解方法。根据优化目标的个数,这类方法可分为单目标优化算法[6,8-9]和多目标优化算法[5,7,10],多目标优化算法的求解结果为Pareto 最优解集,包含多个互不支配的分配方案。如何从解集中选出唯一的最优WTA 方案,这部分内容在以前的工作鲜有人提及,是本文的研究重点。

本文面向海战场环境下我方多类型反舰导弹攻击敌舰编队的弹目分配问题展开研究,结合多个约束条件,建立考虑时间维度的多阶段多目标数学模型,采用精英非支配排序遗传算法(elitist nondominated sorting in genetic algorithm,NSGA-II)求解模型;针对算法生成的Pareto 最优解集中多个互不支配的方案结果,提出一种基于改进专家法赋权的组合距离评估——灰色关联分析(combinative distance-based assessment and gray rational analysis,CODAS_GRA)决策方法,该方法将CODAS 和GRA 两种不同决策方法的优点进行结合,采用改进熵权法确定偏好系数,可从多个结果中选出唯一的最优分配方案。

1 问题描述与建模

1.1 WTA 问题描述

WTA 问题可分为两种:1)静态武器目标分配(static weapon target assignment,SWTA);2)动态武器目标分配(dynamic weapon target assignment,DWTA)[1]。SWTA 仅考虑单一时间段的武器目标分配,所有武器在同一阶段用于攻击目标;DWTA 添加时间维度,是一个多阶段武器目标分配过程,需考虑多阶段间的相互作用。本文研究DWTA 问题,采用“shoot-look-shoot”策 略 进 行 分 析,“look-shoot”的过程类似于SWTA,可将DWTA 视为SWTA 的重复[11],即:

1.2 建立数学模型

假设:1)我方共有W 种不同类型的导弹,各类型导弹的弹量上限一定,单位经济成本一定;敌舰编队共有T 个舰船目标,不同阶段各目标的威胁程度由战场评估而得。2)同一类型的反舰导弹可由不同作战平台发射,每个敌舰目标可被多种类型的反舰导弹混合攻击。3)对于射程范围内的敌舰,反舰导弹可通过航路规划到达既定目标,并对目标造成一定毁伤。

1)目标函数

a)优化函数1:对敌毁伤最大

b)优化函数2:弹药消耗最小

其中,Ci表示第i 种导弹的单位经济成本。上述模型中pij(t),Vj(t)等参数需在战场信息感知数据收集时确定。

以“最大化对敌毁伤”这一目标为例,为了得到max f1的全局最优结果,则需要在各阶段均得到max f1的最优结果[12],即:

2)模型约束

约束(5)限制整个作战过程中可分给各目标的最大弹药量,避免造成弹药浪费;约束(6)规定整个作战过程中分配给所有目标的弹药总和不得超过该类型反舰导弹总量;约束(7)表示受反舰导弹搭载平台上火力通道数的限制,一波次(一阶段)下各类型反舰导弹最大可发射弹药数;约束(8)表示导弹打击距离约束,Dimin~Dimax代表i 类型导弹的作用范围,disij(t)代表i 类型导弹发射位置与目标j 之间的距离。

1.3 WTA 最优方案确定流程

上一节所建立的数学模型符合典型的多目标优化问题特征[13],采用多目标进化算法NSGA-II进行求解,所得结果为Pareto 最优解集。提出一种基于改进专家法赋权的CODAS_GRA 方法,可从解集中选出唯一的最优WTA 方案,为指挥员提供一定参考。一个阶段下最优WTA 方案的决策流程如图1右侧所示,图1 左侧代表DWTA 的多阶段(多波次)方案决策流程。

图1 武器目标分配方案的决策流程Fig.1 Decision-making process of weapon-target allocation(WTA)solution

2 WTA 方案优化求解

NSGA-II 算法[14]引入精英策略,寻优能力较强,运行速度较快,采用该算法求解多目标优化数学模型,做适应性设计如下。

1)染色体编码

选择决策矩阵xij(t)中各数值作为染色体,如图2 所示,采用十进制编码,每条染色体由W 个不同基因段所组成,每个基因段由T 个不同基因位组成,基因位上的数字代表第W 种类型的导弹分给第T 个目标的弹药数。

图2 染色体编码图Fig.2 Chromosome coding diagram

2)确定遗传算子

采用二元锦标赛选择算子,每次从种群中随机取出两个解决方案,选择其中更好的一个,具体操作为[14]:①当两个解决方案非支配排序等级不同时,选择其中具有更小的非支配等级的一个;②当两个解决方案非支配等级相同时,选择其中具有更大的拥挤距离的一个。采用两点交叉算子来产生子代个体,随机选择起点和终点,交换父代两点之间部分基因位的值。采用交换变异算子,在子代个体上随机选择两个不同基因位,交换两基因位上的值,提高种群多样性。

3)设置迭代终止条件

设定最大迭代次数,超过该次数则算法终止。

3 基于改进专家法赋权的CODAS_GRA方法

基于改进专家法赋权的CODAS_GRA 方法步骤图如图3 所示。

图3 方法步骤图Fig.3 Step diagram of the method

3.1 基于改进专家法的权重确定方法

考虑本文应用场景,一场海战中更关注对敌毁伤还是我方导弹资源节约,应由具有领域知识的军事专家来决定。因此,采用主观赋权——改进的专家法来计算不同优化目标的权重。

首先由多名军事专家对不同优化目标的重要性进行评价,考虑专家知识、经验的不同,认为专家决策信息同样存在不确定性,故采用三角模糊数对专家群决策信息进行表达。为确保军事专家决策的一致性和公平性,引入三角模糊数距离公式剔除差异程度较大的专家,融合剩余专家权重分配信息,得到最终的各优化目标权重,具体步骤如下。

Step 1 军事专家意见表达。设有r 名专家,c个优化指标,由专家组成员给出各项指标的重要性描述,采用三角模糊数对专家组定性评价语言进行表达,如表1 所示。

表1 重要性评价语言变量Table 1 Language variables of importance evaluation

Step 2 确定评价矩阵A。

Step 3 计算专家意见融合结果为:

即:

Step 4 确定离差矩阵D。

其中,dij表示每位专家所作决策与专家组意见融合后的结果之间的离差值,通过计算矩阵A 中每一行元素与矩阵对应元素之间的三角模糊数距离得到。

Step 5 专家意见剔除。对于离差矩阵D,统计每一行元素之和,得出元素之和最大、最小的两行行数,根据此结果去掉评价矩阵A 中对应的两行,认为这两位专家所作重要性决策结果与其他人差距最大、最小,故剔除,令去掉该两位专家决策信息后的判断矩阵为:

3.2 改进的CODAS_GRA 决策方法

本文将组合距离评估法(combinative distance-based assessment method,CODAS)[17]和灰色关联分析法(gray rational analysis,GRA)[18]两种不同方法进行结合,并修改CODAS 方法中负理想解为正理想解,提出一种改进的CODAS_GRA 方法。该方法可兼顾CODAS 方法需要人参与的主观灵活性以及GRA 方法的客观准确性,来确定每个方案的最终评价值。方法实现如下述各步骤,假设m 行n 列目标矩阵包含Pareto 最优解集中m 个方案的n 个优化目标值,fij代表目标矩阵中第i 个方案的第j 个目标函数值,Fij代表fij经过归一化后的结果,wj代表第j 个目标函数的权重。

对于逆向型目标(即越小越好):

其中,wj为各目标函数权重,可利用3.1 节提出的改进专家法来确定。

Step 5 构造相对评价决策矩阵Ra和差异矩阵ΔIij。

其中,

Step 6 分别计算CODAS 方法和GRA 方法所得到的各方案得分结果。

Step 7 计算每个方案最终评估值。

其中,Scorei值最小者所对应的方案即为推荐的最优WTA 方案,式中c1,c2偏好系数可通过改进熵权法来确定,详见3.3 节。

3.3 基于改进熵权法确定偏好系数

上一节将CODAS 方法和GRA 方法进行结合提出一种改进的CODAS_GRA 方法,进行最优武器目标分配方案的决策,但c1,c2无法直接确定,本节介绍改进熵权法在该问题上的应用。

由3.2 节可知,改进的CODAS_GRA 方法本质上是将CODAS 和GRA 这两种方法的优点结合,c1,c2偏好系数的确定实际上是对不同决策方法的结果进行赋权,应综合考虑决策者对不同方法的倾向性,以及方法本身在领域内的适用性等。因此,在传统熵权法中引入决策者的偏好,通过构建原始数据矩阵,采用改进熵权法来确定c1,c2偏好系数。

在构建原始数据矩阵时,被评价对象即为CODAS 方法和GRA 方法,评价指标为领域内遴选决策方法的标准。结合军事背景,确定选取多准则决策方法的标准应包括:1)该方法的原理及算法应易于理解,便于指挥员对方案结果进行解释;2)为方便起见,该方法的输入应尽量少;3)该方法应易于实现,算法复杂度不高,以适应战场环境。改进熵权法确定偏好系数的步骤如下。

表2 得分标度表Table 2 Score scale table

Step 3 计算各指标下各评价对象的特征比重pij。

Step 4 计算各项指标的熵值。

Step 5 计算各指标熵权。

Step 6 计算各评价对象的综合评估值,归一化得到最终权向量u,即可作为由熵权法确定的CODAS方法和GRA 方法的各自偏好系数。

4 仿真实验

4.1 想定设计

假设某一时刻,我方决定对敌舰编队发起攻击。初始状态下,我方共有4 种反舰导弹,敌舰编队共有5 艘舰船目标,一些参数信息如表3~表6 所示。规定整个过程中分给各目标的弹药总上限均为12 枚,避免造成浪费。算法一次运行输出一次武器目标分配方案,作为一个打击波次。每波次打击结束后评估各打击目标的毁伤程度,确定剩余弹量,根据此战场信息并结合下页表7 确定是否继续下一波次方案解算,规定对所有目标的毁伤程度应为重伤或击沉。

表3 目标威胁程度Table 3 Threat degree of target

表4 反舰导弹信息Table 4 Anti-ship missile information

表5 反舰导弹对目标的毁伤效能Table 5 Damage efficiency degree of anti-ship missiles against targets

表6 毁伤程度区间Table 6 Range of damage degree

4.2 实验结果

针对上一节的想定,采用MATLAB R2019a 进行编程,在Intel(R)Core(TM)i5-10210U CPU@1.60 GHz 2.11 GHz、16 G 内存、Windows 10 的主机上进行实验,设置染色体交叉概率为0.9,变异概率为0.1,种群规模为100,迭代次数为1 000。

选择TOPSIS 方法[19],MOORA 方法[20]、CODAS_P 方法、CODAS_N 方法[17]、GRA 方法[18]与本文提出的基于改进专家法赋权的CODAS_GRA 方法进行对比实验,其中“CODAS_P”表示在计算时选择正理想解,“CODAS_N”表示选择负理想解。如图4 所示,其中,蓝色星号代表NSGA-II 算法求解得到的Pareto 前沿,红色小圈代表不同决策方法所选出的唯一最优方案在目标空间的对应结果。表7(a)为各决策方法所选出的最优方案对5 个目标造成的毁伤数值以及所需经济成本,表7(b)为毁伤数值所对应的毁伤程度,以及花费经济成本排名。

图4 各方法所选出的WTA 方案结果Fig.5 The results of the WTA scheme selected by each method

结合图4 及表7 可看出,MOORA 方法和GRA方法选出的分配方案可对5 个目标均造成重伤或击沉效果,但方案本身需要耗费较多的导弹成本,且不符合多波次打击的战术要求;CODAS_P 方法所选出的方案在弹药成本耗费方面略少于本文方法,但其仅能对两个目标造成重伤效果;CODAS_N 方法所选出的方案弹药成本耗费最少,但一波次打击中仅能对一个目标造成重伤,方案过于保守;对比TOPSIS 方法和本文方法选出的方案,二者均可对3个目标造成重伤效果,但本文方法选出的分配方案弹药成本耗费更少,方案更优。

表7(a)各决策方法所选方案结果Table 7(a)Results of the selected schemes by each decision-making method

表7(b)各决策方法所选方案结果Table 7(b)Results of the selected schemes by each decision-making method

对于本文方法选出的最优方案,按照1.3 节图1 的处理流程,一波次方案执行后重新确定打击目标剩余T 2,T 4 共两个,且导弹有剩余,故继续执行第2 波次的武器目标分配方案解算,假设第2 阶段时武器对目标的毁伤效能保持不变。合并1 阶段、2阶段分配方案结果,如下页表8 所示。

由表8 可以看出,第1 阶段(第1 波次)方案集中火力攻击目标舰艇1、目标舰艇3 和目标舰艇5,即威胁程度居中、威胁程度最大、以及威胁程度最小的3 个舰艇目标,第2 阶段补充攻击剩余两艘舰艇,方案本身较为合理,同时能够满足多波次攻击的战术要求。本文所提出的基于改进专家法赋权的CODAS_GRA 方法选出来的唯一最优弹目分配方案,能够同时兼顾最大对敌毁伤效能和最小我方弹药消耗两个目标,两阶段攻击结束后,5 艘敌舰全部被重伤,符合作战要求,表明了本文方法的合理性与有效性。

表8 本文方法所选最优分配方案结果Table 8 The results of the scheme selected by the proposed method

5 结论

为解决多类型反舰导弹攻击舰艇编队的弹目分配问题,考虑导弹的攻击范围、一波次下各类型导弹最大可发射弹药数等约束条件,建立了考虑时间维度的多阶段多目标优化数学模型,采用NSGA-II 算法求解模型;针对求解得到的Pareto 最优解集,提出一种基于改进专家法赋权的CODAS_GRA 方法,可从解集中选出唯一的最优武器目标分配方案,通过与TOPSIS 方法、MOORA 方法、CODAS_P 方法、CODAS_N 方法、GRA 方法的对比,验证了本文方法的有效性与合理性。下一步工作将进一步研究强化学习在武器目标分配问题上的应用,并将其结果与本文结果进行对比。

猜你喜欢

赋权分配专家
论乡村治理的有效赋权——以A县扶贫项目为例
致谢审稿专家
企业数据赋权保护的反思与求解
应答器THR和TFFR分配及SIL等级探讨
试论新媒体赋权
遗产的分配
一种分配十分不均的财富
基于改进AHP熵博弈赋权的输变电工程评价
绩效考核分配的实践与思考
请叫我专家