基于不对称博弈的联合火力打击规划效果评估
2020-12-08宋志峰
宋志峰,刘 昊,,孙 奇
(1.国防大学联合作战学院,河北 石家庄 050000;2.中国人民解放军31696部队,辽宁 锦州 121000)
由统一的联合作战指挥机构优化并推送火力打击任务规划,诸军兵种火力打击力量作为作战集群共同发起立体复合火力打击的作战形式被称为联合火力打击。联合火力打击是未来联合作战的重要作战样式,对其实施兵力与目标分配相关问题研究历来是学者重点关注的领域[1-2]。以往的联合火力打击任务规划研究集中在动态火力分配层面,其在对抗推演中的最终博弈状态单纯以红蓝胜负作为唯一评判标准,但在实际作战中,敌我常处于不对称态势下的对抗状态。所谓不对称态势,是指敌我双方作战力量之间的不对等,如参战兵力、地理天候环境限制、武器装备性能等因素造成的火力打击效能对比差异。力量对比的差异性导致红蓝胜负结果并不能客观衡量战法策略或任务规划的优劣[3-4]。本文在前人研究的基础上,针对不对称态势下的联合火力打击对抗博弈进行动态推演和量化评估,并突破胜负评判框架,设计能够体现不对称态势下任务规划优劣特征的衡量指标,实现对不对称态势下任务规划的效果评估。
在同类算法中,文献[5-7]在兵棋推演的基础上探索了对基于方案计划的兵棋对抗结果量化评估,优点是评估指标多元,并通过科学设置作战环境,拟合了不对称态势,为本文算法提供了参考借鉴的模板,缺点是推演对抗难以脱离人工干预,由于系统流程复杂,导致推演成本偏高,计算机大规模规划优化难度较大。文献[8-10]从作战筹划的角度对方案计划进行了量化评估,并从当前态势出发分析了方案计划的可行性,评估指标众多,优点是能够在设置战场环境情况下对不对称态势进行静态分析评估,在评估结果量化和重复评估上均能实现计算机自动运行,缺点是缺少了动态推演的博弈过程,导致评估结果很难反映战场实际,只能代表当前静态环境下的可能结果,一旦环境发生变化则评估结果失真。本文借鉴了兵棋推演中的评估指标和对抗博弈推演流程,并结合作战筹划中的量化评估和重复性评估,优化规划结果,在此基础上,设计了不对称态势下对联合火力打击任务规划的效果评估方法。
1 不对称博弈模型
传统的棋类游戏均是以相同力量对比的红蓝双方作为参战单位进行对抗博弈和推演,但在实际作战中,几乎不可能发生力量对比相同的战争形态,交战双方处于力量均势的冲突概率相应降低,只有当力量态势发生严重偏差,即产生不对称态势时,战争的发生概率极大地增加[11]。不对称态势下的敌我对抗评估,难点在于无法通过胜负结果判定双方的战法策略优劣,由于不对称态势存在,导致胜负几乎可以预判,此时的战法策略优劣评估指标难以通过胜负结果衡量,必须以更为细致立体的评估指标判断交战双方的战法策略优劣[12-14]。不对称博弈模型中通常需要考虑如下因素。
1.1 胜负因素
胜负因素是不对称博弈模型的衡量指标之一,而非绝对指标,力量对比失衡使战法策略的选择意义更为重大,策略选择失当在特定环境下可能造成优势方的博弈失败。
1.2 火力打击力量因素
火力打击力量因素是不对称博弈模型中造成不对称态势的主导因素,正是由于参战部队火力打击能力的对比失衡,使得博弈战法策略选择发生相应改变,弱势方不可能延续均势博弈模型中的战法策略,而会依据优势方战法策略做出适应性调整,优势方的火力打击力量优势也不一定导致博弈结果一定占优,在此情况下,战法策略的重要性进一步突显。
1.3 目标数量因素
目标数量因素是不对称博弈模型特有的影响因素,在均势博弈模型中,双方的目标数量相同,种类一致,因此,无须考虑双方目标数量差异产生的火力打击任务规划分配结果差异。在不对称博弈模型中,优势方由于火力打击力量增强,必须通过完善的指挥控制网络、侦察情报网络、信息传输网络、后装保障网络确保火力打击过程的顺畅执行,因此,对应的目标数量相应增多。对于弱势方而言,敌方目标数量的增多虽然增加了其战场目标选择和火力打击的压力,但也更有利于其观察和打击优势方的体系关键节点目标,提升了弱势方的弹药利用率。
2 任务规划评估方法
本文跳出原有的胜负评判思维模式,通过对部队火力打击能力、目标毁伤程度和目标网络的体系价值计算,产生能够反映任务规划优劣的多元评估指标,进而达成对任务规划和战法策略选择的综合评估。
2.1 评估对象输入
任务规划的输入格式如表1所示。输入元素包括打击部队的编号及序号,作用目标的编号及序号,使用弹种编号,任务规划执行及火力打击发生作用的时间;其中:序号为部队弹种或目标在部队编成表或目标属性表中的对应位置;任务规划执行时间为在对抗推演过程中,该项任务规划开始执行的时刻;火力打击作用时间为任务规划开始执行后,叠加射弹飞行延时或空中部队飞行延时而使目标遭受火力打击的时刻。设第j支部队弹种的射弹飞行时间为bfj,第k个任务规划的执行时间为gsk,则目标遭受火力打击的时间ghk为
ghk=gsk+bfj
(1)
表1 任务规划格式示例
任务规划的生成过程不是简单在动态规划中为部队赋予目标的过程,而受实战环境的具体规则限制,如弹种目标限制表、部队空闲时间、弹药储备、空域划分、射程等因素都会对规划结果产生限制性影响。受篇幅所限,本文不探讨任务规划的具体生成过程,而是以复盘分析算法为主介绍任务规划的复盘流程。
2.2 复盘分析算法
复盘分析算法是在任务规划完毕后,对规划结果进行量化计算,形成敌我态势最终对比结果的过程。从算法流程上分析,复盘分析算法相当于对任务规划的重新推演,并在原有对抗博弈基础上分析规划前没有考虑的评估项,如对火力打击作用时间的修正性评估。复盘分析算法流程如图1所示。
图1 复盘分析算法流程图
2.2.1 部队火力打击能力计算
对于已排序的任务规划,由于部队可能遭受过敌方火力打击,因此,有必要在部队固有火力打击能力基础上计算当前的火力打击能力。设红方第jH支部队弹种的火力打击能力为bhjH,其归属于红方第iH个目标,当前的毁伤程度为msiH;则红方第jH支部队当前的实际火力打击能力bh′jH计算公式为
bh′jH=bhjH·msiH
(2)
同理,蓝方第jL支部队弹种当前的火力打击能力bh′jL计算公式为
bh′jL=bhjL·msiL
(3)
式中,bhjL为蓝方第jL支部队弹种的固有火力打击能力;msiL为蓝方第jL支部队弹种归属目标的毁伤程度。
2.2.2 目标毁伤程度计算
在任务规划中,设红方第jH支部队弹种对蓝方第iL个目标实施火力打击,第iL个目标当前的毁伤程度为msiL,则实施任务规划中的火力打击后,目标的预计毁伤程度ms′iL计算流程如下:
Step1 计算目标当前的毁伤状态。设其规定毁伤状态为mgiL,其计算公式为
mgiL=mziL+mwiL+|mliL|+mdiL
(4)
式中,mziL、mwiL、mliL、mdiL分别对应第iL个目标在蓝方目标属性表中的重要程度、威胁程度、防护能力和机动能力的专家评分指标。目标可承受毁伤状态mniL计算公式为
mniL=mgiL·msiL
(5)
Step2 计算目标当前已经遭受的火力打击能力。使用毁伤函数,将目标毁伤状态切换为目标已经遭受的火力打击能力,设目标已经遭受的火力打击能力为moiL;计算公式为
(6)
式中,调节参数λ1和λ2计算公式为:
λ1=mgiL
(7)
(8)
mhiL为目标拟合1次的打击毁伤百分比,mjiL为目标的拟合打击部队弹种序号。
Step3 计算执行任务规划后已遭受的火力打击能力。已知红方第jH支部队弹种当前的实际火力打击能力为bh′jH,则蓝方第iL个目标遭受的火力打击能力mo′iL计算公式为
mo′iL=bh′jH+moiL
(9)
Step4 计算目标的更新毁伤状态。使用毁伤函数,逆推出目标的更新毁伤状态mn′iL。
mn′iL=λ1-λ1·e-λ2·mo′iL
(10)
Step5 计算目标的更新毁伤程度。使用公式(4),逆推出目标的更新毁伤程度ms′iL。
2.2.3 网络体系价值计算
本文使用目标组成超网络中的信息流循环效率作为网络体系价值的衡量指标。具体计算流程如图2所示。
图2 网络体系价值计算流程图
在超网络划分模块中,将超网络划分为侦察情报子网、指挥控制子网、火力打击子网、信息传输子网、后勤装备保障子网,并按照其对火力打击信息传输的作用不同,将前3个子网归为内网,后2个子网归为外网;计算信息流循环效率模块中,将内外网循环效率通过调节参数融合为单一的评估指标。
2.3 规划评估算法
本文在复盘分析基础上,对复盘结果的各项性能指标量化计算,以衡量任务规划的优劣。规划评估按照复盘结果可归为体系价值评估、弹药利用率评估和目标毁伤评估三类。
2.3.1 体系价值评估
(11)
体系价值下降程度CH计算公式为
(12)
2.3.2 弹药利用率评估
(13)
(14)
式中,mH为红方参与打击的部队数量。
2.3.3 目标毁伤程度评估
由于战场目标众多,对于目标毁伤程度的评估必须能够反映各级、各类目标的体系毁伤效果。设目标的歼灭阈值为η,具体评估指标如下(以红方为例)。
1)打击目标数:衡量任务规划中红方实施火力打击的目标总数。
2)歼灭目标数:衡量任务规划中红方实施火力打击能够达成歼灭毁伤程度的目标总数。将歼灭阈值与目标当前毁伤程度相比,如毁伤程度超过歼灭阈值则判定目标已经被歼灭。
3)累加毁伤程度:衡量任务规划中红方对蓝方目标产生毁伤的累加结果。具体计算为将蓝方目标产生毁伤程度相加并输出结果。
4)歼灭百分比:衡量歼灭目标占打击目标数的比例。
5)火力分散度:衡量未打击目标占目标总数的比例。
3 实验分析
为了体现不对称态势,在录入数据时,设置红蓝双方的火力打击部队配置如表2、3所示。
3.1 不对称态势下规划效果分析
为了测试对抗博弈系统在不对称态势下的任务规划情况,设计实验如下:按照不对称态势设计敌我兵力,火力打击部队比例为红蓝部队打击力量2∶1,红方遵循特定的战法策略及任务规划,通过蒙特卡洛大规模仿真汇总蓝方任务规划结果,取最优任务规划结果作为实验结果输出。动态任务规划如表4所示。
表2 红方火力打击部队配置
表3 蓝方火力打击部队配置
表4 不对称态势下的动态任务规划
敌我体系价值对比情况如图3所示。
图3 体系价值对比分析
从体系破击角度分析,红蓝双方虽然在打击力量上差异较大(2∶1),但如果红方战法没有考虑体系破击因素,单纯以目标重要程度选择火力分配和任务规划,则蓝方在体系破击上有一定概率胜过红方(856.76>1612.39)。敌我弹药利用率对比情况如图4所示。
图4 弹药利用率对比分析
从弹药利用率角度分析,红方虽然在弹药储备总量上高于蓝方(2∶1),但如果蓝方在规划上做好准备,优先打击掉红方的防空部队和易毁伤的部队目标,会大幅度提升蓝方空中部队的弹药利用率(89.1%>11.54%、83.27%>6.25%)。红方的弹药利用率平均值比蓝方均值低11.63%,主要原因为:1)蓝方在任务规划之初集中非空中火力打击红方防空部队,既降低了敌防空部队的弹药利用率,又提升了己方空中部队的弹药利用率;2)蓝方在对抗博弈中后期打击红方相对易毁伤的导弹部队,使红方导弹部队的弹药利用率降低。
敌我所属目标毁伤情况如图5所示。
图5 目标毁伤情况对比分析
从所属目标毁伤情况分析,红方的任务规划打击的目标较蓝方更为分散(66.67%>59.26%),没有形成有效的歼灭毁伤效果,红方虽然在弹药储备上占优,在火力打击中打击的目标数量也明显多于蓝方,但由于目标选择不恰当,导致打击的目标体系价值相对较低,使得双方的体系价值下降程度差异巨大(88.37%>62.64%)。综上分析可知,在不对称态势下的火力打击任务规划中,如果因为火力打击力量占优而仅依靠经验规划火力打击任务,很可能由于火力分散、弹药利用率低下、体系破击目标选择不合理而导致战场陷入胶着状态,难以达成预定目标;从弱势一方分析,如果把握好如下火力打击分配原则:善于寻找和打击高体系价值目标,降低敌方弹药利用率并提升己方弹药利用率,善于利用战场迷雾隐藏己方目标,集中火力歼灭目标,则会在对抗博弈中掌握战场主动,逐步扭转劣势。
3.2 不对称态势下战法选择策略分析
在上述实验分析基础上,对红蓝双方在各种战法策略上的任务规划进行对抗博弈,并通过实验分析不对称态势下红蓝双方应采用的最合理战法策略。实验设计如下:红蓝双方的火力打击能力对比同上,拟制的战法策略如表5所示,交叉比对红蓝双方在各种战法策略上的对抗博弈结果,并分析红蓝双方应采用的最佳战法策略。
表5 战法策略表
如以体系价值下降程度作为双方策略评判的评估标准,则红蓝双方的战法策略对应分值如图6所示。
图6 红蓝体系价值下降程度对比
通过实验分析可知,在蓝方使用战法1应对时,红方采用战法4的生存能力更强(体系价值下降45.33%),对蓝方造成最大限度的体系毁伤(体系价值下降92.13%);蓝方如使用战法2,红方采用战法1的生存能力更强(体系价值下降58.73%),而使蓝方造成体系价值下降90.52%;蓝方如使用战法3,红方采用战法2的生存能力更强(体系价值下降5.73%),而使蓝方造成体系价值下降96.84%;蓝方如使用战法4,红方采用战法2的生存能力略强(体系价值下降69.27%),而使蓝方造成体系价值下降75.28%。综上,如红方指挥员无法有效侦测蓝方决策意图,建议使用战法2的体系破击规划策略,即按照目标体系价值高低设计任务规划。对于蓝方指挥员来说,采用战法4的保存实力策略是各种策略搭配博弈推演后的最佳策略:先隐蔽火力打击实力,待红方火力打击完成并暴露目标位置后,按照体系破击策略实施火力反击。红方采用战法2,蓝方采用战法4的弹药利用结果和歼灭百分比结果对比如图7所示。
图7 红蓝最佳策略对比分析
4 结束语
本文针对不对称态势下的联合火力打击任务规划问题,设计了能够对抗推演的复盘分析算法和任务规划效果评估算法,梳理了不对称态势下的任务规划效果评估流程,形成了三类量化评估指标,在此基础上,设计制作了对抗博弈的原生系统,实现了对任务规划的量化评估。本文设计的算法适用于不对称态势下的敌我战法策略选择问题,为联合作战指挥员的任务规划求解提供了战法选择建议和量化分析结果。论文价值主要体现在:1)从对抗博弈角度分析了不对称态势下的联合火力打击过程,通过复盘分析算法模拟了红蓝双方的毁伤效能计算过程;2)设计了不对称态势下的联合火力打击任务规划效能评估算法,实现了敌我火力打击力量不对称状态下的任务规划量化对比分析;3)在原生系统基础上,探讨了不对称态势下优势方和弱势方的最佳战法策略选择,为指挥员战场指挥决策提供参考。