基于Bayes混合先验分布的兵棋推演规则建模方法*

2019-07-20刘铁林苏小波

火力与指挥控制 2019年6期

薛辉，刘铁林，苏小波

（1.陆军工程大学石家庄校区，石家庄 050003；2.空军石家庄飞行学院，石家庄 050071）

战争作为复杂巨系统，影响其胜负的因素很多，武器装备先进程度、人员能力素质水平、士气、指挥员指挥艺术、作战样式、国家的政治、经济等等，尤其是信息化战争的出现，使得战争更加扑朔迷离。兵棋推演作为战争的一种模拟工具，近年来备受军事领域推崇，兵棋是通过对历史的更深理解，尝试推断未来，是历史和科学的结合，是智慧的较量，是纸做的时间机器，它是分析战争的重要手段，是一种研究战争的利器［1］。历史指运用数理统计的方法对实战、演习等数据及经验的总结，科学即运用科学的方法和理论探索战争的基本规律。胜负裁决规则作为兵棋推演的核心内容决定着模拟效果的好坏，决定着兵棋推演的结果是否符合战争规律。

当前兵棋系统的裁决规则主要通过对战争历史数据广泛采集和统计分析，通过经验数据寻找战争规律，该方法最易于被军事专家及指挥人员接受。而数学家、工程师最为推崇的是作战运筹分析，通过对武器装备战技指标的分析，运用数学方法建立作战模型，通过数学分析得出相应的结果进而揭示战争的一般规律，该方法在“二战”时的工业化背景中取得了明显成效。通过总结不难发现，当影响战争胜负的因素比较单一且易于量化时，适合运筹分析，当影响战争胜负的因素比较多元且仅能定性分析时，适合经验规律总结。日益先进的武器装备作为内因和经济全球化、精细化分工作为外因，决定着未来战争样式必然复杂多变，影响战争胜负因素必然多元化、复杂化且量化评估难。

本文的研究思路是运用运筹分析的方法建立兵棋推演胜负裁决的基础作战模型，通过Bayes方法及混合Beta分布，使其与历史战争经验总结的规律进行合理有效的融合，对兵棋推演中胜负裁决的概率进行调整，进而有效提高胜负裁决概率的准确度。

贝叶斯（Bayes）方法可充分有效利用先验信息，通过对先验信息的收集、挖掘和加工，使之形成先验分布而参加到统计推断中来，以提高统计推断的准确度。贝塔分布（Beta Distribution）作为伯努力分布和二项分布的共轭先验分布的密度函数，在机器学习和数理统计学中都有重要应用，同样胜负型事件的先验分布也可为贝塔分布。

1 兵棋推演胜负裁决规则建模方法

如果仅由人员、武器装备影响战争胜负，可以根据人员训练水平、武器装备战技指标确定战斗力指数后，按照军事运筹分析方法，建立数学模型分析战争胜负规律。

在模拟机械化步兵部队在对阵地防御之敌机械化步兵部队的进攻作战行动中，设定以下辅助规则：1）进攻一方的剩余战斗力低于初始战斗力的2/3时即认为进攻失败；2）防守一方的剩余战斗力低于初始战斗力的2/5时即认为防守失败。该规则的制定虽然符合大多数战斗规律，但事实上战争中还有很多意外的情况会发生，敌对双方的胜负不一定是按照上述约定进行，其胜负规律具有一定的随机性，下面假设红方为进攻方，蓝方为防守方，将达到此临界值之前的胜负概率设置如下。

1.1 依据战术基本原则建立胜负裁决规则模型

经典兰彻斯特方程假定，对抗双方均处于敌方火力范围内，由于战斗紧迫可以不考虑支援部队，双方的战斗力完全取决于双方的作战单元数和单个作战单元的战斗力值。

用x0表示红方初始战斗力值，x（t）表示对抗中红方t时刻的战斗力值；y0表示蓝方初始战斗力值，y（t）表示对抗中蓝方t时刻的战斗力值，a表示蓝方单个作战单元对红方作战单元在单位时间内的损耗系数，b表示红方单个作战单元对蓝方作战单元在单位时间内的损耗系数，我们是通过兰彻斯特方程［2］求解相应时刻红蓝对抗双方的剩余战斗力，如下所示：

求解以上一阶常系数线性微分方程组可得：

通过变换可得到如下兰彻斯特平方律方程

为便于计算，当假定一方剩余战斗力值进行分析时，知道 x（t）或 y（t）可利用以下公式计算另一方的剩余战斗力值

依据战术基本原则和战争规律，在双方剩余兵力不同阶段建立相应的胜负裁决概率模型：

1）当 x（t）/x0>2/3 且 y（t）/y0>2/5 时

从军事战术基本原则分析，相比于对方战斗力损耗越慢取胜的把握越大，即剩余战斗力比值大的一方胜率要大于剩余战斗力值的一方，为使双方胜负概率充满整个概率空间，通过各方剩余战斗力值与初始值的比值 y（t）/y0与 x（t）/x0进行归一化处理后，作为该方在相应t时刻的胜率。具体如下所示：

2）当 x（t）/x0≤2/3 或者 y（t）/y0≤2/5 时

按照战术基本原则，任何一方先达到临界值，即判定进攻或防守失败，暂时不考虑双方同时达到临界值的可能性。

1.2 模拟双方士气建立胜负裁决规则模型

综合考虑双方人员、装备水平及训练情况后，用α，β表示双方士气，其取值范围为［0，1］，当取0值时即认为“不战而逃”，取1值时认为“誓死战斗到底”，则将双方的胜负概率进行如下调整：

按照以上模型，兵棋推演中胜负裁决规则比较接近战争规律，这与孙子兵法中的“车杂而乘之，卒善而养之，是谓胜敌而益强”所描述的战争规律是一致的。即战争规律是双方的胜负概率随着时间的推进在不断地发生变化，且胜率大者愈大，胜率小者愈小。

2 基于Bayes混合先验的胜负裁决规则建模方法研究

在不考虑气候环境、后勤供应保障、指挥艺术等等且武器装备战斗力占主要决定因素的战斗时，上节所建立的模型可以最大程度反映战争规律，但如果影响因素多元且定量化分析难时，需要借鉴历史战争经验总结的规律，并将两种方法合理结合，提高战争模拟的可信度。

当前国内兵棋系统采取的胜负裁决规则模型都是在经典频率学派的理论指导下得出的，即历史经验、演习数据等的统计分析，它是对所有影响战争胜负因素聚合后的分析，是整体涌现的结果。本文将其作为后验样本信息，将上节建立的模型作为先验信息，即假设上节的模型抓住了影响战争胜负的主要因素，但要通过后验样本信息对该信念进行不断调整，如果后验样本信息支持则增强信念，如果后验样本信息反对则降低信念。

用规范的语言描述，即贝叶斯学派注重于参数空间，描述的是观察者知识状态在新的观测发生后如何更新，即观察者持有某个前置信念（prior belief），通过观测获得统计证据（evidence），通过满足一定条件的逻辑一致推断得出的关于该陈述的合理性，从而得出后置信念（posterior belief）来最好地表征观测后的知识状态（state of knowledge）。严谨的数学定义如下所示：

定义1［3］在获得样本x后，参数θ的后验分布（posterior distribution）就是在给定X=x条件下θ的条件分布，记为π（θ|x）。对于有密度的情形，它的密度函数为

贝塔分布中的参数可以理解为伪计数，伯努力分布的似然函数可以表示为一次事件发生的概率，它与贝塔分布有同样的形式，因此，可以用贝塔分布作为其先验分布。

式中，（0<θ<1，α>0，β>0），其中 α，β 为先验分布的超参数。

2.1 不考虑差异性的胜负裁决规则建模

用SH表示红方在t时刻的胜率的期望，战争的胜负与成败型产品类型，其先验分布为贝塔分布Beta（α，β），则

兵棋推演系统中规定其胜算概率越高，则其方差就越小。k为调整系数取值0.01~0.05，k值越小其散布越小。

有了先验分布，结合历史战争的统计数据（n，x），n为总数，x为红方胜利数，f=n-x为红方失败数，可以得到后验分布 Beta（θ|a+x，b+f）密度函数为

这样就调整更新了兵棋推演中胜负裁决概率θ的分布，使其更加准确，更加合理。事实上这么做就是将历史战争规律的总结融入到军事运筹分析中，是军事专家与工程师、数学专家所各自推崇战争模拟方法的融合，但是两者之间各自所占比重是必须考虑的问题，主要有两点原因：一是样本量的不同必然导致先验信息与后验信息的互相淹没；二是需要科学确定两者对整体规律的贡献权重。

2.2 基于混合Beta分布胜负裁决规则建模

2.1 中建立的数学模型调整更新了胜负裁决概率，但是如果先验信息过多就会淹没现场信息，且利用上式的Beta分布进行Bayes胜负裁决概率调整，只考虑了兵棋对历史战争经验的继承性，而忽略了兵棋能够推演模拟未来新战争样式的独特方面，即任何兵棋系统都会有其差异性、创新性，可以采用均匀分布来描述兵棋推演的差异性、创新性，因此，采用混合Beta分布来描述兵棋推演胜负裁决规则的继承和引入的差异性、创新性。文献［4-9］解决成败型产品可靠性评估时均采用了混合Beta先验分布。

ρ作为继承因子，反映了历史战争经验规律总结和军事运筹分析方面的相似程度，可以用统计数据或军事指挥员给出；为了体现军事指挥艺术与科学理论方法的完美结合，继承因子ρ可以由军事指挥员给出。美军的兵棋推演系统将自由式（依靠军事指挥员经验和指挥艺术）兵棋与严格式（依靠数学模型及算法）兵棋巧妙地结合进行研讨式兵棋的开发，与本文的混合Beta先验分布的思路不谋而合。由专家给出ρ的方法有时很难做到准确，文献［10］利用两样本的卡方拟合优度检验，给出了确定ρ的方法。（1-ρ）称为更新因子，反映了兵棋系统在继承历史战争经验时引入的差异性、创新性。

设有历史样本信息（m，x）来自总体X，m为试验数，x为成功数，f=m-x为失败数；样本信息（n，y）来自总体Y，n为试验数，y为成功数，f'=n-y为失败数。

原假设H0：X与Y是相同的总体，检验统计量为

K依分布收敛到自由度为1的卡方分布。给定检验水平α，有

式中，χ12（α）为自由度为1的卡方分布的α分位点。式（16）中要求，x，y，f，f'都应大于 5，若不能满足这一条件，Yates［11］给出了对K的一个修正：

以下使用的K均为式（18）中的定义，式（18）中的K近似服从自由度为1的卡方分布。上述检验问题中，一个略小于χ12（α）的K和一个远小于χ12（α）的K，意义有所不同，后者支持原假设的理由更强烈一些，令

称为该检验的拟合优度，Q（K）越大，支持原假设的证据就越强。文献［10］指出从Q（K）的概念来看，它可以作为两总体的相似程度的度量，那么，ρ和Q（K）是具有相互联系和影响的，记此种关系为

f取决于现场样本信息和历史样本信息的情况，可以通过在各种可能的概率下产生现场样本和历史样本相同容量的随机数来模拟计算，大多数情况下可以令

混合Beta验前分布的使用是对经典统计方法和传统Bayes方法的合理折衷。如果存在多种相关信息可以利用，如战争的样式、力量规模、武器装备性能相近等，可以构造如下的混合验前分布，不同的ρi表示历史战争经验规律总结和军事运筹分析在不同方面的相似性和继承性。

根据贝叶斯公式，结合混合先验分布得到的后验概率模型为：

使用兵棋推演的目的是检验及调整作战计划，提高打赢概率。从“预己从严、料敌从宽”的角度讲，制定的作战计划应该确保有最低的胜算，因此，军事指挥员更关心的是给定可信度（置信度）γ后，最低的胜率值SHL，以便定下决心是否执行该作战方案。在给定可信度γ后，SHL可由下式解出：

3 仿真算例分析

3.1 参数假设

假设按照军事运筹分析的方法，通过第1节的方法，运用兰彻斯特方程计算得出红方胜率的期望值SH=0.8，即红方胜率为0.8，蓝方胜率为0.2。

通过对历史相似战争案例广泛采集和统计分析后，红蓝双方的胜负情况分别为：HS=4，LS=1。在给定置信水平γ=0.8的情况下，采用经典的频率统计方法对战争规律进行总结，取

红方的胜率为θ=0.51。

3.2 计算分析

按照军事运筹分析的方法，无论实战规律是否与数学模型推演结果一致，兵棋推演系统仍然没有必要修改红方胜率SH=0.8。同样，按照对战争经验总结，兵棋推演系统仍然没有必要修改红方胜率SH=0.51。

按照第2节建立的模型，基于实战规律作为小样本，在有先验信息的情况下，按照基于混合Beta分布的胜负裁决概率模型，假设调整系数k=0.02，利用式（13），可计算得到贝塔分布超参数的拟合值α=31.2，β=7.8。

两种样本信息之间的继承因子可以由卡方拟合优度检验方法求得，也可由专家给出。假如由军事指挥员根据战争经验给出继承因子ρ=0.7，则在给定的置信水平γ=0.8的情况下，根据式（23）和式（24）得出红方的胜率为0.751 2。

通过以上对比，折衷后的胜负概率值较前面两者更为稳健，通过卡方拟合优度检验法确定的继承因子，充分体现了历史战争经验规律总结法和军事运筹分析法两者之间的继承性以及差异性，使得兵棋推演包含两者共同优点，有效地提高了模拟程度。

4 结论

利用混合贝塔分布的贝叶斯方法将历史战争经验与军事运筹分析方法结合，对兵棋推演的胜负裁决规则建模方法暂没有相关文献进行研究，本文尚属首次提出，通过算例分析，证明该方法确实有效，得出的胜负裁决概率合理可靠，能够有效促进兵棋推演系统更好地模拟战争规律，对于提高战斗力、增强打赢本领具有一定的军事意义。下一步可以通过Bayes网络建模，使用实时更新的数据库、知识库不断训练参数，动态调整胜负裁决规则。