基于前景理论的军事防御资源分配模型

2020-09-10胡伟涛

看世界·学术上半月 2020年4期

胡伟涛

摘要：资源分配规划问题在军事防御领域起着重要的作用，受限条件下的军事资源分配是实际存在的。以往该领域的规划、决策问题往往从期望效用理论入手，存在对敌方行为考虑不够完全，不够贴近现实情况等不确定性问题。本文采用前景理论描述敌方面临不确定性情境下的选择行为，并利用Logit选择模型估算敌方选择概率。并以防守者期望损失最小为目标，建立资源分配模型。指导防守者对目标进行资源分配，增强目标的防御能力。

一、引言

当今世界是一个和平和发展，机遇与挑战共存的世界，探究未来各国军事上难以有大规模的对抗性战争发生，但局部地区冲突总是不可避免，恐怖分子袭击事件时有发生[1，2]。同时，各国应对这些冲突的军事经费又相对受限，因此如何在资源相对有限的条件下进行防御外来袭击相关问题的研究，这是应对军事领域的发展过程中急待解决的问题。

传统的资源决策尤其是军事防御资源分配方面一直以来都受着期望效用理论的影响，作战双方理想化的作为完全理性的决策者，但实际作战对抗过程中决策者往往会表现出与期望效用理论不一样的现象。1979年Tversky和Kahneman在此基础上提出了前景理论[3]，使用“前景”来替代“效用”。前景理论可以较好刻画决策者在面临不确定情境下的主观行为。在由此特别归纳出了两类模型，价值函数模型和决策权重模型。

价值函数模型有如下三个重要特征：

（一）参照点依赖：决策者更加看重结果的变化值而不是最终值;

（二）风险偏好逆转：决策者面對收益倾向于风险厌恶，面对损失倾向于风险追求;

（三）损失规避：决策者表现出对损失的规避程度要大于对收益的偏爱程度。

人们在决策时将事件发生的原始概率转化为一个非线性的决策权重，并且时常表现为高估小概率事件和低估大概率事件。因此，Kahneman和Tversky分别得出了决策者预估行为的形如“S”形价值函数和倒“S”形的决策权重函数。

本文基于前景理论建立起军事防御层面上的资源分配模型，结合价值函数模型和决策权重函数模型，通过Logit风险分析方法估计对手对目标打击的概率选择。以防守者期望损失最小为目标，建立资源分配模型。

二、基于前景理论的资源分配模型

本节主要基于前景理论相关知识对不同事件的前景值进行估算，研究在考虑敌方主观风险态度的情况下对我方目标打击的前景值大小。刻画决策者在面对不确定性情境下所表现出来的资源分配选择与防御行为，并据此依据战略Logit风险分析（SLRA）方法[4]想建立资源分配模型。

（一）敌方攻击成功概率

在进攻者攻击目标的概率确定上。假设目标没有任何防护资源，则进攻者总可以成功攻击目标，这在实际军事对抗过程中也并非不可能，有时候为了更大的效益或者整体上效益的最优就必须要有所取舍;相反，如果存在无限多的防护资源，则进攻者成功攻击目标的概率接近为0，即攻击该目标总不能达到预期的效果。由此，给出如下攻击成功概率公式：

（1）

其中si表示对我方目标i的攻击成功概率;αi表示防御目标i具有的防护效果，bi表示对目标i投入的资源，且有（B为可分配的总资源）。

决策者在决策过程中经常会对起始的概率进行转化，经常会表现为对小概率事件因害怕损失而表现出高估的现象，在大概率事件因利益获取有限而表现出低估的现象。

（二）不同事件下的前景值

假设考虑I个防御目标上的防御性对抗问题，且对应每个防御目标都可能有J个属性的损失。防守者要将总数为B的资源分配到I个目标上，以减少敌方对目标各属性上的伤害。假设ni为第i个前景可能的结果，xijk为第i个前景第k个可能结果上属性j上的值，假设rj为属性j的参考值，且由进攻方决定。

首先，每个事件下对应的收益值和损失值都要进行归一化，方便后续在不同属性上对指标值进行加权聚合。假设为归一化后的值，参考值的确定是由攻击者确定的，故而一个事件的结果是收益型还是成本型，取决于进攻者，而不是防守者。

采用下式对参考点值进行归一化，如下：

（2）

（3）

其中，表示归一化后的某个目标上第j个属性上的参考值。

继而，基于归一化之后的参考点和不同属性上的可能结果值，本文采取上文介绍到的价值函数来对每种情况下的得失情况进行处理：

，（4）

其中λj 代表防守者针对属性j的损失厌恶系数，gj和 lj 分别是针对属性j上的收益和损失的风险偏好。

由于防守者防守目标可能面临多个方面的损失，每涉及多个属性。假设已经按降序进行排列，以的概率发生，属性Aj有mj个收益可能，则事件i的前景值[5]为：

，（5）

和分别是针对属性j收益和损失时候的决策权重，和是属性j上针对收益和损失的概率决策函数。

（三）最优资源分配模型

采用SLRA方法来计算防守者的最佳资源分配模型。假设进攻者攻击目标i的概率[4]为：

，（6）

其中pi为防守者对进攻者攻击目标i的估计值，且取决于分配给目标i的资源。

防守者会采取一定的分配策略，使得自己的期望损失最小，由下式给出：

，（7）

其中kj是属性j的权重，表示敌方对目标城市i发动攻击成功后对属性j上所造成的损失归一化后的值，表示敌方对目标城市i发动攻击失败后对属性j上所造成的损失归一化后的值。

三、示例分析

自20世纪60年代以来，恐怖主义活动日益频繁，严重威胁着国际社会的安全和秩序。本小节开展示例研究，旨在将所提出的资源分配模型应用于军事领域中的对恐怖分子攻击的目标防御问题上。

假设一个场景：恐怖分子可能袭击四个城市A，B，C和D中任一个，意图造成经济损失、人员伤亡和连锁反应这三个方面的影响。假定每次恐怖分子只会攻击其中一个城市。不同城市的防护程度为和。针对三个属性的参考点设置为20亿，0.3，和0.4。其中人员伤亡和连锁反应这两个属性采用[0，1]区间内的打分值进行衡量。防守者的损失厌恶程度为。针对这三个属性的权重设为值k1=0.25，k2=0.5和k3=0.25。防守者的资源约束为B=100亿。

恐怖分子在不同城市上的攻击可对我方造成的不同属性上的损伤值。攻击成功时在城市A，B，C，D上造成的损失分别是60，60，50，40;失败时分别是10，10，5，5。造成的人员伤亡在攻击成功时分别是0.6，0.6，0.75，0.75;失败时分别是0.2，0.25，0.35，0.15。造成的连锁反应在攻击成功时分别是0.7，0.65，0.65，0.6;失败时分别是0.4，0.35，0.3，0.3。

实验结果基于前景理论的最优资源分配方案為是分配到各个目标城市的经费额度;具体来说，将30亿分配给了目标城市A，将25亿分配给了目标城市B，27亿分配给了目标城市C，以及剩余的18亿分配给了目标城市D。

实验结果同时显示，在该资源分配方案下，恐怖分子进攻城市D成功的概率最大，为0.7。但恐怖分子在不同目标城市的进攻选择概率由高到低依次是目标城市C，城市A，城市B，最后为城市D。防守者总体期望损失为0.278，而恐怖分子的期望收益为0.262。尽管恐怖分子进攻城市D的概率最大，但依据本文建立考量恐怖分子主观风险偏好及不确定性因素的资源分配模型来看，恐怖分子更有可能进攻城市C，因为这种情况下恐怖分子收益最高，同时对我方造成的打击效果最好。

四、结论

本文基于前景理论，研究了考虑敌方主观风险偏好的资源分配对策模型。采用SLRA方法预测敌方对我方不同防御目标的攻击概率，并以此来指导我方资源分配模型的构建，同时分别对敌方是否具有转移行为进行了分析与考虑，并通过示例分析验证了该模型的可行性。这也充分说明了在考虑资源分配模型时候，需要考虑对手风险水平的重要性。

参考文献：

[1]Bai，C.，Sarkis，J.：Supplier development investment strategies：A game theoretic evaluation. J. Annals of Operations Research. 240（2），583--615 （2016）

[2]Golany，B.，Goldberg，N.，Rothblum，U.：A two-resource allocation algorithm with an application to large-scale zero-sum defensive games. J. Computers & Operations Research. 78，218-229 （2017）

[3]Kahneman，D.，Tversky，A.：Prospect theory，an analysis of decision under risk. J. Econometrica. 47（2），264-291 （1979）

[4]Kujawski，E.：Accounting for terrorist behavior in allocating defensive counterterrorism resources. J. Risk Analysis. 18（4），365-376 （2015）

[5]Bleichrodt，H.，Schmidt，U.，Zank，H.：Additive utility in prospect theory. J. Management Science. 55（5），863-873 （2009）