基于效用的目标分配贝叶斯风险决策模型研究*
2012-06-07王政委王金山
王 鹏 王政委 王金山 沈 浮
(1.陆军军官学院基础部 合肥 230031)(2.解放军蚌埠汽车士官学校 蚌埠 233011)
1 引言
运用效用理论对战场目标分配方案比较和评判会获得满意的结果,但仅用期望效用准则对战场目标分配进行优选,会使决策者对结果的可靠性产生怀疑,而贝叶斯决策理论正是将先验信息与侦察情报信息(后验)相结合,力求主观与客观相一致,提高了指挥员决策的科学性和合理性。
2 模型假设与说明
指挥员在进行目标分配方案决策时,每一种方案最终效果都取决于上级意图和目标威胁度及价值。因此战场目标分配是风险型多目标决策问题。对于一个风险型多目标分配问题,记:
状态空间ψ={θ1,θ2,…,θm)={θt},θt为状态变量(t=1,2,…,m);
决策空间Q={q1,q2,…,qn)={qt},qh为状态变量(h=1,2,…,n);
指标空间F={f1,f2,…,fv)={θk},θt为状态变量(k=1,2,…,v);
3 战场目标分配贝叶斯风险决策模型
目标分配决策的因素繁杂,影响指挥员决策的可变因素根据战场情况变化而不同,但是通过分析比较,战场目标分配方案有代表性的评价指标主要为三个:完成上级决策意图程度、目标威胁度和时间紧迫度。因此,基于效用的战场目标分配贝叶斯风险决策模型可表示为
其中:B1为完成上级决策任务过程中对敌打击效果的贝叶斯风险系数,B2为打击敌方目标造成的我方威胁的贝叶斯风险系数,B3为打击目标先后顺序误判造成的贝叶斯风险系数。w1,w2,w3分别为上述三个指标的权重。
当决策者可以获取在不同的状态θi下取决策变量值的概率时,战场目标分配风险模型为
完成上级意图对敌打击效果的贝叶斯风险系数:
敌方目标造成的我方威胁的贝叶斯风险系数:
打击目标先后顺序造成的贝叶斯风险系数:
其中:y1,y2,y3为三个 决策变量在 状态θi下 的值:si为不同的战场目标未来状态;δ(δ)为决策法则;f(sj/θi)为打击战场目标效果确定的条件下得到的目标未来状态的密度函数;π(θi)为对战场目标打击效果不确定时的先验密度。由上面的式子计算战场目标分配中各方案的贝叶斯风险系数,决策者通过比较风险最小的方案为最优方案。
4 战场目标分配的贝叶斯风险决策程序
为了提高决策的准确度,降低决策的风险程度,在决策分析中常常应用贝叶斯公式计算后验概率分布,以修正原有事件的先验概率分布,为提高决策的准确性提供更加可靠的信息,其决策程序一般按以下三步骤进行:
第一步,决策者利用已经掌握的情报信息和经验,估计出各种自然状态出现的概率,并可通过以上建立的决策模型计算出自然状态下的损益值。然后将决策问题转化成损失函数矩阵,通过对该矩阵的分析,得出各作战方案的期望值,按照一定的准则选出最优方案。
第二步,经过先验分析后,当时间允许时(时间不允许,直接进行后验分析),为使决策更加可靠,决策者需要考虑要新侦察的情报信息,而这些信息也不可能完全准确,因此必须分析收集追加的信息究竟有多大价值,这种分析是在实际收集信息之前进行的,故称为预后验分析。
第三步,如果收集的信息将会带来更大的收益,决策者会决定去做。当经过调查获得更多的信息后,利用这些信息通过贝叶斯公式就可对先验阶段的各种估计进行修正,使得这种估计更加可靠,从而降低决策的风险性。
5 基于效用的贝叶斯决策的模型进行决策案例分析
1)对战场目标毁伤度分析
通过对当前战场态势和后续发展的分析,认为战场目标毁伤度较高的概率较大,对其各状态概率的评估如下:
战场目标毁伤度高的概率:P(θ1)=0.25;战场目标毁伤度较高的概率:P(θ2)=0.60;战场目标毁伤度一般的概率:P(θ3)=0.15。
2)战场目标分配决策指标的确定
根据已有的数据资料及上节的研究分析,选用以下三个指作为评价方案的评价指标,并计算相应各状态下的指标值如下:f1为完成上级决策意图程度;f2为目标威胁度;f3为时间紧迫度。
表1 f1完成上级决策意图程度下指标值
表2 f2目标威胁度下指标值
表3 f3时间紧迫度下指标值
3)先验决策分析
(1)确定指标的权重表4,其中参数n=3,RI=0.52。
表4 指标权重
经计算:
所以上面的矩阵有满意的一致性。
(2)各指标效用函数的确定
假设决策者是风险厌恶型的,风险厌恶型决策者的效用函数可以采用二次函数形式来表示,在战场目标分配决策中如果不考虑边际效用增加的事实,对从效用函数得出的无差别曲线的实际评价来看这种效用函数表达式是可能的。风险厌恶型效用函数还可以用指数形式u(c)=a+be-kx来表示,其中k>0,b<0,a,k,b为常数。因此其损失函数为l(c)=-u(c)。
按照效用函数确定方法,根据战场信息情况报,得出了一系列的有关效用和毁伤目标相对应的数据,再通过统计分析中的回归分析,确定了有关战场目标分配决策的几个收益函数,得出相应的损失函数并对数据处理如表5~7所示。
(3)按先验概率进行决策
根据已经确定的贝叶斯风险函数B=w1B1+w2B2+w3B3和求出的权重以及指标值,即可得到各自然状态下的损失值以及期望值:
在完成上级决策意图执行目标打击情况下损失函数:
表5 完成上级决策意图目标打击损失
敌方目标威胁造成损失函数:
表6 敌方目标威胁造成损失
受时间影响造成损失函数:
表7 因打击时间先后造成的损失
进而得到决策表:
表8 先验概率表
如果以贝叶斯风险期望值最小为决策准则,可确定最优方案:
E(B)*=minE(Bh),h∈[1,3],即选择方案q1。
利用测量风险的数学工具风险度ρ=σX/E(X),ρ值的大小,表明不同方案损失离散度的大小。离散度越大,说明未来收益的不确定性大,风险也就越大。解得三个方案ρ1=0.171,ρ2=0.200,ρ3=0.241由以上计算可知,方案q1相对方案q2,q3的风险度都要小,根据效用理论,对于对风险持厌恶态度的决策者来说,风险最小的方案其期望损失值也最小。
4)后验决策分析
在先验分析阶段(战斗准备阶段),指挥员决策时所冒的风险较大,这主要源于指挥员对敌情缺乏足够的信息,难以做出准确判断。此时往往需要根据战场情况,搜集更加详细的信息后作出决策,指挥员再经过各种侦察情报信息进行分析比较研究后,对先验概率进行修正,得到后验概率,具体结果见表9。
表9 后验概率修正
解得ρ1=0.115,ρ2=0.138,ρ3=0.162由以上计算可知各方案的风险度较先验决策时分析,降低了6%~8%,可见利用贝叶斯风险决策分析方法大大降低了指挥决策的风险程度。
6 结果分析
1)本文所提出的战场目标分配贝叶斯风险决策模型,总损失函数的评定采用了线形加权和的方法。这种方法较其它方法突出了权重的作用,从而可以较好地体现决策者对评价指标重要性的偏好。指挥决策者可以根据现实情况,给他所认为更为重要的指标赋予更大的权重,而这种重要性将会从决策结果中反映出来。
2)从对先验概率和后验概率两种情况下风险度的计算结果可以看到,战场目标分配贝叶斯风险决策方法通过对先验概率的修正,在较大程度上降低了决策的风险程度,具有一定的科学性和实用性。值得注意的是,决策者所确定的先验概率分布以及对战场侦察结果准确性的判断(即条件概率)对该方法的准确性有着较大影响。
3)通过建立的贝叶斯决策风险决策模型并进行案例分析,将贝叶斯决策理论运用到战场目标分配决策分析中,结果表明运用可以提高决策的准确程度,降低了决策的风险程度,证明了该模型具有实用性和有效性。
[1]邓桂菊,甘乃峰.边际效用函数的确定及分析[J].鞍山师范学报,2008,(5).
[2]邹木铮.基于期望效用理论的企业并购定价分析[D].硕士研究论文,中南大学,2007,11.
[3]张静.基于效用理论的项目风险评价与投资决策研究[D].硕士研究生论文,合肥工业大学,2007,5.
[4]张湘雄.基于效用理论的产品价值综合评价方法研究[D].重大大学研究生论文,2010,5.
[5]鲍海英.基于效用理论的房地产投资贝叶斯风险决策研究[D].哈尔滨工业大学研究生论文,2006,7.
[6]崔海波.基于NSGA-Ⅱ的炮兵群火力分配问题研究[D].硕士研究生论文,国防科技大学,2010:7:49-52.
[7]邹宇皇.高寒山地作战炮兵火力分配研究[D].硕士研究生论文,国防科技大学,2010,(7).
[8]韩明,唐燕贞.可靠度的E-Byes估计、性质及应用[J].纯粹数学与应用,2010(4):184-189.
[9]欧阳才超,李为民,阳曙光.联合火力打击目标分配[J].空军工程大学学报,2009,(3).
[10]吴平健,李智勇.目标分配的遗传算法改进研究[J].计算机与数字工程,2009,37(9).
[11]王学玲.贝叶斯网络分类模型研究及其在信用评估中的应用[J].计算机与数字工程,2010,38(8).
[12]梁雪梅.期望效用理论及其检验研究[D].硕士研究生论文,经济学院,2005,6.