区间不确定性下的空中作战行动过程优选方法
2021-03-26钟赟万路军张杰勇
钟赟,万路军,张杰勇
1. 中国人民解放军94040部队,库尔勒 841000 2. 空军工程大学 信息与导航学院,西安 710077 3. 空军工程大学 空管领航学院,西安 710051 4. 中国电科28所 空中交通管理系统与技术国家重点实验室,南京 210007
随着航空平台技术、信息网络技术和人工智能技术的飞速发展,空中作战集群化、网络化和智能化趋势日益显现[1-2]。空中作战的行动过程(Course of Action, COA)设计,作为空中作战任务计划生成的关键技术,是空中作战编队根据实际作战环境和敌方可能采取的作战行动,生成的最优或较优作战行动方案,其本质是对动态作战行动、作战环境和作战效果三者因果关系的科学定量描述和高效优化求解,其设计效果决定了空中作战效能发挥[3-4]。
对COA问题建模分析,运用较多的贝叶斯网络(Bayesian Nets, BNs)和动态贝叶斯网络(Dynamic Bayesian Nets, DBNs)方法存在其固有缺陷:一是在概率推理过程中,BNs和DBNs高度依赖条件概率表(Conditional Probability Table, CPT),而CPT的合理构建具有一定困难;二是随着作战规模的增大,CPT中节点数量随之增多,进而降低概率推理的计算效率[5]。因此,研究人员主要通过引入因果强度逻辑(Causal Strength Logic, CAST)参数,采用参数定义较少、推理效率较高的影响网络(Influence Nets, INs)方法[6],对COA问题进行研究。
在现有研究中,大多考虑了COA优选中的不确定性,并采用不同方法处理这种不确定性。文献[7]考虑到作战过程中的不确定性和对抗性,基于不完全信息博弈方法和INs进行问题建模,但缺乏对参数的不确定性表征。文献[8]认为不确定性(外部事件出现概率的区间性)主要来源于外部事件,通过蒙特卡洛(Monte Carlo)方法对外部事件的不确定性进行模拟,并根据多次实验下的概率计算信噪比(Signal-to-Noise Ratio, SNR)作为目标函数,但没有考虑基准概率和影响强度值的不确定性。文献[9]对文献[8]进行了拓展研究,针对影响强度值时变场景,基于动态影响网络(Dynamic Influence Nets, DINs)进行建模,并采用学习型遗传算法对模型进行求解,但缺乏对关键参数确定过程中专家知识的一致性检验。
综上所述,当前研究存在着不确定性来源分析不充分、对参数不确定性处理方式相对简单、关键参数获取过程中专家知识缺少一致性检验等问题。
本文采用无需估计变量分布律的区间值度量参数不确定性,引入区间优化思想[10-11]构建基于DINs的COA优选模型;基于改进Kendall协和系数检验法得到经过一致性检验的关键参数,并分析期望效果实现概率和各关键参数的相关关系;最后,采用改进快速非支配排序遗传(Non-dominated Sorting Genetic Algorithm II, NSGA-II)算法对模型进行求解。
1 空中作战COA建模分析
1.1 基本概念
期望效果(Desired Effects, DE):是空中作战编队所要实现的最终作战目的。执行的作战任务不同,期望效果的种类和数量也有所不同,选取高效COA的核心目标,就是使得期望效果的实现概率最大。令空中作战过程中的期望效果集合为D={d1,d2,…,d|D|},其中,|D|为期望效果的数量。
中间效果(Intermediate Effects, IE):是空中作战编队为达成最终作战目的而取得的阶段性作战效果,其是作战行动、外部事件和期望效果之间的纽带。空中作战编队执行复杂任务时,直接建立数量较多的作战行动、外部事件和期望效果之间的影响关系难度较大。因此,一般通过中间效果实现对各影响关系的分类关联,从而有效降低表征作战过程中所有影响关系的难度。令空中作战中的中间效果集合为C={c1,c2,…,c|C|},其中,|C|为中间效果的数量。
1.2 基于INs的COA静态建模分析
基于INs进行COA问题因果关系建模,是将作战行动、外部事件、期望效果和中间效果之间的因果关系影响强度用CAST参数来表示,通过从根节点到叶节点的概率传播,进而计算得到期望效果的实现概率。
图1 基于INs的COA静态模型Fig.1 Static model of COA based on INs
图1为基于INs的COA静态模型。基于INs的COA静态模型可表征为四元组IN={V,E,CAST,BP}。V={A,B,C,D}表示影响网络中作战行动A、外部事件B、期望效果C和中间效果D等节点集合。E={(A,C),(B,C),(C,D)}表示影响网络中节点的因果关系,用带箭头或圆头的有向边描述。
CAST表示对∀v∈V,影响网络中的因果关系影响强度集合,对于有向边(A,C),影响强度为CAST(A,C)∈{(h,g)|h≥-1,g≤1}。其中,h表示父节点为1对子节点为1的影响程度,g表示父节点为0对子节点为1的影响程度。一般可以根据h和g的取值情况,将因果关系划分为促进关系和抑制关系两类,对于有向边(A,C),当h>0,g≤0时,表示A对C有促进作用,所对应的有向边e∈E带箭头;当h≤0,g>0时,表示A对C有抑制作用,所对应的有向边e∈E带圆头。而在概率推理过程中,影响强度值取h值或g值,取决于父节点是否发生。若发生则取h值,反之则取g值。
BP表示影响网络中各相关节点取值的基准概率集合,即在没有外部因果关系影响下,相应节点取值为1的概率,有BP={bp1,bp2,…,bp|BP|}。
以事件cn受事件ai影响场景下的概率计算为例,令xi为取值0或1的随机向量,ai的发生与否,直接影响到xi的取值情况。若事件ai发生,则xi=1;反之,则xi=0。为度量xi的取值对事件cn是否发生的影响,采用式(1),从定性角度定义事件ai对事件cn的影响情况:
(1)
对于给定的ai,事件cn发生的条件概率为P(cn|ai),则式(2)表示从定量角度定义事件ai对事件cn的影响情况:
(2)
式中:P(cn)为事件cn发生的基准概率。
令s(ai)∈[-1,1],进而利用线性插值法扩展P(cn|ai)的定义空间,则给定ai,事件cn发生的条件概率P(cn|ai)定义为
P(cn|ai)=
(3)
在实际问题中,存在多个事件对某事件同时产生影响。此时,需要进行影响强度值聚合后进行概率推理,具体见式(14)~式(18)。
1.3 基于INs的COA静态建模分析
通过式(1)~式(3),建立了CAST值与条件概率P(cn|ai)的映射关系,从而将作战行动、外部事件、期望效果和中间效果的因果关系用影响值进行链接,生成相应影响网络。
然而,空中作战是连续动态的作战过程,作战行动和外部事件会随着战场态势的变化而不断演进,从而导致基于INs的COA静态模型并不能有效表征参数变量的动态演变过程。
为克服INs在建模过程中时间特性表征不足的缺陷,需基于DINs对空中作战COA问题进行动态建模,在影响强度计算过程中引入自环(Self Loop, SL)机制。即某作战阶段的期望效果和中间效果实现概率不仅与当前作战阶段的作战行动过程有关,还会受到上一作战阶段的期望效果和中间效果实现概率的影响,从而有效刻画了期望效果和中间效果状态转移的马尔科夫特性。
图2 基于DINs的COA动态模型Fig.2 Dynamic model of COA based on DINs
考虑到空中作战COA优选的目的是有效完成使命任务,因此主要选取最后作战阶段的期望效果实现概率P{dm(tT+1)}作为评价指标。以编队作战资源和规则为约束条件,以特定行动过程下的期望效果实现概率为优化目标,建立基于DINs的COA优选数学模型为
maxF(S)=P{dm(tT+1)|CE(t0),ΨS}
(4)
式中:R(tk)为tk-1~tk阶段的作战资源消耗;R0为作战资源阈值。
目标函数表示以初始外部作战环境为起点,在可行行动空间中选取相应行动过程,使得最终期望效果实现概率最大;第1个约束表示任意作战阶段的作战资源消耗均不能超过作战资源阈值;第2个约束表示行动过程必须在可行行动空间中选取。
1.4 参数不确定性分析
在空中作战编队作战过程中,不确定性主要体现在相关作战参数的取值分布上,主要包括以下3类。
1) 外部事件出现概率的不确定性。由于敌方敌对行为的不可预测以及作战专家知识的局限性,外部事件出现概率很难以准确值给出。
2) 基准概率的不确定性。由于作战专家知识的局限性,不能给出基准概率的准确值。
3) 影响强度值的不确定性。由于作战专家知识的局限性,不能给出影响强度的准确值。
在复杂的战场环境中,难以给出上述参数的准确值,甚至较难估计其分布律。因此,主要采用只需简单给出上下界的区间数对上述参数的不确定性进行表征。对于区间数U=[uL,uR]和V=[vL,vR],定义相关运算法则为[12]
U+V=[uL+vL,uR+vR]
(5)
kU=[kuL,kuR]k>0
(6)
2 DINs的概率传播机制
与INs一样,DINs的概率传播也是子节点与多个独立父节点之间的近似概率推理,概率推理的核心要素CAST参数由作战专家根据作战知识给出。与INs不同的是,DINs具有动态特性,若父节点的实现概率随着时间发生动态变化,则子节点的实现概率也会发生相应变化。
DINs的概率传播机制主要包括2个方面,分别是关键参数确定和概率传播算法,其中,关键参数主要包括CAST参数和外部事件出现概率。
2.1 关键参数确定
对于DINs中的关键参数,一般采用多专家知识融合方法进行确定。在具体表征方式上,用横坐标为专家权威度Q、纵坐标为关键参数的二维坐标系,即信念图进行表示[6]。图3为关键参数是影响强度值时,基于信念图的影响强度值。
图3 基于信念图的影响强度值Fig.3 Influence strength value based on belief graph
其中,专家权威度Q和关键参数的分类采用模糊语言型分类,并建立评语到定量表达的映射,专家权威度Q的评判划分为5个等级,分别为高、较高、一般、较低、低,对应量化值为1.0、 0.75、0.5、0.25、0;关键参数的评判划分为7个等级,分别为绝对强、很强、较强、一般、较弱、很弱、无,对应量化值为1.0、0.9、0.7、0.5、0.3、0.1、0。图3中点位h2(0.8,[0.75,0.85])和g2(0.8,[0.25,0.30])分别表示,在不考虑取值正负性情况下,权威度为0.8的专家给出h值的取值范围为[0.75, 0.85],g值的取值范围为[0.25,0.30]。
一般直接采用相应方法进行关键参数的融合生成,然而,当前研究缺乏对专家知识的一致性检验,从而造成某些与其他专家知识不一致的专家知识对最终融合值生成产生影响。因此,首先采用改进Kendall协和系数检验法对专家知识进行一致性检验,随后将通过一致性检验的专家知识融合生成最终结果。
1) 基于改进Kendall协和系数检验法的一致性检验
同样以影响强度值为例,记所有作战专家集合为Z={z1,z2,…,z|Z|},|Z|为专家数量,则对集合Z中专家知识进行一致性检验步骤如下。
Ro=[ro,1,ro,2,…,ro,|V|]
(7)
式中:ro,v(1≤v≤|V|)为Cho,v在Ho中按升序排序的排序号,区间数的排序方法见式(21)。
步骤2建立假设J0:集合Z中作战专家关于影响强度赋值意见不一致;备择假设J1:集合Z中作战专家关于影响强度赋值意见一致。令显著性水平α=0.05。
步骤3根据式(8),计算专家集合Z中集合所有专家知识的Kendall协和系数检验量Kendall(Z)。
Kendall(Z)=
(8)
步骤4判断Kendall(Z)与显著性水平α下Kendall协和系数检验阈值Kα的大小关系,若Kendall(Z) 2) 基于综合加权的一致性专家知识集结 通过对专家知识的一致性检验,可以得到集合Z的专家知识一致度ηZ: (9) 则对于一致性专家知识集结,需要找到一组这样的专家组Z′,使得Z′中专家知识一致并且具有最高专家组权威度,即有 maxμZ′ (10) 式中:第1个约束表示Z′中专家知识必须一致。μZ′为Z′的专家组权威度,计算公式为 (11) 为求解式(11),并利用综合加权方法集结专家知识得到融合后影响强度值,采用具体步骤如下。 步骤1初始化专家集合Y=∅,令计数标志count=1。 步骤2判断专家集合Z的知识一致度ηZ是否等于1,若否,则将Z中知识相似度最小专家移至集合Y,循环执行步骤2直至ηZ=1或Z中只剩1名专家。专家知识相似度计算方法如式(12)所示: (12) 步骤3令集合Zcount=Z且count=count+1,并先后执行Z=Y,Y=∅,循环执行步骤2和3直至ηZ=1或Z中只剩1名专家。 步骤4比较Z1,Z2,…的专家组权威度,并令Z′=argmax{μZ1,μZ2,…}。 步骤5通过步骤1~步骤4,确定了符合一致性原则并使得权威度最大的专家组,采用式(13) 计算得到融合多专家知识的影响强度h值结果。 (13) 式(13)的计算涉及到区间数和区间数的加法运算规则,以及区间数和实数的乘法运算规则,采用式(5)和式(6)进行计算。 类似地,融合多专家知识的其他关键参数均可以通过上述步骤计算得到。 在任意作战阶段,子节点的实现概率取决于父节点的实现概率。因此,随着作战进程的不断推进,需要根据父节点的实现概率变化情况,从上至下依次进行子节点实现概率的更新。具体概率传播算法如下。 步骤1对于特定作战阶段,根据当前影响网络中所有节点出度和入度情况,将节点划分为不同层次。其中,根节点层次最高,中间节点层次居中,叶节点层次最低。 步骤2判断是否进入下一作战阶段,若是,则更新所有节点所在层次和根节点先验概率。 步骤3根据影响强度值计算子节点条件概率,以父节点集合A、子节点cn,求cn的条件概率P(cn|a1,a2,…,a|A|)为例,ai的影响强度取值为s(ai)。相应条件概率具体计算过程如下。 1) 进行正影响强度聚合,生成PI值。 (14) 2) 进行负影响强度聚合,生成NI值。 (15) 3) 将PI值和NI值聚合,生成整体影响强度OI值。 (16) 4) 计算得到条件概率P(cn|a1,a2,…,a|A|)。 P(cn|a1,a2,…,a|A|)= (17) 步骤4根据全概率公式,计算子节点的实现概率。同样以步骤3中父节点事件发生情况为例,并考虑到父节点的独立性,P(cn)的计算公式为 P(cn)= P(cn|a1,a2,…,a|A|)×P(a1)× P(a2)×…×P(a|A|)+ P(cn|a1,a2,…,a|A|)× P(a1)×P(a2)×…×P(a|A|)+ P(cn|a1,a2,…,a|A|)×P(a1)× P(a2)×…×P(a|A|)+…+ P(cn|a1,a2,…,a|A|)× P(a1)×P(a2)×…×P(a|A|) (18) 步骤5按照上述步骤,将所有层次节点进行概率更新。 由于外部事件出现概率、基准概率和影响强度值的区间不确定性,期望效果和中间效果的实现概率必然也为区间值。而期望效果和中间效果实现概率区间值的上下界取决于其与上述各关键参数的相关关系。因此,需要根据式(14)~式(18), 分析子节点实现概率与各关键参数的相关关系,有定理1~定理4成立,详见附录A。由此可知,目标节点实现概率与外部事件出现概率成反比,与基准概率成正比,与影响强度h值、g值成正比。 考虑到空中作战具有随时间演化的动态特性,在目标节点,即期望效果和中间效果实现概率计算过程中,需要逐阶段进行,步骤如下。 步骤1对目标节点状态进行初始化,输入经过一致性检验专家知识集结的各关键参数。 步骤2根据作战专家知识,选取tk-1~tk阶段的可行行动策略。 步骤3根据式(14)~式(18)进行概率传播,生成本作战阶段期望和中间效果实现概率。 步骤4向下一作战阶段传播期望效果和中间效果实现概率,并同样根据式(14)~式(18),计算下一阶段目标节点实现概率。 步骤5当作战使命结束时,计算目标函数值P{dm(tT+1)}。 空中作战行动过程生成是一个典型的组合优化问题,本质是优选出使得期望效果实现概率最大的行动组合,其主要包括3个关键部分:一是根据Kendall协和系数检验法集结专家知识生成影响强度值;二是根据DINs计算生成期望效果实现概率;三是采用改进区间优化算法优选最佳行动过程。如图4所示,为行动过程优选方法框架。 图4 行动过程优选方法框架Fig.4 Framework of COA optimized selection method 从式(4)可知,需要进行优化的目标不止一个,空中作战行动过程优选问题是一个典型的多目标优化问题,可采用多目标优化算法进行求解,而NSGA-II算法是一种有效求解方法[13]。 该算法根据快速非支配排序、个体拥挤距离计算以及基于外部档案的精英保留等策略,对包括选择、交叉和变异等算子的遗传算法[14]进行拓展,使之能够高效、稳定求解多目标优化问题。 因此,需要根据区间优化的特点,对NSGA-II算法进行适应性改造,主要包括实数型编解码方式、基于可能度的区间数个体排序、基于期望值和宽度值的区间数个体拥挤距离计算,从而有效求解式(4)描述的数学模型。 1) 实数型编解码方式 考虑到NSGA-Ⅱ算法的迭代特性,采用长度为|A|的实数型编码方式。对于不同位置的个体元素,取值范围各有不同,如对第i个个体元素,取值范围为(1,|ai|+1),其中,|ai|为作战行动ai中基本策略的个数。 2) 基于可能度的区间数个体排序 若存在区间数U=[uL,uR]和V=[vL,vR],则可以构建区间可能度模型为[15] (19) 根据式(19),区间可能度的主要特性如下:① 0≤P(U≤V)≤1成立;② 若P(U≤V)=P(V≤U),则同时有uL=vL,uR=vR成立;③P(U≤V)+P(V≤U)=1成立。 在此基础上,定义区间数个体排序方法。对区间数U=[uL,uR]和V=[vL,vR],若P(U≤V)≥0.5,则称U不大于V;若P(U≤V)≤0.5, 则称U不小于V;若P(U≤V)>0.5,则称U小于V;若P(U≤V)<0.5,则称U大于V。 因此,若染色体Y1对应的期望效果实现概率分别为P1{d1(tT+1)}和P1{d2(tT+1)},染色体Y2对应的期望效果实现概率分别为P2{d1(tT+1)}和P2{d2(tT+1)}。 1) 若满足P1{d1(tT+1)}≥P2{d1(tT+1)}且P1{d2(tT+1)}≥于P2{d2(tT+1)},与此同时,若满足P1{d1(tT+1)}>P2{d1(tT+1)}或P1{d2(tT+1)}>P2{d2(tT+1)},称Y1优于Y2,即有Y1≻Y2。 2) 若满足P1{d1(tT+1)}≤P2{d1(tT+1)}且P1{d2(tT+1)}≤P2{d2(tT+1)},与此同时,若满足P1{d1(tT+1)} 3) 当Y1既不优于,也不劣于Y2时,称Y1等价于Y2,即有Y1~Y2。 改进NSGA-II算法搜索目的,是通过多次迭代寻优,搜索到优于其他所有个体的个体集合。 4) 基于期望值和宽度值的区间数个体拥挤距离计算 在改进NSGA-II算法中,由于规模限制,某一等级的染色体无法全部进入外部档案,需要根据个体间拥挤距离计算结果,排除拥挤距离较小的个体。因此,对区间数距离计算主要采用基于期望值和宽度值的广义EW距离计算方法[16]。 dEW(U,V)= p≥1 (20) 式中:一般取p=2;E(U)=(uL+uR)/2和W(U)=(uR-uL)/2分别为区间数U的期望值和宽度值;E(V)和W(V)的计算方法类似。 空中作战任务类型众多,以离岸岛屿攻击任务为例。假定敌方在某离岸岛屿构建完整作战防御体系,敌方重要目标主要包括作战指挥中心、雷达阵地、弹药库、机场以及港口等。我方作战行动预期是集中各类作战力量,摧毁敌方关键作战目标,便于下一步夺取岛屿控制权。 在作战行动方面,令空中作战编队可采取行动集如下。a1:对敌方空中作战编队实施空对空攻击;a2:对敌方水面舰艇实施空对海攻击;a3:对敌方固定预定目标实施空对地攻击;a4:对影响固定预定目标攻击的前序固定非预定目标,实施空对地攻击;a5:对敌方移动预定目标实施空对地攻击;a6:对影响移动预定目标攻击的前序移动非预定目标,实施空对地攻击;a7:作战信息支援;a8:空中截击作战;a9:对敌电子干扰;a10:空中加油。 在外部事件方面,由作战专家根据作战知识或作战历史数据给出事件类型和出现概率,可能的外部事件如下。b1:敌方空中作战编队进行空中拦截;b2:敌方水面舰艇编队进行对空拦截;b3:敌方地面防空系统进行防空作战;b4:敌方对我进行电子干扰;b5:岛外增援空中作战编队参与作战。 在期望效果方面,主要包括两类。d1:空中作战编队成功完成离岸岛屿攻击任务;d2:空中作战编队任务执行中战损程度。 在中间效果方面,由我方作战行动和外部事件共同作用生成,包括如下。c1:空对空攻击任务执行效果;c2:空对海攻击任务执行效果;c3:对影响预定目标攻击的前序非预定目标攻击任务执行效果;c4:空中作战编队攻击预定目标前空中集结;c5:对预定目标攻击任务执行效果;c6:空中作战编队返航空中集结。 根据作战专家分析,空中作战编队执行离岸岛屿攻击任务,可以分为6个作战阶段:①t0~t1阶段,对敌方空中拦截作战编队进行截击;②t1~t2阶段,对敌方海面舰艇进行压制; ③t2~t3阶段,对敌方前序固定或移动非预定目标进行攻击;④t3~t4阶段,经过空中加油后,进行预定目标攻击前的空中集结;⑤t4~t5阶段,对敌方固定或移动预定目标进行攻击;⑥t5~t6阶段,对敌方岛外增援空中作战编队进行截击后,编队返航。 图5 离岸岛屿攻击任务DINs模型Fig.5 DINs model of offshore island attack mission 表1为经过一致性检验的外部事件出现概率。表2为根据专家知识,考虑作战资源和规则约束,给出的各作战阶段行动可选策略[11]。 表1 外部事件(EE)出现概率Table 1 Occurrence probabilities of EE 表2 各作战阶段的可选策略Table 2 Alternative strategies for all phases 为验证模型正确性和算法有效性、优越性,在CPU配置为Intel(R) Core(TM) i3 2.27 GHz的计算机上,基于MATLAB R2010a进行多组仿真实验。其中,实验1验证改进Kendall协和系数检验法的有效性;实验2验证目标节点实现概率与各关键参数相关关系理论分析的正确性;实验3和4分别验证改进NSGA-II算法的有效性和优越性。 表3为根据专家知识给出的基准概率(bp),表4为根据专家知识,给出的h值和g值取值情况。 采用Kendall协和系数检验法对h值进行一致性检验,具有最高权威度专家组集合为{z1,z2,z3,z6},生成的最终h值分别为[0.36,0.44]、[0.65, 0.72]、[-0.89,-0.78]、[-0.82,-0.77]、 [0.52,0.67]、[0.58,0.67]、[-0.69,-0.59]、[-0.65,-0.57]、[0.41,0.51]、[0.25,0.38]、[-0.84,-0.69]、[0.26,0.35]、[0.52,0.59]、 [0.51,0.62]、[0.66,0.78]、[0.20,0.31]、 [0.51,0.63]、[0.36,0.46]、[0.70,0.82]、 [0.37,0.44]、[-0.49,-0.39]、[0.37,0.47]、[0.28,0.40]、[-0.72,-0.58]、[0.23, 0.30]。 当对g值进行一致性检验生成时,具有最高权威度专家组集合为{z1,z2,z3,z5},生成的最终g值分别为[-0.55,-0.49]、[-0.68,-0.55]、 [0.23,0.31]、[0.44,0.57]、[-0.40,-0.31]、[-0.66,-0.59]、[0.61,0.71]、[0.42,0.50]、[-0.82,-0.70]、[-0.72,-0.64]、[0.38, 0.48]、[-0.36,-0.23]、[-0.58,-0.49]、 [-0.45,-0.35]、[-0.28,-0.19]、[-0.43,-0.37]、[-0.56,-0.48]、[-0.54,-0.47]、 [-0.56,-0.44]、[-0.33,-0.19]、[0.30, 0.37]、[-0.74,-0.63]、[-0.75,-0.68]、 [0.61,0.71]、[-0.67,-0.56]。 当对bp值进行一致性检验生成时,具有最高权威度专家组集合为{z1,z2,z3,z5},生成的最终bp值分别为[0.21,0.30]、[0.55,0.65]、[0.31,0.42]、[0.56,0.63]、[0.41,0.54]、[0.53,0.64]、[0.36,0.47]、[0.67,0.75]。 表3 各专家给出的基准概率(bp)取值情况Table 3 Values of bp given by all experts 表4 各专家给出的h值和g值取值情况Table 4 h and g values given by all experts 图6为期望效果实现概率随外部事件出现概率、基准概率和影响强度值的变化情况。从图6可以看出,d1和d2的实现概率与外部事件出现概率成反比,与基准概率和影响强度值成正比,验证了理论分析的正确性。 仿真实验3为验证改进NSGA-II算法的有效性,利用相应算例参数,进行仿真实验。其中,本文算法的最大迭代次数gen=100,种群规模sizepop=30,交叉概率pc=0.9,变异概率pm=0.1。 仿真实验4为验证本文算法的优越性,将其与多目标离散人工蜂群(Multi-Objective Discrete Artificial Bee Colony, MODABC)算法[17]和多目标离散粒子群(Multi-Objective Discrete Particle 图6 期望效果(DEs)实现概率随各关键参数变化情况Fig.6 Change in DEs realization probabilities with each key parameter 图7 典型Pareto最优解Fig.7 Typical Pareto optimal solution Swarm Optimization, MODPSO)算法[18]进行对比。对比指标采用衡量多目标优化算法的覆盖性指标、均匀性指标和宽广性指标[19],其中,覆盖性指标和宽广性指标为效益型指标,越大越好;均匀性指标为成本型指标,越小越好。对目标函数进行归一后计算指标值,各算法均运行20次,取20次运行结果平均值进行对比。 图8为本文算法与MODABC算法对比情况。图9为本文算法与MODPSO算法对比情况。 从图8可以看出,与MODABC算法相比,本文算法在覆盖性指标和均匀性指标上都要更优,在宽广性指标上,在大多数迭代次数下,均更优。从图9可以看出,与MODPSO算法相比,本文算法在覆盖性指标和均匀性指标上都要更优,在宽广性指标上,劣于MODPSO算法。因此,相比于其他2种对比算法,本文算法总体上较优。 图8 改进NSGA-II算法与MODABC算法的对比Fig.8 Comparison between improved NSGA-II algorithm and MODABC algorithm 图9 改进NSGA-II算法与MODPSO算法的对比Fig.9 Comparison between improved NSGA-II algorithm and MODPSO algorithm 空中作战COA设计过程中,存在大量不确定性,为了提高COA设计的高效性和鲁棒性,需要充分考虑这种不确定性。本文针对其中的参数不确定性,基于区间优化思想构建问题模型,在关键参数确定过程中引入改进Kendell协和系数检验法进行专家知识的一致性检验,定量分析目标节点实现概率与各关键参数的相关关系,进而采用改进NSGA-II算法对模型进行求解。仿真实验结果表明,所提出方法是有效的,且相比其他算法,具有优越性。本文研究对于考虑参数区间性的空中作战COA设计问题具有一定参考价值,下一步,可以将事件随机性、决策模糊性等不确定性[20-21]引入空中作战COA优选。 附录A: 定理1若父节点A、C对子节点D有促进作用,父节点B对子节点D有抑制作用,则子节点D与父节点A、C呈正相关关系。 证明取简单情形,假定父节点集合为{a1,b1,c1},对于子节点d1,共有8种组合场景,包括{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}和{d1|a1,b1,c1}。 以父节点a1为例,定义只有a1状态不同,b1和c1状态相同的两个场景,为一对场景对。例如,{d1|a1,b1,c1}和{d1|a1,b1,c1}即为一对场景对;同理,{d1|a1,b1,c1}和{d1|a1,b1,c1}也为一对场景对。 对于场景对{d1|a1,b1,c1}和{d1|a1,b1,c1},在场景{d1|a1,b1,c1}下,影响强度值取为h(a1)>0、h(b1)≤0和h(c1)>0,分别进行正、负影响强度聚合,有PI(a1,b1,c1)=1-[(1-h(a1))×(1-h(c1))],NI(a1,b1,c1)=1-(1+h(b1))成立。类似地,在场景{d1|a1,b1,c1}下,影响强度值取为g(a1)≤0、h(b1)≤0和h(c1)>0,分别进行正、负影响强度聚合,则同样地,有PI(a1,b1,c1)=1-(1-h(c1)),NI(a1,b1,c1)=1-[(1+h(b1))×(1+g(a1))]成立。 当P(a1)=x,0≤x≤1时,有P(a1)=1-x。根据式(18),P(d1)在上述场景对下的部分项P(d1|b1,c1)可以表示为 P(d1|b1,c1)=P(a1)×P(b1)×P(c1)× P(d1|a1,b1,c1)+P(a1)×P(b1)× P(c1)×P(d1|a1,b1,c1) (A1) 式中:P(d1|a1,b1,c1)和P(d1|a1,b1,c1)的计算主要根据式(14)~式(17)。 由于影响强度值取值范围为[-1,1],因此,必定有PI(a1,b1,c1)≥PI(a1,b1,c1),NI(a1,b1,c1)≤NI(a1,b1,c1)成立。根据式(16)可知,OI与PI呈正相关关系,OI与NI呈负相关关系,则有P(d1|a1,b1,c1)≥P(d1|a1,b1,c1)成立。若记S1=P(b1)×P(c1)×P(d1|a1,b1,c1),S2=P(b1)×P(c1)×P(d1|a1,b1,c1),则S1≥S2,式(A1)可简化为P(d1|b1,c1)=P(a1)×S1+P(a1)×S2。 当P(a1)=x+Δx,Δx≥0时,有P(a1)=1-x-Δx成立,P(d1)在相应场景对下的部分项变化量为:ΔP(d1|b1,c1)=(x+Δx)×S1+(1-x-Δx)×S2-x×S1-(1-x)×S2=Δx×(S1-S2)≥0。对于其他场景对,均可采用以上证明过程进行证明,且可以拓展到更复杂情形。因此,子节点D与父节点A呈正相关关系;同样地,可以证明,子节点D与父节点C呈正相关关系。 定理2若父节点A、C对子节点D有促进作用,父节点B对子节点D有抑制作用,则子节点D与父节点B呈负相关关系。 证明同样以定理1证明过程中的简单情形为例,对于场景对{d1|a1,b1,c1}和{d1|a1,b1,c1},在场景{d1|a1,b1,c1}下,影响强度、PI和OI取值情况与定理1中相同。在场景{d1|a1,b1,c1}下,影响强度值取为h(a1)>0、g(b1)>0和h(c1)>0,分别进行正、负影响强度聚合,同样地,有PI(a1,b1,c1)=1-[(1-h(a1))×(1-g(b1))×(1-h(c1))],NI(a1,b1,c1)=0。 当P(b1)=y,0≤y≤1时,有P(b1)=1-y。根据式(18),P(d1)在上述场景对下的部分项P(d1|a1,c1)可以表示为 P(d1|a1,c1)=P(b1)×P(a1)×P(c1)× P(d1|a1,b1,c1)+P(b1)×P(a1)× P(c1)×P(d1|a1,b1,c1) (A2) 由于影响强度值取值范围为[-1,1],因此,必有PI(a1,b1,c1)≤PI(a1,b1,c1),NI(a1,b1,c1)≥NI(a1,b1,c1)成立。根据OI与PI、NI的相关关系,则有P(d1|a1,b1,c1)≤P(d1|a1,b1,c1)成立。若记S3=P(a1)×P(c1)×P(d1|a1,b1,c1),S4=P(a1)×P(c1)×P(d1|a1,b1,c1),则S3≤S4,式(A2)可简化为P(d1|a1,c1)=P(b1)×S3+P(b1)×S4。 当P(b1)=y+Δy,Δy≥0时,有P(b1)=1-y-Δy成立,P(d1)在相应场景对下的部分项变化量ΔP(d1|a1,c1)=(y+Δy)×S3+(1-y-Δy)×S4-y×S3-(1-y)×S4=Δy×(S3-S4)≤0。对于其他场景对,均可采用以上证明过程进行证明,且可以拓展到更复杂情形。因此,子节点D与父节点B呈负相关关系。 定理3若父节点A、C对子节点D有促进作用,父节点B对子节点D有抑制作用,则子节点D与父节点的影响强度h值呈正相关关系。 证明同样以定理1证明过程中的简单情形为例,对于场景对{d1|a1,b1,c1}和{d1|a1,b1,c1},影响强度、PI以及OI的取值情况与定理1中相同。 首先,分析起促进作用父节点的影响强度h值对子节点D实现概率的影响。在场景{d1|a1,b1,c1}下,当h(c1)增大时,则PI(a1,b1,c1)也增大,进而导致OI和P(d1|a1,b1,c1)的增大。在场景{d1|a1,b1,c1}下,当h(c1)增大时,则PI(a1,b1,c1)也增大,同样进而导致OI和P(d1|a1,b1,c1)的增大。因此,在该场景对下,根据式(18),P(d1)随之增大。对于其他场景对,均可采用以上证明过程进行证明,且可以拓展到更复杂情形。 然后,分析起抑制作用父节点的影响强度h值对子节点D实现概率的影响。在场景{d1|a1,b1,c1}下,当h(b1)增大时,则NI(a1,b1,c1)减小,进而导致OI和P(d1|a1,b1,c1)的增大。类似地,在场景{d1|a1,b1,c1}下,当h(b1)增大时,则NI(a1,b1,c1)减小,进而使OI和P(d1|a1,b1,c1)增大。因此,在该场景对下,根据式(18),P(d1)随之增大。对于其他场景对,均可采用以上证明过程进行证明,且可以拓展到更复杂情形。 综上,子节点与所有父节点的影响强度h值呈正相关关系。 定理4若父节点A、C对子节点D有促进作用,父节点B对子节点D有抑制作用,则子节点D与父节点的影响强度g值呈正相关关系。 证明同样以定理1证明过程中的简单情形为例,以场景对{d1|a1,b1,c1}和{d1|a1,b1,c1}为例。在场景{d1|a1,b1,c1}下,影响强度值取为g(a1)≤0、g(b1)>0和h(c1)>0,分别进行正、负影响强度聚合,则有PI(a1,b1,c1)=1-[(1-g(b1))×(1-h(c1))],NI(a1,b1,c1)=1-(1+g(a1))成立。在场景{d1|a1,b1,c1}下,影响强度值取为g(a1)≤0、g(b1)>0和g(c1)≤0,进行正、负影响强度聚合,有PI(a1,b1,c1)=1-(1-g(b1)),NI(a1,b1,c1)=1-[(1+g(a1))×(1+g(c1))] 首先,分析起促进作用父节点的影响强度g值对子节点D实现概率的影响。在场景{d1|a1,b1,c1}下,当g(a1)增大时,NI(a1,b1,c1)减小,进而导致OI和P(d1|a1,b1,c1)的增大。在场景{d1|a1,b1,c1}下,当g(a1)增大时,NI(a1,b1,c1)减小,同样进一步导致OI和P(d1|a1,b1,c1)的增大。因此,在该场景对下,根据式(18),P(d1)随之增大。对于其他场景对,均可采用以上证明过程进行证明,且可以拓展到更复杂情形。 然后,分析起抑制作用父节点的影响强度g值对子节点D实现概率的影响。在场景{d1|a1,b1,c1}下,当g(a1)增大时,PI(a1,b1,c1)也增大,进而导致OI和P(d1|a1,b1,c1)的增大。在场景{d1|a1,b1,c1}下,当g(a1)增大时,则PI(a1,b1,c1)随之增大,进而导致OI和P(d1|a1,b1,c1)的增大。因此,在该场景对下,根据式(18),P(d1)随之增大。对于其他场景对,均可采用以上证明过程进行证明,且可以拓展到更复杂情形。 综上,子节点与所有父节点的影响强度g值呈正相关关系。2.2 概率传播算法
3 行动过程优选模型求解
4 仿真实验分析
4.1 仿真案例设计
4.2 仿真结果分析
5 结 论