APP下载

基于RS-DBN的电子对抗目标清单生成方法

2021-08-24赵禄达

系统工程与电子技术 2021年9期
关键词:电子对抗排序概率

赵禄达,王 斌

(国防科技大学电子对抗学院,安徽 合肥 230037)

0 引 言

目标清单的生成是作战筹划中的一项重要内容,其内容一般包括作战对象的详细信息和作战目标等级划分两部分[1]。在现代战场上,电子目标清单是作战筹划中作战目标分配、干扰资源分配和战术行动决策的基础,对作战过程中的电子目标进行精准的情报探知和精确的等级排序具有十分重要的意义。

由于电子对抗作战样式的多样化和目标的时变特性,电子对抗作战目标清单难以单纯通过指挥员主观判断进行评估,为此,不少学者对这类问题进行了深入研究。文献[2-4]分别用灰色关联改进的主成分分析法、层次分析法(analytic hierarchy process,AHP)、改进的模糊多准则优化妥协决策(fuzzy vlse kriterijumska optimizacija i kompromisno resenje,FVIKOR)法以及前景理论,对空中作战目标的威胁度进行了评估排序。文献[5-6]使用主成分分析法进行指标数据降维,结合一种快速的前向神经网络极限学习机(extreme learning machine,ELM)和粒子群算法进一步提高了空中作战目标威胁评估模型的精确度。文献[7]利用离散Hopfield神经网络(Hopfield neural network,HNN)对作战过程中对方电子目标的历史数据进行网络训练,建立了具有较强泛化能力的电子目标威胁评估模型。文献[8]利用Kullback-Leibler散度改进了传统的逼近理想解排序法(technique for order preference by similarity to an ideal solution,TOPSIS),并且使用动态自回归模型(dynamic auto regressive,DAR(p))对时间序列上缺失的数据进行修补,加强了目标威胁评估精度。文献[9-10]充分考虑战场主、客观因素对目标威胁排序的影响,通过模糊熵对主客观因素进行隶属度划分,结合TOPSIS法得到了更加贴近作战实际的评估方法。以上文献在对作战清单的研究时,以防御作战为背景的清单求解方法研究为主,对进攻作战为背景的清单求解方法研究较少;对当前作战态势下的目标排序分析较多,对不同作战阶段的目标排序分析较少。实际作战中,防御作战的目标清单中目标等级排序与目标威胁度基本一致,而进攻作战中仅考虑目标威胁度表征目标等级排序是远远不够的。文献[11]建立了联合作战的超网络体系架构,对联合作战中的火力进攻目标进行了价值排序。文献[12]将防空作战中随作战进程变化的因素考虑到目标排序指标中,使用灰色聚类分析单阶段目标重要度,结合序关系法分析不同作战阶段的目标排序,为作战筹划提供了决策支持。文献[13-14]分别利用DAR(p)模型和动态贝叶斯网络(dynamic Bayesian network,DBN)模型对样本数据不完整的情况进行数据修补,结合战场目标特点对防空作战目标威胁进行评估。文献[15]使用云模型对DBN的节点参数进行描述,利用证据相关法进行网络推理,得到了对超视距空战目标排序的有效方法。文献[16]使用DBN对雷达对抗干扰目标的选择进行分析,并利用期望最大化算法对战场数据不完整的情况给出了解决办法。文献[17-18]综合考虑作战协同和作战环境的影响,针对空中联合作战中目标威胁评估问题,使用信息熵改进的DBN(information entropy-DBN,IE-DBN)对问题进行了较好的求解。文献[13-18]通过评价过程的动态变化一定程度上反映了目标的动态变化,对电子对抗目标清单的生成方法有一定的借鉴价值。但以上评估方法主要存在以下两点不足:一是部分考虑了战场数据不完整的评估方法对战场动态因素考虑不足;二是指标体系赋权主观性偏大,使得评估结果准确度下降。

为了克服上述不足,考虑到以上文献中使用的随机抽样法需要大量的实验数据和抽样次数,DAR(p)模型对作战历史样本数据要求较高,于是本文提出一种基于随机集-DBN(random set-DBN,RS -DBN)的评估方法,既关注到数据的不确定性和不完整性,也充分考虑主客观因素和战场动态变化的影响,具有很强的军事适用性。

1 电子对抗目标清单生成方式

作战筹划中,对作战目标的分析是判断情况和决策的核心环节,其得出的作战目标清单主要包括作战目标的种类、数量、工作参数等目标固有信息以及目标攻击价值、打击目标风险、打击目标成本等对目标分级产生影响的因素[19]。电子对抗(electronic countermeasures,ECM)目标清单生成流程如图1所示。目标固有信息一般需要对作战全过程进行全域侦察不断获取,而各个目标等级排序才是作战决策中指挥员最关切的内容,结合目标情报信息以及目标等级排序,就可以以此为基础对作战全过程实施精确指挥和控制。

图1 ECM目标清单生成流程Fig.1 ECM target list generation process

1.1 单阶段目标等级评价指标体系构建

按照电子对抗作战目标和战场特点,建立电子对抗作战目标等级评价指标体系如图2所示。此处借鉴美军提出的作战评估BOCR(benefit,opportunity,cost,risk)理论,电子对抗作战目标等级影响因素应该包括干扰目标的风险、干扰目标的价值、目标时效性和目标的干扰成本4个因素[20-21]。由于本文通过DBN的转移条件概率模拟阶段转移因素,此处不考虑目标时效性问题;假设作战资源充足,对对方目标有充足的干扰兵力,此处不考虑干扰成本问题。

图2 目标等级评价指标体系Fig.2 Target level evaluation index system

1.2 基于DBN的评价指标体系

陆上战术进攻战斗一般可分为信火准备、前沿突击、纵深攻歼、控守抗反4个作战阶段,本文使用DBN的时刻节点转移来表征作战阶段的变化,通过目标等级作为各个时刻的根节点,以X1、X2、X3、X4表示4个作战阶段,如图3所示。图3中,各目标等级节点下的各节点指标含义与图2中一致。其中,实线箭头代表相同时刻的目标等级评价指标条件概率指向,虚线箭头代表跨时刻的条件概率指向。由于目标威胁程度和目标被干扰产生的附加效果两个指标会随着战斗阶段的变化而变化,所以当前时刻ADD、THR节点和目标等级节点均有条件转移箭头指向下一时刻的相应节点。由于DBN的推理复杂程度随着节点状态空间包含数量的增加呈指数级增长,本文节点状态空间均使用3级制进行表述。指标体系的节点状态空间如表1所示。

表1 DBN节点状态空间Table 1 Node state space in DBN

图3 基于DBN的目标等级评价指标体系Fig.3 Target level evaluation index system based on DBN

2 RS-DBN评价方法

2.1 评估流程

本文使用的电子对抗目标等级评估方法主要由基于随机集的DBN参数算法和DBN推理算法两部分组成。通过随机集确定DBN的各个节点参数,经过DBN推理得到目标等级节点参数,进而得到电子对抗目标等级。评估流程如图4所示。

图4 RS-DBN评估流程图Fig.4 RS-DBN evaluation flow chart

2.2 评估算法

2.2.1 基于随机集的贝叶斯网络参数确定算法

设对方有k个电子目标S1,S2,…,Sk,每个目标的评价指标记为ξ1,ξ2,…,ξk,其中ξ1∈{Θ1,Θ2,…,Θn,…,Θk}表示k个指标的值域,其k维参数笛卡尔积空间为Θ=Θ1×Θ2×…×Θk。目标等级评价指标表示为ζ=f(ξ),ξ=(ξ1,ξ2,…,ξk),f为目标等级与指标之间的对应关系,一般为非线性复杂函数。定义ξk的可能取值范围为Ik∈[ξk_0-Δξk,ξk_0+Δξk],ξk_0为指标标称值,Δξk为指标公差。

在具体评价时,通过ξk的随机变化得到ζ的变化,再由概率赋值进行节点条件概率的确定。

基于随机集的DBN参数算法步骤如下。

步骤 2构造随机集(F′,M′)。随机集的包含3个条件[23-24]:

(1)∀u∈F,即∀Ai∈F′,满足u⊆Ai;

(2)∀Ai∈F′,至少∀u∈F,满足u⊆Ai;

若满足以上3条,则(F,M)⊆(F′,M′)。

M′(I1,j·I2,k)=

证毕

步骤 3求解(F′,M′)的像(R′,ρ′)。根据随机集求解像的拓展准则[25-26],可以得到:

R′={Ri=f(Ai)|Ai∈F′}

(1)

ρ′(Rj)=∑{M′(Ai)|Rj=f(Ai)}

(2)

式中:f(Ai)={f(u)|u∈Ai}。

步骤3中,最关键的就是求解f(Ai),下面给出针对本文问题的两次全局最优化求解方法。

由拓展准则可得:电子对抗目标等级排序中各时刻根节点的目标等级关于其余节点指标是大致单调的,设A∈F为一有限闭集,则

(3)

以下讨论f的简化计算方法。

若f连续且不存在极限点,则式(3)变为

(4)

若f及其偏导均连续且关于ξ严格单调,则式(4)拓展为

(5)

例如,k=2,d=[3,2]时,ξ1的取值范围I1可以划分为[u1,1,u1,2),[u1,2,u1,3),[u1,3,u1,4],ξ2的取值范围I2划分为[u2,1,u2,2),[u2,2,u2,3],A1=[u1,1,u1,2)×[u2,1,u2,2),A2=[u1,1,u1,2)×[u2,2,u2,3),A3=[u1,2,u1,3)×[u2,1,u2,2),A4=[u1,2,u1,3)×[u2,2,u2,3),A5=[u1,3,u1,4)×[u2,1,u2,2),A6=[u1,3,u1,4)×[u2,2,u2,3);若满足式(5),则重叠顶点不需进行计算,比如f(A2)=[min{f(u1,1,u2,2),f(u1,1,u2,3),f(u1,2,u2,2),f(u1,2,u2,3)},max{f(u1,1,u2,2),f(u1,1,u2,3),f(u1,2,u2,2),f(u1,2,u2,3)}],计算次数降为12次;若满足式(5),f在I1上递增,在I2上递减,不存在极值点顶点A1,A6也可不用计算,比如f(A2)=[min{f(u1,1,u2,3)},max{f(u1,2,u2,2)}],则计算次数降为10次。

步骤 4求解Fζ的上概率、下概率。由式(6)和式(7)可得

∑{p(f(An))|y≥inf(f(An))}

(6)

∑{p(f(An))|y≥sup(f(An))}

(7)

式中:Pl(R)和Bel(R)分别为(R′,ρ′)的似真函数和置信函数。

步骤 5求解区间概率。根据区间划分,求解节点区间概率:

(8)

重复步骤1~步骤4,对DBN中所有节点条件概率进行求解,进而获得所有DBN节点参数。

2.2.2 DBN推理算法

贝叶斯网络(Bayesian network,BN)主要依靠贝叶斯推理进行网络节点连接,而DBN通过根节点间的时刻条件概率使单时刻的BN相连接。在引入随机集后,DBN节点参数通过随机集进行表述,设DBN中每个时刻的观测数据组成的集合为Zk={Z1,Z2,…,Zk},随机集的似然函数(一阶马尔可夫转移概率密度函数)为

(9)

式中:δ为一计数测度,其可由多目标观测模型置信测度β∑k+1|k经过广义拉东-尼可达姆导数方法[27]求导得到。

贝叶斯非线性推理的向前推导和向后推导公式如式(10)和式(11)所示。

(10)

(11)

电子对抗目标排序的DBN推理算法步骤如下。

步骤 1网络初始化。建立DBN网络,确定随机集获得的节点指标和网络先验信息(包括历史目标数据和目标经验排序)。

步骤 2实施网络推理。不同作战目标均需要经过一次DBN网络向前推理,通过式(10)获得后验概率分布密度函数fk+1|k+1,在通过区间范围计算得到后验概率分布pk+1|k+1,进而更新整个DBN网络数据。

步骤 3获得目标排序预测。以4个作战阶段作为DBN的4个时刻片段,通过步骤2中的网络推理,得到当前阶段网络数据,将当前阶段网络数据与实际值进行对比(一般与蒙特卡罗实验数据结果进行对比),若绝对误差大于0.06,则返回步骤1对初始化先验信息进行修正;若绝对误差小于0.06,利用式(11)进行网络向后推理得到剩余时间片段网络节点参数集。

步骤 4各个时刻结果排序。求得的不同电子对抗目标根节点后验概率为P{RANK|T(i),i=1,2,3,4},RANK表示随机集求出的节点等级概率范围,T(i)表示根节点的4个阶段时刻条件,对节点概率进行线性加权,得到RANKi作为最终排序的依据。

3 案例仿真及结果分析

3.1 案例背景

以陆军某合成分队10年的演训数据为样本,选取其中融入电子对抗力量的相同规模陆上战术进攻战斗数据,对其中6个雷达类目标(1部远程预警雷达、3部活动目标侦测雷达、2部炮瞄雷达)和6个通信类目标(1个短波通信网专、2个超短波通信网专、3个超短波通信网指挥节点)共计12个电子目标实施目标等级评价。将数据进行统计分析,总计200组,在目标评价指标中,JAM、ENV和ADD 3类数据由于战场统计和资料完备性等原因导致数据不完整,在下文仿真过程中将利用随机集的不确定性补全节点参数。

本文的仿真环境为:CPU为i7-8850H,16.0GB RAM;操作系统为Windows10,DBN仿真工具为Netica,数据仿真分析工具为Matlab(R2018a)。

3.2 案例仿真求解

以求解1部远程预警雷达的目标等级为例,进行求解过程的说明。按照第2.2节中算法步骤,对案例进行分步求解。首先,根据图2所示的指标体系,对确定数据集的指标数据进行贝叶斯网络节点概率分析。将JAM、ENV和ADD 3个数据不完整节点去除,通过基于期望最大化算法(expectation maximization,EM)算法的BN数据训练,得到BN推理结果如图5所示。

图5 贝叶斯网络初步推理Fig.5 BN preliminary inference

得到的节点条件概率表(conditional probability table,CPT)如表2~表4所示。

表2 节点条件概率表1Table 2 Node CPT 1 %

表3 节点条件概率表2Table 3 Node CPT 2 %

表4 节点条件概率表3Table 4 Node CPT 3 %

其次,对数据不完整的节点利用随机集进行CPT的求解。下面以求解P(JAM |RIS)和P(ENV |RIS)为例,说明求解过程。假设建立的评价体系中节点间的关系为近似线性的,ζRIS=f(ξJAM,ξENV),显然IJAM,IENV∈[0,1]。根据第2.2.1节中的步骤2,将IJAM,IENV划分为10个子区间:[0,0.1],[0.1,0.2],[0.2,0.3],[0.3,0.4],[0.4,0.5],[0.5,0.6],[0.6,0.7],[0.7,0.8],[0.8,0.9],[0.9,1.0],据前文ξJAM服从正态分布,ξENV服从指数分布,其统计均值分别为uJAM=0.48,uENV=0.69,标准差σJAM=1.581 1,根据概率分布计算区间概率赋值为

(12)

PENV([a,b])=e(-a/uENV)-e(-b/uENV)

(13)

区间概率赋值的计算结果如表5所示。

表5 ξJAM,ξENV的区间概率赋值表Table 5 Interval probability assignment table of ξJAM,ξENV

这样,空间Θ=IJAM×IENV就被划分为100个子空间(焦元),由式(1)和式(2)可求得每个焦元所对应的像,再通过式(6)和式(7)即可求得FζRIS的上、下概率。为了说明随机集方法的合理性和高效性,此处使用蒙特卡罗方法获得干扰目标风险的累积概率分布,结果如图6所示。将干扰目标风险的3个等级(high,middle,low)范围设定为:[0.6,1.0),[0.3,0.6),[0,0.3],根据式(8)得到其所在概率区间分别为:P(high)=[0.629,0.837),P(middle)=[0.206,0.446),P(low)=[0.076,0.153),取区间中点值作为CPT元素。按照此法获得的不完整数据节点的CPT如表6~表8所示。

图6 ζRIS的累积概率及上下概率分布Fig.6 Cumulative probability and upper and lower probability distributions of ζRIS

表6 不完整数据节点的CPT(1)Table 6 CPT for incomplete data nodes (1)

表7 不完整数据节点的CPT(2)Table 7 CPT for incomplete data nodes (2)

表8 不完整数据节点的CPT(3)Table 8 CPT for incomplete data nodes (3)

至此,所有的CPT全部求解完毕,按照第2.2.2节的步骤进行DBN初始化,目标等级评价节点的作战阶段片段状态按照0.60、0.25、0.15概率进行转移,进行前向推理的DBN网络如图7所示。

图7 DBN网络推理图Fig.7 DBN network inference graph

按照相同方法,对其余11个目标进行不同作战阶段的目标等级评估。目标编号1~12分别代表6个雷达类目标(1部远程预警雷达、3部活动目标侦测雷达、2部炮瞄雷达)和6个通信类目标(1个短波通信网专、2个超短波通信网专、3个超短波通信网指挥节点)共计12个电子目标,推理评估结果如表9所示。

3.3 结论分析

3.3.1 目标等级结果分析

首先对案例中12个目标的等级结果进行分析,根据专家经验[28],本文规定不同目标的威胁等级对应的期望值分别为1.08、0.64、0.11,归一化后为1.00、0.59、0.10。对表9中的后验概率进行线性加权[29-30],以阶段一(X1)的等级一(One)为例,加权公式如下:

(14)

式中:pi(One|X1)表示目标i(i=1,2,…,12)在阶段一过程目标等级为一级(One)时的后验概率。那么,综合威胁等级期望和后验概率即可得到最终的目标等级结果如下:

(15)

得到等级结果曲线如图8所示。

表9 DBN评价12个作战目标等级结果Table 9 DBN evaluate the results of 12 operational target levels

图8 12个目标在4个阶段的等级曲线Fig.8 Level curve of 12 targets in 4 stages

可以看出在12个目标中,预警雷达随着作战阶段推移等级逐渐下降,尤其在第4个作战阶段等级最低,这是因为我方在进攻过程中距离敌方兵力配置纵深越来越近。由于雷达波束宽度的限制,预警雷达对远距离目标探测效果要优于近距离目标。活动目标侦测雷达随着作战阶段推移等级缓慢下降,这是由于我方在接近敌方兵力部署密集区时其作用发挥越来越弱。炮瞄雷达在第2个阶段时等级上升,是由于我方在突入过程中需要重点压制其正常工作,掩护我进攻兵力。短波通信网专在第1个阶段时等级较低,是由于敌防御前沿是采取连、排级小股防守策略,通信联络方式为超短波,短波通信主要是本级与上级和协同部队进行通联。超短波通信网专和通信节点在每个阶段等级的变化幅度不大,是由于在战术进攻战斗中对方主要以超短波通信为主实施各级的指挥控制。要特别说明的是,所有目标在第2阶段和第3阶段等级差别不大,这是由于在这2个作战阶段中,我方主要兵力作战地域为对方防御纵深,双方交战激烈,我方需要对敌进行全方位的打击,从而各个电子目标等级差别不大,这与实际作战也是相吻合的,进一步说明了评价方法的有效性。通过对目标变化趋势的精确判断,能够更好的给电子对抗指挥员在不同作战阶段实施灵活用兵提供帮助。

3.3.2 评估算法性能分析

在使用随机集进行不完整数据节点的CPT求解时,使用的是区间的上、下概率的间接求解方式对实际概率进行估算。图6中,d1=d2=10,将空间划分为了100个焦元,可以看出上、下概率曲线在由蒙特卡罗仿真出的概率曲线两侧,在计算时虽会产生一定误差,但在计算量上却远小于蒙特卡罗方法。为了说明算法性能,在此令d1=d2=40,得到曲线如图9所示。

图9 500个焦元划分下的累积概率及上下概率分布Fig.9 Cumulative probability and upper and lower probability distributions in 500 focal elements

可以看出,上下概率曲线比图6中更加靠近蒙特卡罗概率曲线,评估的精确度更高。

设评估误差为

(16)

由蒙特卡罗方法的抽样特点可知,要使仿真结果贴近实际,就需要将其统计误差控制在一定的阈值ε0内[31]满足:

(17)

式中:λa为正态差;a为数据集的统计置信度;σ为标准差,利用中心极限定理即可通过式(16)反算得到蒙特卡罗方法的最低抽样次数N。设ε0=0.05,查表得λa=1.96,置信水平a为95%,随机集的上下概率方法与蒙特卡罗方法的对比结果如表10所示。

表10 随机集结果对比Table 10 Comparison of random set results

通过对比可见,蒙特卡罗法虽然具有很低的误差,但运算次数和复杂程度远高于上下概率法,当数据集进一步拓展后,这种劣势就会表现的更加明显。综上,通过上下概率法计算随机集的焦元对应概率效率高,适用性强。

4 结 论

本文以电子对抗作战目标清单生成为牵引,提出了基于随机集的DBN目标等级评价方法,通过分析可得出以下几点结论。

(1)本文建立的电子对抗作战目标等级评价体系考虑作战阶段的时刻变化因素,将不同作战阶段目标指标的变化充分考虑,克服了传统目标评价体系静态评估的不准确性,此动态评估体系更符合作战实际和要求。

(2)利用随机集方法对DBN初始化方法进行改进,考虑作战过程中不完整信息对评价结果的影响,使用随机集方法将节点处的不完整信息进行补充,克服了传统使用数据统计分布确定CPT的不准确性,使最终评价结果更加具有适用性。

(3)本文在CPT确定过程中使用区间数学的上下概率法对节点概率进行确定,经过与蒙特卡罗方法得出的节点概率进行比较,得出结论:在规定的误差范围内,虽然蒙特卡罗算法具有较高的计算精度,但算法复杂度很高,相对的,上下概率法计算复杂度和计算时间远小于蒙特卡罗法,对计算条件要求不高,具有更好的推广性。

(4)在对案例进行仿真计算后,得出的电子对抗目标等级排序与实际作战基本一致,特别是4个作战阶段中的第2、3阶段目标等级变化不大,与作战筹划时的兵力需求的统筹考虑相一致,这点明显优于传统评价方法得出的目标等级排序结果。

(5)文中提出的评价方法也可推广至其他作战问题的动态评估中。

猜你喜欢

电子对抗排序概率
第6讲 “统计与概率”复习精讲
排序不等式
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
恐怖排序
《航天电子对抗》编辑部召开第九届编委会成立会
《航天电子对抗》欢迎来稿
节日排序
大数据技术在电子对抗情报系统中的应用