APP下载

基于BP网络与DS证据理论的态势估计问题研究*

2013-08-10周国祥许锦洲韦晓萍

舰船电子工程 2013年8期
关键词:态势战场概率

周国祥 许锦洲 韦晓萍

(1.海军蚌埠士官学校 蚌埠 233012)(2.海军指挥学院浦口分院 南京 211800)

1 引言

随着传感器和军事信息系统的发展应用,海战场各作战平台的探测距离远、机动能力强、火力范围广,使得战场态势变化更加快速复杂,且敌我双方交战过程中普遍采用了伪装、隐蔽和欺骗(CC&D)等战术,如何及时、准确、迅速地反映战场态势的变化,增强对战场态势的感知,逐步识别敌方意图和作战计划,并作出正确的态势估计[1],将成为作战双方争夺战场信息优势的焦点[2]。

态势估计是信息融合功能模型[3~6]的二级处理过程,它接收一级融合结果,并从中抽取对当前态势尽可能准确、完备的战场情报信息,为各级指挥员作战决策提供辅助支持。态势估计是在决策级上进行的一种推理行为[7],由于传感器性能以及敌方干扰、欺骗等行为,使得态势估计过程需要处理的信息具有高度不确定性。同时,由于作战的复杂性,使得用于推理的军事知识存在着不确定性。因此,态势估计系统必须能够处理不确定性信息,进行有效推理[8]。

用于态势评估的主要方法有模板匹配[9]、规划识别[10]、贝叶斯网络[11~12]以及专家系统[13]等,这些方法运用于战场态势评估问题各有其优缺点。DS证据理论是一种有效的不确定性推理方法,比传统概率论能更好地把握问题的未知性和不确定性[14]。该理论提供了证据的合成方法,能融合多个证据源提供的证据,因此成功应用于信息融合领域。针对文献[7~8]中存在的基本概率赋值函数由领域专家给出,结果容易受专家主观因素影响的问题,本文提出一种基于神经网络和DS证据理论相结合的态势估计方法,使用神经网络中应用最为广泛的BP网络来求解基本概率赋值函数,再使用DS证据理论进行态势估计。结果表明,该方法可有效克服专家主观因素的影响,为海战场战术态势估计提供新的途径。

2 神经网络和DS证据理论

2.1 BP网络原理与算法步骤

BP神经网络是一种多层前馈神经网络,其主要特点是信号前向传播,误差反向传播。该网络是一个典型的多层网络,由输入层、一个或多个隐含层、输出层组成,各层之间采用全互连方式,同层单元之间不存在连接。可以利用训练样本的学习建立起记忆,将未知模式判为最接近的记忆。且经过神经网络处理的数据,可近似认为数据间是相互独立的,能较好满足DS证据理论对证据独立性的要求。

BP算法的基本思想[15]是,学习过程由信号的正向传播与误差的反向传播组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理之后,传向输出层。若输出层的实际输出与期望输出(导师信号)不符,则转入误差的反向传播。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程是周而复始地进行的。权值不断调整的过程,也就是网络的学习训练过程,此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。

BP算法的步骤[15]如图1所示。

图1 标准BP算法流程

针对标准BP算法存在易陷入局部极小、学习效率低、收敛速度慢、隐节点选取缺乏指导等缺陷,目前已提出不少有效的改进算法,较常用的有增加动量项、自适应调节学习率、引入陡度因子等方法。本文采用增加动量项和自适应调节学习率相结合的BP改进算法。

1)增加动量项

若用W 代表某层权矩阵,X代表某层输入向量,则含动量项的权值调整向量表达式为

可见,增加动量项即从前一次权值调整量中取出一部分叠加到本次权值调整量中,α称为动量系数,一般α∈(0,1)。动量项反映了以前积累的调整经验,对于t时刻的调整起阻尼作用。

2)自适应调节学习率

设一初始学习率,若经过一批次权值调整后使总误差E总增加,则本次调整无效,且有

若经过一批次权值调整后使总误差E总减少,则本次调整有效,且有

2.2 基于DS证据理论的态势估计

1)DS证据理论

在命题A的一个辨识框架Θ中,有幂集2Θ上的基本概率赋值函数m:2Θ→ [0,1],且满足:

式(4)中,m(A)称为辨识框架上的基本概率赋值函数,它表示证据支持命题A发生的程度。其信任函数bel(A)和似然函数pl(A)分别如下式(5)~(6)所示:

信任函数bel(A)表示证据完全支持命题A的程度,似然函数pl(A)表示证据不反对(不怀疑)命题A的程度,区间 [bel(A),pl(A)]构成证据的不确定空间,表示命题的不确定程度。

设m1,m2,…,mn是同一辨识框架Θ上n个不同证据的基本可信度分配,由Dempster公式进行合成,合成后的mass函数m:2Θ→ [0,1]如下:

式中,m1(Ai1),m2(Ai2),…,mn(Ain)为焦元。k为证据之间的冲突概率,反映了证据之间冲突的程度;归一化因子(1-k)-1的作用就是避免在合成时将非0的概率赋给空集Φ。

2)BP网络与DS理论的融合方法

本文所采用的BP网络与DS理论的融合模型如图2所示。在传感器探测和0级处理、1级处理的基础上,将各时刻传感器所探测目标的状态估计、特征信息、航迹信息、属性估计、事件(辐射源事件、机动事件)等信息提取出来,进行模糊化处理后利用BP神经网络进行敌目标意图分类识别,将神经网络的输出作为DS证据理论推理所需的基本概率赋值,采用DS证据理论来完成决策级融合,实现对海战场战术态势的评估。该模型将BP网络自主学习、联想记忆、容错能力与DS证据理论的不确定推理能力结合起来,能较好地解决DS理论中基本概率赋值难以获取的问题。

3)融合判决准则

本文采用如下基于规则的判决准则:

图2 BP网络与DS理论的融合模型

(1)判定的目标作战意图应具有最大的基本概率分配函数值;

(2)判定的目标作战意图与其它作战意图的基本概率分配函数值之差要大于某个阈值;

(3)表示未知的m(Θ)必须小于某一门限;

(4)判定目标作战意图的基本概率函数值要大于不确定基本概率函数值m(Θ)。

3 算例仿真

3.1 目标信息预处理

由于各种传感器得到的速度、目标方位、发现距离等数据均为实数,为减少识别空间,便于神经网络的分类判决,需要对各属性进行模糊化,本文采用文献[16]的方法进行模糊化处理。

模糊化后各识别属性如下:

1)目标类型:分为 (C1,C2,C3)三种类型。其中,C1为巡洋舰等大型舰艇;C2为巡逻艇、快艇等;C3为驱护舰。

2)运动速度:分为快、较快、较慢、慢,分别表示为(V1,V2,V3,V4)。

3)目标方位:将识别参考点设为中心,以正北、正东为正方向的四个象限,分别表示为 (B1,B2,B3,B4)。

4)发现距离:分为远、较远、较近、近四个类别,表示为(D1,D2,D3,D4)。

5)目标火力范围:分为远、较远、较近、近四个类别,表示为 (F1,F2,F3,F4)。

6)航迹类型:分为直航、以直航为主、以机动为主、机动四种,表示为 (T1,T2,T3,T4)。

7)警戒雷达是否开机:R1为开机,R2为未开机。

8)导攻雷达是否开机:R1为开机,R2为未开机。

对海战场战术态势的类别分为进攻、防御、相持、逃跑四种,表示为 (A1,A2,A3,A4)。

3.2 应用实例

根据以往数据资料积累可得到一些敌目标属性及其意图信息,首先对属性信息进行预处理,建立起BP网络的训练样本集,如表1所示。

表1 属性模糊化后BP网络学习样本

续表1

选取上述训练样本集对神经网络进行训练,这里采用3层BP神经网络,训练算法采用增加动量项和自适应调节学习率的改进BP算法,训练误差设为0.01,经反复训练确定网络结构为8-11-4,BP神经网络训练误差下降曲线如图3所示。

图3 BP神经网络训练误差下降曲线

设我水面舰艇执行警戒任务时发现有敌舰艇接近,敌舰意图有进攻 (A1)、防御 (A2)、相持 (A3)、逃避 (A4)四种,则得到辨识框架Θ= (A1,A2,A3,A4)。在E1~E3时刻,分别将所探测目标的状态估计、特征信息、航迹信息、属性估计、辐射源事件等信息模糊化后输入已训练好的神经网络,得各时刻基本概率赋值函数m1、m2、m3。经过D-S证据理论方法进行信息融合后,结果如表2所示:

表2 证据空间的时空域融合

由表2可知,随着时刻E3传感器检测到证据m3,使得A1的可信度达到0.4594,且不确定的可信度降为0.0240,若设定阈值ε1=0.40,阈值ε2=0.25,显然有m(A1)=max{m(Ai)}>ε1,(i=1,2,3,4),且 m(A1)-max{m(Ai)}>ε2,(i=2,3,4),根据判决准则可判定敌舰艇处于态势A1,即目标可能发动进攻,这与实际情况是相符的。

4 结语

本文分析了海战场态势估计的特点,提出BP网络与DS证据理论相结合的方法,克服了DS证据理论中基本概率赋值难以获取的问题。将传感器0级、1级处理结果进行预处理后,输入BP网络进行目标意图的分类识别,将神经网络的输出作为证据,采用DS证据理论完成各时刻证据空间的时空域融合,仿真试验结果表明,该方法能有效克服专家主观因素的影响,可有效应用于海战场中舰艇编队战术态势估计。

[1]韩崇昭,朱洪艳,段战胜.多源信息融合[M].北京:清华大学出版社,2006:475476.

[2]赵宗贵,李君灵,王珂.战场态势估计概念、结构与效能[J].中国电子科学研究院学报,2010,5(3):226230.

[3]沃兹,李纳斯.多传感数据融合[M].马萨诸塞州波士顿出版社,1990.

[4]霍尔,李纳斯.多传感器数据融合概述[J].IEEE论文集,1997,85(1).

[5]霍尔,李纳斯.多传感器数据融合手册[M].纽约:CRC出版社,2001.

[6]斯坦伯格,波曼,怀特.回顾JDL数据融合模型[J].第三届NATO/IRIS会议论文集,1998.

[7]徐晓辉,刘作良.基于DS证据理论的态势评估方法[J].电光与控制,2005,12(5):3637,65.

[8]贾则,宋敬利,金辉,等.DS证据理论在战术态势估计技术中的应用[J].计算机测量控制,2009,17(8):15711573.

[9]李曼,冯新喜,张薇.基于模板的态势估计推理模型与算法[J].火力与指挥控制,2010,35(6):6466.

[10]谷文祥,李丽,李丹丹.规划识别的研究及其应用[J].智能系统学报,2007,2(1):911.

[11]杜菲菲,冯新喜.用于态势评估的贝叶斯网络研究综述[J].电光与控制,2010,17(9):4247.

[12]孙兆林.基于贝叶斯网络的态势估计方法研究[D].长沙:国防科学技术大学,2005,10:710.

[13]Ruoff等.C3I态势估计专家系统:模型、方法与工具[M].指挥与控制科学.AFCEA出版社,1998.

[14]韩峰,杨万海,袁晓光.一种有效处理冲突证据的组合方法[J].电光与控制,2010,17(4):58,13.

[15]韩力群.人工神经网络理论、设计及应用[M].第二版.北京:化学工业出版社,2007,7:4752.

[16]杨金宝,吴晓平.D-S证据理论在电路故障诊断中的应用研究[J].计算机与数字工程,2012,40(12).

[17]牛晓博,赵虎,陈新来.基于信息熵和概率神经网络的海战场目标识别[J].电光与控制,2010,17(4):8485.

猜你喜欢

态势战场概率
历史虚无主义的新近演化态势与特征
第6讲 “统计与概率”复习精讲
战场上的神来之笔
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
C-130:战场多面手
贴秋膘还有三秒到达战场
2019年12月与11月相比汽车产销延续了增长态势
汇市延续小幅震荡态势