基于BP神经网络的蓝方分层智能决策模型设计

2015-03-25刘相利吴梦思

舰船电子对抗 2015年4期

关键词：蓝方电子战红方

刘相利,吴梦思，柯凯

(1.解放军91336部队，秦皇岛 066326；2：解放军91889部队，湛江 524000)

基于BP神经网络的蓝方分层智能决策模型设计

刘相利1,吴梦思2，柯凯1

(1.解放军91336部队，秦皇岛 066326；2：解放军91889部队，湛江 524000)

为了实现电子战模拟训练中蓝方决策的自动化、及时性和真实性，设计了一套基于BP神经网络的蓝方智能决策系统，采用蓝方装备级、平台级和编队级3层互联互通的分层决策结构构建系统的智能控制入口，以编队级决策层为突破口设计了BP神经网络决策模型，确定了神经网络输入层数据预处理规则和隐层结构，在输出端使用决策知识库来实现决策指令的传达，完成神经网络输出层数据的指令化。系统可逼真地模拟蓝方电子战决策过程，并根据战场态势变化及时做出有效应对，具有一定的实用价值。

蓝方分层决策系统；BP神经网络；预处理规则；知识库

0 引言

电子战仿真模拟训练中蓝方系统的决策水平、作战能力对模拟训练的效果至关重要，目前主要依靠人工操作实现蓝方作战决策，自主程度较低，因此对蓝方自动化决策系统的研究具有重要的意义。但是，由于信息化作战条件下对蓝方决策影响因素十分复杂而且高速变化，需要依靠能够进行快速运算的计算机进行分析决策，同时产生了决策系统的真实性和信息处理机制不同的问题[1]，在顶层体系结构设定和指令下达实现等方面存在许多难题。本文基于BP神经网络设计了一套自动化蓝方决策系统，结合知识库和分层体系等方面的知识，实现较为逼真可靠且及时的自动化决策系统的设计。

1 蓝方电子战决策过程分析及设计

由于蓝方作战系统包含驱护舰艇、潜艇、飞机等多维立体空间内多体系、多结构的作战平台，导致蓝方作战系统的软件框架构设的复杂程度较高[2]。考虑到目前主要进行红蓝双方电子战系统对抗的决策过程，该决策过程与蓝方平台的功能结构密不可分，因此可将蓝方平台的功能结构划分为装备决策层、平台决策层和编队决策层。3个决策层由简到难、从局部到全面形成蓝方决策系统的体系结构。编队决策层是整个蓝方决策层的总体架构，建立在装备决策层和平台决策层上。

作为红方电子战装备的训练对象，蓝方电子战平台必须能模拟一定体系结构的电子战系统的作战过程[3]，而蓝方电子战平台决策软件的真实性将会对整个电子战模拟训练系统的真实性起决定性的影响。但由于技术、设备、时间等因素的限制，不可能在一套计算机系统上实现蓝方编队完整的电子战作战决策及实施过程，必须在保持训练真实性的基础上对蓝方电子战系统进行精炼的压缩，这样蓝方电子战系统的功能可确定为数据综合处理与分发、解算红方平台作战要素、威胁判断、编队战术决策、兵力分配、电子侦察与干扰实施时机及方式选择、舰舰协同侦察干扰、舰机协同侦察干扰、机机协同侦察干扰、机动等。

装备决策内容主要分为单装备战术决策、雷达开机关机、雷达侦察机开机关机、侦察机侦察搜索、干扰时机选择等。其中单装备战术决策是核心内容，决定了蓝方单装备平台的战术状态，包括装备开关机时间、侦察方向、干扰实施等内容。

平台决策内容主要包括单平台战术决策、机动、电子战装备开关机时机选择、执行装备选择、干扰对象选择等。其中单平台战术决策是平台决策的核心元素，根据侦察数据确定本舰(机)平台的战术状态，并按上级指令选择最适宜执行指令的装备对指定方向开机侦察、对指定目标实施指定样式的干扰等。

编队决策内容包括编队战术决策、数据分析处理、威胁判断、兵力分配、队形变换以及平台协同等，编队结构由多平台协同工作，根据多平台、多装备的侦察内容确定红方电子战力量分布、特点及分工，解算红方平台运动要素后进行编队战术决策，并对蓝方电子战平台进行作战兵力分配。

蓝方对雷达及电子侦察装备侦收的数据进行分析及处理，确定红方电子战兵力分配及作战特点，进行编队战术决策，决策结果下发到各舰(机)平台，控制舰(机)运动，并由舰(机)平台解析指令下发到电子战平台，由各电子战平台对指定目标实施电子干扰。其调用关系如图1所示。

图1 蓝方决策调用关系

2 基于BP神经网络的决策系统设计

由于电子战装备性能的迅速提升，电子战的特征呈现出更为鲜明的信息化特点，即高强度、多方位、立体化。在极短的单位时间内需要处理大量多变的流动信息，要求指挥员能够及时掌握敌方电子战情况，做出及时正确的应对。如果没有有效的自动决策系统来支撑蓝方平台的运行而单纯依靠指挥员指挥控制，将会对模拟电子战蓝军决策的有效性、及时性、真实性造成较大的影响，因此需要以计算机为核心的决策系统指挥并控制电子战蓝军系统的决策和运行。而在装备、平台、编队3级结构的决策模型中，平台和装备决策层是在解析编队决策内容的基础上进行决策，因此编队决策模型是指挥控制整个蓝方电子战系统的核心。决策的快速有效将会影响到整个蓝方电子战系统的可靠运行，因此引入BP神经网络对编队决策模型进行规划设计，实现快速逼真的编队决策[4]。

2.1 决策模型总体设计

电子战蓝方决策模型体系需要解决2个主要问题：一是决策目的，即执行电子战决策的目的，需要各平台或装备达到什么目的；二是决策内容，即执行决策的内容，需要各平台或装备执行什么任务。根据红方平台电子战作战步骤的推进，采取快速及时的应对措施是蓝方平台必须达到的条件，一旦战场态势发生变化，编队决策平台需要立即根据需求调整编队的电子战作战方案。

系统设计的编队决策模型如图2所示，其中的战场态势综合模块将可能影响电子战战场的自然因素和第三方因素进行综合分析考虑，包括战场自然环境、水文、气象、杂波、中立方船只飞机等，在执行模拟训练前由态势想定方案给出。蓝方侦察数据主要根据蓝方电子战装备侦察的红方电子战数据并结合蓝方已掌握的红方电子情报，由编队决策模型结合知识库进行统一分析决策，最后给出蓝方综合态势想定，并由平台决策模型和装备决策模型分解执行。

图2 蓝方决策模型设计

根据红方作战进程自动进行电子战决策，需要蓝方决策模型能够自动解析战情并采取应对措施，在此引入BP神经网络进行蓝方决策模型的训练和执行。

2.2 神经网络决策模型设计

图3 三层BP网络模型

在编队决策模型的BP神经网络结构中，将战场态势数据转化为归一化的输入层数据是实现蓝方决策自动化的关键，在BP神经网络模型中设计2个输入值，分别是战场环境因素集H1和红方情报数据H2，其中，

H1=[h1,h2,…,hm]

(1)

(2)

式中:战场环境因素集H1中各因子分别代表海浪高度、风向、风力等影响战场态势的因素，分别按照预先设定的标准对其进行归一化处理;红方情报数据H2主要表述战场环境中蓝方侦察机所能侦察到的红方雷达装备的信息，其中J1、W1、G1、V1、D1分别表示平台1的经度、纬度、高度、速度、航向等运动要素，TB1、TE1、f分别表示平台1上搭载的雷达平台的开机时间、关机时间、频率，开机时间和关机时间计态势开始后的相对时间，并按照预先设定进行归一化处理，类似地输入红方电子战要素。

隐层的功能是接收来自输入层的数据并按一定规律自行组织学习，由于决策模型输入因素较多，采取S型函数，完成输入层到输出层的非线性映射。在决策模型的隐层结构中，如何确定隐层结点数非常关键，如果隐层节点数少于理想值，将会导致网络容错性差、样本学习能力低下的后果；若隐层节点数过多，将会导致学习速度变慢、需要大量的归一化样本数据；若隐层节点数与理想值接近，虽能够进行正常训练，但抗外界干扰性能较差，对陌生的输入数据将无法正确映射。综合考虑各方面的因素，由于具有较多的仿真模拟训练数据样本，足够提供较多的样本数据并有足够的时间进行训练数据的学习，因此设定较多的隐层节点数，使系统网络得到足够多的训练，得出的神经网络结构就能够快速适应战场态势的变化。

输出层的数据，其结构类似于H2，规定了蓝方各平台的运动轨迹、战场位置和平台协同等内容，但由于平台战术的多样性及决策内容的复杂性，需要协同决策知识库进行输出数据的指令化。

2.3 决策知识库的设计

蓝方平台决策模型输出的结果主要为蓝方舰(机)平台和电子战装备需要执行的战术动作，根据红方电子战措施采取对应的措施，结合蓝方装备特点分配各舰(机)平台所需执行的任务，本系统建立的知识库[6]主要由6个子库构成：策略库、路径库、协同战术库、战术实现库、战术优化库和样本库，其中战术优化库和样本库的知识只有在离线训练时才能使用，结构如图4所示。

图4 决策知识库结构

其中策略库描述战术概要特征，路径库描述蓝方现有舰(机)战术路径，协同战术库表达平台与平台间协同战术特征，战术实现库精确描述各项战术实施措施，样本库包含训练样本和失败样本库。由于电子战作战实时性要求极高，通过获取知识库的知识完成比赛可能无法得到满意的结果，可在训练结束后利用战术优化库进行相应的优化，并增加到样本库中进一步训练离线训练网络，使决策网络不断地完善。

知识库首先需要考虑知识的表述，将会直接影响到知识的获取和使用，目前常用的方法有产生式规则表述、框架表述、语义网络表述和一阶谓词逻辑表述等，本系统根据电子战决策指令内容构成和特点使用混合知识表达方法，决策知识库整体以面向对象的方法构建，同步融入神经网络与产生式规则。

2.4 决策模型的测试与实现

对已有模拟仿真训练的数据按预设进行归一化处理后得到BP神经网络的输入值，并设定输出期望值，进行神经网络的学习，其流程如图5所示。

图5 神经网络学习流程

选取多个态势的多个样本数据进行训练，由阈值函数判定输出层神经元的输出值，并根据期望值自行调整训练次数，直到达到方案要求为止。由此得出的神经网络各层权值构成了神经网络的结构体系，对战场态势的实时数据进行预处理后用神经网络进行解算得出决策结果。

3 测试实现

蓝方分层智能决策系统在WindowsXP系统上使用VC++6.0编程，软件主界面如图6所示。

图6 系统软件主界面

主界面左侧是应用菜单，都有一定数目的子菜单。训练层级子菜单分为单装备级、单平台级和小型编组级3层级供选，第2层子菜单有更详细的设置，自然因素主要用于录入战场自然环境(如海浪、风力、温湿度等)数据。红方录入用于实时读取红方动态和相关数据，BP训练是使用BP神经网络训练已存数据进行，知识库则分为策略库、路径库、协同战术库、战术实现库、战术优化库、样本库等6个子库，为整个系统提供数据支持，录取回放用于录取战术进程并按指令回放，用于提供详细的使用说明。

主界面上方是控制键区，用于控制蓝方分层智能决策系统的装载、授时、开始、暂停、结束操作，并有运行时间实时显示。中间是作战海图区域，有多个区域海图供选，选择海图在自然因素中操作。

对该软件进行性能测试，对已有的5个样本10 000批已存训练数据进行BP神经网络训练，共耗时23.12s，未超出预定的100s训练时间，符合要求。在双舰编队反导作战战术测试中，红方战术使用不同的平台和装备共进行10次测试，各次测试中蓝方智能决策系统的平均反应时间如表1所示。

表1 系统反应时间

由表1可知，在10次试验中,反应时间因红方平台的不同有一定的变化，但都未超过预设的5 s;系统实时性符合要求，也存在改进空间。

4 结束语

对蓝方决策平台进行装备、平台、编队三级分层决策解析，以编队决策模型为突破口，使用BP神经网络作为自动化决策网络的核心结构，对已有训练实例数据进行预处理，得到包含影响电子战蓝方决策的因素集作为BP神经网络的输入层因子，并以面向对象的方法构建决策知识库整体，同步融入神经网络与产生式规则，使神经网络输出因子形成有效决策指令，指挥平台和装备执行指令，保证仿真模拟训练蓝方平台的及时性、真实性和可靠性。

[1] 耿涛,张安.考虑协同电子干扰效果的空战多目标分配[J].火力与指挥控制,2012,37(3):121-127.

[2] 孙珠峰,黄文斌.潜艇综合训练仿真系统蓝方台分层决策模型及其实现[J].军事系统工程,2000,3(10):41- 43.

[3] 李林森,佟明安.协同多目标攻击空战决策及其神经网络实现[J].航空学报,1999,20(4):309-312.

[4] Luo D L,Shen C L,et al.Air combat decision-making for cooperative multiple target attack:an approach of hybrid adaptive genetic algorithm[J].Journal of The Graduate School of The Chinese Academy of Sciences,2006,23(3):382-389.

[5] 林华.基于神经网络的足球机器人决策知识库的设计[J].微电子学与计算机,2011,11(1):130-134.

[6] 陈晓,夏威,包文.基于集成神经网络的智能决策入侵检测系统[J].计算机系统应用,2010,19(5):113- 115.

Design of Blue Team Hierarchical Intelligent Decision Model Based on BP Neural Network

LIU Xiang-li1,WU Meng-si2，KE Kai1

(1.Unit 91336 of PLA,Qinhuangdao 066326,China;2.Unit 91889 of PLA,Zhanjiang 524000,China)

To realize the automation,timeliness and authenticity of blue team decision in the electronic warfare (EW) simulation training,this paper designs a suit of blue team intelligent decision system based on BP neural network,uses three levels of interoperability hierarchical decision architecture:equipment level,platform level and formation level of blue team to construct the intelligent control inlet of decision system,designs BP neural network decision model taking the formation decision layer as breach,confirms the preprocessing rules of input layer data of neural network and structure of hidden layers,uses decision knowledge database to realize the transmission of decision command at output terminal and completes the instructional processing of neural network output layer data.The system can realistically simulate the EW decision process of blue team,and effectively adjust the policy according to the battlefield situation variety in time,which has definite application value.

blue team hierarchical decision system;BP neural network;preprocessing rule;knowledge database

2015-05-15

TP243

CN32-1413(2015)04-0081-04

10.16426/j.cnki.jcdzdk.2015.04.021