基于深度学习的初级战场态势理解研究
2018-01-18廖鹰易卓胡晓峰
廖鹰 易卓 胡晓峰
随着新技术变革的推进,现代战争已发展为以信息技术为支撑的体系对抗.战场是敌对双方作战活动的空间,是进行战争的基本条件.在信息化战争中,战场空间空前拓展、战场信息海量化、战场环境复杂化、作战对象多元化、作战强度急剧增大给指挥员的精准指挥带来巨大挑战.传统基于人经验或认知的指挥模式已无法有效应对瞬息万变的战场和海量数据,准确快速地把握战略、战役层面的战场态势成为了难题.同时,现有面向作战指挥的计算机辅助决策尚不能以人的认知模式来理解态势(例如用数据对比[1−2]、数据场[3]、信息熵[4]等方法,并不能很好地解决态势理解问题),难以适应新形势的需要,人工智能的研究水平已成为制约战场态势辅助理解的瓶颈.因此,面对复杂万变的战场环境和海量数据,研究基于机器学习的战场态势理解问题对战场辅助决策具有重要意义.
战场态势是个复杂概念.态,强调的是当前的状态,是对作战单元实体属性、状态信息和战场环境的描述;势,主要指作战的发展趋势,即作战单元实体的能力变化、动态关系和行为趋势.面对海量、复杂的战场数据,要想辅助指挥员准确提取有用信息,发掘复杂态势背后的隐藏知识,最为重要的是深入理解战场态势,以减轻指挥员作战决策的难度.对战场态势理解的研究应建立在对战争的深刻认识基础上,必须从认识战场的复杂性入手,从体系对抗的角度,把信息化战场作为一个复杂系统来研究.战争是一门艺术,也是一个复杂系统,“战争的偶然性”、“战争结果的不可重复性”、“战争中的迷雾”、“战争的自同步”等现象,都在说明战争复杂性[5],而作为与战争密不可分的战场自然也就具备了复杂系统特征.因此,要研究战场态势,就必须从认识战场的复杂性入手,从体系对抗的角度,把信息化战场作为一个复杂系统来研究,不能简单地只采用牛顿科学体系、还原论、决定论的思想作为战场态势理解的基础,而要从更新的观念出发来扩展战争认识论.
复杂网络、大数据和深度学习研究的逐步兴起,为从体系对抗的角度来研究战争、理解战场态势提供了契机.战场就是一个涉及各类不同作战单元和战场环境的复杂系统,大量的作战单元和指挥系统之间的联系、人员、装备与战场环境之间的联系等构成了一个高度复杂的复杂网络;而战场在推演的过程中,每时每刻均有大量的数据产生,进而构成了战场大数据;而作为战场主体的人,只有通过对战场大数据、复杂网络的深入理解,才能实现对战场态势的理解,进而实现战场的运筹帷幄.随着战场数据的剧增,人的智能无疑越来越难以适应战场态势理解和决策的需要,采用人工智能方法对研究战争进程、理解战场态势和辅助战场决策具有重要意义.
纵观人工智能的发展历程,人工智能已经历了从2007年深蓝击败国际象棋大师卡斯帕罗夫,到2011年超级电脑“沃森”在美智力竞猜节目中击败人类,到以2012年深度学习为基础的Google猫脸识别[6],再到AlphaGo战胜李世石这几个里程碑事件,其理论和技术日益成熟,应用领域也不断扩大.根据米勒法则:人只能考虑7~9个因素,如果计算机能考虑10个因素以上,其分析能力就超过人[7].随着计算机技术的进一步发展,计算机以其强大的运算能力、存储能力使其在未来的许多应用领域有可能胜过人类.当前人工智能研究的热点聚焦于深度学习:深度学习的动机在于建立、模拟人脑进行分析学习的深度神经网络,它模仿人脑的机制来解释数据,其基本原理是通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示.深度学习已经成功应用于机器视觉、语音识别和自然语言处理[8],其研究和应用已经为进行战场态势理解提供了一定条件.
基于深度学习的战场态势理解的研究,对真正实现有效的作战辅助决策具有重大意义.战场作为高度复杂的系统,参战双方是不合作、相互对抗的,个体或单元获得的信息是不完全的和不确定的.同时,在战场态势信息的认知过程中,抽象层次越高,对态势认知就越具有主观性,直接导致可量化程度越低.为了克服主观性和不完全信息带来的弊端,采用更为客观的深度学习,可以挖掘出大数据背后包含的隐含特征,全面的抽象到态势理解.通过模仿人对事物的认知方式,深度学习可以在无监督的情况下,不断对事物进行抽象学习,一方面通过逐层抽象、提取特征达到知识学习的目的,而最大程度上保持数据的等效性,进而可以提取出战场态势中的关键部分,形成表达战场态势的最小集合,进而对战场数据进行有效过滤,提高态势理解的效率;另一方面,通过计算机对战场态势的累积学习,可以逐步形成战场态势的理解,进而对实时的战场信息形成人工智能认知,为指挥员提供辅助决策,提高指挥员的作战指挥决策速度和准确性.因此,基于深度学习的战场态势理解的研究,对真正实现有效的作战辅助决策具有重大意义.
1 态势理解方案及设计流程
以体系对抗、战争复杂系统思想为指导,系统地研究联合作战条件下战场态势理解问题,深入剖析指挥员对战场态势理解的过程,探索深度学习网络的特征提取和抽象机理,探讨初步的无监督态势分析构想,通过建立复合架构的多层神经网络,基于多次联合作战条件下的兵棋演习数据进行深度学习训练,实现战场态势的无监督逐步理解,构建态势理解系统平台,对现有兵棋系统进行功能扩展.
1.1 态势理解目标的分层设计
模拟指挥员对战场态势理解的过程来设计分层无监督学习的态势理解目标,使得分层目标需要符合人脑认知的过程,也便于构建相应的深度学习网络对其进行实现.
将态势的理解目标分为3个层面,如图1所示,第1个层面是理解作战实体属性、作战实体状态和作战环境;第2个层面是理解作战实体的动态关系;第3个层面是理解作战实体的能力变化和行为趋势.这样易于实现态势理解这一复杂、困难的任务,也便于构建复合架构的深度学习网络.
1.2 态势理解的深度学习机理研究
人的大脑有无数神经元进行数据交换和处理.在目前计算机达不到同等处理能力的条件下,准备分阶段进行,构建多层神经网络对战场态势浅层(易理解)信息先进行学习,随着研究的深入,逐步去挖掘其隐含的深层信息.通过大量的学习实验来缩小识别的误差,研究在每一层隐含层输出的可理解特征,结合指挥员的经验来重新规划设计深层学习网络,以提升每一层神经网络学习抽象的效果.
人的经验来源于工作生活中无时无刻的学习,新的信息和经验不断地存储在大脑中,而利用大量数据样本不断地深度学习的多层神经网络,进行训练就是模拟态势理解过程.为了使得对大规模的多层神经网络训练结果得以保存,实现学习经验的不断累积,利用复杂网络理论,构建相应的权重系数矩阵,将每一轮成功训练得到神经网络显层和隐含层之间的权重系数保存.整个态势理解的机器学习模拟过程如图2所示.
在构建面向态势理解的深度学习模型过程中,需要考虑到深度学习模型效率的问题.一方面在深入分析深度学习机理的基础上研究加快神经元处理速度的方案,另一方面结合不同的认知模式,研究相应认知模式的数学模型,并将其融入深度学习模型,从而得到面向态势理解的深度学习模型.
我们采用了条件反射来进行强化学习,其过程可以由如下等式表示:
其中w ij表示神经元j到神经元i的连接权,y i与y j为两个神经元的输出,α是表示学习速度的常数.若y i与y j同时被激活,即y i与y j同时为正,那么w ij将增大.若yi被激活,而y j处于抑制状态,即y i为正y j为负,那么w ij将变小.通过将该学习方式融入到深度神经网络,即可使得机器具备强化学习的能力.
1.3 复合架构深度学习模型的构建
战场态势理解的复杂性和效率要求,决定了单一的学习模型难以满足需求,本文构建了复合架构的深度学习模型.以分层态势理解目标为指导,通过对战场中基本作战单元实体的学习,可以建立不同作战单元的基本实体模板;进一步,对不同作战单元的基本实体模板,通过学习其特定时间段中时序状态信息,则可以构建作战单元的动态关系模板;再者,对某一作战单元特定时间段的时序动作进行学习,即可识别出作战单元的行为意图,从而构建出行为模板.通过上述学习,则构建了战场态势的主要基本模版.
以战场态势中不同类别的基本单元模板的深度学习模型为基础,构建复合架构的多层神经网络模型.以战场基本单元的深度学习模型为主题,以作战单元之间联系的深度学习模型为基本联系,结合战场环境的深度学习模型,进行模型的融合,生成面向态势理解的基于复杂网络的深度学习模型,以实时感知战场态势.
1.4 分层次的态势理解的检验与优化
从历次兵棋演习数据中选取具有一系列由时序数据组成的典型意义态势,利用这一系列典型态势信息构建成测试态势集,对复合架构的多层神经网络进行测试,以评判学习的效果,与数据对比对学习过程改进优化,实现对态势理解系统平台的检验与优化,其具体步骤如下:
对多层神经网络中高层隐含层特征进行逐层分析,提取出无监督学习抽象得出的特征,并进行特征还原,将这些特征还原成人能够理解的方式,与对应的战场态势数据进行关联分析.需要说明的是,态势数据架构复杂且数量巨大(一个对抗时段的数据就高达数十G),以目前的软硬件计算能力,无法完成深度学习的处理.因此,为更好地完成态势理解原型系统平台的测试,选取一个具有代表性的态势理解过程来进行态势理解的检验与优化:首先进行双方作战单元部署的理解,进而完成各作战单元之间关系的理解,最后实现双方之间态势优劣的理解.分层次态势理解的检验与优化流程见图4,对演习数据进行抽取后进行深度学习,提取多层神经网络隐含层的特征,还原特征与实际态势进行关联分析,得出逐层的特征理解,将态势理解的结果与演习实际数据进行数据比对,将比对结果通过仿真、实验进行反馈调整,通过反复的数据实验,对分层特征分析的结果进行优化,提升态势理解原型系统平台学习理解的效果.
2 仿真与实验
仿真平台使用的是Python,因兵棋演习数据包含大量结构、非结构化数据,为便于开展实验,抽取了部分演习数据,进行了数据转换和实验重构,如图5所示,仿真用实验数据格式如下:
•000000005000001//前10位为作战单元标识号,后5位标识红方、蓝方;
•080034079000022//前面3个3位分别是人员数、武器数、弹药数,后6位为战斗力值;
•006550037000084//3个5位分别是地理位置的经度、纬度、高度;
•000000000400000//前10位为地形类型,后5位为其他属性秒速.
作战单元聚类:
采用K-均值聚类算法对生成的1000个作战单元实体进行聚类分析,以从地理上识别可能处于对战关系的实体集合.
作战聚类态势分类:
经过上述处理,对样本空间的数据进行聚类后得到小聚类,采用改进RBM算法对其进行无监督训练,然后按照步骤1~3生成测试数据,进行5次实验(态势复杂度依次上升),每次进行10组态势测试.同时,由人工(专家)根据测试数据给出战场态势优劣的评价标准,对比改进RBM识别结果和专家评判结果,如图6所示.
通过对隐含层的数据进行识别发现,改进RBM能够一定程度上识别出数据中带有的比较关系,如图7中第2列为战斗力指数,成为算法自动组织关系网络的依据:
3 结论
面对全维战场和海量数据,研究基于深度学习的战场态势理解问题对作战辅助决策具有重要意义.本文围绕着作战态势问题,从体系对抗性和战争复杂性角度出发,系统研究联合作战条件下战场态势理解,通过模仿指挥员理解态势的模式,初步建立复合架构的深度学习网络,基于兵棋演习数据,实现了初步的战场态势优劣判别,有助于态势理解问题的进一步研究.目前我们所进行和即将进行的研究如下:
1)以体系对抗的思想为指导,从复杂网络、大数据和深度学习的角度研究联合作战,提出战场态势理解的智能辅助方案;
2)对人认知和深度学习原理进行深入研究,探索深度学习网络的特征提取和知识抽象机理,构建具有复合架构的多层神经网络,实现对战场态势大数据的无监督学习;
3)设计无监督学习获取的特征还原机制,将特征与对应战场态势进行关联分析,形成逐层的战场态势特征理解,将态势理解与演习数据进行科学比对,通过仿真、实验进行反馈调整,实现态势理解的过程和结果优化.
1 淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].通信学报,2006,34(2):258−262.
2 杨静.基于数据场的密度聚类算法研究[D].太原:山西大学,2013.
3 严家德,金莲姬,王巍巍,等.第二代自动气象站不同气温观测系统数据对比分析[J].气象科学,2014,34(1):60−65.
4 李赟,刘钢,老松杨.战场态势及态势估计的新见解[J].火力与指挥控制,2012,37(9):1669−1677.
5 胡晓峰,杨静.基于数据场的密度聚类算法研究[M].北京:国防大学出版社,2012.
6 LE Q V,RANZATO M A,MONGA R,et al.Building high-level features using large scale unsupervised learning[C]//The 29’th International Conference on Machine Learning,Edinburgh,Scotland,UK,2012.
7 陆明涛.魔法数字7:米勒法则的行为经济学分析[J].重庆工商大学学报(社会科学版),2011,28(1):23−27.
8 LÄNGKVIST M,KARLSSON L,LOUTFI A.A review of unsupervised feature learning and deep learning for time-series modeling[J].Pattern Recognition Letters,2014,42(1):11−24.