基于深度学习的兵棋演习数据特征提取方法研究

2016-10-31郑书奎吴琳贺筱媛

指挥与控制学报 2016年3期

郑书奎吴琳贺筱媛

现代战争的时空特性发生重大变化,多维战场空间融为一体,战略、战役、战术行动界限趋于模糊,时间要素不断升值,战争进入发现即摧毁的“秒杀”时代.模拟现代战争的大型计算机兵棋演习呈现出复杂性、时变性、快速性等特点,这给指挥员带来极大的认知困难,严重时会产生战争炫目[1],单纯依靠人来分析理解战场态势已难以跟上战争节奏.战场态势是指挥员指挥作战、定下决心的主要依据,分析清楚、理解透彻战场态势是实施各类作战行动的主要前提。因此,亟需探索一种新的方法快速准确地实现兵棋演习战场态势的分析理解.机器学习有望成为解决这一问题的新方向,运用机器学习方法对兵棋演习数据进行智能化分析处理,迅速、自主、高效地理清战场形势,可提升对兵棋演习战场态势的感知、分析和理解能力.为此,美军先后启动了DEFT、PPAML等多项研究计划,投入大量的人力和物力研究机器学习分析方法.而数据特征是机器学习分析处理的原材料,机器学习算法的效能直接受输入数据特征的质量影响,有效提取兵棋演习数据的特征成为运用机器学习方法分析战场态势面临的首要问题.因兵棋演习数据具有体量巨大、种类繁多、格式各异、结构复杂、维度极高、时刻变化等特点,传统特征提取方法难以发挥理想效果.近年来飞速发展的深度学习方法提供了新的思路,该方法在无监督的情况下,通过多层神经网络的层层学习,在保持信息不丢失的情况下,可以自主抽取隐含在战场态势信息中的显著特征,并在新的特征空间实现对大数据的紧致表达,从而可以达到数据特征提取的目的,在面对战争偶然性、不确定性、时变性等复杂问题方面具有巨大的优势和潜力.

1 深度学习概述

深度学习研究起源于人工神经网络,是人工智能研究的一个新方向,属于机器学习中的特征学习领域.它通过组合多层简单非线性模块实现输入与输出的复杂非线性关系表达、原始输入到高层特征的逐层抽取，以及高维稀疏空间到低维特征空间的特征映射.

1.1 人工神经网络

人工神经网络是由简单处理单元组合而成的大规模并行分布式处理器,基本处理单位是神经元,包括突触权值、偏置、加法器和激活函数4个基本元素,神经元结构参见图1.

图1 神经元模型

当信号输入到神经元的第k个突触上时,输入数据xk被乘以突出权值ωk,然后被输入到加法器中,对输入数据的加权值进行求和,再加上外部偏置b得到数据Pxkωk+b.为了限制输出振幅和实现非线性功能,最后要将数据代入激活函数f(x),得到输出值:

将单一神经元组合成网络就形成了人工神经网络,典型的网络结构见图2.

图2 一种典型的神经网络结构

设第l层的第k个神经元的输出为则

其中,J为训练目标,L为损失函数.常用的损失函数均方误差(Mean squared error,MSE)和交叉熵(Cross-Entropy,CE).

从而,神经网络的训练转化为一个求极值的问题.通过计算可得出参数更新矩阵,从而得出网络参数ω和b.

1.2 深度学习模型

深度学习结构是深度神经网络,它由多层非线性网络堆栈而成的深度神经网络,包括一个输入层、一个输出层和至少一个隐含层,高层输入来自于低层输出,构建成输入到输出的函数形式,节点间的权重参数相当于表征函数关系的系数,图3所示为典型的深度神经网络.

图3 典型的深度学习模型

由于梯度不稳定、难以摆脱标签数据以及容易陷入局部极值的原因,导致深度神经网络难以训练[2].直到Hinton、Bengio等人的不断探索研究,提出了先进行逐层贪婪无监督预训练,再进行有监督调优训练的方法,才大幅提高了深度学习模型的训练效果,使深度学习的应用取得成功[3−7].

1.3 深度学习在数据特征提取上优势

深度学习通过多层提取和多次迭代后,能够得到更好特佂值,对于复杂结构、极高维度、强相关性的数据具有更强的表达能力,具有自主性、非线性、客观性特性,对噪声和冗余信息有很好的鲁棒性,无监督学习方式摆脱了数据标签化要求,自学习、自适应、泛化能力更强,具有良好的可扩展性和规范性.

2 面向兵棋演习数据特征提取的深度学习模型设计

深度学习是理论上的“黑箱”,难以通过数学方法计算参数、描述原理,也没有完全固定的程序和方法构建深度神经网络、设计训练算法,尤其是兵棋演习数据和提取要求具有特殊性,模型设计需要在具体实验中不断探索和完善.

2.1 模型的建立

深度神经网络有多种结构,每种结构都有不同的特点和功能,适用于不同的需求和应用.自编码器能够对输入数据进行编码和解码,实现数据的压缩和重构,通过最小化重构误差来最优化压缩性能,且不依赖于数据标签,在兵棋演习数据这类海量数据特征提取方面具有显著优势.在自编码器的基础上增加约束条件,可以实现扩展功能.

2.1.1 自编码器

自编码器是一个具有三层神经网络的无监督算法,能够实现编码和解码功能,网络结构如图4所示.

图4 自编码器网络结构

自编码器的运行过程是输入数据先从输入层到隐含层进行编码,再从隐含层到输出层进行解码,如图5所示.

图5 自编码器运行过程

重构数据可用特征数据线性表示:

其中,表示重构数据.

2.1.2 降噪自编码器

2008年,Vincent提出了降噪自编码器[8],通过加入按照一定概率分布的噪声,对自编码器的输入数据造成一定程度的破坏,使输入数据x按设定的破坏率映射变换为x0,用x0对自编码器进行不断训练,使其能够重构还原出原始数据x,其网络结构如图6所示:

当降噪自编码将含噪数据x0重构还原出原始数据x时,就消除了部分或全部输入噪声,从而实现了降噪功能,改善了数据污染,减小了训练数据与测试数据的差别.在降噪过程中,自编码器要学习到输入数据更为鲁棒的表达,从而使学习到的特征鲁棒性更强,提高了自编码器的泛化能力.

图6 降噪自编码器结构

2.1.3 稀疏自编码器

在神经网络中加入稀疏性限制,构建的稀疏自编码器同时拥有稀疏性限制产生的良好表达能力和神经网络具有的自主性、非线性、客观性、良好鲁棒性等特性,理论上具有更好的特征转换能力,更适合于复杂数据的特征提取或特征提取,图7所示为稀疏自编码的一般结构.

图7 稀疏自编码器结构图

2.1.4 栈式自编码网络

为了使自编码器拥有多层神经网络的优良性能,要对若干个自编码器进行栈化堆叠,形成栈式自编码网络,前一个自编码器的输出作为后一个自编码器的输入.栈式自编码网络结构见图8所示、运行过程如图9所示.

图8 栈式自编码深度神经网络结构

图9 栈式自编码网络运行过程

2.1.5 网络结构设计

本文选择栈式稀疏降噪自编码网络作为兵棋演习数据特征提取的深度学习模型.一般而言,更多的网络层数能够得到更抽象的特征和更本质的描述,如果网络层数过多,会加大网络训练和计算的难度,导致网络的过拟合.导致网络的过拟合.Vincent P、Larochelle H、Bengio Y、Lajoie I等多人的研究报告[8−9]指出,一般将隐含层设为三层可取得良好效果.网络每层的节点数与数据的维度直接相关,输入层节点数应与输入数据维度相同,输出层节点数代表了输出数据的维度,隐含层每层的节点数要根据特征提取效果调整设定.第一层隐含层节点数大于输入层节点数可获得更好的特征提取效果,原因是当隐含层神经元个数大于输入层神经元个数时,可实现特征检测功能,能够提取过完备特征.第二、三层隐含层节点数可按逐层递减设置.输出层节点数要通过计算原始数据集的本征维度确定,激活函数选择常用的sigmoid函数,具体层数和每层神经元数将在实验中根据结果多次调试后最终确定.此时,可基本确定网络结果,如图10所示.

2.2 模型的训练

在前人研究的基础上,本文针对兵棋演习数据特征提取这一应用背景对训练方法进行了调整优化,提高了模型的训练效率和性能.

2.2.1 预训练

预训练采取逐层贪婪无监督方法,它每次只训练一层网络而其他层参数保持不变;它不追求整体最优结果,而选择次优结果;它使用无标签数据进行无监督训练;它只是预先训练,得出权重的初始值.

具体步骤:

1)输入无标签原始数据.

2)运用逐层贪婪无监督学习算法对网络权值进行初始化,流程参见图11.

其中l+1层编码数据为:

解码数据为:

优化目标函数为:

固定其他层参数不变,运用随机梯度下降算法对l+1层参数ωl+1、bl+1进行调优.

权重系数为:

通过预训练,最后得出权重系数矩阵[W2,W3,···,WL−1]完成对网络的预训练,再对WL进行随机初始化,实现整个网络参数的初始化.

2.2.2 调优训练

调优训练是利用少量标签数据进行有监督训练,同时对整个网络的训练误差进行优化,目的是对整个网络的权重进行微调,使网络具有更精确的特征提取能力.

图11 逐层贪婪无监督预训练流程

具体步骤:

1)输入标签化数据对(x(i),y(i)).

2)运用随机梯度下降算法对网络权值进行优化,流程参见图12.

图12 随机梯度下降运算流程

其中迭代公式为:

其中每层输出为:

输出层误差为:

误差反向传播时每层误差为:

图13 反向传播运算流程

2.3 模型的检验

结果检验类似于选取准则函数,在选定准则函数后,寻找最优特征提取结果就变成了求泛函数极值问题,选取准则函数是特征提取算法的关键.分类计算是最佳的准则函数,计算原始高维数据经过特征提取后得到的低维数据的分类正确率,分类正确率的高低代表了特征提取方法的性能,本文选用Softmax分类器.网络预训练结束后,将Softmax分类器与深度神经网络进行级联,构成全局网络结构,使数据特征作为分类器的输入,使用标签数据采用有监督方式同时训练深度神经网络和分类器,使分类结果更为精确。训练完成后,输入测试数据,得到基于测试数据特征的分类正确率,正确率越高代表特征质量越高,方法效果越好.

图14 数据集处理和使用过程

表2 两个输入数据集描述

3 实验与结果分析

实验平台计算机CPU为Inten Xeon E5-2687 W,内存为64GB,硬盘2TB.算法采用python语言及开源程序包编写程序的具体代码.实验室搭建分布式机器学习平台,使用Mllib作为工程化的基础库,跑在Spark上,基于Spark有很多神经网络和深度学习的库,还支持Python client.

表3 模型参数

3.1 实验数据集

实验数据集来源于国防大学战役兵棋演习系统,是人在回路的作战模拟数据,是和平时期最贴近于现代战争的计算机推演数据.首先对分类存储于不同数据库中的数据进行集成,然后选取静态和动态两类兵棋演习数据,分别标称数据集一和数据集2,并针对性构建两个实验模型,应用于数据集1的模型称为模型1,应用于数据集2的模型称为模型2.输入数据集具体情况见表2所示,数据集的处理和使用过程见图14.

3.2 基于深度学习的实验

按照前文设计的方法,对预处理后的兵棋演习数据集行进行特征提取,通过特征计算分类精度,检验特征提取方法的性能.

3.2.1 参数设定

深度神经网络的参数设定有些靠计算得出,有些靠实验调试,有些靠经验和操作上的艺术.本文针对课题的特殊性,采取理论分析、数学计算、实验对比调试等方法设定参数,科学地选取出最优参数组合.权值、偏置、输入维度等参数通过理论分析和数据计算得出,隐含层节点数、噪声等级、稀疏限制参数在实验中根据结果优化得出,具体参数见表3.

3.2.2 实验步骤

1)预训练

将无标签的兵棋演习训练数据集输入到输入层、隐含层1、重构层1组成的第一个稀疏降噪自编码器中,训练出隐含层1的权重参数,并计算出隐含层1的输出;将隐含层1的输出作为隐含层1、隐含层2、重构层2组成的第二个稀疏降噪自编码器的输入,训练出隐含层2的权重参数,并计算出隐含层2的输出;同样方法计算出隐含层3、输出层的权重参数和输出数据;将输出层数据作为Softmax分类器的输入,使用兵棋演习数据标签训练出分类器的参数,如图15所示.

2)网络连接

预训练结束后,将输入层、隐含层1、隐含层2、隐含层3、输出层和分类器进行连接,构成一个栈式稀疏降噪自编码网络与Softmax分类器的级联结构,如图16所示.

3)微调训练

使用带标签的兵棋演习训练数据集对级联的Stacked Sparse Denoising AE-Softmax网络进行整体训练,计算整个网络的损失函数和对每个参数的偏导函数,用误差反向传播和随机梯度下降法求出损失函数为最小值时的参数,这些参数即为整个级联网络的最终参数,如图17所示.

图15 预训练过程

图16 网络连接

4)网络测试

将带标签的兵棋演习数据集输入到级联网络中,经过层层特征提取,最后将输出层的数据特征作为分类器的输入进行分类识别,并与数据标签进行对比,计算得出分类误差,即为网络的测试结果,如图18所示.

图17 微调训练过程

图18 网络测试

3.3 基于其他方法的对比试验

为了比较验证深度学习方法处理兵棋演习数据特征提取问题的能力,将采取3类、8种不同方法进行对比实验,如图19所示.

图19 对比实验方法

表4 基于不同方法的特征分类误差对比表

3.4 实验结果

运用3大类、9种方法分别对两个兵棋演习数据集进行特征提取实验,为确保实验环境、条件、标准相同,所有实验均在同一平台上进行,选取相同的参数,设置相同特征提取维度,都使用Softmax分类器进行测试,分成相同的类别,重复相同的实验次数,最终计算所有实验结果的平均值.对所有方法的测试精度和运行时间两个指标进行记录,代表方法的特征提取精度和速度,作为衡量特征提取方法性能的主要参数.实验使用2个数据集、运用9种方法,共得到900组结果,取平均值后得出18组结果,结果见表4.

通过实验结果可得出,对于兵棋演习数据的特征提取,浅层神经网络与传统方法的性能相近,但浅层神经网络的速度更快;稀疏性限制条件和噪声干扰对神经网络的鲁棒性、分类精度提升有显著作用,相比之下噪声干扰的作用更大,同时加入稀疏性限制条件和噪声干扰能够取得更好效果;相比于浅层神经网络,深层神经网络取得了更好的分类结果,加入稀疏性限制和噪声干扰的深层神经网络分类精度得到大幅提升,接近于99%,也证明深度学习方法适用于兵棋演习数据特征提取.虽然深层网络的运算时间较浅层网络和传统方法明显更长,但随着计算机技术的发展,CPU、GPU性能的不断提升,这一问题必将得到解决.

4 结论

随着现代战争的不断发展,作战样式将呈现出快速化、多样性、复杂化等特点,依靠人工智能的方法来分析战争、理解战争、预测战争已成为大势所趋,必将对未来战争的胜负发挥重要影响.由于机器学习需要好的数据特征才能真正发挥作用,因此,数据特征提取是运用机器学习方法分析战场态势首先要解决的问题.基于栈式稀疏降噪自编码网络的特征提取是一种强大的非线性特征提取方法,它的表达能力、泛化能力、对噪声和冗余信息的鲁棒性更强,具有更好的自主性、非线性、客观性、可扩展性、规范性特性,并摆脱了海量数据标签化的要求,是一种战场态势数据特征提取的理想方法,较传统方法和浅层神经网络方法具有较大优势.当然,单独运用某一种方法可能无法取得最佳效果,需要综合使用两种或几种特征提取方法.可以预见的是,基于深度学习的特征提取方法与其他特征提取方法相互配合使用必将产生更好的特征提取效果.