深度学习研究及军事应用综述
2022-04-08王晓丹
王晓丹, 向 前, 李 睿, 来 杰
(1.空军工程大学防空反导学院, 西安, 710051; 2. 61932部队, 北京, 100089)
机器学习是人工智能的一个重要分支,被认为是使计算机(机器)拥有智能的根本途径。机器学习就是通过算法,使得计算机能从大量历史数据中学习规律,从而能识别新的数据或做出预测。深度学习作为一种新的机器学习方法,是机器学习的一个重要分支,也是目前人工智能领域的研究热点之一[1]。
使机器拥有智能,能够像人一样去感知、学习、记忆是人类一直追求的梦想,人们希望通过模拟人脑神经网络的作用机理来复现人的智能。人工神经网络研究始于1943年神经元M-P模型,到1958年Rosenblatt等人[2]提出单层感知器(Perceptron),神经网络的发展进入了新的阶段。随着研究的深入,研究人员证明了单层感知器功能有限、无法解决“异或”问题[3],因此,1969年Minsky和Papert在《感知器》一书出版后的很长一段时间,神经网络的研究处于低迷期。
直到1982年Hopfield提出了连续和离散的Hopfield神经网络模型[4],并采用全连接神经网络实现旅行商问题求解。Hopfield网络是一种循环神经网络(recurrent neural networks,RNN),具有联想记忆功能。1985年Sejnowski和Hinton等设计出波尔兹曼机(boltzmann machine,BM)[5],BM具有较强的无监督学习能力,可以从数据中学习到复杂的知识规则,但存在着训练和学习时间过长的问题。
1986年Hinton等[6]提出了多隐含层网络结构,采用Sigmoid激活函数,利用误差反向传播算法来训练模型,有效解决了非线性分类问题。1989年Hornik等[7]证明了任何函数都可以被三层神经网络以任意精度逼近。LECUN等[8]设计了卷积神经网络(convolutional neural networks,CNN)识别手写字体,但训练模型需要大量时间,同时,反向传播算法被指出存在梯度消失问题。由于神经网络训练存在的容易过拟合、参数训练速度慢等问题,其发展再次陷入低谷。
此后十多年,支持向量机(support vector machine,SVM)、最大熵方法(如逻辑回归)、提升(boosting)方法等不同的浅层机器学习模型相继被陆续提出,如,1995年SVM[9]的提出为解决有限样本下的机器学习提供了有效的手段,SVM在解决高维数、非线性问题等方面表现出了良好性能,从而获得了广泛的应用。2006年,Hinton等[10]提出了自编码器(auto-encoders,AE)以降低数据的维度,并用预训练的方式快速训练深度信念网络(deep belief network,DBN)[11],来抑制梯度消失问题。通过贪婪的逐层训练再进行全局微调,解决了网络训练困难的问题。Hinton等[10-11]提出:①多隐层神经网络可以学习到能刻画数据本质属性的特征,对数据可视化和分类等任务有很大帮助;②可以借助于无监督的“逐层预训练”和“精调”的两阶段策略,解决了深度学习中网络参数训练的难题。
深度学习思想的提出是对传统特征选择与提取框架的突破。深度学习之所以被称为“深度”,是相对于浅层学习而言。浅层学习模型的结构基本上可以看成带有一层隐层节点(如SVM、boosting)或没有隐层节点(如逻辑回归)的模型,而深度学习网络是由多个单层非线性网络叠加而成。浅层学习依靠人工经验提取特征,学习后获得的是没有层次结构的单层特征。深度学习通过对原始数据进行逐层特征变换,将样本在原空间的特征表示变换到新的特征空间,自动地学习得到层次化的特征表示,从而更有利于分类或特征的可视化[11]。
随着计算机处理速度和存储能力的提高,使得深层神经网络的设计和实现已逐渐成为可能。深层神经网络试图模拟人脑的分层学习方法,通过组合低层特征(抽象程度低)形成更加抽象的高层特征表示、属性类别。深度学习算法学习到的抽象特征表示在不同的机器学习应用中表现出了优越的效果。2012年,Hinton及其学生利用深度神经网络技术将ImageNet图像分类问题的错误率从26%降至15%[12]。同年,微软和谷歌先后采用深度学习技术将语音识别错误率降低至20%~30%[13]。2012年6月,《纽约时报》披露了谷歌的Google Brain项目,吸引了公众的广泛关注。深度神经网络机器学习模型在语音识别和图像识别等领域获得了巨大的成功。2013年1月,百度宣布成立百度研究院,其第一个重点方向就是深度学习。2013年4月,《麻省理工学院技术评论》(MIT Technology Review)杂志将深度学习列为2013年十大突破性技术之首。至此,深度学习受到学术界、产业界、各国政府的高度重视,其发展进入爆发期。
近年来,随着超大规模计算、大数据、智能芯片等技术快速发展,推动了深度学习技术的不断突破,深度学习已成为人工智领域的研究热点和主流发展方向之一,深度学习也日益成为军事智能化发展的技术基础与研究热点,深度学习技术在军事领域的应用受到各国的广泛重视。
以下将结合深度学习的最新发展,介绍目前主要的深度学习编程框架及其特点,对深度学习在目标识别、态势感知、指挥决策等典型军事领域的应用进行分析总结,分析深度学习军事应用面临的挑战,并展望未来可能的发展方向和趋势。
1 深度学习框架及研究进展
深度学习受到学术界和产业界广泛重视、得以迅速发展的原因,除了借助于理论层面的突破外,离不开计算机硬件(计算机运算能力的显著提高)和软件(开源软件的广泛流行)两个方面的快速发展。
一方面,深度学习的训练阶段需要对大量数据进行高密度的并行计算处理,传统的中央处理器(central processing unit,CPU)很难胜任此类任务,因此不断有新的处理器被设计和制造,最具代表性的处理器包括Nvidia和AMD系列图形处理器(graphics processing unit,GPU)、谷歌的张量处理单元(tensor processing unit,TPU)和华为的昇腾处理器等。在处理器的软件支持方面,Nvidia率先推出了统一运算设备框架(compute unified device architecture,CUDA),为其生产的GPU提供了一个高性能的运算平台,在此基础之上又开发了深度神经网络的底层加速库cuDNN,为上层开源深度学习框架提供了高性能GPU加速。另外,AMD推出了开放式软件平台(radeon open compute platform,ROCm)助力高性能计算和机器学习,华为为其昇腾处理器开发了神经网络计算架构(compute architecture for neural networks,CANN),目前这两个运算平台正处在快速的发展阶段。计算机领域的摩尔定律表明,在价格不变的情况下,集成电路上的元器件数目在18~24个月内会翻一番[14],换言之,运算性能也会翻一番,深度学习正是在这样的算力变革中快速发展。
另一方面,近年来,开源软件成为深度学习发展的主要推手,其支撑要素为广泛流行的编程语言和高效的算法编程框架。适用于深度学习的主要编程语言有Python、Julia、MATLAB、C++等,其中由荷兰的Guido van Rossum于1990年代初设计的Python具有良好的简洁性、易读性和可扩展性,是当前最为流行的深度学习编程语言。开源编程框架为实现深度学习模型提供了方便的应用程序接口(application programming interface,API),国外框架主要有:FaceBook的PyTorch、Google的TensorFlow和Apache软件基金会的MXNet等;国内框架主要有:百度的飞桨(PaddlePaddle)、清华大学的计图(Jittor)、华为的MindSpore和旷视科技的天元(MegEngine)等。神经网络的整个计算流程可以构成一张计算图,深度学习框架一般有静态计算图和动态计算图两种模式,静态计算图是先搭建网络后进行计算的过程,该模式具有高效的计算能力,但是编程调式的灵活度不高,而动态计算图中网络的构建和计算同时进行,具有灵活、易调节的特点。Tensorflow、PaddlePaddle、Jittor和MindSpore等支持两种计算图模式,在计算效率和易用性上具有较大的优势。目前主要的深度学习框架、特点、以及支持的语言等信息如表1所示。
表1 主要深度学习框架汇总
表1(续)
表1(续)
另外,为了增强各个框架之神经网络模型的互操作性,微软和FaceBook于2017年推出了开放神经网络交换(open neural network exchange,ONNX)标准,它使得开发者可以灵活地在各个框架之间切换以充分利用各个框架的优化特性。正是借助于开源软件“人人参与,人人共享”的独特优势,深度学习中的复杂模型可以采用类似于搭积木一样的模块化实现,缩短了模型实现和验证时间,提高了研究者对深度学习的研究热情和成果转化速度,促进了深度学习的理论研究和理论到实际应用的转化。
2 深度学习在军事领域的应用
深度学习为很多复杂问题的解决提供了新的思路,由于其具有强大的特征表示和学习能力,在以目标识别与检测、态势感知、智能指挥决策等为代表的军事领域中取得了一系列应用成果,并日益成为军事领域智能化发展的技术基础与研究热点。
2.1 目标识别与检测
雷达目标识别一直是军事领域关注的重点,随着高分辨雷达技术的发展,目标的高分辨一维距离像(high resolution range profile,HRRP)、合成孔径雷达(synthetic aperture radar,SAR)图像等已经成为军事目标综合识别的重要数据来源,传统雷达目标识别方法主要采用人工设计的特征提取算法提取目标特征,目标识别的性能依赖于提取特征的好坏,而采用深度学习方法则能自动学习目标数据的深层次抽象特征,能够进行更准确、更稳健的识别,从而受到广泛的关注。表1为当前主要的深度学习框架。
在基于HRRP的雷达目标识别方面,BO.F等[15]提出一种新的矫正自编码器Corrective AE,自动提取HRRP抽象特征,实现了对目标HRRP的高效识别。Pan等[16]采用t-SNE方法解决HRRP目标识别中的训练数据不均衡问题,利用判别式深层置信网络提取训练数据中与类别无关的全局特征来提升小样本条件下的HRRP分类性能。徐彬等[17]考虑HRRP样本距离单元间的时序相关特性,提出了采用双向长短时记忆模型的HRRP目标识别方法,提高了目标识别性能。文献[18]将5种弹道中段目标HRRP转化为0-1二值图,并构建了二维CNN对HRRP图像进行分类,充分利用图像中蕴含的目标结构信息提升了分类效果,但将HRRP转化为图像增加了计算量。Xiang等[19]在一维CNN中引入通道注意力,同时利用改进的人工蜂群算法对一维CNN进行剪枝,在保持对弹道中段目标HRRP的高准确识别率前提下大幅降低了模型的复杂度。
在基于SAR的雷达目标识别方面,Geng等[20]采用卷积自编码网络逐层提取SAR图像特征,利用标签样本对网络参数进行调优,通过进行尺度变换减小SAR图像斑点噪声的影响,利用形态学平滑操作移除分类图中的孤点,提高了模型的鲁棒性和泛化性能;Lin等[21]采用通过集成2个具有不同卷积核尺寸的卷积网络获取图像的多尺度特征表示,克服梯度消失问题,提高了SAR图像识别性能。Shang等[22]在卷积神经网络中引入记忆单元,通过加入信息存储单元记录样本的空间特征,并利用空间特征相似性推测未知样本的类别,取得了较好的识别性能。Ding等[23]使用具有3个卷积层的CNN网络从SAR目标数据中提取丰富的特征。Chen等[24]提出一种全部由卷积层组成的CNN结构,用卷积层替换了全连接层,有效降低了整个模型的参数数量,抑制了过拟合问题并取得了近99%的目标识别准确率。为实现存储和计算资源受限条件下的高速目标识别,基于轻量化模型的SAR目标识别受到关注。Chen等[25]首先采用剪枝和自适应结构压缩降低模型规模并提高训练和推断速度,将权值进行量化和编码实现模型的进一步压缩,在不损失SAR目标分类精度的情况下实现了40倍的模型规模下降和15倍的运算量减少。
总的来说,深度学习算法在雷达目标识别领域具有较多的应用研究,尤其是在理想状态下提高雷达目标识别的速度、精度和自动化效果上有了较大的进步。但是,雷达目标识别问题是典型的非合作目标识别问题[26],目前的研究仍然无法解决非合作目标识别问题。上述深度学习方法一般使用的训练样本是在高信噪比环境下获得的,由于雷达探测距离较远和周围环境复杂多变,实际获取的雷达数据信噪比较低,造成了训练样本与识别样本的信噪比失配。另外,现实场景中雷达无法长时间持续探测和追踪目标,很难获得健全稳定的样本。因此,非合作目标识别问题是雷达目标识别急需解决的问题,需要在信噪比失配和少量不完备样本等条件下进一步开展研究。
2.2 态势感知
现代战场态势具有显著的大数据特征,传统方法已不能满足现代复杂战场态势的感知需求,深度学习技术为研究战场态势感知提供了智能化技术手段[27]。在对以往实战数据、实兵对抗数据、靶场试验数据、兵棋推演数据等进行态势标注的基础上,将其作为训练数据,对深度学习模型进行训练,利用训练获得的网络模型可以实现对战场态势的理解。
朱丰等[28]在分析指挥员理解战场态势的思维模式的基础上,采用深度学习方法进行指挥员战场态势高级理解思维过程模拟,实现了对复杂战场态势的有效感知。廖鹰等[29]针对联合作战条件下战场态势理解,建立了复合架构的深度学习网络,进行指挥员理解战场态势模式的模仿,基于兵棋演习数据实现了初步的战场态势优劣判别。李高垒等[30]利用深度网络模型对空战训练数据进行学习,从数据中提取能够刻画作战态势本质特点的特征量,实现了对空战态势的准确评估。欧微等[31]提出一种基于栈式自编码器的智能目标意图识别模型,通过将目标状态在多个时刻的时序特征和战场环境、目标属性等信息统一编码作为输入,将军事专家的知识经验封装为模式标签,模拟人的推理模式与认知经验,实现了对目标战术意图的智能识别。陶九阳等[32]设计了二维网格上态势要素机动预测的案例,提出一种基于深度卷积神经网络的战场态势要素趋势预测方法。
针对作战意图识别方法难以有效提取情报信息本质特征的问题,Xue等[33]提出了一种基于全景卷积长短时记忆神经网络的空中目标作战意图识别方法,该方法通过全景卷积层提取信息的松散耦合特征,通过时间序列池化层减少神经网络参数,利用长短时记忆神经网络完成时序特征提取与作战意图识别,有效提高了识别准确率。Peng等[34]建立了战场态势感知模型,通过CNN实现了目标类别概率预测,为战场态势评估奠定了基础。
Ou等[35]构建了基于栈式自编码器的智能态势评估模型,该模型首先对历史战场态势数据进行归一化、一致性检查与数据降维,形成标准数据集,而后随机抽取样本,根据专家认知经验添加标签,然后利用无标签样本对栈式自编码器进行预训练,再通过带标签样本进行参数微调并完成模型的训练。Geraldes等[36]通过CNN对无人机拍摄图像进行抽象特征提取与预测,提出了基于深度学习的无人机态势感知模型,用以完成多人检测与多动作识别,为捕获场景提供更多的上下文与态势信息。Zhang等[37]分析了智能态势感知所面临的数据集稀缺、理解复杂等问题,提出了基于战争游戏的智能态势感知总体框架,该框架利用战争游戏推导出战场形势,根据作战规则与经验知识赋予期望标签,而后通过训练CNN,减少期望标签与训练结果之间的误差,实现对战场态势的理解。
由文献可知,基于深度学习的方法在某些局部战场态势感知方面进行了大量研究,大多通过仿真实验一定程度上验证了算法的有效性。但是战场态势瞬息万变,现有的基于深度学习的战场态势感知算法在应对高时变、高动态、强对抗条件下的全局战场态势感知问题缺乏研究,同时现有的方法所用的战场态势数据量小且特征维度有限,缺乏对真实战场多源异构数据的实时性处理和融合识别研究。
2.3 指挥决策
以AlphaGo、AlphaStar等为代表的人工智能应用的成功,表明了深度学习技术在应对实时对抗、不确定性推理等复杂动态场景问题的优秀能力,深度学习在军事智能辅助决策领域的应用已经受到广泛的关注。
荣明等[38]采用价值网络、强化学习以及蒙特卡洛算法,构建了战略威慑智能指挥决策模型,实现了对威慑博弈树的快速搜索。申生奇等[39]将深度学习用于指挥控制决策,提出了基于深度态势匹配的辅助指挥控制决策方法,基于星际争霸平台与数据进行了评估。周来等[40]将深度强化学习方法引入作战辅助决策过程中,成功用于最佳行动决策序列的搜索。王壮等[41]针对指控系统复杂性、非线性,态势感知多源性、异构性等问题,采用深度强化学习技术,基于价值-策略的自学习方法提升了智能体决策质量。
Liu等[42]为解决无人机空战决策问题,提出一种基于深度强化学习的智能战术决策方法,该方法结合Q学习,采用深度神经网络实现了动作价值函数的精确拟合,避免了传统强化学习方法导致的维数灾难。崔文华等[43]针对兵棋推演的自动对抗问题,提出了基于深度强化学习的决策方法框架,该框架立足多源层次化战场态势描述,提出了面向智能博弈的战场态势表示方法,同时将作战指挥分层分域的原则与战争游戏的模块化分层框架相结合,用于各决策智能体与战场环境交互机制与对抗策略的产生。Runhild等[44]模拟了复杂战场的智能博弈,验证了深度强化学习技术在给定战场环境下寻找最优决策的可行性。为克服传统指挥控制系统对专家规则与决策模型的依赖,Fu等[45]提出了基于深度强化学习的智能指挥系统,为解决复杂场景动态决策问题,该系统立足数字战场,生成学习数据,通过门控循环单元网络提取时序特征,运用注意机制选择行动对象,同时在无先验知识的情况下,基于近端策略优化算法在固定和随机策略场景下训练神经网络,使决策更加灵活可靠。Li等[46]为优化无人飞机在复杂环境下的自主攻击决策,提出了基于深度强化学习的新型深度确定性策略梯度算法,用于无人机攻击区域拟合,并通过仿真结果验证了算法能够实时判断出最优攻击区域。为提升超视距空战辅助决策能力,Hu等[47]提出了基于改进深度Q网络的超视距作战空战智能机动规划方法,建立了智能体与环境交互的机动决策框架。
上述研究主要利用深度强化学习技术,提出了解决指挥决策领域相关问题的新思路,是对智能化指挥决策的初步探索。但是,指挥决策的复杂性,决定了基于深度强化学习的指挥决策研究仍然存在很多难题尚未解决,具体包括:
四组患者围手术期资料见表2。典型病例见图1。手术时间由A组至D组依次减少,A组的手术时间明显长于B、C、D组,差异有统计学意义(P<0.05),而B、C、D组间比较,差异无统计学意义(P>0.05)。术中失血量由A组至D组依次减少,A组的术中失血量明显多于B、C、D组,差异有统计学意义(P<0.05),而B、C、D组间比较,差异无统计学意义(P>0.05)。
智能体抽象建模难。目前对于真实战场的模拟仍然存在很多假设和简化,但战争是复杂的一体化对抗,很难将诸多的因素抽象为深度强化学习算法的输入,做到既简化细节,又保留博弈的本质。
多价值目标决策难。当前,强化学习只能以输赢作为决策目标,但是实际战争的目标并不是单一的,除了输赢,仍然还有其他评价目标,因此需要进一步研究多价值目标决策问题。
多决策实体协同难。目前的指挥决策研究主要是通过构建单独的智能体解决单一的决策问题,但如何在时间有限、资源有限的情况下解决资源分配、任务分配、冲突协调等多智能体协同问题,仍需要进一步开展研究。
2.4 其他应用
除上述军事应用领域外,深度学习技术凭借优异的性能,正逐渐应用于装备故障诊断、材料缺陷检测、作战效能评估等领域。
在装备故障诊断领域,深度学习技术被应用于分析装备振动信号等状态数据,进而判断装备内部组件的状况。鞠建波等[48]提出了一种基于DAE的装备故障诊断方法,该方法通过DAE实现装备故障的无监督抽象特征提取,并根据样本标签采用BP算法对网络进行有监督的迭代微调,提升了故障分类的准确率。Xue等[49]提出了一种基于改进深度信念的航空发动机旋转部件故障诊断方法,该方法通过引入自适应参数,实现了DBN学习速率随误差的自适应调整。Sypa等[50]提出了一种基于深度神经网络的液体火箭发动机启动瞬态故障检测与诊断方法,并采用某液体火箭点火实测数据进行模型性能测试。
在材料缺陷检测领域,深度学习技术通常被应用于分析材料表面图像,检测斑点、凹坑、划痕、缺损等缺陷。针对传统检测方法铝材表面缺陷检测率不高的问题,向宽等[51]提出了基于改进Faster RCNN(region-based CNN)的缺陷检测方法,相较于原始Faster RCNN,该方法网络中加入特征金字塔结构,增强小缺陷的特征提取能力,并使用感兴趣区域校准算法来代替粗糙的感兴趣区域池化算法,获得更加准确的缺陷位置信息。针对缺陷样本不足问题,Gong等[52]提出了一种基于深度迁移学习的航空复合材料缺陷检测模型,CNN被应用于特征提取器与标签分类器,从输入图像中提取特征,并将其赋予正确的类别标签。旷可嘉[53]提出了基于单次检测器(single shot multi-box detector,SSD)网络模型用于航空发动机缺陷的自动检测,提出的SSD模型相较于R-CNN、Fast R-CNN和Faster R-CNN具有更高的检测精度和速度。
在作战效能评估领域,可以利用深度学习技术在特征提取、非线性函数映射等方面的优点,模拟人类思维对作战方案、装备体系作战能力等进行智能评估。任俊等[54]针对武器装备体系效能评估在高维噪声小样本数据条件下准确性不高的问题,提出一种基于堆栈降噪自编码与支持向量回归机的混合模型,该模型比传统支持向量回归机等模型能够更准确地评估装备效能。郭圣明等[55]针对传统数据挖掘方法无法深入分析防空体系复杂关联关系和体系能力涌现生成机理的问题,提出一种基于强制自编码神经网络的防空作战体系能力回溯分析方法,可形式化描述防空体系能力指标涌现过程,同时还赋予指标体系相对明确的物理含义,有助于对指标体系的深入认知和管控。赵晓晓等[56]针对作战任务规划的合理性评估问题,提出了融合专家系统的多层神经网络作战任务规划合理性智能分析模型,可准确有效地评估作战任务规划的合理性。戚宗锋等[57]将深度学习与传统的层次分析法相结合,利用深度置信网络实现了底层评估数据的分类与判定,解决了指标体系的底层采样数据容易出现的数据量大、缺乏统一标度、指标间权重难以确定等问题,该模型在雷达侦察系统作战能力评估问题方面得到了有效验证。
3 深度学习军事应用面临的挑战及展望
深度学习在军事领域的应用受到世界各国的重视,国防部高级研究计划局(defense advanced research projects agency,DARPA)于2007年启动了“深绿”(Deep Green)计划,将人工智能引入作战辅助决策,将智能和仿真嵌入指挥控制系统;2009年DARPA进一步启动了“深度学习”研究计划,尝试采用深度学习方法,从战场获取的大量无标签的声音、视频、传感器和文本数据中抽取更多隐藏的有用特征,并将其用于模式识别和特征分类、挖掘关联关系、监测异常、描述事件的时间关系等;2016年,美国辛辛那提大学研发的人工智能程序Alpha AI操控F-15战机在模拟空战中击败了资深飞行员美国退役空军上校基恩·李(Gene Lee)驾驶的F-22战机。近年来启动的“指挥官虚拟参谋”(CVS)项目、“指南针”(COMPASS)项目、“IKE项目”等,显示了深度学习技术对指挥控制、军事智能辅助决策等领域产生的巨大的影响。
3.1 数据获取困难,训练样本少
由于探测手段的限制以及军事目标的高度保密特性、目标特性的非合作性,大量数据样本的获取及标注困难成为了目标识别等应用的重要问题。通常,深度学习模型网络层数深、模型复杂,在训练时需要大量的数据,在小样本条件下直接训练深层神经网络会产生严重的过拟合问题,从而导致网络的泛化能力急剧下降,样本量不足已成为制约深度学习方法在目标识别中应用的主要因素。
因此,针对军事应用问题的特点,解决小样本条件下的深度学习至关重要,可基于现有数据进行数据扩充和模型优化等,如通过平移、加噪声等方法对现有数据集进行扩充,也可采用VAE、GAN等深度学习技术进行对抗学习来生成样本;模型优化方面,可利用迁移学习、度量学习、半监督学习等方法实现小样本条件下的网络模型优化。
3.2 处理不确定、不完备信息、多域信息能力有待提升
由于军事领域问题的复杂性、对抗性和特殊性,通过各类传感器获取的数据往往存在不完整性、不确定性、模糊性以及噪声干扰严重等特点,高质量数据获取困难。深度学习方法的成功源于大量高质量的标注数据作为支撑,因此,如何在信息不确定、不完备情况下,运用深度学习技术消除军事应用问题的不确定性,提升目标识别、指挥决策等的准确性、可靠性和鲁棒性,值得进一步深入研究。
同时,深度学习为提取战场大数据中隐藏的复杂特征、实现战场态势自动感知与理解提供了可能的手段,战场大数据具有明显的“不确定性、非线性、涌现性”等特性,如何利用深度学习技术实现时域、空域、频域、任务等不同域战场大数据的特征提取与融合,实现战场态势感知与理解,进而消除“战争迷雾”,仍然面临巨大的挑战。深度学习、信息融合等技术的融合发展,将会为问题的解决提供支撑。
3.3 精确度和实时性还有待提高
现代战争节奏快、反应时间短,处理时间存在的延时极有可能延误战机而导致严重后果。深度学习应用于军事领域问题面临着高性能、高实时性要求的挑战。提高学习性能、提升学习速度是深度学习军事应用需解决的关键问题,由于深度学习方法模型复杂、学习数据量大、优化困难,通常需要较长的模型训练时间,计算资源和存储资源消耗巨大,因此,模型太大、训练时间太长、资源高消耗的深度学习模型无法满足实际问题需求。
针对实际军事应用问题的特点和需要,需要研究准确性高、鲁棒性强和泛化性能强的深度学习模型;针对深度学习模型计算和存储资源消耗较大的问题,研究并行计算方法以充分利用现有计算资源;针对模型太大的问题,在保证准确率的前提下,可以进行模型压缩,以及研究轻量化的深度网络模型,采用如模型裁剪、权重稀疏化、权重量化等技术以大幅减少模型参数,提高模型泛化性能,并实现网络加速。
3.4 可解释和可理解性有待于提高
深度学习模型复杂、参数多,学习过程是一个黑盒学习过程,学习结果的可解释性差,因此,深度学习军事应用同样存在得出的学习结论可解释性差、可理解性差的问题。对于军事指挥决策,由于决策者无法完全理解深度学习方法的决策过程,因此对学习获得的决策结论可信度不足,从而影响了其在军事指挥决策中作用的发挥。
进一步加强深度学习工作机理可解释性的研究,建立可解释的深度学习模型和学习过程,对于实现智能化态势感知、指挥决策等具有重要的意义。可以尝试将深度学习与擅长逻辑推理的符号学习、存储了知识的知识图谱结合,将深度学习与具有可解释性的学习算法如决策树等进行结合,使其既有深度学习强大的特征表达能力,又有一定的可解释性。对于对抗性较强的动态决策,可以尝试将深度学习与博弈论结合来完成动态决策性任务。
4 结语
深度学习目前已成为人工智能领域的研究热点,随着对深度学习研究的深入,其在诸多领域的应用都取得了突破性进展,深度学习技术的迅猛发展也为军事领域问题的解决提供了新的手段。由于军事领域问题自身的复杂性、对抗性等特点,深度学习应用于军事领域仍然面临着诸多挑战,本文分析总结了深度学习在目标识别、态势感知、指挥决策等领域的应用及发展,分析深度学习军事应用存在的问题与挑战,指出问题解决的可能方向,下一步将在此方向进行深入研究。