基于深度学习的军事辅助决策研究

2020-05-11张晓海操新文

火力与指挥控制 2020年3期

张晓海，操新文

（国防大学联合作战学院，石家庄 050084）

0 引言

随着科学技术、战争形态、指挥体系等不断发展演进，军事辅助决策智能化研究已成为当下热点问题。自20 世纪80 年代以来，我军大力开展辅助决策研究，不仅在理论方法研究上取得诸多成果，而且还研制了以专家系统、方案（计划）推演系统为主的辅助决策系统，为指挥决策提供了有力的辅助支持。但不可否认，诸如情报分析处理、态势感知理解、作战任务规划等问题仍是制约辅助决策走向更高发展的瓶颈。

近年来，AlphaGo［1］横空出世、震惊世界，其深度强化学习的理念方法被迅速应用到多个领域。从图像语音识别到自然语言理解，从棋类游戏到作诗作画，都有深度学习的身影。军事领域也不例外，中科院自动化所基于深度学习技术研发的“CASIA-先知V1.0”AI 系统，在2017 年9 月举办的全国兵棋推演大赛中战胜了人类选手，无疑对军事辅助决策智能化发展产生深刻影响。

本文着眼深度学习在军事辅助决策中的应用方法问题，首先对军事辅助决策的概念和内涵作了简要说明，回顾了军事辅助决策的研究情况，总结了传统研究方法的短板和不足；而后，在简要阐释深度学习原理的基础上，分析了军事辅助决策面临的困难和挑战；最后展望并提出了深度学习应用于军事辅助决策的方法思路。

1 军事辅助决策的内涵与方法

1.1 军事辅助决策

决策，起源于管理学，是指管理者为实现目标，从多个备选方案中进行选择的活动。辅助决策是指借助决策者以外的智慧和工具，利用科学方法，辅助和支持决策者完成决策的过程，也称决策支持。在军事领域，辅助决策系统能为指挥员提供情报融合、态势分析、计划拟制和方案评估等功能，以辅助指挥员进行指挥决策。

1.2 辅助决策研究方法

从发展来看，辅助决策研究方法大体分为3种，即传统的定量模型方法、专家系统和人工智能辅助决策。传统方法主要是通过各种定量模型，为决策问题提供支持［2］。该方法适用于解决结构化问题，但对于复杂的决策环境，如军事领域的决策支持，则表现出了自身的局限性：1）传统决策模型要求决策过程明确，且具有可计算性［3-4］，无法解决非结构化问题；2）传统方法以定量数学模型为基础，很难解决具有不确定性的决策问题［5-6］；3）这类模型需要决策者同时具备决策领域和数据模型的知识，在决策过程中无法主动适应环境的变化［7-8］。

专家系统通过领域专家对问题求解的经验和知识进行归纳，建立专家知识库，利用推理机完成辅助决策，在一定程度能够更好地解决传统数学模型无法处理的问题［9-12］。但专家系统通常只能针对特定问题构建知识库，在面向不同的决策问题时，缺乏较好的适应性［13］。近年来，人工智能技术飞速发展，特别是深度学习不仅在语音识别、图像处理、计算机视觉、自然语言理解等领域取得了突破，更在围棋、电视游戏、医疗辅助、自动驾驶等方面展现出了超强的能力，这为辅助决策智能化发展带来了新的机遇。

1.3 军事辅助决策相关研究

1.3.1 美军相关研究

早在20 世纪80 年代，美国防部牵头制订了仿真组网计划，服务于军事辅助决策系统的研发。随后展开了如联合作战计划和执行系统（JOPES）、战区级作战方案评估系统（CEM）、计算机辅助任务规划系统（CAMPS）、联合任务规划系统（JMPS）、参谋计划与决策支持系统（SPADS）等一系列面向联合作战的军事辅助决策系统的研究。进入21 世纪，美军加快了辅助决策系统建设步伐。2004 年，启动了实时作战智能决策项目（RAID）［14］，意在作战过程中，根据不断变化的战场态势，自动生成作战行动方案。2007 年，美国国防高级研究计划局（DARPA）启动“深绿”计划（Deep Green）［15］，希望藉此通过实时态势仿真，实现对未来情况的预测。虽然，该计划由于战争复杂性导致的组合爆炸等瓶颈问题最终宣告失败，但其提出的战术级作战指挥辅助决策系统框架构想，则具有很大的启示作用。“深绿”失败后，DARPA 先后又启动了一系列面向作战辅助决策的研究计划，如Mind’s Eye 计划着眼态势认知、TRACE 计划解决态势目标识别判断、DBM 计划应用于空中战场的态势分析和协调控制、TEAM-US计划重点放在认知速度和精度的提升、Insight 计划旨在提前对时间敏感的更大潜在威胁进行分析等。2012 年，随着以深度学习为代表的人工智能技术迎来第3 次爆发，美军针对大数据的特点和战场态势的复杂性，又启动了面向作战全过程的辅助决策研究计划——Commander’s Virtual Staff，目的是为指挥官提供主动建议、高级分析及自然人机交互等决策支持。

1.3.2 国内相关研究

多年来，我军广泛开展辅助决策研究，取得了较丰硕的成果。

情报处理是决策活动的前提，在复杂的战场环境中，情报信息具有多源性。为正确将情报信息进行分类、识别、融合，文献［16］运用D-S 证据理论方法依次对信号各参数相似度和各信号进行多层融合处理；文献［17］在战术目标情报处理流程中，引入了模糊分析方法，建立了目标模糊分类、去重的模型，为在一定可信度下快速实现目标融合提供了可行思路。

态势认知是支持辅助决策的关键环节，目前比较成熟的主要是基于知识、基于统计的方法。文献［18］在离散事件系统的模型基础上，提出了一种用于战场态势分析的步进融合算法；文献［19］通过变换态势分析人员视角，提出了基于作战效能最大化的单平台战术任务推理模型；文献［20］提出运用贝叶斯网络建立海战场态势分析模型，以解决海战场态势分析中不确定信息的处理问题。

方案评估是定下决心的重要基础。文献［21-22］针对地面防空战斗部署和火力配系方案的选择，提出了符合作战实际的评估准则，构建了基于统计的模型方法；文献［23］通过有效的人机交互，可根据任务需要和战场态势，实现行动方案的规划和评估；文献［24］可辅助生成空中军事打击行动方案，并对方案进行仿真评估。

计划推演对作战计划的科学性和可行性具有重要作用。文献［25］结合研讨型兵棋和综合集成的思想，探讨了兵棋推演海军海上军事任务中应用的可能性及一般应用方式方法；文献［26］结合海军兵棋推演的研究内容重点，给出作战规则建模、指挥关系建模等主要关键技术的解决方法；文献［27］采用合同网协议对武器目标分配的流程进行了研究；文献［28］给出了作战计划推演子系统的基本结构框架。

在专家系统研究方面，军事科学院研发的“进攻一号”军事专家支持系统［29］，是典型的基于规则进行推理分析，从而解决作战辅助决策问题的专家系统。该系统建立了多达4 000 条规则，通过特定的推理机制，能够判断当前战场态势，生成作战决心，从而辅助指挥员定下战斗决心。虽然专家系统在一定程度上能够达到实际应用的需求，但在面对充满不确定性和非线性问题的复杂战场环境时，则表现出了局限性。

除专家系统外，相对较为成熟的还有基于统计的方法，该类方法以浅层网络模型为主，其处理非线性问题的能力，较专家系统虽有一定提高，但距离实际应用还相差甚远。

2 基于深度学习的军事辅助决策研究分析

2.1 深度学习的原理和特点

2.1.1 什么是深度学习

图1 浅层网络和深度网络

2006 年，Hinton［32］等人提出了深度置信网络，拉开了深度学习的帷幕，掀起了新一轮机器学习浪潮。而深度学习之所以被称为“深度”，是相对于浅层神经网络而言的，如图1 所示。此后，相继出现了卷积神经网络［33-36］、递归神经网络［37-39］、生成对抗网络［40］等复杂网络模型。它们不仅在模式识别、信息检索、自然语言处理等多个人工智能领域都取得了重大突破，还可以对复杂模式进行分类，在决策问题研究中产生了巨大影响。

2.1.2 为什么深度学习

深度学习成为热点，源自2016 年AlphaGo 与李世石的人机围棋大战。其实，早在20 世纪90 年代，IBM 公司就开发了一款名为“深蓝”的国际象棋AI，同样在人机大战中战胜了著名的国际象棋特级大师卡斯帕罗夫。而为何历经20 年，人工智能才在围棋上战胜人类呢？“深蓝”使用的是穷举法，就是说以当时的算力，对国际象棋的走法和棋局是可以穷举的。而之所以无法在围棋上有所建树，是由于围棋的走法有2.08×10 170 种可能，与国际象棋相比异常复杂，使用传统的穷举算法是无法攻克的。

AlphaGo 所采用的深层神经网络，可以承载超大规模的神经元，能掌握甚至超出人类已有的围棋知识。深度学习能够通过多个隐层对学习的特征进行逐层变换，从而形成对样本特征的抽象表达，以此提高分类或预测的准确率。这为军事辅助决策的智能化研究提供了崭新思路。

2.2 基于深度学习的军事辅助决策研究现状

目前，国内已经展开了多项基于深度学习的军事辅助决策技术研究，尤其在目标识别、态势感知等方面取得一定成果。

在目标识别领域，文献［41］采用深度学习对边际Fisher 特征进行自动提取，相较于传统的MFA 算法具有更好的非线性特征提取能力；文献［42］将卷积神经网络和空间转换网络相结合，提高了海上无人机目标识别的准确率；文献［43］通过一种稀疏自编码神经网络对降维后的样本数据进行特征提取，而后利用训练好的softmax 分类器进行分类识别，有效提高了复杂战场环境中具有高相似度军事目标的分类精度；文献［44］先对连续拍摄且拍摄时抖动的图像进行预处理，而后采用一种改进的卷积神经网络模型，有效提高了战场目标识别能力。

在态势感知方面，文献［45-47］提出了在大数据条件下的战场态势评估方法，但这些研究对于大数据深层信息的挖掘能力还不够强；文献［48］详细分析了海战场防空态势评估的关键问题，并针对解决海战场防空态势评估复杂性问题，结合深度学习的特点提出了新的思路；文献［49］阐述了在大数据环境下，应用深度学习解决态势感知问题的优势，对基于深度学习的战场态势评估模型进行了探索；文献［50］结合战场目标的时序特征，提出了一种基于栈式自编码器的意图识别模型，并针对实验结果对参数和训练方法的选择进行了分析；文献［51］提出了态势智能认知的相关技术框架，剖析了未来工作中的关键问题，提出了可能的技术路线，为战场态势智能认知研究奠定了基础；文献［52］设计了二维网格上态势要素机动预测的案例，提出了一种基于深度卷积神经网络的态势要素趋势预测方法，并证明了态势变化速度与网络损失函数交叉熵是等价的，且态势变化速度与趋势预测的准确率成反比。

上述研究采用深度学习方法，提出了解决军事辅助决策领域相关问题的新思路，是对智能化军事辅助决策的初步探索。然而，作战决策的复杂性，决定了基于深度学习的军事辅助决策研究依然面临着诸多挑战和难题。

1.1.3 仪器与设备 TM-767型打浆机，上海远岸工贸有限公司；EL104分析天平，梅特勒托利多仪器有限公司；UV-2600型紫外可见分光光度计，尤尼克(上海)仪器公司； DHG-9146A型电热恒温鼓风干燥箱，上海精密实验设备有限公司；TDL-5-A型低速台式离心机，上海安亭科学仪器厂；RE-52AA型旋转蒸发仪，上海亚荣生化仪器厂；SHZ-III型循环水真空泵，上海亚荣生化仪器厂；pH211台式酸度离子计，意大利HANNA公司；SY-1-2型电热式恒温水浴锅，天津欧诺仪器仪表有限公司。

2.3 基于深度学习的军事辅助决策面临的挑战

2.3.1 态势认知

态势认知是指挥控制活动的核心环节，也是正确决策的前提和基础。自有战争以来，“战场迷雾”始终制约和影响着对抗双方指挥人员对战场态势的认知。尽管深度学习为态势认知提供了技术可能，但也面临重重困难。一方面，从知识表示的角度看，由于情报信息具有多源化特点，只有将不同结构或形式的信息进行融合处理，才能得到准确的战场态势；另一方面，从知识获取的角度看，由于获取的战场信息通常具有不完备性，因此，从不完备信息中提取出可用于辅助决策的战场知识，是态势认知的一大难点。

2.3.2 意图识别

战争是一个复杂系统，想要准确预测敌方下一步行动极其困难。首先，战争具有不确定性，作战双方不会按照固定的规则出招；其次，作战是个时序问题，且在这一过程中，作战双方要对多个作战实体进行实时控制，因此，在对未来进行预测时，很容易导致组合爆炸或预测失真；再次，当进行更高层次的作战指挥时，通过简单的局部组合是无法推测全局作战意图的，这是由于不同指挥员的指挥风格和指挥艺术所导致的，对于战略级的作战意图，甚至还掺杂了政治、外交等更加难以量化的诸多因素。

2.3.3 样本积累

基本的深度学习模型是基于数据的，训练样本需要达到一定的规模才能体现出模型的优势，而当前面临的一个很大问题就是训练样本的匮乏。目前的深度学习模型以有监督学习为主，需要大量的标签数据，而我军近年来未经历过真实的战争行动，即使通过演习和模拟仿真可以进行数据的积累，但为这些数据添加标签费时费力。目前，常利用兵棋系统通过推演生成作战数据，然而，现有的兵棋系统对复杂战争的还原度还不足以反映真实的战场情况，模型最终训练得到的也是人造的规律，其价值体现还需考量。

2.3.4 粒度选择

辅助决策技术中另一大难题即为量化分析。在联合作战中，随着指挥层次的上升，量化信息将更为复杂和困难。为避免决策网络的组合爆炸或失真，基于不同指挥层次的辅助决策，对于输入数据的粒度、时序深度的选择将尤为重要。相较而言，陆军的指挥决策比海军和空军更加困难，这是由于人比飞机和舰艇更为自由，且数量更加庞大，指挥粒度的选择极易对态势判断产生影响。

3 基于深度学习的军事辅助决策研究展望

3.1 信息融合处理

上节讨论了战场情报的多源化特性，即制约作战指挥决策的本质并非信息本身，而是与需求不相适应的信息融合处理能力。在战场复杂环境中获取的情报信息通常有图像、语音、文字、电子信号等等多种格式或模态，但这些信息只有经过融合、整理后才能形成决策效益。对此，大数据挖掘技术将是解决情报融合的核心手段；同时，基于深度学习的人工智能技术，可以对战场态势的特征进行分层次的学习，从而自动提取出不同层次的抽象特征，用于战场态势理解；另外，应当对专家知识等已有的研究成果加以高效利用，比如先期组织军事专家为生成的样本集添加标签，可有效提高融合处理效率。

3.2 样本自动生成

深度学习模型对样本的依赖程度很大，而目前我军训练样本一般由训练、演习、兵棋推演得来。深度生成模型为样本生成提供了一个新途径，如生成对抗网络（GAN）可以区分从训练数据抽取的样本和从生成器抽取的样本，并使生成的样本更加接近训练数据。在某个特定任务中，使用这种方法可自动生成大量样本数据，以满足模型训练的需要。当然，样本数据的维度过高，可能会影响到算法的效率，应当针对训练任务特点，在保证训练数据可满足模型需求的情况下，对不重要的信息维度进行降维，使得样本集的信息维度得到合理的控制。

3.3 训练模型泛化

在军事领域，由于战争具有复杂性，无法保证样本数据的全面覆盖，因此，更加需要模型能够正确处理训练集之外的输入，即提高模型的泛化能力。训练数据的深度学习最大的特点就是网络参数规模更大，可提取的特征信息分层次，特征信息可抽象，特征表达更加丰富，这也使它相较于规则模型、浅层网络模型具有更好的特征表达。然而，随着隐层和神经元数量规模的提升，模型也许可以在某一特定环境下更好地处理任务，但泛化能力也会随之减弱。因此，在深度学习中，通常采取增加样本噪声、控制模型能力、正则化等减少过拟合的方法来提高模型的泛化能力。

3.4 自然语言理解

自然语言理解是军事辅助决策智能化发展一个重要领域。当前，深度学习在自然语言处理领域的应用已非常广泛，从底层的分词、语言模型、句法分析到高层的语义理解、智能问答、机器翻译等方面都取得了不错的效果。基于此，通过深度学习方法来解决人机对话、关键信息抽取、语义识别、方案计划自动生成等任务，以提高辅助决策的智能化程度，也是一个重要的研究方向。一是研究探索对文本语音等进行数据化处理，不仅有利于输入数据，同时也对态势认知具有重要意义；二是结合语音识别和作战文书关键信息抽取等技术，可以为实现计算机智能化口述标图提供解决方案；三是运用生成模型，根据深度网络的海量参数和提取的特征，研究探索以自然语言形式生成方案计划，从而更加符合作战指挥需要。