作战推演中智能博弈对抗算法水平评估模型研究∗

2020-10-30

舰船电子工程 2020年9期

（海装沈阳局驻大连地区第一军事代表室大连 116000）

1 引言

作战推演是检验战略、战术、作战方案、武器装备、人员素质等的重要手段[1]。随着人工智能技术的发展，人们提出将人工智能算法用于在作战推演中扮演蓝方，以获得更好的客观性和真实性[2]。此时，决策者要了解智能博弈对抗算法的对抗水平，以及其做出的决策是否可用及可信，决策者才能确定使用哪个智能博弈对抗算法参与作战推演。因此，需要制定一套客观、公正、完整的智能博弈对抗算法的评价标准和评价方法[3～4]。

现有的博弈对抗算法的评估方法不是针对人工智能算法模型而设计的，其指标体系和评价方法都不能适用于新提出的基于人工智能的博弈对抗算法及模型[5]。因此需要针对作战推演中的基于人工智能的博弈对抗算法及模型研究可信的评估指标体系和评估模型，能够帮助决策者选取合适的博弈对抗算法模型，并且还能进一步发现基于人工智能的博弈对抗算法模型的不足之处，不断完善这些算法和模型，具有重要的应用价值。本文首先确立整个智能博弈对抗算法模型的评估原则，然后建立评估指标体系，最后研究提出验证评估方法模型，实现对智能博弈对抗算法整体进行全面分析评价。

2 智能博弈对抗算法水平评价指标体系构建原则

1）完整性原则

如何构造一个完整的评价指标体系是全面、准确地认识智能博弈对抗算法的基础[6]。因此，在构建指标体系的时候可从不同的评估视角出发，考虑博弈对抗算法中每一个功能因素，对指标进行层次划分逐步构建整个完整指标体系。在实际评估时，为了整体评估效率，可以根据评估指标在算法中的权重来确定是否取舍。

2）稳定性原则

智能博弈对抗算法的评估体系应具备一定的稳定性，能够反映这些算法的共同属性，通常作战推演中会有多次博弈对抗产生中间数据，可通过这些数据划分共同的衡量指标，在一定程度上评估指标不会大规模地改变，也不能频繁变动[7]。

3）定量与定性分析结合使用的原则

由于作战推演是比较复杂的活动，因此智能博弈对抗算法涉及到大量的参数，其本身结构复杂，可以得出其中包含相当数量可以量化和衡量的因素，也包含一定量难以量化和衡量的因素。作战推演下的智能博弈对抗算法评估指标体系需要采用定量和定性相结合的原则进行构建，采用定量指标进行计算，可以使评估更具客观性，同时结合定性指标，能够弥补只采用定量指标评估的不足。

3 智能博弈对抗算法水平评估

博弈对抗算法水平是指算法能够完成作战任务、达成作战目的的能力。博弈对抗算法水平综合了各种因素的影响，对博弈对抗算法模型输出的各阶段的作战结果进行统计评估，然后对整个模型的作战水平进行评价。

图1 智能博弈对抗算法水平评估评估指标

智能博弈对抗算法水平评价主要包括作战效能指标和结果统计指标。作战效能评估主要包含了整体目标完成水平、侦查预警水平评估、火力打击水平评估和防空作战水平评估等。作战结果评价指标包含作战兵力使用评价指标、作战损伤评价指标和作战消耗评价指标等[8～9]。

1）作战结果评价指标

作战结果评价指标是对智能博弈对抗算法模型产生的作战结果数据进行统计分类，可以得出智能博弈对抗算法的作战成果和作战损耗。因此作战结果统计需集中到研究员和指挥人员这些相关人员最为关心的方面，因此作战结果评价指标一般应包含作战兵力使用评价指标、作战损伤评价指标和作战消耗评价指标等统计指标。

2）作战效能评估

作战推演中设置了博弈对抗模型的目标，可将作战效能评估指标划分为整体目标完成水平、空中侦察目标完成水平、预警探测目标完成水平、火力打击目标完成水平、电子干扰目标完成水平等。整体目标评估即从整体上评估联合作战目标是否达成。通过作战效能的评估分析，可发现对方作战体系的薄弱环节。通过定量与定性相结合的方法比较进攻或防御目标的实现程度，获得作战任务的完成度分析。

4 博弈对抗算法水平评价模型构建

传统运筹分析方法不能很好地适应智能博弈对抗算法的动态变化，因此针对联合作战博弈对抗算法水平评估的问题采用深度学习的方法，选择博弈对抗算法模型输入数据，这些输入数据包括作战实体平台、机/舰载设备、武器效能、作战任务等，以及博弈对抗算法模型运行过程产生的结果数据，例如各部队和装备的状态数据，火力使用数据等，构建评估特征数据空间，标签值按照作战效果（优秀到差）由专家进行评判分为几个等级，构建和训练智能博弈对抗算法模型水平评估模型，将博弈对抗算法模型输出的作战行动多次评估结果量化后取平均值，得到博弈对抗算法模型作战水平值，用于智能博弈对抗算法模型的水平评估。

1）评估特征构建

在智能博弈对抗过程中，包含两类数据：（1）智能博弈对抗过程中输入的指令数据，是算法模型根据作战态势变化作出的各种作战命令；（2）设置固定步长时间段，得到各时段博弈对抗算法模型产生的瞬时作战结果数据，作战结果数据按照时间顺序，根据步长时间选取带时间戳的所有结果数据集合[10]。

选择抽取博弈对抗中一个指令下达时，到结束阶段战斗中的数据输入和博弈对抗后的兵力结果：时间开始时间（作战实体平台、机/舰载设备、武器作战效能、作战任务）、时间结束时间（作战实体、机/舰载设备、武器作战效能）来等构造多维特征项。

图2 智能博弈对抗中的多维数据立方体模型

将智能博弈对抗模型中输入向量维数巨大，本文采用自编码神经网络抽取输入数据的高层特征，用于后续博弈对抗算法模型的评估，同时生成一些作战水平的标签[11]。输入层的每个数据由发出指令前作战平台状态数据、指令和完成指令后作战平台状态数据，训练输出作战水平的度量，将作战水平的度量转化为一个作战水平的分类问题。作战平台状态数据由上节提到的多个评价指标数据构成。

结果统计指标主要来自于作战单元与武器装备等实体级指标度量，这些数据可以在智能博弈对抗算法模型的数据中直接抽取，而作战效能的评估指标可根据特定的作战行动对照任务清单中的作战任务成功的标准进行量化权衡。生成小批量有标签样本，标签值按照作战效果分为优秀、良好、中等、合格、不合格、差六个等级。

2）基于稀疏自编码器的特征压缩

本文采用一个三层稀疏自编码网络得到输入数据的特征向量，用于后续的评估模型的训练。首先用输入数据来训练第一个网络，通过使输出x̂接近输入，可以得到第一个网络的隐藏层h(1)(k)，如图3所示。采用原始输入x(k)训练第一个自编码器，得到输入的一阶特征表示h(1)(k)，将一阶特征h(1)(k)输入到第二个稀疏自编码器，以此学习二阶特征h(2)(k)，再把这些二阶特征h(2)(k)作为第三个网络，一个softmax分类器的输入。通过上面栈式自编码的学习，可以把隐藏层h(2)(k)取出来，它就是输入数据以作战水平分类为目标降维压缩后的向量，用于后续评估模型的训练。

图3 稀疏自编码器的特征压缩

3）评估模型构建与验证

评估模型的输入是先将大量的特征数据进行压缩去除一些冗余信息，输出智能博弈对抗算法模型的综合指标度量，将智能博弈对抗算法水平的评估问题转换成机器学习的分类问题，对智能博弈对抗算法水平评估问题采用深度学习模型进行建模。首先对高维特征数据特征进行降维后作为训练样本，方案级样本的标签来自智能博弈对抗算法最后完成作战目标的程度，与单个作战行动的标签相同，通过与作战任务清单设置的任务成功标准进行对比得到量化权衡，可得到大批量有标签样本，标签值按照作战效果分为优秀、良好、中等、合格、不合格、差六个等级。

在博弈对抗的过程中所产生的行动数据是巨大的，对于作战效果的判断完全依赖于专家判断是不太可能的[12]，采用深度学习模型完成对无标签的博弈对抗行动进行分类。由于行为数据的特征维数比较高，这会导致训练量很大，因此先采用自编码的神经网络先一步提取特征。本文采用CNN+LSTM的结构对博弈对抗算法模型进行评估，特征数据经过两层卷积层，然后将不同时序的特征组合起来作为LSTM层的输入，构建智能博弈对抗算法模型作战水平评估模型，网络结构如图4所示。

图4 智能博弈对抗算法水平评估模型

评估模型的构建可采用特定的深度学习神经网络算法，将大量无标签样本和少量有标签样本相结合，训练深度学习模型可自动挖掘出深度特征，并能对整个战场态势进行良好的判断[13]。基于深度学习的智能博弈对抗算法水平评估模型如图4所示。

在对智能博弈对抗算法模型验证包含两个方面：首先在对评估模型进行训练时，应先将数据集用n-fold方法划分穿个表格多个训练集和测试集，取多次测试集上的准确率平均值作为最终准确率，选取达到90%以上准确率的深度学习评估模型才能用于评估智能博弈对抗算法模型。二是将评估模型用于已训练好的智能博弈对抗算法模型，将智能博弈对抗算法模型运行时实时运行的阶段输入数据通过数据预处理后输入深度学习评估模型，然后深度学习评估模型给出作战行动的评估结果，然后取多次评估结果的平均值，得到智能博弈对抗算法模型作战效能水平值，用于智能博弈对抗算法模型的水平评估。

5 结语

对于作战推演下的智能博弈对抗算法评估来讲，采用传统的评估方法由于人为介入环节较多影响了评估的客观性，本文提出了智能博弈对抗算法水平评估模型。一是明确智能博弈对抗算法水平评价指标构建原则，建立了智能博弈对抗算法决策水平指标体系。二是由于智能博弈对抗算法中用于评估的数据量巨大并且特征较为稀疏，采用深度学习模型挖掘数据特征，以此降低后续评估模型训练的难度。三是采用深度学习模型对该模型后续还需进一步改进，如还需进一步细化评估指标体系。另外，随着作战推演下的智能博弈对抗算法仿真度进一步提高，后续评估模型可以不断地迭代学习，其准确率和实用性也将不断提升。