基于Bi-LSTM和多头自注意力的空战目标意图识别模型
2024-12-20刘文兵雷钰李广飞高全学
关键词:意图识别; 空中目标; 多头自注意力; Bi-LSTM; 时序特征
中图分类号:V249.4 文献标识码:A DOI:10.19452/j.issn1007-5453.2024.10.010
在现代信息化空战中,获取敌机的意图对于评估空战态势至关重要。然而,空中目标面临来自先进导弹、无人机和电子战设备等多样威胁,使得现代空战环境变得异常复杂。为解决这一问题,采用智能化推理方法成为夺取制空权、确保飞行员和军事力量安全的关键步骤[1-3]。
在对敌方目标意图识别的研究中,目前的方法主要分为两大类:一是基于规则推理的方法,包括贝叶斯网络[4-5]、证据推理[6-7]和模板匹配[8-9]等;二是基于数据驱动的机器学习方法,包括支持向量机、深度神经网络和强化学习等[10-12]。
贝叶斯网络以其因果概率推理和动态参数调整能力在战场环境中提供决策支持。王昊冉等[4]提出的多实体贝叶斯网络(MEBN)有效解决了对意图因素进行不确定性表示的问题,但其主要针对单一目标的意图识别,未全面考虑复杂战场环境。证据推理方法在面对不确定性问题时表现出色,但在复杂多目标环境下需要进一步研究和改进[6-7]。模板匹配方法是一种传统的战术意图识别方法,依赖于领域专家的经验,该方法虽然在某些情境下有用,但在处理复杂、多变的战场环境时仍需进一步改进[8-9]。
随着计算机技术的不断发展,机器学习方法为意图识别任务带来了新机遇和挑战。江佳运等[10]采用支持向量机(SVM)和遗传算法相结合的双层识别模型提高整体准确性,但在实际应用中,可能需要更多的计算资源和时间。在处理大规模的战场态势数据时常面临梯度爆炸的问题,这可能导致模型在训练过程中产生不稳定性。针对该问题,翟翔宇等[11]在多层全连接神经网络的基础上进行标准化处理和利用跳跃连接解决梯度爆炸问题,从而提高模型的性能。然而,这些神经网络在处理长序列的目标数据时,提取特征信息和实现意图识别的能力仍有待改进。鉴于循环神经网络(RNN)具备挖掘长序列数据中的非线性关系的能力,王晟[13]利用RNN处理目标数据的时间序列属性。考虑到RNN在处理长期依赖性时存在一定限制,参考文献[14]~[17]引入了长短期记忆网络(LSTM),其能够同时考虑短期和长期依赖性,以更好地捕捉目标意图。李战武等[14]提出基于LSTM-Attention 意图识别算法,通过利用注意力机制,模型的性能得到有效提升。而滕飞等[15]提出了一种Bi-LSTM-Attention 意图识别模型来同时利用当前时刻前后的目标信息,从而更有效地识别目标的意图。
面对空中目标相关任务的复杂挑战,本文提出了基于双向长短期记忆网络(Bi-LSTM)和多头自注意力(MHSA)的空战目标意图识别模型。Bi-LSTM融合了历史和未来时刻信息,MHSA增强了目标状态特征提取和深层数据关联关系挖掘的能力。试验证明,该模型在空中目标的战术意图识别方面表现出显著优势。这一成果为军事领域的意图识别研究提供了新思路和新方法,为未来的研究和应用提供了有力的支持。
1 空中目标意图识别问题描述
在动态、对抗性环境中,空中目标战术意图识别是模式识别中一项非常具有挑战性的任务。其要求推理敌我目标的静态特性、战场态势信息和实时动态数据,然后通过综合分析模型预测结果和相关的军事领域知识以判定敌方目标的意图。
式中,f 为时序特征集合到意图空间I P 的映射函数。由于目标的特征信息通常具有多维性和复杂性,因此需要利用时间序列处理方法对这些数据进行分析,使网络能够更好地理解和利用这些多维数据中的关键信息。
图1 为基于时序序列分析的目标战术意图识别过程。在对空战目标的战术意图进行分析时,首先,对多个时刻下目标的时序状态数据进行预处理,以确保数据的质量和一致性。然后从特征空间中选择主要目标特征,以构建一个完整的训练数据集;其次,使用意图网络识别模型进行训练,以挖掘战术意图和时序特征集之间的隐式映射关系。在实际空战中,连续采集N 个时刻(T T ) 目标状态信息,并将这些信息整合和编码后输入已经训练好的目标意图识别模型中,以获取目标的战术意图识别结果。
1.1 空中目标特征描述
空中目标的意图受多种因素的影响,其中任务类型和环境条件是两个主要因素。为了准确表示不同任务和环境的情况,必须选择适当的特征。此外,还需要考虑雷达站和其他空中目标感知传感器的实际特性,以确保目标的特征能够在各种情况下可靠地识别和区分。
目标特征的选择是至关重要的,其中包括目标的雷达状态、雷达反射面积和敌我属性识别。雷达状态是根据执行的任务而变化的,例如,一架战斗机在进行空中格斗时可能需要打开其雷达以探测敌方目标,而侦察机在执行侦察任务时可能需要同时开启对空雷达和对海雷达以获得更全面的信息。雷达截面积(RCS)是一个关键特征,它反映了目标的隐身能力,即目标对雷达波的反射情况。这个特征对目标能够执行的任务范围产生了重要影响,因为隐身能力强的目标更难被探测。此外,敌我属性识别用于区分目标是敌方还是友方,这在决定是否要采取敌对行动时至关重要。
目标的状态包括多种属性,如目标的航向角、高度、速度、加速度、距离等[18]。不同的战术意图对这些状态属性都有特定的要求和限制[19],因此,在参考文献[14]的基础上,本文对目标的战术意图在各个状态属性中的体现不同,对其可能的意图进行判断。此外,为了便于研究,本文采取了简化规则,具体内容见表1。
1.2 目标战术意图空间描述
在空中作战中,目标的战术意图是决定战场行动的核心因素之一。这种意图的复杂性在于它受到多种因素的影响,包括敌方的行为、地理环境、资源可用性以及作战指挥人员的决策。根据目标的不同特征,本文将其可能的战术意图分为7 类,包括突防、佯攻、攻击、侦察、撤退、监视和电子干扰。
考虑到目标特征的多样性,首先,使用默认的意图规则库来生成初步的意图标签空间,这可以帮助快速分类目标的意图。然后,由专业的作战指挥人员修改和优化初步生成的标签,以确保它们充分反映实际情况,并能够适应不同的战术情景。由于战术意图本质上是非数值型数据,进一步分析和计算这些战术意图,需要将它们编码为数值以得到对应的类别标签,目标意图空间编码过程如图2所示。
2 基于Bi-LSTM和MHSA的空战目标意图识别模型
本文提出了一种基于Bi-LSTM和MHSA空战目标意图识别模型。该模型由Bi-LSTM、MHSA和目标意图决策过程三个部分组成。
2.1 双向长短期记忆网络(Bi-LSTM)
LSTM是由Sepp等[20]学者于1997年提出的,目的在于有效处理长序列数据问题。相比于RNN模型,LSTM在网络结构中增加了一个特征信息判别器(Cell)来保留对网络有益的特征、遗忘无意义的特征。Cell中引入了三个关键门控单元,包括遗忘门、输入门和输出门,用于实现信息的保留和传递,使其能够很好地处理长时间序列数据。LSTM的结构如图3所示。
然而,LSTM仅考虑了单方向的信息传递,即其只关注前向数据之间对当前时刻数据的重要信息而没有挖掘后向数据序列之间隐藏的信息。这在某些任务中可能会导致无法捕捉到完整的上下文信息从而使得任务失败,尤其是需要考虑未来数据信息的情况。而Bi-LSTM 引入了双向信息传递机制,以更全面地处理序列数据。通过同时使用两个独立的LSTM层,一个用于前向时间步的信息获取,另一个用于后向时间步的信息获取。这两个LSTM层是相互独立的,每个都有自己的隐藏状态和单元格状态。前向LSTM 从序列的起始处开始处理数据,而后向LSTM 则从序列的末尾开始处理数据。该模型的结构如图4所示。
在现代化复杂、高对抗目标意图识别任务中,经雷达和传感器获取的空战数据呈多维度和长序列特征。因此,本文通过使用Bi-LSTM分别获取当前时刻目标状态的前向和后向依赖信息,从而使模型获取当前目标状态完整的上下文信息能力,旨在增强动态目标的表征能力。
2.2 MHSA
尽管通过Bi-LSTM可捕获敌方目标状态的动态时序表征,然而特征中仍然存在大量的冗余信息。在空战对抗中,目标的意图与其状态属性密切相关,不同的目标状态特征对于目标意图分析的影响不同。因此,引入多头注意力机制从不同的角度捕获当前状态序列特征更丰富的上下文关系。
注意力机制源于人类视觉的关注过程,它在深度学习中的应用针对多维多层次的输入特征,然而,并非所有特征对最终的输出具有相同的重要性[21]。为了更好地理解输入内容的关键信息,注意力机制通过对上层网络输出的状态信息序列进行权重分配,从而自动筛选出重要信息并排除不必要的信息。自注意力机制[22]是深度学习模型中的一个重要组成部分,特别适用于序列数据的处理。它能够捕捉同一序列中不同位置信息的相互影响,更注重数据特征和内部交互,通过为输入序列中的每个元素分配不同的权重,以捕捉元素之间的关系和依赖关系,同时不受序列长度的限制。飞机轨迹数据通常是时序数据,包括飞行速度、高度、航向等属性。自注意力机制可以用来构建用于飞机轨迹数据的序列模型,以有效地捕捉不同时间点之间的关联和依赖关系。自注意力机制模型结构如图5 所示。
2.3 目标战术意图识别算法流程
本文提出的目标战术意图识别算法整体流程如图6所示。
该模型在对空战目标的战术意图进行分析时,首先对多个时刻下目标的时序状态数据进行预处理,以确保数据的质量和一致性,然后从特征空间中选择主要目标特征,构建训练数据集;通过Bi-LSTM 学习空战意图特征矢量中的深层次信息,并借助多头自注意力机制自适应分配网络权重,从而提升目标的特征学习能力,增强在空战过程中的主要目标状态特征表示,得到具有权值分配的特征矢量;最后,将不同权重的空战特征信息送入SoftMax 层,以实现对空中目标意图的识别。
利用多分类SoftMax 函数对多头自注意力层的输出进行相应计算,从而得出空中目标战术意图分类
3 仿真试验
3.1 试验数据
雷达截面积和敌我属性等因素在飞机意图识别过程中至关重要。然而,考虑到本文的研究重点和限制,将专注于使用飞机的6 种状态属性(飞行速度、高度、航向角、加速度、距离、雷达状态)进行识别,因为这些属性对于研究问题非常关键且具有代表性。此外,考虑更多的属性可能会带来额外的计算和数据处理的负担。因此,通过结合不同意图所对应的状态范围(见表1)构造了7 种不同的目标战术意图数据,包括攻击、突防、侦察、监视、佯攻、电子干扰、撤退。需要强调的是,战术意图不仅受一架飞机的状态决定,还受战场环境以及其他飞机的影响。为了研究的可控性和可行性,在研究中将这些复杂因素进行了简化处理,以便更专注于方法研究,并有效地探索了所提方法在给定假设下的有效性和适用性。
仿真数据规模为9000个样本,训练集样本规模为5000个样本,测试集和验证集规模为2000个样本。每个样本连续采集12帧信息(每帧信息包括航向角、飞行高度、干扰状态、雷达状态等7个维度特征信息)。
3.2试验设置
试验采用多分类任务中的单个类别的准确率(意图识别正确的正样本个数占意图识别器判定为正样本个数的比例)和F1 分数(精确率和召回率的调和平均值)指标来定量评估所提出模型的有效性和竞争性。本文提出的模型采用Bi-LSTM 作为主干网络模型,MHSA机制中选择了6个不同的注意力机制头,采用SGD优化器更新网络参数,损失函数为交叉熵损失函数,学习率设置为0.001,批大小和训练周期分别设置为64 个和1000个epoch。
3.3试验结果分析
所提出的模型在2000个测试样本上的分类混淆矩阵见表2,其中对角线上的数值表示意图预测正确的样本数,每一行非对角线上的数值表示该类意图被错误预测为其他意图的样本个数。
观察表2可知,本文所提出的模型在7 种不同意图的识别任务上表现出了相当高的准确率,特别是对于突防意图,所提出模型仅将一个样本错误地预测为侦察类意图。然而,对于攻击意图来说,所提出模型将39个攻击意图样本错误地识别为佯攻意图,而侦察意图和监视意图也可能发生一些误识别。这些错误识别背后的原因可能是因为这几种不同意图所对应的空战序列特征相似性较高,同时这些意图也具有较强的欺骗性,从而导致本文模型作出错误的决策。
为了进一步说明所提出模型的竞争性,试验中选择Bi-LSTM和Bi-LSTM Attention 方法与本文模型进行定量比较,试验结果见表3。仔细分析表3 可得出,与Bi-LSTM和Bi-LSTM Attention 算法相比,在F1 分数上,本文模型比Bi-LSTM 和Bi-LSTM Attention 方法分别高出11.09%和5.08%。此外,在单个意图类别上,与Bi-LSTM和Bi-LSTM Attention 方法相比,oYCifUw4sqOKge8M/En1Mg==本文模型在攻击、侦察、佯攻、监视、撤退意图上的准确率占据了绝对的优势,而在突防和电子干扰意图上仅落后2.07%和0.35%。
此外,为进一步说明本文所提出模型的空战意图识别过程,选择攻击、侦察、撤退、佯攻、电子干扰和监视6种目标意图实例的识别过程进行可视化,如图7 所示。图7 中空心的红色圆圈表示目标的不同时期的历史状态,对应的数值表示目标处于不同状态下的实时属性,实心红色圆圈表示模型预测的目标意图。
4 结束语
本文针对空战中目标战术意图的多样性和时序性等复杂挑战,提出了一种基于Bi-LSTM和MHSA的目标意图识别方法。考虑到战术意图通常随着时间而变化,通过利用Bi-LSTM网络捕捉目标状态数据中的前后时序关系,使模型能够理解不同特征序列之间的依赖关系;此外,MHSA方法通过多个独立不同的自注意力机制以从多个角度捕获时序特征的不同关联关系增强目标的表征能力。最终,通过SoftMax 层将模型的输出映射到不同的战术意图类别中,以实现最终的意图分类。试验结果表明,本文提出的方法在意图识别问题上表现出显著的优势。