APP下载

基于自训练半监督学习的战场态势评估模型∗

2021-10-11霍士伟郭圣明唐宇波

舰船电子工程 2021年9期
关键词:态势战场向量

霍士伟 郭圣明 唐宇波

(1.国防大学 北京 100091)(2.国防科技大学信息通信学院 西安 710106)

1 引言

随着人工智能技术的快速发展和在军事领域的广泛运用,作战指挥方式由传统的以指挥员决策向人机协同的智能作战指挥方式转变。其中,智能化战场态势评估是实现智能化作战指挥的基础和关键,是科学完成兵力优化、火力分配等指挥决策的前提[1]。

目前智能战场态势评估方法主要有基于知识推理的评估方法和基于机器学习的评估方法。其中基于知识推理的评估方法主要包括基于模板匹配的方法[2]、案例推理的方法[3]、D-S 证据理论方法[4]、模糊逻辑方法[5]等。基于知识推理的方法能够较好地处理战场态势评估中信息的不确定性,但是普遍存在难以构建完备的知识库问题,对具有高度非线性、涌现性的复杂战场态势难以有效评估,原因在于这类评估方法的知识表示大多是基于人的经验,推理过程有太多主观因素,无法从战场全局实现战场态势的自主表示和推理[6]。以神经网络[7]、支持向量机[8]为代表的机器学习评估方法能够直接从大量战场态势数据中学习规律,实现对复杂战场态势的表示和认知,避免了构建知识库的复杂过程,同时避免了人的主观因素影响。目前,基于机器学习的智能战场态势评估成为当前作战指挥决策领域的研究热点,并取得了大量成果。但是,基于机器学习的评估方法需要大量标记样本数据来进行模型训练,而在战场环境下,要获得充足的满足模型训练要求的带标签样本数据是比较困难的。相对而言,我们能够获得较多的无标记数据,但是为这些数据添加标签则需要花费大量的人力和时间。在这种情况下,直接将传统机器学习方法用于战场态势评估,会造成评估准确性不高。因此,研究如何利用无标签样本来辅助机器学习模型训练对基于机器学习的战场态势评估具有重要意义。

半监督学习是一种可有效利用无标签样本来辅助机器学习模型训练的方法,可有效提高标记样本不足条件下模型的精度和泛化性能[9]。其中自训练半监督学习是一种简单且适应性强的半监督学习方法[10]。本文以自训练半监督学习方法为模型整体训练框架,以适用于小样本条件下分类的支持向量机模型为基础分类器,提出了基于自训练半监督学习的战场态势评估模型,为解决标记样本不足条件下的智能战场态势评估问题提供了思路。通过实验,验证了该模型在战场态势评估标记样本不足条件下的可行性和有效性。

2 基于自训练半监督学习的战场态势评估思路

自训练半监督学习是一种简单且适应性强的半监督学习方法[10]。自训练半监督学习方法首先利用现有的少量有标签样本进行监督式学习,然后将学习得到的分类模型对无标签样本进行分类预测,也就是为无标签样本添加伪标签,然后根据一定的伪标签选择策略选择伪标签准确率较高的数据加入训练集重新训练分类模型。迭代上述过程,直到算法达到预定条件。自训练方法实现简单,适应性强,可广泛用于各种领域标记样本不足的分类和预测场景。

本文结合自训练半监督学习和支持向量机分类模型设计了战场态势评估模型,如图1所示。模型以小样本条件下表现较好的支持向量机模型作为基分类器,以适用战场态势评估中的初始标记样本较少的特点。针对战场态势评估过程中存在大量无标签样本和少量带标签样本的情况,通过自训练的半监督学习方法利用无标签样本来对支持向量机模型进行辅助训练来提高模型的准确性和泛化性能。

图1 基于自训练半监督学习的战场态势评估思路

基于半监督学习的战场态势评估基本流程如下。

1)对原始战场态势数据进行预处理,区分为有标签样本和无标签样本;

2)利用数据集中的有标签样本作为训练集对支持向量机模型进行训练,得到初始评估模型;

3)利用训练得到的初始评估模型对的无标签样本进行评估,评估结果作为样本伪标签,根据一定的伪标签样本选择策略,从伪标签样本中选择样本标注准确率高的样本加入训练集,利用新训练集对支持向量机模型进行重新训练;

4)重复上述训练模型、对无标签样本添加伪标签、选择伪标签样本重新训练模型的过程,直到模型达到所需要求。

3 基于自训练半监督学习的战场态势评模型设计

3.1 基于支持向量机的战场态势评估分类模型

在基于半监督学习的战场态势评估模型中,基学习器性能的好坏直接关系着整个模型的性能。由于战场态势评估中初始带标签样本数据较少,而支持向量机模型可以很好地适用小样本数据集的分类问题,因此本文选择支持向量机模型作为基分类器。

支持向量机是一种基于统计学习理论的机器学习方法,它基于结构风险最小化原则对数据进行分类,将原始数据通过核函数映射到高维空间中,然后采用线性超平面对数据进行分类,解决了低维数据空间中线性不可分的问题[11]。常用的核函数有常用的核函数主要有线性核函数、多项式核函数、高斯核函数、Sigmoid核函数。

SVM分类的建模和求解主要过程如下:对于样本集 D={(x1,y1),(x2,y2),…,(xm,ym)},y∈{-1,1},对于线性可分问题,可以通过线性方程划分超平面:wtx+b=0,样本中任意点到超平面距离为

在应用支持向量机进行战场态势评估时,需要选取适当的核函数。核函数选择一般通过实验比较的方法选择分类效果最好的核函数。本文通过实验比较选择线性核函数作为核函数。线性核函数是样本特征在原始空间的内积,参数少,且执行速度快。

3.2 基于马氏距离的伪标记样本选择策略

对于自训练半监督学习来说,伪标记样本选择策略是模型性能好坏的关键。伪标记样本选择策略的目的是将无标签样本中被正确标记可能性较高的样本选择出来加入有标签样本中构成新的训练集,这样才能够进一步提高模型的精度和泛化性能。如果将错误标记的伪标签样本加入新的训练集,则可能造成模型性能的下降。本文采用基于马氏距离的伪标记样本选择策略[12]。伪标记样本选择策略的主要过程如下。

3.3 基于自训练半监督学习的战场态势评估算法

结合上述基于支持向量机的战场态势分类模型和基于马氏距离的伪标签样本选择策略,本节设计了基于自训练半监督学习的战场态势评估算法,算法步骤如下。

4 实验与分析

本节利用文献[13]提供的战场态势评估数据对第3节中的评估模型进行实验验证。实验硬件环境为Intel i3-4030U CPU,主频1.9GHz,内存4G,编程环境为Matlab2018a,并包括支持向量机算法的libsvm工具包。

4.1 实验设置

实验数据共包括200条战场态势评估数据,输入变量包括敌我兵力数量对比、敌我防御能力对比、敌我攻击能力对比等7维特征,战场态势评估等级为样本标签,战场态势评估等级包括绝对优势、优势、均势、劣势、绝对劣势5个等级。为了适应评估模型的要求,针对实验数据中的5种战场态势等级(绝对优势、优势、均势、劣势、绝对劣势),分别设置对应的5类标签值(1、2、3、4、5)。部分实验数据如表1所示。

表1 部分实验数据

原始验数据集为有标签的样本集,为了支持本文的半监督学习方法实验验证。从全部样本中抽取x个样本作为有标签训练样本,抽取t个样本作为测试样本,抽取w个样本为无标签训练样本。为了对所提模型性能进行比较分析,设置以下条件下的对比实验:1)单独的支持向量机评估模型使用有标签样本进行训练;2)利用本文提出的自训练半监督学习的评估模型同时使用有标签样本和无标签样本进行训练。另外,通过设置不同的实验条件(实验条件包括有标签样本数x、无标签样本数w和伪标签样本选择阈值θ),在不同实验条件下比较模型的性能。

4.2 实验结果与分析

针对不同实验条件进行了实验验证,实验结果如表2所示。由表中结果可以看出,在三种条件下,本文提出的基于半监督学习的战场态势评估模型同时利用有标签和无标签样本进行训练,相对于只采用有标签样本的支持向量机模型来说,在评估准确率方面都有一定的提高。实验表明,在具有大量无标签样本和少量有标签样本条件下,通过自训练无监督学习方法通过利用无标签样本进行辅助训练,可以提高模型的准确率和泛化性能。

表2 实验结果

4.3 对伪标记样本选择阈值的分析

在基于自训练无监督学习的空中目标威胁评估算法中,样本选择阈值θ是一个重要参数。为了探讨其取值规律,本节进一步通过实验对其进行分析。在x=40,t=48,w=88固定不变条件下,对θ分别取1~30进行对比实验,结果如表3所示。由表中结果可以看出,当θ取值为17~22时,模型评估准确率最高,为79%;当取值过大或过小时,模型的准确率都会下降。其中原因在于,当样本选择阈值θ过大时,会将过多的判断错误的伪标签数据加入新的训练集,而这些判断错误的伪标签样本会造成模型准确率的下降。当样本选择阈值θ过小时,能够加入新训练集的伪标签样本数量较少,同样无法有效提高模型的准确率。因此,在实际应用中,要通过反复实验来确定合适的样本选择阈值取值范围。

表3 样本选择阈值分析实验结果

5 结语

为解决标记样本不足条件下基于机器学习的战场态势评估准确率和泛化性能低的问题,结合自训练半监督学习和支持向量机模型提出了基于自训练半监督学习的战场态势评估模型,设计了基于马氏距离的伪标记样本选择策略。实验表示,在标记样本不足条件下,本文提出的模型同时利用有标签和无标签样本进行训练,相对于只采用有标签样本的支持向量机模1型来说,在评估准确率方面都有较大的提高。为标记样本不足条件下的战场态势评估提供了新的解决思路。

猜你喜欢

态势战场向量
历史虚无主义的新近演化态势与特征
2022年全国农作物重大病虫害呈重发态势
向量的分解
战场上的神来之笔
聚焦“向量与三角”创新题
贴秋膘还有三秒到达战场
2019年12月与11月相比汽车产销延续了增长态势
向量垂直在解析几何中的应用
赤焰战场RED2
向量五种“变身” 玩转圆锥曲线