APP下载

类别不平衡条件下的雷达信号识别*

2021-04-25孙艺聪田润澜王晓峰田维群

电讯技术 2021年3期
关键词:查全率编码器分类器

孙艺聪,田润澜,王晓峰,田维群

(空军航空大学 航空作战勤务学院,长春 130022)

0 引 言

雷达信号分类识别[1-2]是电子战领域一个重要的研究方向,在完成信号截获和脉冲参数分析后,需要对信号进行进一步分析,以得到辐射源类型甚至是个体信息,最终获得情报产品。近年来采用深度学习分析脉内调制特性的研究有很多[3-7]。这些方法主要基于两个基本的假设:一是训练集中每种类型样本数量分布大致相同;二是分类错误造成的后果是相同的。然而在现实情况下,由于数据收集方法限制、样本的稀缺性以及噪声干扰等原因,会导致不同类型信号样本数量有很大的差异,而且往往分类错误后所造成的代价通常也不同。尤其是在电子侦察领域,常见的雷达信号类型侦收到的数据有很多,但是对于一些特殊的、威胁程度相对较高的信号类型却很少能被侦察到,得到的数据集不均衡。传统的基于分类准确率指标的方法训练得到的模型分类效果不佳,甚至毫无用处。保证能够准确地识别这些出现概率低且威胁程度高的信号类型,具有十分重要的意义。

针对这个问题,本文提出了一种基于栈式自编码器结合过采样技术支持向量机[8]的分类方法。

1 雷达信号识别流程

本文所提方法的具体流程如图1所示。首先,通过栈式自编码器对中频信号样本集进行特征提取和降维处理,对降维后的数据中的少数类样本采用过采样的方法生成更多数量的少数类样本,使多数类和少数类样本数量达到平衡;然后,利用支持向量机(Support Vector Machine,SVM)对再平衡后的数据集进行分类,寻找最大间距超平面[9];最后,采用F分数和受试者工作特征(Receiver Operating Characteristic,ROC)曲线来评价网络的性能。

图1 雷达信号识别流程图

2 类别不平衡分类

2.1 类别不平衡分类问题概述

当数据集S中的不同类之间样本数相差很大(通常在两个数量级以上),那么S被称为不平衡数据集[10]。常规方法对于不平衡数据集处理得到的模型一般效果不好,对于样本数量少的类别准确度会很低。目前关于类别不平衡问题的研究,主要集中在信用评估[11]、医疗诊断[12]等领域。这些领域对于每一类分错的代价是不一样的,如将患者诊断为健康的代价就可能高于健康人被诊断为患者的代价。雷达信号识别问题也有相似的情况:常见的容易侦收到的雷达信号类型,往往是那些运用在目标探测、远程预警雷达等平台上的,侦察设备可以很容易地侦收到大量的这类信号。而对于一些运用在制导雷达、火控雷达上的信号类型却很难能侦收到,然而这些信号类型威胁程度更高,判错带来的影响也更大。

2.2 评价方法

传统分类模型评价方法一般采用准确率(accuracy)作为评价标准。准确率越高的网络往往性能也越好,然而在数据不平衡的情况下,预测多数类能力的占比可能大于一半,从而掩盖了预测少数类能力比较弱的事实,无法体现模型的真实水平。网络模型偏向于样本数多的类型,造成样本数少的类被大量错分[13],这样的网络不能应用到实际问题中。为了能够恰当地评价网络模型,除了准确率标准外,学者们还提出了一些其他指标,主要有查准率(precision)、查全率(recall)和F分数(F-score),其中F分数是查准率和查全率的调和平均。这三种指标的计算方法如式(1)所示:

(1)

式中:P、R、F分别代表查准率、查全率和F分数;TP、TN、FP、FN分别为真正例、真反例、假正例和假反例的数量;β为调和参数,度量了查全率对查准率的相对重要性,β>1查全率影响更大,β<1查准率影响更大,常用的有F0.5score、F1score和F2score。上述指标主要用于二分类问题,对于多分类任务,在综合考评时就需要引入新的指标,其中最常用的一个指标是宏平均(Macro-averaging)[14],它首先对每一个类统计指标值,然后再对所有类求算数平均值,具体如式(2)所示:

(2)

除了上述指标外,常见的性能评估方法还有受试者工作特征(Receiver Operating Characteristic,ROC)和ROC曲线下面积(Area Under ROC Curve,AUC)[15],图2是其示意图。ROC曲线是一种通过图形展示分类器性能的工具[16],它以真正例率(True Positive Rate ,TPR)和假正例率(False Positive Rate,FPR)为轴,两者的定义分别为

(3)

图2中对角线对应的是“随机猜测”模型的ROC曲线,实线为一个典型的ROC曲线。通过ROC曲线可以较为直观地比较分类器的性能好坏,一般情况下曲线越靠近左上角,网络的性能就越好。然而实际中多个ROC曲线往往会有交叉,无法直接从图像对分类器性能进行比较,这时就可以采用AUC值比较。AUC值越大,性能相对就会越好,可以定量比较分类器性能,一般情况下AUC的值大于0.5,且小于1。

图2 ROC曲线和AUC

AUC的一种计算公式为[17]

(4)

式中:f为模型函数,分母代表正负样本总的组合数,分子代表正样本大于负样本的个数。通过AUC值的大小,可以对比出不同分类模型的性能。

F分数可以对于分类过程中的多数类和少数类合理地进行评价,利用宏平均可以计算得到一个宏F分数,用于对多分类任务进行评价;ROC曲线在样本集分布变化时能够保持不变,能够保证在不平衡数据评价时指标依旧有效;AUC能够量化模型的性能,可以用于在ROC曲线不能直接比较的情况。综上,本文采用F分数、ROC曲线和AUC作为模型的评价指标。

3 栈式自编码器

自编码器(Autoencoder,AE)是一种无监督的学习模型[18]。常规的自编码器一般由三层组成:输入层、隐藏层和输出层。从输入层到隐藏层为编码过程,输出维度一般低于输入维度,可以用作对输入数据的降维,同时还可以作为特征提取器来作为深度学习输入数据的预处理;从隐藏层到输出层为解码过程,主要是通过编码层的输出重建编码器的输出。编码过程可表示为

y=σe(w1x+b1) 。

(5)

解码的过程可以表示为

x′=σd(w2y+b2) 。

(6)

式中:w1、b1为编码器的权重和偏置,w2、b2为解码器的权重和偏置。通过解码器得到的输出与原始输入作为对比,使用均方误差构造损失函数,设置损失函数为

(7)

网络训练采用传统的基于梯度的训练方式,目标是最小化损失函数。当网络训练完成后,网络中的编码结构就是我们需要的网络模型。

为了学到更加复杂的编码特征,一般采用多个自编码器堆叠的结构,这样的自编码器就是栈式自编码器(Stacked Autoencoder,SAE)[19],又叫做堆栈自编码器。它是由多个自编码器得到的。一般采用逐层训练的方式,通过将前一个自编码器的输出作为下一个自编码器的输入,依次训练每一个自编码器,通过分层预训练找到较好的参数,在最后一层训练完成后对整个网络采用方向传播进行训练,对网络参数进行微调。栈式自编码器通过增加隐层可以学到更加复杂的编码方式,每一个隐层可以学习到不同维度的信息,通过增加网络深度并减少每层神经单元数不仅可以学习到输入数据更深层次的特征,还能够有效降低数据的维度,减少计算量。每层网络的神经元个数通常取上一层的神经元个数的一半。本文采用SAE来对原始数据进行特征提取和数据降维。

4 过采样方法

研究表明,通过改变训练集之间的比例,使其重新达到平衡,可以有效改善传统分类方法在这类问题上退化的现象[20]。数据再平衡的方法有很多,如重采样法、集成分类器法和划分训练集法[21],其中最常用的方法就是重采样法。重采样法主要分为欠采样和过采样。欠采样通过删除多数类样本的方法减少多数类的样本数量,但是会导致多数类重要信息的缺失;过采样通过补充小样本来达到增加样本的目的,但是可能会导致过拟合。近年来,通过对过采样方法的改进,学者们提出了几种补充少数类样本的过采样方法,得到了很广泛的应用,主要有以下几种:

(1)随机过采样法(Random Oversampling,ROS)

随机过采样法通过随机复制少数类样本实现样本的平衡,但是由于其引入了重复的样本,有可能导致过拟合现象,这种方法如今使用很少。

(2)合成少数类过采样技术[22](Synthetic Minority Oversampling Technique,SMOTE)

SMOTE通过对少数样本进行分析并人工合成新的样本,本质上是基于“插值”来产生新的样本。

为了达到较好的预测效果,较高级的方法采用有选择的复制少数类样本。一些方法试图寻找每种类别的边界,主要思路是边界和边界附近的样本更容易被分类错误,也意味着对于分类更加重要,而远离边界的样本就显得不那么重要。根据这一思想,提出了Borderline-SMOTE[23]和SVM-SMOTE[24]方法,它们是在原始的SMOTE方法上进行改进,通过一定的规则来选择样本。Borderline-SMOTE方法首先将少数类样本分为三类:安全样本、危险样本和噪声样本。安全样本是指所有的k近邻样本均来自于同一个类;危险样本则是至少有一半的k近邻样本来自于同一类;噪声样本则是指样本的所有k近邻样本都是其他类样本。Borderline-SMOTE更关注那些处在边界的危险样本,只为那些周围大部分是多数类样本的少数类样本生成新样本,生成样本的方法同SMOTE。SVM-SMOTE方法则是利用支持向量机分类器产生支持向量然后再生成新的样本。

(3)自适应综合过采样[25](Adaptive Synthetic Sampling,ADASYN)

ADASYN关注的是在那些基于K最近邻分类器被错误分类的原始样本附近生成新的少数类样本,最大的特点是能够自动决定每个少数类样本需要产生多少合成样本。

少数类样本由于样本数量少,SVM不能够找到足够数量的支持向量,导致少数类边界不明显,所以在对少数类样本进行再平衡时需要重点增加边界和边界附近的样本数量,以此增加少数类的支持向量数量,有助于支持向量机找到更加合理的边界。本文主要采用改进SMOTE方法中的Borderline方法。

5 仿真实验

本文选择8种雷达信号类型,分别是多相码(Frank、P1、P2、P3、P4)、BPSK、Costas和LFM。除Costas外载频取值范围为1~1.2 kHz。表1是这8类信号仿真模型的主要参数。

表1 8种信号参数设置

根据实际信号特征,采用Matlab仿真生成实验数据,信噪比为-10~10 dB,采样点个数为200个。将P2、P4、BPSK、Costas和LFM设为多数类,各产生20 000条数据;Frank、P1和P3设为少数类,各产生200条数据,构成不平衡数据集,少数类和多数类的不平衡度为1∶100,过采样每类少数类信号合成数量为19 800。

实验1 为了说明SAE降维和提取特征的有效性,首先构建含有3层隐藏层的SAE模型(200-100-50-25-3),将本文得到的数据集输入到SAE模型中进行处理,损失函数采用均方差。通过对SAE网络进行训练得到适合的编码器,将数据集利用训练好的编码器进行编码,数据从原始的200维降到了三维,将降维后得到的数据在三维特征空间上的分布进行可视化处理,如图3所示。

图3 三维特征空间数据分布

从图3可以看出,多数类信号在三维特征空间上的分布比较清晰,同一类信号之间能够较好地汇聚到一起,不同类信号之间的界限也相对明显,可以进行有效的分类。另外,由于少数类样本数量较少,相对于多数类汇聚效果不明显,在分类过程中很有可能会被误分为其他类型,导致分类效果不好,这也说明了提高少数类数量的重要性。

为了进一步探索降维维度对分类精度的影响,以编码器最后一层神经单元个数为变量,以网络的macro_F为指标。网络前几层编码单元数按顺序减半,最后一层神经单元数从2个到15个,每种网络结构做5次实验,对5次实验的macro_F取平均值作为最终的结果,实验结果见图4。

图4 不同网络结构的识别能力

从图4中可以看出,随着编码器最后一层神经元个数的不断增加,网络整体的识别能力是先上升然后下降的,在神经元个数为11个时达到最大,随着神经元个数的增加,网络的性能缓慢下降,网络的识别能力不再随着神经元的增加而提升,网络结构为200-100-50-25-11时识别能力较优。

实验2 过采样方法可以有效提高少数类样本的数量。为了比较各种过采样方法的优劣,本文选用5种常见的过采样方法:ROS、SMOTE、Borderline-SMOTE、SVM-SMOTE和ADASYN。分别绘制5种过采样方法的ROC曲线,计算对应的AUC值,然后与不采用任何处理方式的训练结果进行对比,结果如图5和表2所示。从图5结合表2可以明显看出,采用原始数据训练得到的SVM网络性能一般,AUC值只有0.827 07,分类器整体的效果并不好,而通过5种过采样方法处理后的数据集训练得到的SVM网络性能均有所提升,AUC值均在0.9以上,分类性能有了明显改善。其中经过Borderline-SMOTE处理后的数据集训练得到的分类器的性能更好,原因是当处理不平衡数据时,由于少数类的支持向量更少,支持向量机就会忽略少数类支持向量导致决策面出现偏移,学习时决策面易于偏向少数类,从而增加了少数类别的错误分类率,而Borderline-SMOTE方法更注重于对少数类边界样本的生成,从一方面增加了少数类的支持向量数量,SVM的超平面位置选择会更加合理。

图5 ROC曲线对比图

表2 各类处理方法的AUC值

实验3 对于雷达侦察领域来说,尤其是在少数类错分代价更大的情况下,往往需要少漏掉少数类样本,这时候就需要尽可能地提高查全率以减少少数类样本被错分的概率。可以用F2score来作为评价的标准。为了验证过采样方法的效果,分别计算Borderline-SMOTE过采样方法训练得到的分类器和原始数据训练得到的分类器在不同信噪比下的F2score,结果如图6所示。图6(a)是通过不平衡数据集训练得到的SVM分类器的识别结果,从图中可以看出,三类少数类信号类型的F分数值相较于其他类型信号较低,尤其是Frank和P1两类信号的识别精度最大也不超过40%,这样的网络在实际应用中效果不好。多数类信号识别结果也不是很好。这是由于少数类数量较少,少数类边界不明显,分类器在分类过程中将少数类误分为多数类,导致各类信号F分数普遍不高。图6(b)是利用经过Borderline-SMOTE方法处理后的数据集训练得到的分类器在各信噪比下的F分数,从图中可以看出,少数类和多数类的F分数均有所提高,且各类信号整体趋势接近,识别能力相差不大,证明了过采样方法处理的有效性。

(a)基于原始数据的识别结果

另外,图6中两种识别结果均出现了高信噪比情况下F分数比低信噪比F分数低的现象,分析原因在于本文采用的评价标准F2score是由查准率和查全率共同作用的,查全率所占的比重更大,而查准率和查全率是一对矛盾的指标,查准率高的情况下往往查全率较低,所以会导致出现信噪比高的情况下F分数低于信噪比低的情况,但是从整体上看F分数是上升的。

6 结束语

本文提出了一种利用SAE和SVM结合过采样方法对不平衡雷达信号分类的方法,运用在信号调制方式识别上,并通过实验进行了验证。实验结果表明,通过过采样方法可以有效提高不平衡分类问题中少数类分类效果,在保证了较高准确率的同时也提高了少数类准确率,改善了传统方法中少数类准确度不高的问题。但是还是存在低信噪比条件下识别准确率不高的问题,在选取更合适的样本均衡方法和进一步优化网络结构等方面还有进一步提升的空间。

猜你喜欢

查全率编码器分类器
海量图书馆档案信息的快速检索方法
基于FPGA的同步机轴角编码器
基于双增量码道的绝对式编码器设计
基于词嵌入语义的精准检索式构建方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
JESD204B接口协议中的8B10B编码器设计
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
多总线式光电编码器的设计与应用
多重决策树并行组合分类器设计及其应用研究