APP下载

基于改进CNN的HRRP目标识别方法

2022-09-13李月琴张红莉米雅洁修丽梅

兵器装备工程学报 2022年8期
关键词:识别率分类器特征提取

李月琴,张红莉,张 维,米雅洁,修丽梅

(北京联合大学 智慧城市学院, 北京 100101)

1 引言

高分辨距离像(HRRP)是雷达各距离单元目标散射回波的矢量和,反映了目标散射点沿雷达径向距离方向上的分布情况,同时包含了丰富的目标结构、形状和尺寸信息[1]。与SAR图像和ISAR图像相比,HRRP更易于处理和获取[2],因此成为雷达自动目标识别领域的研究热点。

传统的HRRP目标识别方法主要有:自适应高斯分类器模型、K近邻法(KNN)、因子分析模型[3]、字典学习[4]、支持向量机(SVM)等[5]。但目前传统的识别方法主要基于雷达数据的浅层结构特征,难以避免造成部分信息的丢失,以致最终的HRRP目标识别精度有限。深度学习已在图像和语音等领域得到成功应用[6-7],因此部分学者开始研究基于深度学习的HRRP目标识别算法。与传统识别方法相比,深度学习算法能自主学习更高层次的结构信息,完成不同目标的分类与识别。典型应用的方法有卷积神经网络(CNN)、堆栈自动编码器(SAE)、循环神经网络(RNN)、深度置信网络(DBN)等[8-11]。其中,CNN能将特征提取和基于特征的分类识别相结合,它能够通过卷积的方式从HRRP信号中提取更高层次的特征信息,挖掘潜在的数据关联信息。目前 CNN 已经被有效运用于RATR领域[12]。文献[13]将CNN应用于军用和民用车辆的HRRP识别,对样本的距离像进行了32次复制,将一维距离像数据转换成二维图像数据。但该类方法只是单纯地复制距离像,并没有增加距离像的特征信息,虽然有利于CNN的搭建,但是增大了计算量。文献[14]通过直接搭建专门处理一维距离像的卷积神经网络,成功解决了多基地雷达系统中的 HRRP 识别问题,但是提出的网络模型只是简单地堆叠,其特征提取能力有待进一步研究,仅适用于单一场景,其泛化能力非常有限。文献[15]针对地面目标HRRP识别问题,提出一种基于CNN的HRRP序列识别算法。在两类地面车辆目标的识别准确率分别达到92.50%和90.00%,且识别结果明显高于传统的决策树算法。

但针对HRRP目标识别的CNN结构的设计依然有待改进,因此本文中设计了一种适合HRRP样本数据的改进CNN模型。在处理小数据集时,由于复杂的网络模型和数据源的有限特征等因素,CNN在训练过程中往往会导致损失函数收敛过慢,针对该情况,将批归一化(BN)算法引入CNN模型,从而加速网络收敛;为进一步提高目标分类能力,设计LGBM分类器对CNN提取的高层次特征进行训练预测。通过实验验证,改进CNN有效提高了模型的分类性能,进一步提升了HRRP目标识别率。

2 数据预处理

2.1 信号预处理

(1)

(2)

对距离像样本进行归一化处理以及降噪处理后,目标所在位置是能量聚集处,幅值较高,因此可以采用门限法将目标所在片段截取出来。

2.2 HRRP特征提取

HRRP信号是一种高分辨率雷达信号,其维数通常在上百维以上,直接利用原始HRRP信号进行雷达自动目标识别,不仅会消耗大量计算机内存资源,而且由于使用了大量冗余信息,雷达自动目标识别的速度也会降低[18]。

不同的特征侧重表达距离像不同维度的统计特性,多个特征之间互有补充,因此相较于利用单一特征识别目标,提取多个特征能更有效地提高目标的识别精度。HRRP信号中包含有关目标几何结构、组成、峰值数量等丰富信息,因此,雷达HRRP目标识别中最经典的特征提取方法是直接从原始HRRP信号中提取具有物理意义的特征,如目标的长度、目标强散射点的数目、强散射点之间的距离、HRRP径向能量等、散射中心分布熵等;其次,一维距离像的平均值、均方差、对称性与分散性程度等其他特征,可以从数学分析的角度反映出目标的统计特性;另外,为了有效对抗一维距离像的平移敏感性,可以提取频谱及功率谱等平移不变特征。

经过上述分析,本文从预处理后的HRRP中提取了13个具有代表性、能较好反映目标本质特性的特征,分别是功率谱特征、目标径向长度、强散射中心数目[19]、二阶中心矩、三阶中心矩、散射中心分布熵、平均值与方差、目标平均起伏特性、对称性与分散性、去尺度结构特征以及目标径向能量。

3 基于改进CNN的雷达目标识别

3.1 CNN基本原理

卷积神经网络(CNN)是一种包含卷积计算的前馈神经网络,经典的CNN网络主要由卷积层、池化层、全连接层组成[20],如图1所示。

图1 卷积神经网络的典型结构示意图Fig.1 Typical structure of CNN

卷积层用于对输入数据进行特征提取,可以包含多个卷积核。每个通道的卷积核对输入数据进行卷积运算,并添加偏差值,最后通过激活函数得到输出特征向量。第d个卷积层的第j个输出特征图映射可以表示为

(3)

CNN结构的卷积层之间需要周期性地引入池化层,进行特征选择。常采用最大池化方式,将一个区域中的最大值作为池化输出,以减小数据维数,减少冗余信息并减少计算量。最大池化函数的表达式为

(4)

其中,l=0,1,…,(N-1)/s,N为输入数据的维数,s为步长,r为池化窗口的大小。

CNN利用全连接层将提取的特征向量映射到类。全连接层可将上一层得到的特征按顺序进行排列得到一维向量,将其输入给Softmax分类器,并在分类器层处理后得到CNN的输出。在Softmax分类过程中,输入数据x被预测为类别j的概率为

(5)

其中,t=1,2,…,C,zt为全连接层输出向量z的第t个分量,C为目标类别数,Pt(z)代表了当前样本属于第t类目标的概率。

CNN在训练网络时采用反向传播算法,致力于最大限度地减小网络的损失函数。常选择交叉熵函数,即:

(6)

用于描述网络预测值与目标真实值之间的误差。式中θ表示网络所有的权值和偏置,C为目标类别数,S为样本数量,xi表示输入的第i个目标HRRP数据,yi表示第i个目标的输出层标签向量,Ut(xi;θ)为CNN的第t个输出。

3.2 改进CNN

与传统机器学习方法相比,CNN可以从简单的特征中挖掘出更复杂的特征,并用它们来解决问题。因此本文采用CNN来对HRRP特征样本进行更深层次的特征挖掘与目标识别,以提高雷达目标识别率。另外,虽然CNN中的Softmax也可以进行分类和预测,但让模型既提取特征又进行分类会使模型的泛化能力变弱,因此考虑让CNN模型单独提取特征,用LGBM模型作为分类器进行预测。这样就把CNN的特征提取功能和LGBM的分类预测能力结合起来,使模型结构具有更好的识别精度。

3.2.1 本文设计的网络结构

CNN通常由多层网络组成,往往通过增加网络的深度和宽度来提升网络性能。网络层过多会导致过拟合,计算复杂度增加,但网络层数不足也会导致无法有效提取特征,从而影响网络的整体识别性能。因此,有必要根据数据来设计网络结构。由于典型的CNN主要用于图像识别,且数据形式为二维,而HRRP数据是一维向量,因此根据HRRP数据的特点,本文采用了一维CNN结构用于雷达HRRP目标识别。根据所采用的数据集的特点,本文设计的基于雷达HRRP目标特征向量的改进CNN模型结构如图2所示。

图2 基于雷达HRRP目标特征向量的改进CNN模型结构框图Fig.2 Diagram of improved CNN architecture based on radar HRRP target feature vectors

考虑在不影响网络性能的同时,计算量应尽可能小,本文设计的网络包含两个特征提取块和一个全连接层。其中,特征提取块部分包括两个卷积层、两个BN层和一个池化层。利用卷积层对输入HRRP数据进行深层特征提取,所有卷积核大小为3*1,步长为1。池化层的池化窗口尺寸为2*1,步长为2,经过计算输出特征向量大小为输入特征向量的一半,实现特征选择和数据降维。为了解决损失函数收敛过慢问题,在每个卷积层后引入一个BN层来加速网络收敛。然后利用全连接层将提取的特征向量映射到标记空间,最后输出分类结果。

3.2.2 利用BN加快收敛速度

CNN在处理小数据集时,由于网络模型复杂,数据源提供的特征有限等因素,在训练过程中往往会导致损失函数收敛过慢问题。由于网络各层的输入并不符合独立同分布假设,因此训练过程中各层的参数将发生变化,而且这些变化会随着网络层的叠加而被放大。因此上一层网络必须不停调参以适应新的分布,这使得网络难以收敛。而引入批归一化(batch normalization,BN)算法可以解决这个问题,它使各层网络在CNN训练过程中都保持相同分布,从而在保证归一化的同时减少了计算量,并保留了模型的表达能力。

假设CNN中某一层的输入数据为{x1,x2,…,xm},并且这组小样本数据的数量为m,使用BN算法对输入数据进行批归一化处理,输出数据为{y1,y2,…,ym}。训练阶段批归一化算法的具体计算如下:

(7)

(8)

(9)

(10)

引入BN算法后,保证了每层输入数据的相对稳定性,提升了训练速度;减弱了网络对训练参数的敏感性,即使选择初始较大的学习率,也不会造成过拟合。

3.2.3 利用LGBM提高分类性能

虽然卷积神经网络的Softmax 层也可以进行分类和预测,但是让模型既提取特征又进行分类会使模型的泛化能力变弱。基于以上考虑,本文在设计目标识别算法时,让CNN单独提取特征,而设计另一个分类器模型用于分类预测。

梯度提升树(GBDT)是通过多次迭代训练来提升学习器性能,但当数据越来越多,越来越复杂时,其计算开销很大,难以在精度和效率之间达到一个比较好的平衡。LGBM是一种改进的GBDT算法,它不但降低了计算开销,提升了模型的计算效率,而且在维持较快训练速度的同时还能获得更好的精度,其基本思想是把许多准确率较低的树模型结合起来。每次迭代都会产生一棵新树,经过不断迭代,最终得到一棵较优的树,并作为预测模型。相较于传统 GBDT 算法,LGBM为了提升分类性能进行了以下改进。

1) 使用Leaf-wise决策树生长策略以减少损失。LGBM使用Leaf-wise策略实现决策树的生长,如图3所示。每次对当前分裂增益最大的叶子结点进行分裂,如此循环[21]。相比传统GBDT使用的level-wise策略,当分裂次数相同时,Leaf-wise策略可以减少更多误差,达到更高的精度。因此使用Leaf-wise策略的LGBM分类器,可以有效减少损失,从而提高分类精度。

图3 Leaf-wise策略叶子节点分裂过程示意图Fig.3 Leaf-wise strategy leaf node splitting process

2) 使用直方图算法寻找类别特征最优分割点。LGBM采用直方图算法对类别特征值进行最优分割[22-23]。首先将浮点连续特征值离散为k个整数,构造宽度为k的直方图。当遍历数据时,统计数据以离散值为索引累积在直方图中,之后根据直方图的离散值进行遍历,寻找最优分割点。如图4所示,它将原本#data个数据离散成k个直方图中,使得LGBM在计算分裂增益上的时间复杂度从O(#data×#features)减少到O(k×#features)。因此LGBM使用直方图算法寻找类别特征值的最优分割,在加快了算法的训练速度的同时也减少了内存开销。

图4 特征值直方图化示意图Fig.4 The process of feature histogram

3.2.4 LGBM分类器建模过程

图5描述了基于改进CNN的雷达HRRP目标识别方法中LGBM分类器训练的主要过程。

如图5所示,对所述LGBM分类器进行训练包括以下步骤:

图5 LGBM分类器建模过程框图Fig.5 LGBM classifier modelling process

2) 初始化s棵LGBM基分类决策树,为每个样本赋予1/s的权重,并从训练集进行子采样,以形成每个弱分类器所需要的子训练集;

3) 训练弱分类器hr(x)并计算误差,然后重新调整训练样本的权重,并确定当前弱分类器hr(x)的权重αr;

4) 更新权重后,进入下一次迭代,并在每次迭代时,使用梯度下降法在损失函数的负梯度上移动,以最小化损失函数;

5) 重复步骤3)和4),当达到最大迭代次数s时,得到不同弱分类器的预测结果,以及各分类器对应的权重,并将弱分类器合并为强分类器:H(x)=α1h1(x)+α2h2(x)+α3h3(x)+…+αrhr(x)+…+αshs(x)并以此作为预测模型。其中s为算法最大迭代次数,r为第r轮迭代,1≤r≤s,hr(x)为第r次迭代训练产生的分类器。

在识别阶段,用训练好的CNN模型提取待识别样本的深层特征,输入给上述训练好的LGBM分类器预测模型,以获得目标识别结果。

4 实验

4.1 数据处理

为了验证本文所提方法的有效性,分别基于仿真数据和实测数据在不同识别方法下进行了HRRP目标识别测试。

4.1.1 仿真数据处理

基于目标散射中心模型,对立方体、长方体、四棱锥和六棱柱四类目标进行了回波的仿真,其中立方体边长为10 m;长方体底面长10 m,宽6 m,高6 m;四棱锥底面边长10 m,高10 m;六棱柱底面边长5 m,高10 m。探测器选用线性调频连续波雷达,因为C波段在抗雨衰、防雾霾方面优势明显,仿真模拟的探测器拟定为C波段线性调频雷达,关于雷达与探测环境的基本参数,如表1所示。

表1 探测器的基本参数Table 1 Basic parameters of the detector

探测距离为60 m,探测角度0~360°被平均分为72个角域,利用雷达依次采集每个角域内四类目标的1~10个雷达回波信号,将其转换为HRRP信号。当探测距离R=60 m,探测角度在0~5°时,四类目标的HRRP如图6所示。

图6 四类目标的一维距离像Fig.6 One-dimensional distance images of four types of targets

为了抑制噪声对目标信号的影响,对同一段差拍信号得到的9段HRRP进行平均距离曲线处理,得到一段新的距离曲线,四类目标的平均距离曲线如图7。与未进行降噪处理的HRRP相比,平均距离像中的噪声得到了抑制,目标信号明显突出,信噪比明显增强。

图7 四类目标的平均距离曲线Fig.7 Average range profile of four types of targets

然后对平均距离像进行最大值归一化处理,以抑制幅值敏感性,此时,所有的HRRP数据均处于0~1的范围内。之后采用自适应门限法设定门限以提取目标所处的HRRP片段,并对截取出的每一个HRRP有效片段依次提取13个特征分量,该13个数字特征作为训练数据集的一个样本。同样的方法,再对每类目标另取 7 200个识别样本,用于检验目标识别效果。

4.1.2 实测数据处理

实测试验的主要设备包括电源、探测器、被探测目标以及数据处理中心,如图8所示,测试场地为校园内某条道路。探测器为线性调频探测器,距离分辨率为0.3 m。被探测目标是两种地面车辆目标,如图9所示。被探测目标在距离探测器40 m处绕中心转动使探测角度发生变化,利用探测器共采集了36个探测角度的数据,每个探测角度下采集2组数据,每组数据包含500段差拍信号,并将其转换为HRRP信号。

图8 实测试验探测地点实景图Fig.8 Real map of actual test detection location

图9 被探测目标图Fig.9 Detected target

下面举例说明采集的数据,图10为当探测距离为40 m时两类车辆目标的原始距离曲线,可以发现目标的HRRP信号不突出,被淹没在噪声中。

图10 两类目标的原始距离曲线Fig.10 Original range profiles of two targets

对实测HRRP信号进行降噪处理,得到两类车辆目标的平均距离曲线,如图11所示,可以发现在35~40 m处峰值最强,说明此处存在目标。

图11 两类目标的平均距离曲线Fig.11 Average range profile of two targets

然后对平均距离像进行最大值归一化处理,使得所有的HRRP幅值均处于0~1的范围内。之后采用单元平均虚警率(CA-CFAR)方法提取目标所处的HRRP有效片段,并对截取出的每一个HRRP有效片段依次提取13个特征分量,作为训练数据集的样本。

4.2 实验结果

4.2.1 特征提取有效性验证

为了验证人工提取特征的有效性,分别使用改进前后CNN和传统识别方法GBDT、SVM、KNN,在实测车辆目标的原始HRRP数据和特征提取后的数据上进行了目标识别测试。

图12表示经特征提取前后不同方法的识别结果。可见,经特征提取后,所有算法的目标识别率都有提升,说明通过特征提取能够获得反映目标特性的有效信息,比未提取特征的原始HRRP更利于分类识别。另外,无论是特征提取前还是特征提取后,改进CNN的识别性能始终优于其他对比方法,说明所提的改进CNN方法能够有效提高目标识别率。

图12 基于实测数据特征提取前后不同方法的识别效果曲线Fig.12 Recognition effect of different methods before and after feature extraction based on measured data

图13表示经特征提取前后不同识别方法的测试时间结果。与特征提取前相比,对HRRP进行特征提取后再作为输入,改进CNN和CNN-Softmax的测试时间分别缩短了约0.1 s和0.13 s,GBDT、KNN和SVM的识别速度也有明显提升。综上,在进行HRRP目标识别时,首先对HRRP数据进行特征提取能够有效提高识别率,同时也能提升识别速度。

图13 基于实测数据特征提取前后不同方法的测试时间曲线Fig.13 Testing time of different methods before and after feature extraction based on measured data

4.2.2 引入BN算法收敛性验证

当采用本文提出的基本CNN网络结构时,随着迭代次数变化,未引入BN算法和引入BN算法的网络损失函数变化曲线如图14。

图14 训练集和验证集损失函数变化曲线Fig.14 Loss function variation curves for the training and validation sets

可见,在训练阶段,引入BN算法的CNN损失值小于未引入BN的网络损失。尤其是在训练初期,引入BN算法的网络损失函数减小得更快,这说明BN算法可以有效地解决训练过程中损失函数收敛过慢问题。因此在CNN网络引入BN算法能够加快网络的收敛速度,更利于提升模型的识别性能。

4.2.3 所提算法目标识别性能验证

为验证所设计的改进卷积神经网络模型对HRRP目标识别的性能优势,进行了两个对比实验。一是CNN-Softmax与改进CNN的对比试验。其中CNN-Softmax和改进CNN为采用本文设计的卷积神经网络提取深层特征,分别使用Softmax和本文设计的LGBM对所提特征进行分类的方法。二是改进CNN与其他分类方法的对比试验。在对比不同算法模型时,需要使用统一的衡量算法能力的评价标准。针对雷达HRRP目标的分类识别,本文从目标层面计算平均正确识别率Pa,来衡量分类模型的识别性能。其定义如下:

(11)

其中,C为目标类别数,Tj为第j类目标被准确识别的样本数,Nj为被判为第类目标的样本数。

1) CNN-Softmax与改进CNN的性能对比

表2是在相同的实验条件下,在4类仿真目标上2种方法随样本量变化的条件下平均正确识别率,可以看出,无论训练样本量多少,改进CNN的目标识别率要高于CNN-Softmax,且在样本量少时,也能保持较好的识别精度。

表2 不同训练样本量下2种方法的识别结果Table 2 Identification result of the two methods under different training sample sizes

图15为改进CNN与CNN-Softmax随样本量变化时的测试时间曲线,可见,改进CNN的测试时间明显低于CNN-Softmax。因为当CNN模型提取深层特征后,LGBM在寻找特征的最优分裂点和减少样本数方面进行了优化,从而提高了分类的准确率和时间效率,增强了HRRP目标识别性能。综上,改进CNN既有效提高了目标识别率,也明显提升了识别速度。

图15 随样本量变化改进前后CNN的测试时间曲线Fig.15 Comparison of CNN test time before and after improvement with sample size change

2) 所提算法与其他识别方法的对比

为进一步验证所提出的改进CNN算法的有效性,分别基于仿真数据和实测数据,将本文方法与CNN-Softmax和传统识别方法GBDT、SVM、KNN进行对比。

表3是不同识别方法分别在仿真数据和实测数据上的目标识别结果。在仿真数据上,改进前CNN使用Softmax做分类时的平均识别率为98.14%,改进CNN用LGBM做分类时的平均识别率提高到了99.17%,比改进前提高约1%,同时明显高于传统识别方法GBDT、SVM和KNN。在实测数据上,改进CNN的平均识别率为89.66%,比改进前CNN提高4.6%,且明显高于传统识别方法GBDT、SVM和KNN。可见,改进CNN的目标识别性能均优于改进前CNN及其他传统识别方法,再次验证了本文所提目标识别算法确实能增强HRRP目标识别性能。

表3 不同分类方法的识别结果Table 3 Identification results of different classification methods

5 结论

本文提出了一种基于改进CNN的HRRP目标识别方法。采用一维CNN对HRRP样本进行深层特征提取和目标识别,在构建CNN时引入BN算法加快了损失函数的收敛速度;设计了LGBM分类器作为CNN的分类层,有效提高HRRP识别率和识别速度,提升了模型的识别性能。通过与改进前CNN和传统识别方法的对比实验,表明所提的改进CNN在提高目标识别率的同时也有效提升了识别速度,可为后续进行HRRP目标识别提供参考。

猜你喜欢

识别率分类器特征提取
同步定位与建图特征提取和匹配算法研究
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于AdaBoost算法的在线连续极限学习机集成算法
基于曲率局部二值模式的深度图像手势特征提取
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别