基于改进CNN的HRRP目标识别方法

2022-09-13李月琴张红莉米雅洁修丽梅

兵器装备工程学报 2022年8期

李月琴，张红莉，张维，米雅洁，修丽梅

(北京联合大学智慧城市学院，北京 100101)

1 引言

高分辨距离像(HRRP)是雷达各距离单元目标散射回波的矢量和，反映了目标散射点沿雷达径向距离方向上的分布情况，同时包含了丰富的目标结构、形状和尺寸信息[1]。与SAR图像和ISAR图像相比，HRRP更易于处理和获取[2]，因此成为雷达自动目标识别领域的研究热点。

传统的HRRP目标识别方法主要有：自适应高斯分类器模型、K近邻法(KNN)、因子分析模型[3]、字典学习[4]、支持向量机(SVM)等[5]。但目前传统的识别方法主要基于雷达数据的浅层结构特征，难以避免造成部分信息的丢失，以致最终的HRRP目标识别精度有限。深度学习已在图像和语音等领域得到成功应用[6-7]，因此部分学者开始研究基于深度学习的HRRP目标识别算法。与传统识别方法相比，深度学习算法能自主学习更高层次的结构信息，完成不同目标的分类与识别。典型应用的方法有卷积神经网络(CNN)、堆栈自动编码器(SAE)、循环神经网络(RNN)、深度置信网络(DBN)等[8-11]。其中，CNN能将特征提取和基于特征的分类识别相结合，它能够通过卷积的方式从HRRP信号中提取更高层次的特征信息，挖掘潜在的数据关联信息。目前 CNN 已经被有效运用于RATR领域[12]。文献[13]将CNN应用于军用和民用车辆的HRRP识别，对样本的距离像进行了32次复制，将一维距离像数据转换成二维图像数据。但该类方法只是单纯地复制距离像，并没有增加距离像的特征信息，虽然有利于CNN的搭建，但是增大了计算量。文献[14]通过直接搭建专门处理一维距离像的卷积神经网络，成功解决了多基地雷达系统中的 HRRP 识别问题，但是提出的网络模型只是简单地堆叠，其特征提取能力有待进一步研究，仅适用于单一场景，其泛化能力非常有限。文献[15]针对地面目标HRRP识别问题，提出一种基于CNN的HRRP序列识别算法。在两类地面车辆目标的识别准确率分别达到92.50%和90.00%，且识别结果明显高于传统的决策树算法。

但针对HRRP目标识别的CNN结构的设计依然有待改进，因此本文中设计了一种适合HRRP样本数据的改进CNN模型。在处理小数据集时，由于复杂的网络模型和数据源的有限特征等因素，CNN在训练过程中往往会导致损失函数收敛过慢，针对该情况，将批归一化(BN)算法引入CNN模型，从而加速网络收敛；为进一步提高目标分类能力，设计LGBM分类器对CNN提取的高层次特征进行训练预测。通过实验验证，改进CNN有效提高了模型的分类性能，进一步提升了HRRP目标识别率。

2 数据预处理

2.1 信号预处理

(1)

(2)

对距离像样本进行归一化处理以及降噪处理后，目标所在位置是能量聚集处，幅值较高，因此可以采用门限法将目标所在片段截取出来。

2.2 HRRP特征提取

HRRP信号是一种高分辨率雷达信号，其维数通常在上百维以上，直接利用原始HRRP信号进行雷达自动目标识别，不仅会消耗大量计算机内存资源，而且由于使用了大量冗余信息，雷达自动目标识别的速度也会降低[18]。

不同的特征侧重表达距离像不同维度的统计特性，多个特征之间互有补充，因此相较于利用单一特征识别目标，提取多个特征能更有效地提高目标的识别精度。HRRP信号中包含有关目标几何结构、组成、峰值数量等丰富信息，因此，雷达HRRP目标识别中最经典的特征提取方法是直接从原始HRRP信号中提取具有物理意义的特征，如目标的长度、目标强散射点的数目、强散射点之间的距离、HRRP径向能量等、散射中心分布熵等；其次，一维距离像的平均值、均方差、对称性与分散性程度等其他特征，可以从数学分析的角度反映出目标的统计特性；另外，为了有效对抗一维距离像的平移敏感性，可以提取频谱及功率谱等平移不变特征。

经过上述分析，本文从预处理后的HRRP中提取了13个具有代表性、能较好反映目标本质特性的特征，分别是功率谱特征、目标径向长度、强散射中心数目[19]、二阶中心矩、三阶中心矩、散射中心分布熵、平均值与方差、目标平均起伏特性、对称性与分散性、去尺度结构特征以及目标径向能量。

3 基于改进CNN的雷达目标识别

3.1 CNN基本原理

卷积神经网络(CNN)是一种包含卷积计算的前馈神经网络，经典的CNN网络主要由卷积层、池化层、全连接层组成[20]，如图1所示。

图1 卷积神经网络的典型结构示意图Fig.1 Typical structure of CNN

卷积层用于对输入数据进行特征提取，可以包含多个卷积核。每个通道的卷积核对输入数据进行卷积运算，并添加偏差值，最后通过激活函数得到输出特征向量。第d个卷积层的第j个输出特征图映射可以表示为

(3)

CNN结构的卷积层之间需要周期性地引入池化层，进行特征选择。常采用最大池化方式，将一个区域中的最大值作为池化输出，以减小数据维数，减少冗余信息并减少计算量。最大池化函数的表达式为

(4)

其中，l=0,1,…,(N-1)/s，N为输入数据的维数，s为步长，r为池化窗口的大小。

CNN利用全连接层将提取的特征向量映射到类。全连接层可将上一层得到的特征按顺序进行排列得到一维向量，将其输入给Softmax分类器，并在分类器层处理后得到CNN的输出。在Softmax分类过程中，输入数据x被预测为类别j的概率为

(5)

其中，t=1,2,…,C，zt为全连接层输出向量z的第t个分量，C为目标类别数，Pt(z)代表了当前样本属于第t类目标的概率。

CNN在训练网络时采用反向传播算法，致力于最大限度地减小网络的损失函数。常选择交叉熵函数，即：

(6)

用于描述网络预测值与目标真实值之间的误差。式中θ表示网络所有的权值和偏置，C为目标类别数，S为样本数量，xi表示输入的第i个目标HRRP数据，yi表示第i个目标的输出层标签向量，Ut(xi;θ)为CNN的第t个输出。

3.2 改进CNN

与传统机器学习方法相比，CNN可以从简单的特征中挖掘出更复杂的特征，并用它们来解决问题。因此本文采用CNN来对HRRP特征样本进行更深层次的特征挖掘与目标识别，以提高雷达目标识别率。另外，虽然CNN中的Softmax也可以进行分类和预测，但让模型既提取特征又进行分类会使模型的泛化能力变弱，因此考虑让CNN模型单独提取特征，用LGBM模型作为分类器进行预测。这样就把CNN的特征提取功能和LGBM的分类预测能力结合起来，使模型结构具有更好的识别精度。

3.2.1 本文设计的网络结构

CNN通常由多层网络组成，往往通过增加网络的深度和宽度来提升网络性能。网络层过多会导致过拟合，计算复杂度增加，但网络层数不足也会导致无法有效提取特征，从而影响网络的整体识别性能。因此，有必要根据数据来设计网络结构。由于典型的CNN主要用于图像识别，且数据形式为二维，而HRRP数据是一维向量，因此根据HRRP数据的特点，本文采用了一维CNN结构用于雷达HRRP目标识别。根据所采用的数据集的特点，本文设计的基于雷达HRRP目标特征向量的改进CNN模型结构如图2所示。

图2 基于雷达HRRP目标特征向量的改进CNN模型结构框图Fig.2 Diagram of improved CNN architecture based on radar HRRP target feature vectors

考虑在不影响网络性能的同时，计算量应尽可能小，本文设计的网络包含两个特征提取块和一个全连接层。其中，特征提取块部分包括两个卷积层、两个BN层和一个池化层。利用卷积层对输入HRRP数据进行深层特征提取，所有卷积核大小为3*1，步长为1。池化层的池化窗口尺寸为2*1，步长为2，经过计算输出特征向量大小为输入特征向量的一半，实现特征选择和数据降维。为了解决损失函数收敛过慢问题，在每个卷积层后引入一个BN层来加速网络收敛。然后利用全连接层将提取的特征向量映射到标记空间，最后输出分类结果。

3.2.2 利用BN加快收敛速度

CNN在处理小数据集时，由于网络模型复杂，数据源提供的特征有限等因素，在训练过程中往往会导致损失函数收敛过慢问题。由于网络各层的输入并不符合独立同分布假设，因此训练过程中各层的参数将发生变化，而且这些变化会随着网络层的叠加而被放大。因此上一层网络必须不停调参以适应新的分布，这使得网络难以收敛。而引入批归一化(batch normalization,BN)算法可以解决这个问题，它使各层网络在CNN训练过程中都保持相同分布，从而在保证归一化的同时减少了计算量，并保留了模型的表达能力。

假设CNN中某一层的输入数据为{x1,x2,…,xm}，并且这组小样本数据的数量为m，使用BN算法对输入数据进行批归一化处理，输出数据为{y1,y2,…,ym}。训练阶段批归一化算法的具体计算如下：

(7)

(8)

(9)

(10)

引入BN算法后，保证了每层输入数据的相对稳定性，提升了训练速度；减弱了网络对训练参数的敏感性，即使选择初始较大的学习率，也不会造成过拟合。

3.2.3 利用LGBM提高分类性能

虽然卷积神经网络的Softmax 层也可以进行分类和预测，但是让模型既提取特征又进行分类会使模型的泛化能力变弱。基于以上考虑，本文在设计目标识别算法时，让CNN单独提取特征，而设计另一个分类器模型用于分类预测。

梯度提升树(GBDT)是通过多次迭代训练来提升学习器性能，但当数据越来越多，越来越复杂时，其计算开销很大，难以在精度和效率之间达到一个比较好的平衡。LGBM是一种改进的GBDT算法，它不但降低了计算开销，提升了模型的计算效率，而且在维持较快训练速度的同时还能获得更好的精度，其基本思想是把许多准确率较低的树模型结合起来。每次迭代都会产生一棵新树，经过不断迭代，最终得到一棵较优的树，并作为预测模型。相较于传统 GBDT 算法，LGBM为了提升分类性能进行了以下改进。

1) 使用Leaf-wise决策树生长策略以减少损失。LGBM使用Leaf-wise策略实现决策树的生长，如图3所示。每次对当前分裂增益最大的叶子结点进行分裂，如此循环[21]。相比传统GBDT使用的level-wise策略，当分裂次数相同时，Leaf-wise策略可以减少更多误差，达到更高的精度。因此使用Leaf-wise策略的LGBM分类器，可以有效减少损失，从而提高分类精度。

图3 Leaf-wise策略叶子节点分裂过程示意图Fig.3 Leaf-wise strategy leaf node splitting process

2) 使用直方图算法寻找类别特征最优分割点。LGBM采用直方图算法对类别特征值进行最优分割[22-23]。首先将浮点连续特征值离散为k个整数，构造宽度为k的直方图。当遍历数据时，统计数据以离散值为索引累积在直方图中，之后根据直方图的离散值进行遍历，寻找最优分割点。如图4所示，它将原本#data个数据离散成k个直方图中，使得LGBM在计算分裂增益上的时间复杂度从O(#data×#features)减少到O(k×#features)。因此LGBM使用直方图算法寻找类别特征值的最优分割，在加快了算法的训练速度的同时也减少了内存开销。

图4 特征值直方图化示意图Fig.4 The process of feature histogram

3.2.4 LGBM分类器建模过程

图5描述了基于改进CNN的雷达HRRP目标识别方法中LGBM分类器训练的主要过程。

如图5所示，对所述LGBM分类器进行训练包括以下步骤：

图5 LGBM分类器建模过程框图Fig.5 LGBM classifier modelling process

2) 初始化s棵LGBM基分类决策树，为每个样本赋予1/s的权重，并从训练集进行子采样，以形成每个弱分类器所需要的子训练集；

3) 训练弱分类器hr(x)并计算误差，然后重新调整训练样本的权重，并确定当前弱分类器hr(x)的权重αr；

4) 更新权重后，进入下一次迭代，并在每次迭代时，使用梯度下降法在损失函数的负梯度上移动，以最小化损失函数；

5) 重复步骤3)和4)，当达到最大迭代次数s时，得到不同弱分类器的预测结果，以及各分类器对应的权重，并将弱分类器合并为强分类器：H(x)=α1h1(x)+α2h2(x)+α3h3(x)+…+αrhr(x)+…+αshs(x)并以此作为预测模型。其中s为算法最大迭代次数，r为第r轮迭代，1≤r≤s，hr(x)为第r次迭代训练产生的分类器。

在识别阶段，用训练好的CNN模型提取待识别样本的深层特征，输入给上述训练好的LGBM分类器预测模型，以获得目标识别结果。

4 实验

4.1 数据处理

为了验证本文所提方法的有效性，分别基于仿真数据和实测数据在不同识别方法下进行了HRRP目标识别测试。

4.1.1 仿真数据处理

基于目标散射中心模型，对立方体、长方体、四棱锥和六棱柱四类目标进行了回波的仿真，其中立方体边长为10 m；长方体底面长10 m，宽6 m，高6 m；四棱锥底面边长10 m，高10 m；六棱柱底面边长5 m，高10 m。探测器选用线性调频连续波雷达，因为C波段在抗雨衰、防雾霾方面优势明显，仿真模拟的探测器拟定为C波段线性调频雷达，关于雷达与探测环境的基本参数，如表1所示。

表1 探测器的基本参数Table 1 Basic parameters of the detector

探测距离为60 m，探测角度0～360°被平均分为72个角域，利用雷达依次采集每个角域内四类目标的1～10个雷达回波信号，将其转换为HRRP信号。当探测距离R=60 m，探测角度在0～5°时，四类目标的HRRP如图6所示。

图6 四类目标的一维距离像Fig.6 One-dimensional distance images of four types of targets

为了抑制噪声对目标信号的影响，对同一段差拍信号得到的9段HRRP进行平均距离曲线处理，得到一段新的距离曲线，四类目标的平均距离曲线如图7。与未进行降噪处理的HRRP相比，平均距离像中的噪声得到了抑制，目标信号明显突出，信噪比明显增强。

图7 四类目标的平均距离曲线Fig.7 Average range profile of four types of targets

然后对平均距离像进行最大值归一化处理，以抑制幅值敏感性，此时，所有的HRRP数据均处于0～1的范围内。之后采用自适应门限法设定门限以提取目标所处的HRRP片段，并对截取出的每一个HRRP有效片段依次提取13个特征分量，该13个数字特征作为训练数据集的一个样本。同样的方法，再对每类目标另取 7 200个识别样本，用于检验目标识别效果。

4.1.2 实测数据处理

实测试验的主要设备包括电源、探测器、被探测目标以及数据处理中心，如图8所示，测试场地为校园内某条道路。探测器为线性调频探测器，距离分辨率为0.3 m。被探测目标是两种地面车辆目标，如图9所示。被探测目标在距离探测器40 m处绕中心转动使探测角度发生变化，利用探测器共采集了36个探测角度的数据，每个探测角度下采集2组数据，每组数据包含500段差拍信号，并将其转换为HRRP信号。

图8 实测试验探测地点实景图Fig.8 Real map of actual test detection location

图9 被探测目标图Fig.9 Detected target

下面举例说明采集的数据，图10为当探测距离为40 m时两类车辆目标的原始距离曲线，可以发现目标的HRRP信号不突出，被淹没在噪声中。

图10 两类目标的原始距离曲线Fig.10 Original range profiles of two targets

对实测HRRP信号进行降噪处理，得到两类车辆目标的平均距离曲线，如图11所示，可以发现在35～40 m处峰值最强，说明此处存在目标。

图11 两类目标的平均距离曲线Fig.11 Average range profile of two targets

然后对平均距离像进行最大值归一化处理，使得所有的HRRP幅值均处于0～1的范围内。之后采用单元平均虚警率(CA-CFAR)方法提取目标所处的HRRP有效片段，并对截取出的每一个HRRP有效片段依次提取13个特征分量，作为训练数据集的样本。

4.2 实验结果

4.2.1 特征提取有效性验证

为了验证人工提取特征的有效性，分别使用改进前后CNN和传统识别方法GBDT、SVM、KNN，在实测车辆目标的原始HRRP数据和特征提取后的数据上进行了目标识别测试。

图12表示经特征提取前后不同方法的识别结果。可见，经特征提取后，所有算法的目标识别率都有提升，说明通过特征提取能够获得反映目标特性的有效信息，比未提取特征的原始HRRP更利于分类识别。另外，无论是特征提取前还是特征提取后，改进CNN的识别性能始终优于其他对比方法，说明所提的改进CNN方法能够有效提高目标识别率。

图12 基于实测数据特征提取前后不同方法的识别效果曲线Fig.12 Recognition effect of different methods before and after feature extraction based on measured data

图13表示经特征提取前后不同识别方法的测试时间结果。与特征提取前相比，对HRRP进行特征提取后再作为输入，改进CNN和CNN-Softmax的测试时间分别缩短了约0.1 s和0.13 s，GBDT、KNN和SVM的识别速度也有明显提升。综上，在进行HRRP目标识别时，首先对HRRP数据进行特征提取能够有效提高识别率，同时也能提升识别速度。

图13 基于实测数据特征提取前后不同方法的测试时间曲线Fig.13 Testing time of different methods before and after feature extraction based on measured data

4.2.2 引入BN算法收敛性验证

当采用本文提出的基本CNN网络结构时，随着迭代次数变化，未引入BN算法和引入BN算法的网络损失函数变化曲线如图14。

图14 训练集和验证集损失函数变化曲线Fig.14 Loss function variation curves for the training and validation sets

可见，在训练阶段，引入BN算法的CNN损失值小于未引入BN的网络损失。尤其是在训练初期，引入BN算法的网络损失函数减小得更快，这说明BN算法可以有效地解决训练过程中损失函数收敛过慢问题。因此在CNN网络引入BN算法能够加快网络的收敛速度，更利于提升模型的识别性能。

4.2.3 所提算法目标识别性能验证

为验证所设计的改进卷积神经网络模型对HRRP目标识别的性能优势，进行了两个对比实验。一是CNN-Softmax与改进CNN的对比试验。其中CNN-Softmax和改进CNN为采用本文设计的卷积神经网络提取深层特征，分别使用Softmax和本文设计的LGBM对所提特征进行分类的方法。二是改进CNN与其他分类方法的对比试验。在对比不同算法模型时，需要使用统一的衡量算法能力的评价标准。针对雷达HRRP目标的分类识别，本文从目标层面计算平均正确识别率Pa，来衡量分类模型的识别性能。其定义如下：

(11)

其中,C为目标类别数，Tj为第j类目标被准确识别的样本数，Nj为被判为第类目标的样本数。

1) CNN-Softmax与改进CNN的性能对比

表2是在相同的实验条件下，在4类仿真目标上2种方法随样本量变化的条件下平均正确识别率，可以看出，无论训练样本量多少，改进CNN的目标识别率要高于CNN-Softmax，且在样本量少时，也能保持较好的识别精度。

表2 不同训练样本量下2种方法的识别结果Table 2 Identification result of the two methods under different training sample sizes

图15为改进CNN与CNN-Softmax随样本量变化时的测试时间曲线，可见，改进CNN的测试时间明显低于CNN-Softmax。因为当CNN模型提取深层特征后，LGBM在寻找特征的最优分裂点和减少样本数方面进行了优化，从而提高了分类的准确率和时间效率，增强了HRRP目标识别性能。综上，改进CNN既有效提高了目标识别率，也明显提升了识别速度。

图15 随样本量变化改进前后CNN的测试时间曲线Fig.15 Comparison of CNN test time before and after improvement with sample size change

2) 所提算法与其他识别方法的对比

为进一步验证所提出的改进CNN算法的有效性，分别基于仿真数据和实测数据，将本文方法与CNN-Softmax和传统识别方法GBDT、SVM、KNN进行对比。

表3是不同识别方法分别在仿真数据和实测数据上的目标识别结果。在仿真数据上，改进前CNN使用Softmax做分类时的平均识别率为98.14%，改进CNN用LGBM做分类时的平均识别率提高到了99.17%，比改进前提高约1%，同时明显高于传统识别方法GBDT、SVM和KNN。在实测数据上，改进CNN的平均识别率为89.66%，比改进前CNN提高4.6%，且明显高于传统识别方法GBDT、SVM和KNN。可见，改进CNN的目标识别性能均优于改进前CNN及其他传统识别方法，再次验证了本文所提目标识别算法确实能增强HRRP目标识别性能。

表3 不同分类方法的识别结果Table 3 Identification results of different classification methods

5 结论

本文提出了一种基于改进CNN的HRRP目标识别方法。采用一维CNN对HRRP样本进行深层特征提取和目标识别，在构建CNN时引入BN算法加快了损失函数的收敛速度；设计了LGBM分类器作为CNN的分类层，有效提高HRRP识别率和识别速度，提升了模型的识别性能。通过与改进前CNN和传统识别方法的对比实验，表明所提的改进CNN在提高目标识别率的同时也有效提升了识别速度，可为后续进行HRRP目标识别提供参考。