APP下载

联合多层次深度特征的SAR 图像目标识别方法*

2020-04-02蔡德饶

火力与指挥控制 2020年2期
关键词:识别率分类器卷积

张 婷,蔡德饶

(1.江西警察学院,南昌 330031;2.上饶职业技术学院信息工程系,江西 上饶 334100)

0 引言

合成孔径雷达(SAR)通过主动式的微波遥感获得高分辨的图像[1],可以为对地观测、战场侦察等邻域提供必要的信息支持。自动目标识别(ATR)是SAR 图像解译的重要环节之一[2-3],旨在获得大场景SAR 图像中感兴趣区域所包含的目标信息,并判定其具体类别。一般的SAR 目标识别方法主要包含特征提取和分类器设计两部分。特征提取阶段获得原始SAR 图像的特征描述。常用的SAR 图像目标特征包括几何特征、投影特征以及散射中心特征。几何特征主要描述目标的几何外形,如目标区域[4]、目标轮廓[5]等。投影特征则是通过数学变换的形式将原始图像的灰度分布投影到新的特征空间。常见的方法包括主成分分析(PCA)[6]、线性鉴别分析(LDA)[6]等。在高频区,雷达目标的后向散射可以等效为局部现象。这些局部特性也称为散射中心。研究表明,散射中心同样是SAR 目标识别的有力特征。文献[7-8]就是采用属性散射中心实现高性能的SAR 目标识别。分类器通过设计合理的决策机制判定目标类别。常用于SAR 目标识别的分类器包括K 近邻分类器(KNN)[6,9],支持向量机(SVM)[4-5,10],稀疏表示分类器(SRC)[11-13]等。作为特征和分类器联合作用的结果,SAR 目标识别的性能与提取的特征以及选取的分类器息息相关。

近年来,深度学习技术飞速发展[14-15]。卷积神经网络(CNN)作为深度学习技术在图像解译领域的代表,目前已在SAR 图像目标识别中得以成功运用[15-17]。与传统的分类方法不同,卷积神经网络将特征学习和分类决策融入统一的框架。具体而言,采用多种卷积核对原始SAR 图像进行不同方面的特征分析。此外,通过多层次的网络学习层次化的深度特征。因此,深度特征对于目标特性的描述能力更强,有利于提高识别性能。在深度网络的最后一层,通常采用多类的回归分类器(Softmax)对学习的深度特征进行分类,判定目标类别。

本文提出联合多层次深度特征的SAR 目标识别方法,旨在充分发掘多层次深度特征对于目标识别的鉴别力以提高识别性能。首先根据以往的研究成果,设计了适应于SAR 目标识别的卷积神经网络。对于网络中每一个卷积层输出的特征图,通过矢量化串接以及降采样的方式构造一个特征矢量。由此,多个卷积层的特征矢量构成多层次的深度特征。为了充分利用构造的多层次深度特征,本文采用联合稀疏表示(Joint Sparse Representation,JSR)[18-20]对它们进行联合决策。联合稀疏表示是压缩感知理论在多任务学习领域的应用,其在准确表征单个任务的同时发掘不同任务之间的内在关联。因此,联合稀疏表示可以更好地对多层次深度特征进行分类,从而达到提高目标识别性能的效果。采用MSTAR数据集对提出的算法进行性能测试,实验结果证明了方法的优越性能。

1 多层次深度特征构造

1.1 卷积神经网络

卷积神经网络作为深度学习技术的一项重要工具,在图像处理领域得以广泛运用并取得了良好的效果。与传统的分类方法不同,卷积神经网络将特征学习和分类集成到同一框架。具体而言,采用多个卷积层学习层次化的深度特征。最后,通过Softmax 完成分类任务。

为了提高网络的稳健性以及减小计算复杂度,往往在每一个卷积层后设置池化层。池化操作通过对特征图上h×w 的局部窗口进行操作达到降低维度、增强稳健性的目的。常见的池化操作有平均池化和最大值池化。以最大值池化为例,其具体操作方式如下:

通过多个卷积层和池化层的交替作用之后,最终输出的特征通过一个多类回归分类器(Softmax)判定测试样本的目标类别。

1.2 多层次深度特征

为了充分利用卷积神经网络学习的层次化深度特征,本文对卷积神经网络中每一个卷积层的输出进行特征构造,进而获取多层次深度特征。针对SAR 目标识别的特定应用,本文依据先前研究成果设计如下页图1 所示的卷积神经网络,该网络包括3 个卷积层(Conv),3 个最大值池化层(Max Pooling),2 个全连接层(FC)。在网络的训练过程中,通过卷积操作可以获取原始SAR 图像不同侧面的特征。图2 显示了一幅MSTAR SAR 图像在图1 所示的网络中不同卷积层输出的特征图。可以看出,不同卷积层的结果能够体现原始图像不同的特点,如区域、轮廓、点特征等。由此,多层次的深度特征可以有效继承各个卷积层的特征,从而给予目标更为全面的描述,通过联合多层次深度特征可以有效提升目标识别性能。

实际上,每一个卷积层输出的特征图数量较多,且每一个特征图都是一个较高维度的图像。此时,直接采用原始的特征图会给后续的分类算法带来较大的计算负担。为此,本文采用对每一个卷积层输出的所有特征图统一进行降采样,获得统一的特征矢量。例如,对于图2(b)所示的16 幅特征图,分别对其中的任一特征图按照逐行串接的方式进行矢量化,然而采用同一降采样因子获得低维度矢量。最后,将所有16 幅特征图获得的特征矢量按照设定的先后顺序进行串接,得到第1 卷积层对应的深度特征矢量。对其与两个卷积层的输出进行同样操作,获得相应的深度特征矢量。

图1 本文设计的卷积神经网络

2 联合多层次深度特征的目标识别方法

2.1 联合稀疏表示

图2 一幅MSTAR SAR 图像在不同卷积层输出的特征图

2.2 目标识别方法

本文采用联合稀疏表示对构造的深度特征进行分类。具体流程如下页图3 所示,可以归纳为以下步骤:

步骤1:采用训练样本训练图1 所示的卷积神经网络;

步骤2:基于训练的网络对所有训练样本提取多层次深度特征,构建深度特征字典;

步骤3:基于训练的网络对待识别的测试样本构造多层次深度特征;

步骤4:采用联合稀疏表示对测试样本的多层次深度特征进行分类;

步骤5:基于最小重构误差的原则判断目标类别。

在具体的操作过程中,对于每一个训练样本,分别基于训练得到的网络获取其各个卷积层输出的特征图。然而,采用1.2 节中的方法生成各个层次对应的深度特征矢量,且每一卷积层的特征图均通过合理的降采样得到600 维的矢量。所有训练样本对应卷积层输出的深度特征矢量则构建成相应的字典。在本文中,则形成3 个卷积层对应的3 个字典,即K=3。最终,对测试样本进行相应的特征构造,并基于联合稀疏表示计算各个训练类别的重构误差进而判定目标类别。

图3 本文识别方法的流程

3 实验与分析

3.1 MSTAR 数据集

为了验证提出算法的有效性,基于MSTAR 数据集进行实验分析。该数据集包含了10 类地面静止车辆目标的SAR 图像,分辨率0.3 m×0.3 m。10类目标常见训练和测试集设置如表1 所示。其中,训练集来自17°俯仰角,测试集来自15°俯仰角。对于任一目标,其SAR 图像均包含了0~360°方位角。为了充分体现提出算法的性能,实验中选用了几类现有的SAR 目标识别算法进行对比实验,包括基于SVM 的方法[10],基于SRC 的方法[11]以及基于CNN的方法[15]。

表1 10 类目标的训练和测试集

3.2 实验结果与分析

3.2.1 3 类目标测试

首先基于表1 中BMP2,BTR70 和T72 3 类目标的训练和测试样本测试提出方法的识别性能。此实验设置中,BMP2 和T72 两类目标的测试样本与对应的训练样本存在一定的型号差异。下页表2 列出了本文方法对3 类目标具体的分类结果,3 类目标(含各个型号)的识别率均达到97%以上,平均识别率为98.47%。从表2 中还可以看出,对于训练集中未包含的型号,它们的识别率相对较低。这表明型号差异会一定程度带来识别性能的下降。各类方法的平均识别率如表3 所示。本文方法的识别率高于对比算法,证明了该算法在此实验条件下的高性能。对于CNN 方法,由于训练集和测试集中存在的型号差异,导致训练得到的网络对于不同型号的样本的适应性较差。本文方法通过联合多层次的深度特征,增强了对于样本畸变(如型号变化带来的局部变化)的稳健性。因此,本文方法可以获得更好的识别性能。

3.2.2 10 类目标测试

基于表1 中的测试集和训练集,测试了提出算法对10 类目标的识别性能,对于BMP2 和T72 两类目标,其训练和测试样本均保持同一型号(BMP2 的Sn_9563 和T72 的Sn_132)。此时,10 类目标的训练和测试样本仅仅存在2°的俯仰角差异。本文方法对10 类目标的分类混淆矩阵如图4 所示,其中横坐标代表真实目标类别,纵坐标提出算法预测的目标类别,对角线上的元素代表正确识别率。可以看出,10类目标的识别率均达到98%以上,最终的平均识别率为99.38%。实验结果充分证明了该方法高性能。

表2 3 类目标的识别结果

表3 各类方法对3 类目标的平均识别率

图4 本文方法对10 类目标的混线矩阵

表4 对比了提出算法与其他算法对于10 类目标识别问题的平均识别率。与3 类目标的识别实验结构对比,此时各类方法对于10 类目标的平均识别率均有了一定的提高。这主要是因为本实验中的训练和测试集之间不存在型号差异。得益于卷积神经网络的强分类性能,本文方法与文献[16]中基于CNN 的方法的识别性能显著高于SVM 和SRC 方法。对于本文方法和文献[12]中的CNN 方法,本文方法的平均识别率有一定的提高,说明了联合多层次深度特征有益于正确的识别。

表4 10 类目标识别问题上的性能对比

3.2.3 噪声干扰

实际过程中,获得的SAR 图像往往受到来自于背景环境和雷达系统的噪声干扰。为了测试提出算法对于噪声干扰的稳健性,本文首先对10 类目标实验中的测试样本添加不同程度的高斯白噪声。然后,基于原始的训练集进行后续的目标识别。图5显示了各类方法在不同信噪比(Signal-to-noise Ratio,SNR)下的平均识别率。可以看出,本文方法在各个信噪比下均保持最高的识别率,充分证明了其对于噪声干扰的稳健性。此外,SRC 方法在信噪比较低(低于0dB)时,识别性能优于SVM 和文献[16]中的CNN 方法。这主要得益于稀疏表示对于噪声干扰的稳健性[21]。该方法一方面通过多层次的深度特征获得具有噪声稳健的特征描述;另一方面,联合稀疏表示同样继承了稀疏表示对于噪声干扰的稳健性。由此,该方法对于噪声干扰具有最强的稳健性。

图5 各类方法在噪声干扰下的识别性能对比

4 结论

本文提出了联合多层次深度特征的SAR 目标识别方法。该方法首先对卷积神经网络中的每一个卷积层的输出进行特征构造,获得统一的特征矢量。进而采用联合稀疏表示对多层次的深度特征进行分类,判定目标类别。通过综合多层次深度特征的优势,以及结合联合稀疏表示的优点实现高性能的SAR 目标识别。实验中,基于MSTAR 数据集分别测试了提出算法对3 类目标、10 类目标的识别性能以及噪声干扰下的稳健性。实验结果表明,本文算法对3 类目标和10 类目标的平均识别率分别可以达到98.31%和99.38%,且具有最强的噪声稳健性,因此,在实际的SAR 目标识别系统中具有很强的应用潜力。

猜你喜欢

识别率分类器卷积
基于全卷积神经网络的猪背膘厚快速准确测定
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
基于朴素Bayes组合的简易集成分类器①
基于AdaBoost算法的在线连续极限学习机集成算法
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术