APP下载

基于增强字典稀疏表示分类的SAR目标识别方法

2020-07-14廖志平

探测与控制学报 2020年3期
关键词:训练样本信噪比字典

陈 婕,廖志平

(桂林电子科技大学信息科技学院, 广西 桂林 541004)

0 引言

合成孔径雷达(SAR)可实现距离向和方位向的二维高分辨率成像,为对地观测提供了有力的工具。战时,通过对SAR图像进行有效解译获取战场目标信息具有巨大的情报价值。为此,研究SAR目标识别技术具有广阔的应用前景[1-2]。从具体的分类识别算法角度,SAR目标识别方法一般按照特征提取和分类决策两个阶段序惯进行。特征提取实现对SAR图像中目标特性的描述,以剔除噪声、背景杂波等带来的干扰。主成分分析(PCA),线性鉴别分析(LDA)等投影变换特征被广泛用于SAR图像特征提取[3-5]。其他用于SAR目标识别的特征还包括目标轮廓[6]、目标区域[7]、散射中心[8-9]等。分类决策阶段,常用的分类器包括K近邻(KNN)[3]、支持向量机(SVM)[10-11]、稀疏表示分类器(SRC)[11-12]以及卷积神经网络(CNN)[13-14]等。Mishra将PCA和LDA用于SAR图像特征提取并采用KNN进行分类对比了两种特征在SAR目标识别中的性能[3]。文献[6]基于SAR目标轮廓提取椭圆傅里叶系数进而采用SVM分类器进行目标识别。文献[7]基于目标二值区域设计匹配算法并根据区域残差进行分类算法设计。文献[12]首次将SRC引入SAR目标识别并取得了良好的识别性能。文献[13]等针对SAR目标识别的特定应用设计了全卷积神经网络,相比传统方法显著提高了识别性能。文献[8]以属性散射中心为基本特征,提出了一种基于Hungarian算法的散射中心匹配方法并将其应用于SAR目标识别。

本文针对现有SAR目标识别中分类决策中存在的不足,提出一种基于增强字典稀疏表示的SAR识别方法。首先通过添加噪声、多分辨率表示的方法丰富训练样本并以此构建增强的字典。所构建的增强字典涵盖了部分扩展操作条件(即噪声污染、分辨率变化)并且字典中样本规模的扩大也有效提高了其基础描述能力。因此,基于增强字典对待识别的样本进行分类,可以得到更可靠的识别结果。

1 稀疏表示分类器

基于压缩感知的基本原理,稀疏表示通过线性表示和稀疏重构的方式寻找测试样本的最佳匹配类别,完成分类任务。记C类目标的训练样本构建的全局字典为A=[A1,A2,…,AC]∈Rd×N,其中Ai∈Rd×Ni(i=1,2,…,C)为第i类的Ni个样本。基于该字典对测试样本y进行稀疏重构如下:

(1)

(2)

从稀疏表示分类的基本原理和流程不难看出,目标类别的判断依赖于其对应类别训练样本的线性表示能力。若训练样本规模较小,则线性表示的精度较低,难以可靠进行识别。即使在训练样本规模较大的情况下,其覆盖条件应当贴近实际情况,考察到实际可能出现的各种干扰。因此,为提高稀疏表示分类的性能,有必要在已有的有限训练样本基础上进行提升,提高最终构建的字典的有效性。

2 字典增强及目标识别

如前文分析,字典的完备性是稀疏表示分类中一个关键的问题,决定字典能否可以有效重构测试样本以及适应复杂多变的样本变化(如噪声添加、分辨率变化等)。因此,提高字典的描述能力及其对扩展操作条件的适应性具有重要的意义。传统的基于稀疏表示分类的SAR目标识别算法大多是针对稀疏系数的求解以及最终的判决规则等问题进行优化改进。如文献[16]根据稀疏表示系数的能量进行决策而不是采用经典的最小重构误差准则。本文则是通过增强字典的完备性进而提高稀疏表示分类器在SAR目标识别上的性能。通过对原始训练样本添加高斯噪声以及进行多分辨率表示达到增强原始字典的目的。

2.1 噪声添加

噪声干扰是SAR目标识别中一种常见的扩展操作条件。用于分类器训练的样本往往通过合作途径获取(如仿真计算),噪声水平一般较低。此时,利用这些样本对低信噪比(SNR)SAR图像进行识别存在较大的困难。为此,本文采用添加高斯噪声的方式模拟噪声污染的训练样本。定义信噪比如式(3)所示。

(3)

式(3)中,H和W分别为图像的高和宽,r(i,l)表示SAR图像的频域数据,σ2代表噪声方差。

图1给出了将SAR图像变换到频域数据的基本过程。经过二维逆傅里叶变换、去除成像过程中的频域补零以及加窗效应从而获得相应频域数据,然后,对频域数据添加噪声获得噪声干扰图像。通过改变添加噪声的方差就可以得到不同信噪比的SAR图像。图2给出了同一目标在不同信噪比下的SAR图像。

图1 SAR图像的频域变换Fig. 1 Procedure of transforming SAR images to the frequency domain

图2 不同信噪比下的SAR图像Fig.2 SAR images at different SNRs

2.2 多分辨率表示

由于传感器的差异,待识别SAR图像可能与训练样本采集自不同分辨率。此时,依托原始训练样本往往难以对测试样本进行可靠分类。为此,本文通过对原始训练样本进行多分辨率表示丰富分辨率成分,为不同分辨率下的识别任务提供支撑。根据SAR成像机理,其距离和方位向的分辨率分别由雷达带宽和合成孔径大小决定。为此,通过对SAR图像的原始回波数据进行适当分割,可以得到不同分辨率下的成像数据。图3给出了实施多分辨率表示的基本流程。首先,根据预设的分辨率需求对SAR图像频域数据进行部分分割。然后,按照一般的SAR成像流程进行频域补零并加窗,从而保证重建图像与原始图像具有相同的像素分辨率。最后,通过二维傅里叶变换将处理后的频域数据变换到图像域获得相应分辨率的SAR图像。通过调整频域分割的比例可以获得目标在不同分辨率下的表示。图4显示了同一目标在不同分辨率的SAR图像。多分辨的表示可以增强原始训练样本的描述能力。一方面,多分辨率的训练样本可以描述更多分辨率的SAR图像;另一方面,即使对于某一固定分辨率的测试样本,多分辨的训练样本也可以提高对其重构的精度。这些都有利于提高稀疏表示分类器的性能。

图3 多分辨率表示的流程Fig. 3 Procedure of producing multi-resolution representations

图4 SAR图像在不同分辨率的表示Fig.4 SAR images at different resolutions

2.3 目标识别流程

本文提出的基于增强字典稀疏表示的SAR目标识别方法,通过对原始训练样本的多信噪比、多分辨率表示,大大提高了字典的表述能力以及对于扩展操作条件的适应性。本文设计的基本识别流程如图5所示,具体按照以下步骤实施:

步骤1 对原始训练样本添加高斯噪声构造多信噪比的SAR图像;

步骤2 对原始训练样本进行多分辨率表示,得到多分辨率的SAR图像;

步骤3 利用原始训练样本及构造的多信噪比、多分辨率的SAR图像共同构建增强字典;

步骤4 基于增强字典采用稀疏表示分类器对测试样本进行识别。

图5 基于增强字典稀疏表示的识别流程Fig.5 Recognition procedure of sparse representation-based classification based on augmented dictionary

实施中,为了降低原始SAR数据的维度,首先采用PCA对原始SAR图像及其多信噪比、多分辨率表示进行特征提取,获得100维的特征矢量。然后,基于增强训练样本的PCA特征矢量构建全局进而进行稀疏表示分类。本文采用SparseLab开源工具包中的正交匹配追踪算法(OMP)求解稀疏表示系数,其中稀疏度和重构误差上限分别设置为60和10-4。图6给出了一幅T72测试样本在增强字典上的稀疏表示系数分布,其中,增强字典由BMP2、BTR70和T72 3类目标的698个训练样本构成(详见实验章节)。采用本文方法增强后,字典规模达到6 980个原子,按照BMP2、BTR70和T72的顺序依次排列。从图6中可以看出测试样本的稀疏表示系数在同类别的字典上的值相对较高并且具有较大系数的原子多集中与T72字典上。这说明T72类别中存在较多与测试样本相似度较高的原子。基于增强字典中T72类别字典对测试样本的重构误差显著小于其他类别,因此可以获得正确的识别结果。

图6 基于增强字典的稀疏表示系数求解示意Fig.6 Illustration of solution of sparse coefficients based on augmented dictionary

3 实验与分析

3.1 实验数据集

MSTAR数据集是由美国DARPA/AFRL提供的地面静止车辆目标实测SAR数据,采集了X波段HH极化下多类地面车辆目标的SAR图像,图像大小128×128像素,分辨率0.3 m×0.3 m,是目前国际上用于SAR目标识别算法验证的常用数据集。本文针对MSTAR数据集中的10类目标(见图7)进行分类实验,部分训练和测试样本如表1所示,其中训练样本来自17°俯仰角,待识别测试样本来自15°俯仰角。实验实施中,选用现有几类SAR目标识别方法进行同步对比实验,包括SVM方法[10]、传统SRC方法[12]以及CNN方法[13]。为保持与提出方法特征的一致性,SVM和SRC均对100维的PCA特征矢量进行分类。CNN则是采用文献[13]设计的全卷积神经网络(包含5个卷积层和3个最大值池化层直接基于原始SAR图像进行训练和分类。对比方法均不进行训练本的增强。

3.2 实验结果

1) 3类目标识别问题

首先,基于表1中BMP2、BTR70和T72 3类目标的训练和测试样本开展实验。3类目标识别问题是SAR目标识别中的基本问题之一,能够反映识别算法对于多类目标的基本分类能力。对于BMP2和T72,两者的测试集与训练集具有一定的型号差异。表2统计了本文方法对3类目标的识别结果,各类目标(型号)的识别率均高于97%,平均识别率达到98.61%。表3比较了不同方法在当前条件下的平均识别率。本文方法识别率最高,CNN方法与本文方法的识别率接近,体现了深度模型较强的分类能力。然而,由于训练样本与测试样本之间存在的一定型号差异,CNN的整体分类性能仍受到一定影响。与传统SRC方法对比,本文通过字典增强有效提升了的整体识别性能,证明了增强字典的有效性。

图7 十类目标的光学图像Fig.7 Optical images of the ten targets

表1 实验训练和测试集

表2 三类目标的识别结果统计

表3 三类目标识别问题性能对比

2) 10类目标识别问题

为进一步考察提出方法对于多类目标的分类能力,基于表1中全部10类目标的训练和测试样本进行测试,获得本文方法的分类混淆矩阵如图8所示。从对角线元素可以看出,本文方法对于各类目标的正确识别率均可达到97%以上。经过总体计算,10类目标平均识别率为98.12%,表明其对于10类目标识别问题的有效性。表4列举了各类方法在当前条件下的平均识别率。对比其他三类方法,本文方法性能更优。同样,与传统SRC相比,本文方法的性能得到显著提升。这表明在增强字典下多信噪比、分辨率表示的样本有利于提高对测试样本的表示能力,进而根据重构误差进行更为精确的目标分类。

图8 10类目标识别的混淆矩阵Fig. 8 Confusion matrix on 10-class recognition

表4 10类目标识别问题性能对比

3) 噪声干扰

为测试增强字典下识别方法的噪声稳健性,本实验中首先按照2.1节中噪声添加方法对表1中的10类测试样本添加不同程度的噪声。然后,采用各方法对不同信噪比的噪声样本进行分类,得到它们的识别结果如图9所示。随着信噪比的不断降低,各方法的性能均表现出不同程度的下降。本文方法在各个信噪比下都能保持优势性能,尤其在低信噪比下,增强字典的方法性能优势更为显著。这一结果验证了本方法具有更为优越的噪声稳健性。一方面,增强字典包含了多个信噪比的噪声样本,因而对于噪声干扰样本的描述能力大大增强;另一方面,稀疏表示分类自身对于噪声干扰具有一定的稳健性[15](从图中也可以看出传统SRC的总体稳健性优于SVM和CNN)。因此,通过增强字典下的稀疏表示进行识别,其抗噪声干扰能力较强。

4) 分辨率变化

为测试增强字典下识别方法对于分辨率变化的稳健性,本实验中首先按照2.2节中的多分辨率表示方法对表1中的10类测试样本进行多分辨率构造。然后,基于不同分辨率的测试样本对各方法进行测试,得到它们的识别结果如图10所示。通过多分辨率表示的引入,增强字典下的稀疏表示相比其他方法性能更优,在各个分辨率下均保持最高的识别率。通过对训练样本进行多分辨率重构,增强后的字典本身就具有了其所覆盖的分辨率的描述能力。此外,由于包含较多的分辨率,通过稀疏表示的优化求解,分类器也具有了一定的外推功能,对更多的分辨率具有适应性。

图9 各方法在噪声干扰下的识别性能Fig.9 Recognition performance of different methods under noise corruption

图10 各方法在分辨率变化下的识别性能Fig.10 Recognition performance of different methods under resolution variance

4 结论

本文提出了基于增强字典稀疏表示的SAR目标识别方法。该方法通过对原始训练样本进行多信噪比、多分辨率样本构造,进而构建描述能力更强、对于扩展操作条件更稳健的增强字典。采用基于增强字典的稀疏表示分类器可有效提高目标识别的整体性能。基于MSTAR数据集的实验表明,本文方法在对于3类和10类目标的平均识别率可分别达到98.61%和98.12%,验证其区分多类目标的能力;通过测试本文方法在不同信噪比、不同分辨率下的识别性能,验证了方法对于噪声干扰、分辨率变化具有较强的稳健性。后续研究中,将针对增强后的字典规模过大的问题进行优化,采用字典学习、去冗余等多种手段进一步提升识别性能。

猜你喜欢

训练样本信噪比字典
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于经验分布函数快速收敛的信噪比估计器
一种基于扩频信号的散射通信信噪比估计方法
自跟踪接收机互相关法性能分析
人工智能
字典的由来
大头熊的字典
基于小波神经网络的网络流量预测研究
正版字典