基于非下采样剪切波特征提取的SAR图像目标识别方法
2020-03-31丁慧洁
丁慧洁
(广东开放大学人工智能学院,广东 广州 510091)
0 引言
特征提取是合成孔径雷达(SAR)图像目标识别的关键技术之一[1]。设计合适的特征不仅可以有效保持SAR图像中的目标特性还可以显著降低图像中的冗余信息,从而提高后续分类的精度和效率。现阶段,研究人员针对SAR目标识别问题设计了大量可靠特征,可分为几何形状特征[2-4]、电磁特征[5-7]和变换域特征[8-11]。几何形状特征描述目标的几何尺寸和外形分布等特性,常用的包括目标区域、轮廓、雷达阴影以及基于此获得的特征矢量:文献[2]采用目标二值区域作为基础特征设计SAR目标识别方法;文献[3]基于SAR目标轮廓设计识别方法。电磁特征反映与电磁散射现象关联的目标特性,典型代表是极化方式、散射中心等:文献[5]通过极化信息的引入提高SAR目标识别性能;文献[6—7]基于属性散射中心模型提取目标的散射中心进而通过散射中心匹配识别目标类型。变换域特征采用数学计算、信号处理的手段对SAR图像的幅度、相位分布进行分析,从而大幅度降低其中的冗余信息:一类采用矩阵投影的手段,如主成分分析(PCA)[8]、非负矩阵分解(NMF)[9];另一类则是基于变换域的思想,如小波变换[10]、单演信号[11]等。在获得SAR图像有效特征的基础上,选用合适的分类器对它们进行分类,达到识别未知样本目标类别的目的。常用的分类器包括K近邻(KNN)[8],支持向量机(SVM)[12],稀疏表示分类(SRC)[13]以及深度神经网络[14-16]等。需要指出的是,当前的大多数特征提取方法对于SAR图像的分析不够全面,往往只能体现目标一个方面的特征。通过全面分析SAR图像获得多层次的特征,有利于提升后续分类的性能。
采用非下采样剪切波(NSST)对图像进行分解获得多个子代图像,这些子代图像与原始图像具有相同的尺寸,其中一个为低通分量,描述原始图像的主要信息,其余子代图像为高通分量,反映原始图像中的细节信息;同时,这些子代图像具有多尺度描述能力以及良好的平移不变性。鉴于这些优良特性,NSST已经在图像融合、去噪、识别等领域得到了广泛运用[17-22]。联合多子代NSST图像,能够为SAR目标提供更全面的信息,从而为后续的分类识别提供更有力的支撑。本文采用联合稀疏表示对多子代图像进行联合表征,联合稀疏表示是一种多任务学习算法[23-24],能够在独立表示各个任务分量的同时发掘它们之间的关联,因此有利于提供整体的重构精度,最终根据各个子代图像的重构误差之和判定测试样本的目标类别。本文针对现有SAR图像特征提取方面的不足,提出基于NSST特征提取的SAR目标识别方法。
1 非下采样剪切波(NSST)
传统的Shearlet变换是基于合成小波理论和多尺度分析提出的,具有对信号的多尺度分析能力;然而,Shearlet变换并不具有平移不变性,这限制了其在图像分析等领域的灵活应用。为此,研究人员提出了NSST,它由非下采样金字塔(NSP)滤波器组合基于改进的剪切滤波器组(SF)组成。对于维度n=2的图像数据,合成膨胀的仿射系统为:
(1)
式(1)中,ψ∈L2(R2);F和H均为2×2可逆矩阵,|detF|=1。若MFH(ψ)具有紧框架,则称MFH(ψ)中的元素为合成小波。F为各向异性膨胀矩阵,Fj与尺度变换相关联;H为剪切矩阵,Hl与保持面积不变的几何变换相关联。当F=[4 0 0 2],H=[1 1 0 1]时,此时的合成小波称为剪切波。图1显示了NSST的基本示意图,详细分解过程可参见文献[17—22]。
根据NSST的基本性质和分解过程,当将其应用于SAR图像分解时,可以得到多层次的分解结构。这些结果具有多尺度分析能力,从而为SAR图像中目标的特性描述提供了更丰富的信息。此外,分解结果还具有平移不变性,克服了SAR图像目标中心化可能带来的位置偏差。因此,基于NSST提取的SAR图像特征有利于提高后续目标识别的整体精度和稳健性。
图1 NSST示意图Fig.1 Illustration of NSST
2 联合多层次NSST子代图像的SAR目标识别方法
2.1 联合稀疏表示
NSST可以分解得到原始图像的多层次子代图像,从而可以为描述目标特性提供更充分的信息。为了充分利用这些信息,本文采用联合稀疏表示对这些子代图像进行联合表征。联合稀疏通过多任务学习算法考察多个关联任务的内在关联,从而提高整体的表征精度。记测试样本y的K类不同特征分量为[y(1)y(2)…y(K)],它们可以分别基于对应的字典进行稀疏表示:
y(k)=A(k)α(k)+ε(k)(k=1,2,…,K)
(2)
式(2)中,A(k)为第k类特征相应的字典,α(k)则为对应的稀疏表示系数矢量。在不考察不同分量之间关联的情况下,可以通过优化式(3)中的目标函数获得各个任务的稀疏表示系数矢量:
(3)
式(3)中,β=[α(1)α(2)…α(K)]存储各个分量对应的稀疏表示系数矢量。实际上,来自同一样本的多个特征矢量存在一定的关联,因此稀疏表示系数矩阵β具有一定的结构约束,可以通过下式进行表达:
(4)
根据求得的稀疏表示系数矩阵,按照式(5)计算所有特征分量在不同训练类别上的总重构误差。最终,根据能够产生最小重构误差的训练类别判定测试样本的目标类别。
(5)
2.2 目标识别流程
基于上述分析,本文设计了如图2所示的SAR目标识别框架,其具体可归结为以下几个关键步骤:
1) 对训练样本进行NSST分解,获得多层次子代图像并分别构建独立字典;
2) 采用过程对测试样本进行NSST分解,获得对应的多层次子代图像;
3) 基于联合稀疏表示对测试样本的多层次子代图像进行联合表征;
4) 按照式(5)的准则计算各个训练类别对于测试样本的整体重构误差并判定目标类别。
具体实施中,综合考虑识别精度和效率,分解文献[21]中指出的4个子代图像代入后续联合稀疏表示,其中第1子代图像为低通分量,反映目标的整体信息。对于所有的子代图像,采用文献[13]中的随机投影降维方法得到520维的特征矢量。
图2 基于NSST特征提取的SAR目标识别方法的基本流程Fig.2 Basic procedure of SAR target recognition method based on NSST feature extraction
3 实验与分析
3.1 实验数据集
利用MSTAR公开数据集对本文提出方法进行性能测试。该数据集利用X波段机载SAR传感器采集了十类地面军事车辆目标的高分辨率(0.3 m)SAR图像,是目前验证SAR目标识别算法的重要数据集。表1列出了这十类目标具体类别以及标准操作条件(SOC)下的典型实验设置,其中训练集采集自17°俯仰角,测试集来自15°俯仰角。由于MSTAR数据集中SAR图像获取条件的多样性,还可以基于其设置多种实验条件,如型号差异、俯仰角差异。实验过程中,同时选用了几类现有的SAR目标识别方法进行对比,包括文献[12]中基于SVM的方法,文献[13]中基于SRC的方法和文献[14]设计的CNN。
表1 标准操作条件下的典型实验设置Tab.1 Typical experimental setup under SOC
3.2 实验结果与分析
3.2.1标准操作条件
首先基于表1中的实验设置对提出方法在标准操作条件下的识别性能进行测试,具体结果展示如图3所示的混淆矩阵。图中对角线上的元素反映了对应目标在当前条件下的正确识别率,其余元素为错误识别为不同目标的概率。可见,各类目标均可以以98%以上的识别率实现正确分类。通过对各类对比算法进行相同测试,获得各类方法的平均识别率如表2所列。本文方法以99.14%的识别率居首,充分说明了其有效性。CNN方法在标准操作条件下同样可以取得很高的识别率,主要因为在训练样本充分的条件下训练得到的分类网络对于测试样本具有很好的适应性。
图3 本文法在标准操作条件下的识别结果Fig.3 Recognition results of the proposed method under SOC
表2 各类方法在标准操作条件下的平均识别率
Tab.2 Average recognition rates of different methods under SOC
方法类型平均识别率/%本文方法99.14SVM96.73SRC95.94CNN99.08
3.2.2型号差异
由于同一目标型号差异带来的识别困难在SAR目标识别中受到广泛关注。表3给出了型号差异条件下的一种典型实验设置,包含BMP2,BTR70和T72三类目标。从表3中可以看出,三类目标的测试样本和训练样本来自完全不同的型号。通过典型型号的学习实现其余型号的正确识别具有重要意义。表4给出了不同方法在型号差异条件下的平均识别率。相比标准操作条件,各类方法在当前条件下的识别性能均出现了不同程度的下降。对比而言,本文方法的识别率下降幅度最下,因此仍然保持了最佳的识别结果。CNN方法平均识别率下降最为明显主要是单一型号训练得到的网络对于其他型号的适应性较差。
表3 型号差异条件下的典型实验设置Tab.3 Typical experimental setup under configuration variance
表4 各类方法在型号变化下的平均识别率Tab.4 Average recognition rates of different methods under configuration variance
3.2.3俯仰角差异
当雷达工作在差异较大的两个俯仰角时,其获得的同一目标的两幅SAR图像会存在较大的差异,此时,目标识别问题的难度显著增大。表5给出了俯仰角差异条件下的一种典型实验设置,包含2S1,BDRM2和ZSU23/4三类目标。训练样本来自17°俯仰角而测试样本分别来自30°和45°俯仰角,因此测试和训练样本存在较大的俯仰角差异。图4显示了各类方法在不同俯仰角时的平均识别率。本文方法在30°和45°两个角度下均取得了优于其他方法的性能,说明了其对于俯仰角差异的稳健性。
表5 俯仰角差异下典型实验设置Tab.5 Typical experimental setup under depression angle variance
图4 各类方法在俯仰角差异下的平均识别率Fig.4 Average recognition rates of different methods under depression angle variance
3.2.4噪声干扰
SAR图像中存在大量的噪声,使得部分目标特性不能得到很好地体现。原始MSTAR数据SAR图像的信噪比(SNR)相对较高,并不能充分反映实际侦察条件下的情形。为此,本实验通过模拟仿真的手段向表1中原始十类目标测试样本添加不同程度的噪声,进而获得不同方法在不同噪声水平下的平均识别率,如图5所示。噪声干扰的加剧使得各类方法的性能均出现了显著的下降。对比来看,本文方法噪声干扰条件下可以保持更强的稳健性,尤其在低信噪比条件下,本文方法的性能优势更为明显。
图5 各类方法在噪声干扰下的平均识别率Fig.5 Average recognition rates of different methods under noise corruption
4 结论
本文提出了NSST特征提取的SAR图像目标识别方法。该方法利用NSST对原始图像进行分解从而获得多个子代图像,这些子代图像既反映了原始图像的主要特性又体现了目标的局部细节特征。因此,联合多层次的NSST子代分解结构可以为正确目标识别提供更为充分的信息。在分类阶段,采用联合稀疏表示对四个层次的子代图像进行联合表征,并根据总体重构误差判定测试样本的目标类别。基于MSTAR数据集开展了验证实验,实验结果分析表明该方法在标准操作条件、型号差异、俯仰角差异以及噪声干扰的条件下均可以保持优异性能。