目标区域和阴影联合决策的SAR图像目标识别方法
2019-12-23夏朋举
夏朋举
(许昌职业技术学院,河南 许昌 461000)
0 引 言
合成孔径雷达(Synthetic Aperture Radar, SAR)目标识别是现在战场情报获取的关键手段之一。为此,国内外学者针对这一领域开展了广泛而深入的研究[1]。SAR目标识别方法一般包括两个关键步骤,即,特征提取和分类器。前者通过数学手段或者图像分析从原始SAR图像获得低维的特征矢量。常用的SAR图像特征包括几何形状特征、投影特征和散射中心特征。几何特征主要描述目标的物理形状信息,典型的有目标区域[2]、轮廓[3]等。投影特征通过数学变换的方式在低维子空间寻求原始高维SAR图像的不变特征,如主成分分析(Principal Component Analysis,PCA)、线性鉴别分析(Linear Discriminant Analysis,LDA)[4]等。散射中心主要描述目标局部的电磁散射现象,如,属性散射中心[5]。分类器通过对提取的特征进行作用从而对待识别样本的类别进行决策。常用与SAR图像目标识别的分类器包括支持向量机(Support Vector Machines,SVM)[6],稀疏表示分类器(Sparse Representation-based Classification,SRC)[7]以及卷积神经网络(Convolutional Neural Network,CNN)[8]等。
为了提高SAR目标识别的性能,应当充分利用原始SAR图像中蕴含的鉴别力信息。现有的SAR目标识别方法中,大部分直接采用整体SAR图像或是分割后的目标区域,而忽视了SAR图像阴影的作用。相关研究表明,SAR目标阴影是目标与背景环境在特定的雷达视线下相互耦合的结果,其形状反映了目标的物理尺寸和外形分布。因此,阴影同样可以为目标识别提供有效的鉴别力。Papson等[9]利用SAR图像目标阴影进行目标识别,采用隐马尔科夫模型对阴影边界建模,取得了良好的识别效果。文献[10-11]融合目标区域和阴影,有效提高了SAR目标识别的性能。因此,通过联合目标区域和阴影有望提高SAR目标识别性能。
本文提出了一种联合目标区域和阴影的SAR目标识别方法。目标区域和阴影都包含了对目标物理特性的描述,因此可以分别用于SAR目标识别。同时,两者的相对关系也描述了目标的状态,如目标相对雷达入射方向的姿态。因此,目标区域和阴影的相对关系也可以用于提高SAR目标识别性能。本文方法首先提取目标和阴影的二值区域,然后采用椭圆傅里叶描述子(Elliptical Fourier Descriptors,EFDs)[3,12]分别描述目标区域和阴影的边界。为了描述目标区域与阴影的相对关系,采用一个特征矢量描述两者的相对位置关系和相对大小。在目标识别阶段,采用稀疏表示分类器[7,14]分别对目标区域的椭圆傅里叶描述子、阴影的椭圆傅里叶描述子和相对关系的特征矢量进行分类。为了得到更为稳健的识别结果,对三者的分类结果采用线性加权的决策层融合。基于融合后的归一化相似度判断目标类别。相比文献[10][11]中利用阴影的方法,本文充分考虑了阴影与目标的相对位置关系。同时,决策层的融合进一步提高了识别性能。实验中,基于MSTAR (Moving and Stationary Target Acquisition and Recognition)数据集对提出方法进行了全面测试。
1 目标区域和阴影提取
本文采用以下步骤提取SAR图像的目标区域和阴影:
(1)通过直方图均衡化将原始SAR图像的灰度动态范围变换到[0,1];
(2)采用均值滤波对步骤1的结果进行平滑处理;
(3)基于门限法进行图像分割,目标区域和阴影的门限分别设置为0.8和0.2;
(4)采用形态学开操作[14]剔除背景噪声带来的虚警;
(5)采用形态学闭操作[14]连接目标区域以及阴影区域,获取光滑的目标以及阴影轮廓。
图1对本文使用的目标区域和阴影提取方法进行了直观的解释。图1(a)为原始图像。其经历前三个步骤后的分割结果如图1(b)所示。门限分割的结果存在大量背景杂波带来的虚警,图1(c)显示了通过形态学开操作剔除这些虚警后的结果。采用形态学闭操作连接目标区域和阴影得到最终的提取结果如图1(d)所示。
图1 目标区域和阴影提取过程
2 特征构造
目标区域和阴影描述了目标的物理结构,同时目标区域和阴影的相对位置和大小反映了目标与雷达入射角度的关系。直接利用目标区域和阴影的二值图像较为繁琐并且不利于后续分类器的设计。为此,本文在它们的基础上进一步进行特征构造。为了充分挖掘其中有益于目标识别的信息,构造特征时既考虑了目标区域和阴影独立的特性也考虑了它们的相对关系。
采用椭圆傅里叶描述子分别对目标和阴影的二值区域进行描述。椭圆傅里叶描述子的基本思想是通过多个大小不同的椭圆来拟合某一光滑的闭合曲线。它以多次谐波的方式对目标边界进行无限逼近,因此对于目标和阴影边界的描述精度较高。同时,椭圆傅里叶描述子还具有尺度、选择、起始点变换的不变性,因此描述形状的稳健性较强[12]。
对于一个光滑的封闭边界C,可以采用向量v(t)=[x(t)y(t)]T对其进行表示,其中t∈[0,2π)。因此,v(t)为参数t的周期函数,从而可以用傅里叶级数表达如下:
(1)
式中,系数Fk∈R2×2,k=0,1,2,…代表椭圆傅里叶描述子。可以通过下式计算得到:
(2)
其中,F0为0阶描述子,代表直流分量,即封边边界的几何中心,包含两个系数[a0c0]T。对于k≥1次谐波,均包含四个系数[akbkckdk]T。本文采用椭圆傅里叶描述子分别描述目标区域边界和阴影边界,且均采用7阶谐波,因此两个边界最终都表示为26维的特征矢量。
为了表征目标区域和阴影的相对关系,本文采用如图2所示的描述方法。图中,矩形边框代表了目标和阴影联合区域的边界矩形,两个“*”形标记分辨代表了目标区域和阴影的质心。具体的描述特征如表1所列。由此,目标区域和阴影的相对关系可以用一个14维的特征矢量描述。
3 联合目标区域与阴影的目标识别方法
3.1 稀疏表示分类器
稀疏表示分类器[7]是基于压缩感知理论提出的一种新的分类策略。它的基本思想是采用各类样本构成的全局字典对待识别样本进行线性表示,且约束线性表示系数具有稀疏性。然后,根据各个类别对于待识别样本的重构误差大小判定其类别。记A=[A1,A2,…,AM]∈Rd×N为M类目标的训练样本构成的全局字典,其中Ai∈Rd×Ni(i=1,2,…,M)为来自第i类的训练样本。对于待识别的测试样本y,其稀疏表示过程如下:
图2 目标区域和阴影相对关系描述
表1 描述目标区域与阴影相对关系的特征
(3)
式中,α代表稀疏系数矢量,ε预设的重构误差上限。公式(3)是一个NP-hard问题,可以通过1最小化算法[13]或正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)[7]算法进行求解。
(4)
式中r(i)(i=1,2,…,M)代表各个类别的重构误差
3.2 决策层融合
采用稀疏表示分类器对目标区域边界傅里叶描述子、阴影边界傅里叶描述子以及目标区域与阴影相对关系的特征矢量分别进行分类,然后通过决策层融合得到更为可靠的识别结果。在稀疏表示分类器中,各类的重构误差实际上反映了测试样本与各个类别的距离。因此,重构误差的大小表征了测试样本与不同类别的相似度。利用公式(5)将3个分类结果转换为归一化的相似度,以便于后续的决策融合。
(5)
通过线性加权的方式将3组归一化的相似度融合:
S(i)=ω1s1(i)+ω2s2(i)+ω3s3(i)(i=1,2,…,M)
(6)
式中,s1(i),s2(i)和s3(i)分别代表目标区域边界、阴影边界以及目标区域和阴影相对关系的归一化相似度;ω1,ω2,ω3为三者的线性加权系数,表示着三者的重要程度;S(i)为融合后的归一化相似度。本文中,通过实验环节中的权值调节,最终采用的权值为ω1=0.5,ω2=0.3,ω3=0.2。这表明目标区域对于正确识别的贡献最大,阴影次之,两者的相对关系贡献最小。三者相互补充使得识别结果更为可靠。图3给出了本文方法的识别流程。在求解稀疏表示系数矢量是,本文采用效率更高的OMP算法,以达到实时目标识别的效果。
图3 本文识别方法的流程
4 实验与分析
4.1 实验数据集
本文采用美国国防高级研究计划局(DARPA)和空军动力实验室(AFRL)公开的MSTAR数据集进行验证实验。该数据集包括了X波段HH极化下10类军事目标的实测SAR图像,图像大小128×128像素,原始分辨率为0.3 m×0.3 m,是目前验证SAR目标识别算法最常用的数据集之一。表2列出了10类目标的训练样本和测试样本。其中,训练样本采集于17°俯仰角,测试样本来自于15°俯仰角。
表2 本文使用的训练和测试样本
图4 10类目标的光学图像
4.2 实验结果与分析
实验中,本文采用了几种经典的SAR目标识别算法进行对比,包括:基于支持向量机的算法(记为SVM)[6],基于稀疏表示分类的算法(记为SRC)[7]和基于卷积神经网络的方法(记为CNN)[8]。
4.2.13类目标识别结果
实验中,首先测试了提出算法在3类目标—BMP2、BTR70和T72上的识别性能。本文方法对3类目标的识别结果如表3所示。可以看出,本文方法在3类目标上平均识别率达到98.32%,充分验证了其有效性。表4对比了本文算法与其它几类SAR目标识别方法的平均识别率。本文方法具有最高的识别率。可见,通过联合目标区域和阴影可以为目标识别提供更强的鉴别力,从而提高识别性能。
表3 3类目标的识别结果统计
表4 本文方法与其它方法在3类目标识别上的对比
4.2.210类目标识别结果
采用本文提出方法对表2中的10类目标进行了识别,具体结果如图4所示。本文方法对单个目标的识别率均达到94%以上,最终10类目标的平均识别率为96.72%。可见,联合目标区域和阴影的识别方法对10类目标仍然可以取得较高的正确识别率,验证了其有效性。表3进一步对比了本文方法与其它方法在10类目标上的识别性能,本文方法依旧保持最好的识别率。尽管CNN的分类能力很强,但是其性能与训练集的完备性息息相关。由于测试集的部分型号未包含在训练集中,CNN的识别性能受到一定程度的影响。
图5 本文方法对10类目标的识别结果
4.2.3噪声干扰
实际获取的SAR数据通常会受到来自于背景环境和雷达系统的噪声污染,因此识别算法应当对噪声干扰保持较强的稳健性。为了测试提出方法对于噪声干扰的稳健性,本文按照文献[5]、[15]中的方法对10类目标的测试样本添加不同程度的高斯白噪声进而测试各个识别算法在不同信噪比(Signal-to-Noise Ratio,SNR)下的识别性能。各类方法在噪声干扰条件下的识别性能如图6所示。可以看出,本文算法在各个信噪比下均保持最高的识别率,充分证明了其对于噪声干扰的较强稳健性。同时,SRC在低噪声水平时相比SVM和CNN具有更强的稳健性,这是由于稀疏表示自身对于噪声的稳健性。因此,本文算法在噪声干扰下的良好性能得益于目标区域和阴影的联合使用以及稀疏表示的优良特性。
表5 本文方法与其它方法在10类目标识别上的对比
图6 各类方法在不同信噪比下的识别性能
4.2.4分辨率改变下的识别结果
由于SAR传感器的差异,获取的待识别SAR图像的分辨率可能与训练样本有所差异这就要求识别算法对于分辨率变化具有一定的稳健性。为了测试提出算法对于分辨率变化的稳健性,本文按照文献[5]、[15]中的方法基于原始10类目标的测试样本构造了不同分辨率的SAR图像。通过在不同分辨率下测试各类识别方法,得到的各类方法的性能变化曲线如图7所示。对比而言,本文算法在各个分辨率下均保持最高的识别率,充分验证了其杜宇分辨率变化的稳健性。在分辨率改变的条件下,目标的全局特征发生了较大的变化,因此基于全局特征的SVM、SRC和CNN方法均出现了较为显著的性能下降。本文算法是基于目标区域和阴影,尽管分辨率较低,两者仍然可以以较高的精度得到分离。因此,本文方法仍然可以取得较好的识别性能。
图7 各类算法在不同分辨率下的识别性能
5 结 语
本文提出了联合目标区域和阴影的SAR目标识别方法。该方法采用椭圆傅里叶描述子描述目标区域和阴影的边界;同时采用特征矢量描述两者的相对关系。采用稀疏表示分类器对目标区域边界、阴影的椭圆傅里叶描述子以及相对关系的特征矢量进行分类,并采用决策层融合的方法得到更为稳健的识别结果。利用MSTAR数据集在多种条件下进行了验证实验,实验结果证明了本文方法相比其它方法具有较强的优越性。然而,作为一种基于目标区域和阴影的方法,提出方法对于目标几何外形的保持要求较为严格。当采集的SAR图像外形发生较大变化时,本文方法的性能将会出现较为严重的下降。同时,由于涉及到较为复杂的目标区域和阴影提取,本文方法的效率相对较低。