结合多特征联合表征和自适应加权的SAR图像目标识别方法
2022-11-22王源源王小芳
王源源, 王小芳
(电子科技大学成都学院,成都 611000)
0 引言
合成孔径雷达(SAR)具有全天时、全天候的显著优势,自问世以来即成为军事侦察和资源勘探的有力工具。但是,由于真实成像条件的复杂性以及针对SAR干扰装备的建设和使用,SAR图像的判读和目标识别变得愈发困难。SAR目标识别问题自20世纪90年代以来受到广泛关注,并涌现了大量高性能算法[1]。在国内,SAR目标识别问题在一流高校受到广泛关注,并产出了大量成果[2-5]。根据对现有文献的梳理和分析,研究人员主要着力解决特征提取和分类器应用问题。其中,特征提取研究更为广泛和灵活,特征类型覆盖几何形状、投影变换以及电磁散射等类别。几何形状特征描述目标的区域、轮廓分布规律[6-9],例如文献[6]中的轮廓描述子、文献[7]中的Zernike矩特征等。投影变换特征可进一步区分为投影类和变换类[10-15],前者主要通过训练样本的学习获得最佳投影方向,代表性的是主成分分析(PCA)[10];后者则通过一系列的信号基底对原始图像进行分解,典型的有小波分解[13]、单演信号[3,14]等。电磁散射特征重点描述雷达目标的后向散射特性,如属性散射中心[16-17]。从描述的角度和特征的形式来看,以上3类特征具有不同的能力,因此也具有一定的互补性。分类器通常应用在特征提取之后,通过对特征进行分类做类别判决。SAR目标识别中的分类器主要继承于传统模式识别领域,如K近邻(KNN)[18]、支持向量机(SVM)[19-20]、稀疏表示分类(SRC)[20-22]等。近年来,随着深度学习的发展,以卷积神经网络(CNN)[23]为代表的相关分类模型也不断应用于SAR目标识别并验证了有效性。
本文提出结合多特征联合表征和自适应加权的SAR目标识别方法。在特征使用方面,选取当前应用成熟的PCA、单演信号和Zernike矩特征,分别描述SAR图像的像素分布、时频分布以及目标形状特性。三者从属于不同的特征类别,在描述目标特性方面具有良好的互补性。采用联合稀疏表示模型作为3类特征的表征工具[14-15]。根据联合稀疏表示的原理,其在独立描述各类特征的同时,可利用三者之间的相关性提高表示精度,因此,根据联合稀疏表示的重构结果有利于获得更为可靠的决策。对于不同类别输出的重构误差矢量,本文通过自适应加权方法进行线性融合。在传统基于联合稀疏表示的决策机制中,不同任务的重构误差直接相加,进而根据最小误差进行判决。但实际上,不同任务的权重是不同的,这种同等权值的思路存在一定的不足。为此,本文采用文献[24]提出的自适应权值确定方法获得最佳的权值,分别对不同特征进行加权处理,根据加权融合后的误差矢量判决测试样本的目标类别。实验中,在MSTAR数据集上进行测试和验证,结果验证了方法的有效性。
1 多特征提取
如前文所述,用于SAR目标识别的特征类别多样且不同类别之间具有较大的差异。本文旨在通过多类特征提高决策精度,因此需要重点体现不同特征的互补性,从而充分利用鉴别信息。根据现有文献中的研究成果,本文在后续算法中使用PCA、单演信号以及Zernike矩特征3类典型特征。
PCA特征长期应用于SAR图像目标识别,其核心思想是通过带类别标签的大量训练集获取最佳的投影降维方向,保留数据主成分,剔除噪声、干扰带来的冗余成分[10]。PCA的主要优点是降维效率高,并且可以直接获得形式统一的特征矢量。但是PCA特征不具备明确的物理意义,可解释性不足。在图像出现噪声干扰、部分遮挡等情形时,PCA特征的有效性往往下降明显。
单演信号特征是由董刚刚等[3,14]引入到SAR图像目标识别的,其基本原理是以二维解析信号为基底,对SAR图像进行分解,获得描述幅度、方位和相位三重信息的结果,通过适当处理可转换为特征矢量。SAR图像经过单演信号分解可以获取全面反映图像时频信息的特征,实现对目标全局和局部细节信息的综合描述。然而,单演信号特征提取相对复杂,并且参数的选取也直接影响最终的结果。
Zernike矩特征是传统区域矩特征的典型代表,其基本原理是通过多阶表达式描述区域的外形分布,从而描述目标的形状特征[7]。与前两类特征相比,Zernike矩基于目标区域获取,因此物理意义明确,可以解释目标发生部分变化时的情形。不足的是,Zernike的计算同样复杂,并且其可靠性直接与目标区域提取的精度相关。
为此,本文选取的3类特征从不同角度描述目标的特性,具有良好的互补性。同时,3类特征均可表达为特征向量形式,有利于后续的表征和分类。
2 方法描述
2.1 联合稀疏表示
联合稀疏表示作为传统稀疏表示算法的扩展应用,具备同时处理多个稀疏表示问题的能力。与单个稀疏表示问题求解相比,联合稀疏表示问题可利用不同问题之间的关联性提高整体精度[14-15]。同一测试样本的多类特征,具体为本文中使用的PCA、单演信号和Zernike矩特征,具有内在相关性,适合采用联合稀疏表示模型进行处理及分析。记测试样本为y,按照本文方法提取得到的PCA、单演信号和Zernike矩特征矢量分别为y(1),y(2)和y(3),它们独立表示的形式为
y(k)=A(k)α(k)+ε(k)k=1,2,3
(1)
式中:A(k)为第k个特征的字典;α(k)为相应的稀疏系数矢量。
一般地,通过最小化3类特征的整体误差获得最佳的稀疏系数矢量,待优化问题的形式为[14-15]
(2)
式中,β=(α(1)α(2)α(3)),为系数矩阵。
显然,式(4)呈现的方式并没有利用不同特征之间的关联性。为此,早期研究从稀疏矩阵β的结构入手进行适当约束,更新得到如下优化目标函数[14-15]
(3)
求解阶段,可按特征类别分别进行测试样本重构,然后计算各类特征的整体重构误差,进而判决目标所属类别,即
(4)
2.2 目标识别
对于本文3类特征的重构误差融合,采用相同的思路,具体算法可参见文献[20]。图1给出了所提方法的识别流程,具体步骤可描述如下:
1) 对训练样本采用PCA、单演信号和Zernike矩进行特征提取,分别构建对应的字典;
2) 对测试样本进行上述3类特征的提取;
3) 基于联合稀疏表示模型对测试样本的3类特征进行表征,计算各类特征对应的重构误差矢量;
4) 采用自适应加权算法对3类特征的误差矢量进行融合,根据融合后的误差判定测试样本的目标类别。
图1 所提方法的识别流程Fig.1 Procedure of implementation of the proposed method
3 实验与分析
3.1 实验设置
采用MSTAR公开数据集对本文方法进行实验与分析。图2所示为该数据集中包含的10类典型车辆目标(包含坦克、装甲车等)。
图2 MSTAR数据集包含的目标类别Fig.2 Targets included in the MSTAR dataset
对于每一类目标,MSTAR数据集均采集了较为完备的方位角样本,并覆盖若干俯仰角。表1给出了后续实验中使用的基础训练集和测试集,分别来自17°和15°两个俯仰角。
表1 实验中使用的基础训练集和测试集
上述设置中,训练集与测试集只有较小的俯仰角差异,整体相似程度较高,一般认为是标准操作条件。在此基础上,可通过模拟手段,如噪声添加、模拟遮挡等方式获得近似扩展操作条件下的测试样本,对方法性能进行进一步验证。
作为对比,实验中设置了几类对比方法。其中,PCA、单演信号以及Zernike矩方法分别来自文献[10]、文献[14]和文献[7],与本文方法对比可直接反映多特征联合的优缺点。多特征联合对比方法仅对本文使用的3类特征进行联合稀疏表示,并对不同特征的重构结果进行直接相加,与本文方法对比可直接反映自适应加权融合的优缺点。CNN方法是当前深度学习模型在SAR目标识别中的代表性应用[23],具有较强的对比分析价值。
3.2 结果与分析
3.2.1 标准操作条件
以表1中的基础训练集和测试集为参照,对本文方法在标准操作条件下进行测试。图3所示为以混淆矩阵的形式反映了本文方法的识别结果。
图3 标准操作条件下本文方法的结果Fig.3 Results of the proposed method under standard operating condition
根据图3中横纵坐标的对应关系可知,对角线元素为不同类别的正确识别率。定义平均识别率(Pav)为获得正确分类的测试样本占整个测试集的比例,计算本文方法的Pav为99.43%。表2按照相同的过程分别对5类对比方法进行测试,并统计结果与本文所提方法进行对比展示。由表2可以看出,本文方法的平均识别率最高,显示其有效性。与使用单一特征的3类方法相比,多特征方法的优势较为明显,体现了不同特征之间的互补性。CNN方法在标准操作条件下的性能也保持较高水平,表明深度学习模型的优越性。与多特征联合方法相比,本文通过引入自适应加权融合进一步提高了整体识别性能,显示了所提策略的有效性。
表2 测试条件1下的结果
3.2.2 噪声干扰
实际过程中,获取的非合作目标测试样本往往受到不同程度的噪声干扰。随着测试样本与训练集之间信噪比(SNR)差异的不断增大,两者的相关性也随之降低。在表1实验设置的基础上,本文按照文献[16]中的方法对原始测试样本进行加性高斯白噪声添加。具体地,根据原始图像的能量和预设的信噪比进行噪声生成和叠加,最终构造了不同信噪比的测试集,包括10 dB,5 dB,0 dB,-5 dB和-10 dB。在不同噪声水平下对所提方法和对比方法进行测试,获取如图4所示的结果。直观可见,噪声干扰对于SAR目标识别性能有着较为显著的影响。对比来看,所提方法在各个信噪比条件下均保持了最高的平均识别率,反映其稳健性。与标准操作条件下的结果相似,多特征方法在噪声干扰条件下的性能优势依然明显;不同的是,CNN方法性能的下降十分显著,主要是由于训练集难以有效覆盖测试集中的情形,导致分类模型的适应性降低。3种单类特征方法中,基于Zernike矩特征和单演信号特征的方法稳健性优于PCA特征,这也体现了不同特征对于噪声干扰的敏感性不同。与单类特征的方法相比,本文方法有效融合不同特征,并且在融合过程中使用了自适应权值,能够有效发挥各类特征对于噪声干扰的优势。具体来说,Zernike矩特征和单演信号对于噪声干扰具有更强的稳健性,在实验过程中可观察到它们的权值相比PCA特征更高,发挥其优势。
图4 噪声干扰下的结果对比Fig.4 Results comparison under noise interference
3.2.3 部分遮挡
遮挡情形在实际应用中也十分常见。地面目标由于临近建筑、树木等遮挡导致自身一部分无法收到雷达波。体现在SAR图像上,即为目标的部分缺失。按照噪声模拟相近的思路,本文在表1测试样本的基础上,按照文献[16]、文献[25]中的目标遮挡模型构造不同遮挡水平的测试集。在此基础上,测试获得本文方法以及对比方法的识别结果如图5所示。通过对比可见,本文方法在不同遮挡水平下保持最高的平均识别率,体现其稳健性。与噪声干扰的情形类似,CNN方法在当前条件下性能下降十分显著,反映了深度模型对于扩展操作条件的局限性。与噪声干扰的情形相近,本文方法通过自适应加权融合使得对于遮挡情形识别更有利的特征获得了更大的加权,从而发挥其优势,提高了最终识别结果的正确性。
图5 部分遮挡下的结果对比Fig.5 Results comparison under partial occlusion
4 结束语
本文将联合稀疏表示与自适应加权融合应用于SAR图像目标识别。对于3类特征的联合稀疏表示的重构误差矢量,在线性加权的框架下实现自适应权值确定,从而体现了不同特征对于最终分类结果的不同贡献。基于MSTAR数据集开展实验,分别测试在标准操作条件、噪声干扰以及部分遮挡条件下的识别性能,并与5类现有方法进行对比。实验结果表明,本文方法的有效性和稳健性均具有一定优势。需要指出的是,现阶段本文方法仍存在一定不足之处,这也是后续开展研究的方向。1) 在特征选取方面,可以进一步优化,采用鉴别力更强、互补性更好的多类特征;2) 在权值确定过程中,可进一步结合不同类别特征的先验知识进行优化,提高权值的有效性。