基于小波字典稀疏表示的SAR图像目标识别∗

2014-03-14田莉萍王建国

雷达科学与技术 2014年1期

田莉萍,王建国

(电子科技大学电子工程学院,四川成都611731)

0 引言

近年来稀疏表示理论得到了进一步的发展,尤其是2006年压缩感知理论[1]的提出更推动了稀疏表示理论在各个领域的应用。文献[2]首先将稀疏表示理论应用到人脸识别领域,识别效果良好,识别率均优于最近邻法、线性SVM算法等。而对雷达目标电磁散射特性的研究结果表明,在高频区雷达目标可用少数几个散射中心描述。这种性质和稀疏分解的要求十分吻合,有利于图像分析与目标识别[3]。文献[4]将压缩感知与SAR目标识别系统结合起来,验证了该识别方法的有效性,并对于遮挡具有一定的鲁棒性。文献[5]提出基于特征构造冗余字典的方法,区别于传统的基于像素的构造方法,使得冗余字典维数更低,提高了识别效率。

刘振等人提出的基于稀疏表示的SAR图像目标识别方法(Sparse Representation based Classification,SRC)[6],直接在图像域进行主元分析,提取2DPCA特征向量作为冗余字典的原子向量。而本文将原始图像变换到小波域,建立小波域SAR图像特征模型,得出小波低频成分可充分表征目标类别信息的结论。提出将主元分析运用到二维离散小波变换所获得的SAR图像低频信息上的方法,通过在此空间进行2DPCA特征抽取,理论上获得了维数更低的特征向量。对比其他识别算法,本文算法无需对原始SAR图像进行预处理,解决了针对不同SAR图像预处理算法自适应性难以保证的问题,大大提高了算法通用性。最后,基于MSTAR数据库的实验结果显示,由于结合了小波变换、2DPCA及SRC的优点,较单独基于图像域的SRC算法,本文算法识别速度更快、噪声鲁棒性更高。

1 稀疏表示理论简介

记A i={a i,1,a i,2,a i,3,…,a i,ni}∈R m×ni为单个训练样本集,元素a i,j是m维的矢量,代表被标记的第i类目标中第j个训练样本对应的特征列向量。因此,总训练样本集由A={A1,A2,…,A k}∈Rm×n构成,此时称集合A为冗余字典,元素a i,j为原子。对于任意测试样本y∈R m×1,都可以表示成原子a i,j的线性叠加,x j记为稀疏分解系数:

鉴于字典A的冗余性,原子a i,j不再是线性独立的,故方程组(1)的解是欠定的。为得到最稀疏的解,稀疏求解问题可以表示为

而求解包含ℓ0范数的组合优化问题,是个NP-难题。但是,Donoho已经从理论上严格证明了在一定条件下ℓ1范数和ℓ0范数的求解结果是等价的[7],可以用代替。因此,式(2)的稀疏求解模型在包含噪声的情况下更新为

2 小波域SAR图像特征模型分析

稀疏表示的识别机理是,测试样本能被同类训练样本构造的字典原子稀疏线性表示。测试样本在稀疏分解后,对应目标类别的系数能量较大,即稀疏系数具有类内能量集中的特点。综合电磁散射机理可知,确定性人造目标由一系列强散射点组成,其幅度能量主要集中在图像的低频稳定部分,而背景杂波、噪声等干扰是随机出现的,其幅度能量分散在整个频带中。引入二维离散小波分解技术,将有效表征目标信息的低频信息分离出来。原始SAR图像经小波分解后,低频成分描述目标的整体能量信息,高频成分描述背景杂波或噪声信息。

由二维离散小波分解定义可知,小波分解系数包含四个部分。因此,经2DDWT变换后,小波域SAR图像特征模型为

式中,Wφ表示低频近似系数;WHψ,WVψ,WDψ分别表示水平、垂直和对角方向的高频细节系数。图1表示原始SAR图像经一级小波分解后,获得的不同频段子图像。

图1 SAR图像一级小波分解图

图2表示第一类测试样本,分别在原始图像、小波域中各分量构造的冗余字典下稀疏系数的分布。图2(a)中原始SAR图像的分解系数分布不集中,未表征类别信息不利于识别;图2(b)中SAR图像小波域低频成分的分解系数具有类内能量集中的特点,类别信息明显有利于稀疏表示识别;而图2(c)、(d)、(e)中高频成分的稀疏系数能量分散,属于不利于稀疏表示识别的成分应去除。引入二维离散小波变换后,提取出对稀疏表示识别有利的低频信息,去除干扰识别结果的高频噪声及背景杂波分量,在压缩原子维数的同时提高了识别率。

图2 不同冗余字典下的稀疏分解结果

3 算法实现

根据SAR图像小波低频成分良好的稀疏表示能力,结合稀疏表示识别方法的基本思想,本文算法整体框图如图3所示。由图3可知,算法核心问题为:(1)小波字典的构造;(2)快速有效的稀疏求解方法。下面将围绕这两个问题进行分析。

图3 本文算法的整体框图

3.1 小波字典的构造

在小波字典的构造中,首先利用小波分解提取SAR图像训练样本的低频子图像,然后提取该子图像的2DPCA特征向量作为字典原子保存。结合了小波分解与2DPCA方法的优点,由全部训练样本的特征向量构造小波字典,有效地降低了特征维数、提高了识别效率。此处不再赘述二维离散小波变换理论,下面为2DPCA特征向量的提取过程。

假设训练样本小波分解后,低频子图像集为{I1,…,I n},且I i∈R h×l,i=1,…,n,n为训练样本总数。首先将图像进行中心化处理,即,其中为所有训练样本的均值图像。训练图像的协方差矩阵D定义为

投影矩阵V可由D的前r个较大特征值λ1,…,λr对应的特征向量[v1,…,v r]组成[8]。因此,对于任意样本图像I i∈R h×l,其2DPCA特征F2DPCA=[f1,…,f r]=~I i[v1,…,v r]=(I i-I)V∈R h×r。

3.2 稀疏求解算法

正交匹配追踪算法(OMP)作为对信号稀疏分解的算法之一,其应用最为广泛,因为它在信号分解的稀疏性和计算复杂度之间作出了较好的折中和平衡[9]。OMP算法的流程与步骤如下:

算法流程

输入:稀疏字典D={v1,v2,…,v N},测试样本信号y,稀疏度K;

输出:x的K-稀疏的逼近x。

算法步骤

(1)初始化:初始残余量r0=y,索引集Λ=Φ,迭代次数t=1,且先验稀疏度K已知;

(2)找出残差r与字典D中的原子v i内积最大值所对应的脚标λ,即

(3)更新索引集:Λt=Λt-1∪{λt},由索引集得重建原子集合V t=[V t-1,vλt];

(5)更新残余量:r t=y-V tx t,t=t+1;

(6)判断是否满足t＞K,若满足,则停止迭代;若不满足,则执行步骤(2)。

由算法的迭代终止条件可知,稀疏度值K实质决定了稀疏分解系数x t的非零解个数。故不同稀疏度的测试样本稀疏求解后,所对应的稀疏系数非零解个数不等。由于实际中K未知需要估计,为避免估计每个测试样本的稀疏度K,提出了一种稀疏度自适应的改进OMP算法。改进算法的关键是迭代终止条件的更改,用稀疏系数的类别统计量c k＞C替代t＞K作为终止条件,c k的定义是非零系数属于第k类的个数。类别统计常量C代替稀疏度K,实验验证C取2～5时识别性能最佳,实验中取C=3。改进后,不同测试样本的分解迭代次数t不再由K决定,而是自适应的变化直到满足某一类非零系数个数大于C,即实质上实现了稀疏度的自适应变化。改进O MP算法以类别信息量作为迭代终止条件,更加符合识别要求。

3.3 分类识别

设由改进O MP算法得到的稀疏分解系数为x,记x=(x1,1,…,x1,n1,…,x k,1,…,x k,nk)T,其中共有N类训练样本,第k类样本总数为n k。而如何根据稀疏系数进行分类识别,也是SAR图像稀疏表示识别的关键所在。本文采用归类系数最大准则得到识别结果,归类系数最大准则的定义是:分别记各类分解系数的2范数为归类系数,将归类系数最大值对应的训练样本所属类别作为测试样本的类别。归类系数定义为

图4为三类不同目标在特征冗余字典下的稀疏表示识别结果。由图4可知,稀疏分解系数主要集中在一类上,由其归类系数最大值对应类作为识别结果输出。

图4 三类目标的稀疏表示识别结果

4 实验结果分析

实验采用MSTAR SAR数据,它是迄今公开的较为完备地评价SAR ATR算法性能的标准数据。图像数据的切片大小为128像素×128像素,分辨率为0.3 m×0.3 m,包括了俯仰角在17°和15°下的三类目标,分别可用作实验的训练样本和测试样本。选择17°俯仰角下的三类目标数据作为训练样本,15°俯仰角下的目标数据作为测试样本,表1列出了所用数据样本的型号和个数。

表1 实验样本数据简介

基于MSTAR SAR数据设计了三个识别实验,实验思路如下:(1)通过分析不同小波分解级数下识别性能的差别,确定出最佳小波分解级数;(2)确定最佳小波分解级数后,重点分析小波变换对于稀疏表示识别的影响,对比引入小波变换前后识别性能的差异;(3)验证非理想情况下,本文算法对于噪声的鲁棒性。

4.1 实验1

引入小波变换后,实验分别验证了小波基种类与小波分解级数对识别结果的影响。实验显示,小波基的选择对于识别结果影响不大,而小波分解级数对识别性能有影响。实验中选取‘db1’作为小波基,统计不同级小波分解对应的识别结果,得出在相同原子维数情况下识别性能最优的小波分解级数。由图5的识别性能对比曲线可知,二级小波分解较一级、三级分解的识别性能更佳。因为,其识别率随着原子维数增加呈上升趋势,未出现异常值。当二级小波分解原子维数为480时达到100%的识别率,一级小波分解在原子维数为512时识别率为99.83%,三级小波分解最高原子维数为256,当其达到最高原子维数时识别率为98.63%。由于原子维数越少识别时间越短,综合识别效果与效率,二级小波分解为最佳分解级数。

图5 不同级小波分解下的识别性能对比曲线

4.2 实验2

在二级小波分解级数的前提下,通过对比引入小波变换前后的识别率,结果表明引入小波变换可大大提升稀疏表示识别算法的性能。表2随机简单对比了以小波变换取代预处理后的识别结果,由表2可知引入小波变换后识别率获得提高,且省去了繁琐的预处理过程,因而识别时间大大减少。

表2 引入小波变换前后的识别结果对比

表2中各数据及方法说明:(1)其中原子维数为128×10,64×6的意义:10,6维代表由2DPCA所得的前10,6个特征向量作为特征原子,而128维、64维分别代表图像字典和小波字典的原子维数大小;(2)方法1中的预处理定义参考文献[6],具体过程如图6所示。

统计不同原子维数下两算法的识别结果,并画出识别性能对比曲线如图7所示。对比曲线表明,引入小波变换后识别性能大大提高,故加入小波变换是十分有效的。

4.3 实验3

向原始样本图像添加椒盐噪声,噪声密度比分别为0.02,0.04,0.06,0.08和0.10,图8为不同噪声程度下的各算法识别率结果。结果显示本文算法对于椒盐噪声的鲁棒性,较其他稀疏识别算法的识别结果更为稳定可靠。原因在于本文算法引入小波变换后,只提取小波低频子图像的2DPCA特征向量作为冗余字典原子,去掉了高频噪声的干扰,使得抗噪性能更好。

图6 SAR图像预处理流程

图7 加入小波处理前后识别性能对比曲线

图8 不同噪声密度比下各算法识别率的对比曲线

5 结束语

本文针对现有稀疏表示识别算法基于图像域构造冗余字典的不足,通过对比图像域、小波域各成分稀疏表示能力的差异,得到小波低频成分对识别更有利的结论,由此提出基于小波域主元分析的SAR图像稀疏表示识别算法。这一算法的优越性在于摆脱了传统SAR识别算法对于预处理过程的依赖性,结合了二维小波分解与二维主元分析的优点,使得基于稀疏表示的SAR图像识别方法特征维数更少,识别效率更高。同时,只保留小波低频子图像,去除了高频噪声干扰,使得算法抗噪效果更好。通过MSTAR实测SAR图像数据的实验结果表明,本文算法的识别性能比基于图像域的SRC算法更优。

其他滤波方法中,经高斯滤波与下采样处理后,获得的识别结果不及小波处理。原因在于本文算法成立的基础,由第2小节小波域SAR图像特征模型分析知,仅小波域的低频成分对目标的稀疏表示能力好,仅由低频成分所构成的小波字典对应的稀疏系数集中分布在第一类,与稀疏表示的理论相符。而其他类似于小波字典的冗余字典构成方法,后续研究过程有待继续深入。

[1]Donoho D L.Compressed Sensing[J].IEEE Trans on Information Theory,2006,52(4):1289-1306.

[2]李伟红,龚卫国,陈伟民,等.基于小波分析与KPCA的人脸识别方法[J].计算机应用,2005,25(10):2339-2341.

[3]郑纯丹,周代英.稀疏分解在雷达一维距离像中的应用[J].雷达科学与技术,2013,11(1):55-58.ZHENG Chun-dan,ZHOU Dai-ying.Research on High Rasolution Range Profile Based on Sparse Decomposition in Radar[J].Radar Science and Technology,2013,11(1):55-58.(in Chinese)

[4]高敏.基于CS的SAR目标识别[D].西安:西安电子科技大学,2010.

[5]王燕霞,张弓.基于特征参数稀疏表示的SAR图像目标识别[J].重庆邮电大学学报(自然科学版),2012,24(3):308-313.

[6]刘振,姜晖,王粒宾.基于稀疏表示的SAR图像目标识别方法[J].计算机工程与应用,2012,31(9):1-5.

[7]Chen S,Donoho D,Saunders M.Atomic Decomposition by Basis Pursuit[J].SIAM Journal on Scientific Computing,2001,20(1):33-61.

[8]胡利平,刘宏伟,尹奎英,等.基于G2DPCA的SAR目标特征提取与识别[J].宇航学报,2009,30(6):2322-2327.

[9]王燕霞,张弓.一种改进的用于稀疏表示的正交匹配追踪算法[J].信息与电子工程,2012,10(5):579-583.