APP下载

基于小波变换和深层稀疏编码的SAR目标识别

2014-07-02许悦雷马时平倪嘉成

电视技术 2014年13期
关键词:隐层深层权值

李 帅,许悦雷,马时平,倪嘉成,王 坤

(1.空军工程大学航空航天工程学院,陕西西安710038;2.甘肃省张掖市山丹县95876部队,甘肃张掖734100)

基于小波变换和深层稀疏编码的SAR目标识别

李 帅1,许悦雷1,马时平1,倪嘉成1,王 坤2

(1.空军工程大学航空航天工程学院,陕西西安710038;2.甘肃省张掖市山丹县95876部队,甘肃张掖734100)

针对SAR图像预处理算法自适应能力差、带标签图像不足、目标特征提取困难等问题,提出了一种基于小波变换和深层稀疏编码的SAR图像目标自动识别算法。首先利用灰度值和尺度缩放获得大量的无标签SAR目标,并采用离散小波变换对图像进行高效的降维,再结合深层稀疏编码提取目标的深层抽象特征并完成识别任务。采用MSTAR数据库中3类军事目标进行算法仿真与验证。实验结果表明,在没有预处理的情况下,该算法能够有效地完成多目标SAR图像分类,且具有较高的识别率和鲁棒性。

合成孔径雷达图像;目标识别;深层稀疏编码;深度学习;小波变换

合成孔径雷达(Synthetic Aperture Radar,SAR)由于其全天候作战的特点而迅速发展起来。SAR图像作为一种新型的遥感图像具有特殊的乘性斑点噪声及丰富的纹理信息等特点。通常情况下,SAR图像目标自动识别算法在识别前必须要进行图像预处理,要求在有效抑制相干斑噪声的同时较好地保持目标的结构纹理信息[1-2]。然而,预处理算法的自适应性往往难以满足。另外,目前常见的SAR目标识别算法一般属于监督学习,需要大量带标记的SAR图像目标作为训练样本,这在实际应用中也是很难实现的[3-5]。如文献[3]通过构建过完备字典,并用PCA降维,提出一种基于主元分析和稀疏表示的无预处理的SAR目标识别算法,然而稀疏表示需要利用标记目标有监督的生成过完备词典。而深度学习理论(Deep Learning)是目前无监督及半监督学习算法的前沿核心之一,它可以有效地利用SAR图像丰富的纹理和结构信息,以学习目标的高层抽象特征更好地进行分类。

深度学习理论是由Hinton等人2006年提出来的,其核心思想是通过构建一种包含多隐层的深层神经网络结构,提取图像、语音等信号的高层抽象信息,得到目标近似准确的表示[6]。2007年,Bengio等人提出了一种通过堆叠编码器、解码器实现深度学习的算法——深层自动编码器[7]。由于其在目标特征提取方面具有高效、鲁棒等特点,一些学者已成功将其用于光学图像的识别[8]、去噪[9]、降维[10]等方面,且均取得了较好的效果。二维小波变换通过尺度伸缩和旋转生成一组滤波器,可以提取图像在不同的频率尺度和纹理方向的信息,而其中的低频子带图像包含了SAR目标的大部分能量信息,可以用于实现SAR图像降维。

基于以上分析,本文提出了一种基于小波变换和深层稀疏编码的SAR目标识别算法。首先,通过对SAR图像进行不同倍数灰度值、尺度的等比例缩放增加样本数目,更加准确地表达目标的深层特征,再利用小波变换抽取SAR图像的低通子带图像作为SAR目标数据[12],最后运用深层稀疏编码(Deep Sparse Auto-encoders,DSA)学习目标的特征用于SAR目标的自动识别。本文使用该方法对MSTAR数据库中的3类SAR目标进行识别,并与其他识别方法进行了对比实验。

1 深层稀疏编码模型

2006年,Geoffrey Hinton等人提出了一个基于深置信度网络(DBN)的非监督贪婪逐层训练的深度学习算法。深度学习本质上是神经网络的延续与发展,神经网络基本结构如图1,其核心思想就是通过构建一种具有多隐层的机器学习模型,再利用用于训练的大量数据来学习更有用的特征,得到一个稳定可靠的系统结构。深度学习最简单的一种算法就是利用ANN的结构特点,用半监督的学习方法学习特征[8]。

图1 神经网络的网络结构图

自动编码的结构图如图2所示。

图2 自动编码器的结构示意图

首先对给定的无标签输入数据X=(x1,x2,…,xN)T∈RN进行编码,神经网络的参量θ(W,b),输出为Y= fdec(fenc),则

式中:l(x)=1/(1+exp(-q·x))

通过调整网络中层与层之间的变量(权值W及偏置b)使得重构误差最小,从而得到“最好”的编码。即最小化损失函数

式中:nl,sl为相邻两层神经元的个数;Wji为两层神经元i,j之间的权值向量。

假定X,Y∈[0,1],则可采用交叉熵作为损失函数

深层自动编码就是堆叠这种结构,从而得到一个多隐层的非线性网络,用于表征数据的概率分布,获取高层抽象的特征。当用无监督学习完成对整个网络的训练后,再用BP算法对网络参量进行有监督的微调,这种半监督的学习方法可大大提高网络特征学习的准确性。

深层稀疏编码就是通过约束求取原始数据的近似表示,这种近似可以通过约束隐层神经元间的稀疏性,如式(4)、式(5)。这种稀疏约束使得大部分隐层神经元的状态为0,即对输入没有响应,从而学习“最感兴趣”的目标特征,这种结构正是人脑工作的方式。

式中:ρ为稀疏惩罚系数;^ρ由网络参量θ(W,b)确定。

2 二维离散小波变换概述

二维离散小波变换具有多分辨分析的标准,具有稀疏性、减相关等特点[11],二维离散小波分解可分别用低通滤波器和高通滤波器沿图像行方向、列方向进行一维小波分解实现[11]。图像经过一级二维离散小波变换,原图像被分解成4个子带图像。令φj,m,n(x,y)表示二维离散小波尺度,φ(H)(x,y),φ(V)(x,y),φ(D)(x,y)分别表示水平、垂直和对角线方向的二维离散小波,则

则尺寸为M×N的图像I(x,y)的二维离散小波分解为

小波分解的结果是将图像划分成子带图像的集合。经过一级小波分解生成4种不同系数,从而得到4个子带图像,且各子带图像的维数应是分解前原始图像维数的1/4。在第2级小波分解时,1级分解得到的低频子图像被继续分解划分成了1个低频子图像和3个较高频子图像的集合。小波分解使得图像数据量减少,但同时也造成图像分辨率的下降。小波变换具有很好的能量集中性,低频子图像包含了目标图像大部分的能量,而高频子图像仅包含少量的目标能量。针对SAR图像,目标的低频分量包含了大部分的目标判别信息表现了其“概貌”,高频部分表现了其细节及大量噪声。

3 SAR图像目标识别方法

本文提出的SAR图像自动识别算法由4个部分组成(见图3):1)图像灰度值和尺度缩放。2)二维离散小波分解降维。3)特征抽取。本文采用DSA模型有效地提取目标的区分性特征,以实现更好的识别分类。4)识别分类。由于本文实验中要完成多类SAR目标的识别任务,故采用Softmax回归实现对DSA学习特征的多目标分类。

图3 SAR目标识别系统结构图

各部分具体的处理过程如下:

采用整体灰度值、尺度的缩放增加MSTAR数据库的SAR图像数量,从而获取大量的无标签SAR目标用于无监督学习,可以学得输入图像的本质信息,这比随机初始化网络参量要更加接近真实情况。通过对不同灰度、尺度SAR目标的训练可以突出结构特征信息,大大增加了算法的鲁棒性,重复学习从而更准确地学习目标的深层信息。

一般情况下SAR图像维数较大,过高的输入数据维度会大大增加DSA提取特征的时间,降低运行效率,因此需要在特征提取前进行图像降维。利用离散小波分解可有效实现图像降维,小波分解能够提取得到SAR图像的低通近似系数和高通细节系数。由于低通近似系数携带了目标的大部分能量,因此以它作为DSA模型的输入可以基本保持原始目标的特征信息,而携带了图像细节和噪声的高通细节系数则不适于作为输入数据。

另一方面,小波母函数的选取也是SAR目标低频子图像获取的关键环节。选取不同的小波母函数会得到差异很大的低频图像,对目标信息的保持也有较大差异,从而极大地影响DSA对目标的特征提取。文献[12]采用了基于类内—类间标准差的方法对大量常用的小波母函数提取的低频信息进行评价。如果用M、N分别为目标小波低频特征数和类别数,其中类内标准差表征了同类目标的平均差异,定义为

式中:σij为第j个特征在第i类中类内标准差。而类间平均标准差表征了不同类别目标间的差异,定义为

式中,σμj为第j个特征平均类间标准差。

因此,在选择小波母函数时要在这两个评价指标之间取折中。研究发现,小波母函数“haar”具有较优的可分性指标和计算简便性[13]。因此,本文选用该母函数的2级小波变换对SAR图像进行简单、有效的图像降维,在保持图像大部分有效信息的同时可大大减少计算量,提高目标特征提取的效率。

本文采用深层稀疏编码提取SAR图像的本质特征。首先将每一幅输入SAR图像看成是一个列向量xi,每次输入n幅SAR目标图像构成输入矩阵X=(x1,x2,…,xn)T,作为DSA模型的输入数据,通过第一层编码器获得第一隐层的状态为

对于一个由l个隐层组成的深层网络,采用贪婪算法逐层初始化,则第i隐层的状态为

利用Softmax回归进行分类识别。在第l层上添加一个输出层,构成一个Softmax分类器,Softmax回归模型是logistic回归模型在多类问题上的扩展[14],对训练集{(x(1),y(1)),…,(x(m),y(m))},y(i)∈ {1,2,…,k},在Softmax回归中将输入x归类为类别j的概率为

文中用Softmax实现SAR目标的识别分类,输出为

其中

4 仿真实验及结果分析

本文仿真实验中采用的数据是由美国国防高级研究规划局(DARPA)MSTAR工作组公开的MSTAR图像库,它由实测的SAR地面静止军用目标数据组成。实验中选用其中的3类SAR目标:BMP2(装甲车)、BMP70(装甲车)、T72(主战坦克)进行实验,图像成像分辨率是0.3 m×0.3 m,方位角覆盖范围是0°~360°,图像大小为128×128。实验中不考虑姿态角预测,实验过程中通过对MSTAR数据库中的SAR图像的灰度、尺度缩放得到大量新的无标签数据,共计103 150幅SAR目标图像,训练和测试样本分别是从目标在俯视角分别为17°和15°时的成像数据中随机挑选,分别为20 000幅和10 000幅,每次随机取100幅输入图像组成一个数据集,最后通过BP算法调整得到全局最优的权值向量。实验中通过2级小波分解,每幅样本图像的像素均为32×32。

首先对原始SAR图像做灰度、尺度缩放处理,其中灰度值等比例缩放需要将灰度值限制在0~255之间,尺度缩放后应以图像中心取128×128个像素点作为原始SAR目标图像,三类训练目标的处理结果如图4所示,其中图4a、图4b、图4c分别是BMP2、T72、BTR70做灰度等比例缩放的结果,图4d是T72做尺度缩放后的结果。从图中可以看出,灰度值和尺度缩放增加了输入数据的信息量,不仅扩大了SAR目标数据库的无标签目标数量,还使得输入数据更接近真实情况,从而对识别算法的鲁棒性要求更高。

图4 灰度和尺度缩放处理后的目标图像

图5表示对图4中的输入SAR图像进行2级二维离散小波分解后得到相应的低频子带图像(小波母函数选取“haar”),SAR目标的小波低频系数构成模型输入矢量。从图5中可以看出,本文选取的小波分解在完成图像降维的同时虽降低了分辨率,但仍较好地保持了3类SAR图像目标的基本有用信息,它较好地反映了目标在大尺度下的几何特征。

图5 小波变换提取的相应低频子带图像

其次,本文利用上述得到的小波低频近似系数作为输入数据学习DSA网络(实验中所用的模型为堆叠了5个稀疏自动编码器的深层结构),无监督学习得到包含输入图像信息的初始化数据,有效解决了随机初始化的局限性。

最后,将学习得到的这些深层抽象信息用于SAR目标识别,实验中学习得到的神经元间的权值分布如图6所示(本文只给出了前四层神经元间的权值,其他层间权值与所列结果一致,不再赘述)。图中w1、w2、w3分别表示输入层神经元与第一隐层神经元间、第一隐层神经元与第二隐层神经元间、第二隐层神经元与第三隐层神经元间的权值,图6横轴代表所有权值常数,纵轴代表为某一特定权值的个数。从图中可直观看出,层与层间的神经元的权值绝大多数处于0附近,即下一层神经元对上一层输入没有响应,这与真实的人类视觉机制是完全一致的。最终得到对测试数据集的分类结果如表1所示。

图6 权值稀疏性分析

表1 几种SAR目标识别算法的比较 %

本文实验中采用的平台是Pentium Dual-Core CPU E6700 3.2 GHz,内存为2 Gbyte,操作系统为Windows XP,仿真软件为MATLAB R2010a。由表1可以看出,相比于其他几种方法,本文提出的算法对3类SAR军事目标的识别均有了一定的提高,这充分表明DSA网络较好地提取了不同目标的关键和区分性特征。由图6可知,DSA深层神经网络的权值参量经过本文算法的学习,已经调整得很好,大部分神经元对期望输出有贡献,其输出值等于或近似等于1,其余分类均接近于0。

由以上实验可知,当输入SAR图像训练样本数量足够大,DSA网络深度足够时,本文算法能够有效提取SAR目标的本质特征,较好地完成SAR图像的多目标识别任务,具有很好的识别率和鲁棒性。

5 结语

本文针对SAR图像边缘、纹理丰富、标记图像数量不足,以及预处理算法泛化能力差等特点,在没有预处理的情况下,提出了一种基于小波变换和深层稀疏编码的半监督SAR图像目标识别方法。灰度值和目标尺度缩放在满足大数据量的同时,突出了SAR图像目标的结构、边缘纹理等特征,小波变换提取了SAR目标的低频子带图像,实现对SAR目标的高效降维,而半监督的深层稀疏编码有效提取了“感兴趣”的目标高层抽象信息,再利用Softmax回归对目标进行分类。实验结果表明,本文算法提高了SAR目标识别的识别率,同时对目标旋转、尺度伸缩、灰度变化等具有较强的鲁棒性。

[1]PAPSON S,NARAYANAN R.Classification via the shadow region in SAR imagery[J].IEEE Trans.Aerospace and Electronic Systems,2012,48(2):969-979.

[2]PARK J,PARK S,KIM K.New discrimination features for SAR automatic target recognition[J].IEEE Geoscience and Remote Sensing Letters,2013,10(3):476-480.

[3]刘中杰,庄丽葵,曹云峰,等.基于主元分析和稀疏表示的SAR图像目标识别[J].系统工程与电子技术,2013,35(2):282-286.

[4]宦若虹,张平,潘赟.PCA、ICA和Gabor小波决策融合的SAR目标识别[J].遥感学报,2012,16(2):262-267.

[5]LIUMing,WU Yan,ZHANGPeng,etal.SAR target configuration recognition using locality preserving property and gaussianmixture distribution[J].IEEE Geoscience and Remote Sensing Letters,2013,10(2): 268-272.

[6]HINTON G,OSINDERO S.A fast learning algorithm for deep belief nets[J].International Journal of Computer Vision,2006,18(7): 1527-1554.

[7]BENGIO Y.Learning deep architectures for AI[J].Foundations and Trends R in Machine Learning,2009,2(1):1-127.

[8]VINCENT P,LAROCHELLE H,LAJOIE I,et al.Stacked denoising auto-encoders:learning useful representations in a deep network with a local denoising criterion[J].Journal of Machine Learning Research,2010(11):3371-3408.

[9]XIE Junyuan,XU Linli,CHEN Enhong.Image denoising and inpainting with deep neural networks[C]//Proc.Neural Information Processing Systems Foundation(NIPS 2012).Lake Tahoe,Nevada,USA:[s.n.],2012:350-358.

[10]HINTONG,SALAKHUTDINOV R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.

[11]章毓晋,图像工程—图像处理[M].3版.北京:清华大学出版社,2012.

[12]SANDIRASEGARAM N.Spot SAR ATR usingwavelet featuresand neural network classifier[J].DTICResearch Report ADA443104,2005.

[13]张红,王超,张波,等.高分辨SAR图像目标识别[M].北京:科学出版社,2009.

[14]VINCENT P,LAROCHELLE H,BENGIO Y,et al.Extracting and composing robust features with denoising autoencoders[EB/OL].[2013-09-02].http://oai.dtic.mil/oai/oai?verb=getRecord&metadataPrefix=html&identifier=ADA443104.

SAR Target Recognition Using Wavelet Transform and Deep Sparse Autoencoders

LIShuai1,XU Yuelei1,MA Shiping1,NIJiacheng1,WANG Kun2
(1.Institute of Aeronautics and Astronautics Engineering,Air Force Engineering University,Xi’an 710038,China;2.Troop 95876,Gansu Zhangye734100,China)

To overcome the low adaptability of the preprocessing algorithm,lack of labelled images and difficulty of target feature extraction,a novel approach to target recognition of SAR imageswhich combines deep sparse autoencoders(DSA)and discrete wavelet transform(DWT)is presented in this paper.The gray value and scale variation is used for obtaining large amount of unlabeled SAR targets.The DWT is applied for dimensionality reduction of SAR images.Moreover,through the formation of deep sparse autoencoders,deep abstract feature is learned from the SAR targets.Experiments are implemented with threemilitary targets in MSTAR database.Experimental results based on the MSTAR database demonstrate the proposed algorithm can accomplish themultiple-targets classification effectively even without preprocessing,and has a higher recognition rate and robustness.

SAR images;targets recognition;deep sparse autoencoders;deep learning;wavelet transform

TP391

A

【本文献信息】李帅,许悦雷,马时平,等.基于小波变换和深层稀疏编码的SAR目标识别[J].电视技术,2014,38(13).

国家自然科学基金项目(61372167;61379104);航空科学基金项目(20115896022)

2013-11-25

猜你喜欢

隐层深层权值
基于RTD可编程逻辑门的n变量函数实现算法
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
基于BP神经网络学习算法的图像压缩技术研究
考虑各向异性渗流的重力坝深层抗滑稳定分析
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
SAM系统对TDCS数据的优化处理与深层应用
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究