APP下载

基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别

2016-11-08耿杰范剑超初佳兰王洪玉

自动化学报 2016年4期
关键词:编码器滤波器像素

耿杰 范剑超, 初佳兰 王洪玉

基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别

耿杰1范剑超1,2初佳兰2王洪玉1

浮筏养殖广泛存在于我国近海海域,可见光遥感图像无法完全准确地获取养殖目标,而基于主动成像的合成孔径雷达(Synthetic aperture radar,SAR)遥感图像能够得到养殖目标,因此采用SAR图像进行海洋浮筏养殖目标识别.然而,海洋遥感SAR图像包含大量相干斑噪声,并且SAR图像特征单一,使得目标识别难度较大.为解决这些问题,提出一种深度协同稀疏编码网络(Deep collaborative sparse coding network,DCSCN)进行海洋浮筏识别.本文方法对预处理后的图像先提取纹理特征和轮廓特征,再进行超像素分割并将同一个超像素块特征组输入该网络进行协同表示,最后得到有效特征并分类识别.通过人工SAR图像和北戴河海域浮筏养殖SAR图像的实验验证所提模型的有效性.该网络不仅具有优异的特征表示能力,能够获得更适合分类器的特征,而且通过近邻协同约束,有效抑制相干斑噪声影响,所以提高了SAR图像目标识别精度.

合成孔径雷达,深度学习,稀疏自动编码器,浮筏养殖,目标识别

引用格式耿杰,范剑超,初佳兰,王洪玉.基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别.自动化学报,2016,42(4):593−604

合成孔径雷达(Synthetic aperture radar,SAR)是一种主动成像传感器,具有全天候、全天时、高分辨率的数据获取能力[1−2].SAR图像目标识别是SAR图像解译的重要内容,在军事侦察、资源探测、地理测绘、海域监测等领域有着广泛的应用.随着SAR成像技术的发展,分辨率的不断提高,SAR图像目标识别成为海量SAR数据处理的主要手段.典型的SAR图像目标识别模型分为检测(Detection)、鉴别(Discrimination)和分类(Classification)三个阶段[2].海洋浮筏养殖是海域监测的重要组成部分,自动识别浮筏信息对实现大面积海域动态使用监测有着重要意义[3−4].由于海洋散射信号较弱,光谱成像卫星数据难以获取浮筏信息,而SAR是主动式微波成像,利于获取浮筏信息,在海域监测中具有明显优势[5].因此,利用SAR图像进行海洋浮筏养殖自动识别,不仅可以大范围、宏观调查海域使用情况,而且为海洋遥感业务化动态监测提供了有力手段.但是,由于海洋周期性波浪的影响,后向散射系数相干叠加使得成像存在严重的相干斑噪声;同时由于海洋每个区域的流、浪、涌、内波都不一样,导致后向散射特性非常不规律,同一目标在不同海域特征存在明显差异[6].这些问题增加了海洋SAR图像目标识别难度,有效的特征表示是解决问题的关键.

在SAR图像目标识别问题中,纹理特征被广泛用于SAR图像的特征提取.纹理特征是图像灰度或色彩在空间上的重复或者变化的特征,提取纹理特征的方法可以分为三类:基于统计的方法、基于模型的方法和基于变换域的方法[7].在基于统计的方法中,灰度共生矩阵(Gray-level co-occurrence matrix,GLCM)统计图像上保持某距离的两个像素的灰度状况,主要包括均值、方差、对比度、熵、自相关等元素.在基于模型的方法中,马尔科夫随机场模型是最常用的分析模型.在基于变换域的方法中,小波变换得到变换域各个方向的系数能反映目标的后向散射特性.

为了更加有效地分析理解图像,多尺度几何分析(Multi-scale geometric analysis,MGA)方法陆续被提出,它是一种多方向、多尺度和局部性的图像稀疏表示方法,被称为后小波分析.由于小波分析的方向受限、频率分辨率低,而MGA可以利用图像的几何正则性,能够保持丰富的细节信息.目前常用的MGA方法有Gabor变换、曲波变换、轮廓波变换、剪切波变换等.Gabor变换是具有高斯函数的傅里叶变换,二维Gabor函数相当于一个高斯函数调制的复正弦函数,可以提取图像不同空间位置、空间频率的局部结构信息[8].由于二维Gabor变换在表征图像纹理变化方面的优势,已经被普遍用于人脸识别等模式识别问题中.为了更好地逼近图像的轮廓信息,Do等提出了轮廓波变换[9],通过多尺度分解和方向分解,可以有效地表示图像轮廓.然而,对图像轮廓波变换时,要进行降采样和上采样,这样就不具备平移不变性,而平移不变性在边缘保持、目标检测等方面起着重要作用.为了解决这一问题,Da Cunha等提出一种非下采样轮廓波变换(Nonsubsampled contourlet transform,NSCT)[10],具有平移不变性,可以很好地保持图像的细节和边缘信息.当前,NSCT已经被广泛用于图像融合问题中[11].考虑到二维Gabor变换和NSCT在图像特征表示方面的优势,本研究利用这两种方法分别提取SAR图像的纹理特征和轮廓特征.

在目标识别问题中,有效的特征表示对于识别准确度起着关键作用.但是在许多研究中,特征提取和表示都需要大量的经验知识和人为地参数设置,这个过程比较复杂而且效率较低,尤其是当图像分辨率较高、尺寸较大时,更增加了特征表示的难度.近年来,深度学习神经网络被用于特征自主学习和表示,在智能识别任务中表现出极其优异的性能[12−15].深度学习网络具有类似于人脑感知视觉的层次化结构,不过分依赖研究人员的经验知识,能逐层抽象学习数据的特征,从而发现数据的内在结构信息并改善分类识别的效果.研究表明,深度网络可以很好的挖掘图像的低层特征(如边界)和中层特征(如形状),在图像去噪、图像分类识别等问题中取得较好的效果.在分类识别问题中,利用深度网络得到的特征表示,不同类别的区分度更大,更适合于监督分类.常用的深度网络结构有深度置信网络(Deep belief networks,DBN)[12]、卷积神经网络(Convolutional neural networks,CNN)[16]和堆叠自动编码器(Stacked auto-encoders,SAE)[17].

本文提出一种深度协同稀疏编码网络(Deep collaborative sparse coding network,DCSCN)来进行SAR图像目标识别,并用在海洋浮筏养殖监测任务中.为了从SAR图像获得更优异的特征,提高目标与背景特征差异性,DCSCN利用了自动编码器在特征表示中的优势,获得更适合于分类器的特征.为了克服海洋SAR图像严重的相干斑噪声,对超像素分割的近邻像素特征利用DCSCN进行协同表示,使得同个超像素块特征更相近并平滑掉相干斑噪声,减小噪声对目标识别的影响.

1 深度学习原理

传统的神经网络都是随机初始化模型的参数,然后通过反向传播来优化参数.然而深度网络如果利用这种方式,很容易陷入局部极值或者造成梯度弥散,使得网络参数无法最优.为了解决这一问题,提出了逐层学习参数的预训练,再对预训练后的模型进行反向传播来优化参数的方法[18].常用的预训练单元有限制玻尔兹曼机(Restricted Boltzmann machine,RBM)和自动编码器(Auto-encoders),多层预训练单元堆叠起来构成深度网络.

1.1自动编码器

一个自动编码器由输入层、隐含层和输出层构成,训练学习的目标是使得网络的输出尽量逼近输入[19].自动编码器训练过程由编码过程和解码过程组成,编码过程将输入样本进行线性映射和非线性映射变换得到隐含层表示.设样本集为输入样本对应的隐含层表示为

训练好一层自动编码器后,将其隐含层的激活值作为下一层自动编码器的输入.这样将多层自动编码器堆叠起来构成了堆叠自动编码器.

1.2堆叠自动编码器

堆叠自动编码器是一种典型的深度神经网络,被广泛用于特征学习与表示.该网络先逐层贪婪学习来确定参数,再从最顶层反向传播来微调(Finetune)整个网络的参数.如果最顶层不加入标签信息,则这个学习过程为无监督的特征学习过程;如果最顶层加入样本的标签信息来反向微调整个网络的参数,则这个学习过程是监督学习过程.图1给出了堆叠自动编码器结构图.

图1 堆叠自动编码器结构图Fig.1 The structure of SAE

由图1所示,该堆叠自动编码器共M层,最高层自动编码器的隐含层就是网络的输出.通常在堆叠自动编码器后连接Softmax分类器进行分类识别.在有监督学习网络中,样本的标签也是在Softmax分类器加入的,整个网络的参数通过后向传播来整体调整.网络整体参数微调的目标函数为

2 SAR图像预处理与特征提取

2.1预处理

卫星拍摄的SAR图像需要先进行几何校正,来解决由于传感器以及地球自转等因素造成的图像相对于地面目标发生的几何畸变.由于原始的SAR图像对比度较差,需采用灰度拉伸来提高图像灰度级的动态范围.为了增大目标与背景间的对比度,利用非线性函数对图像进行灰度拉伸处理.为了抑制相干斑噪声对目标识别的影响,采用增强Lee滤波算法进行去噪.

2.2纹理特征提取

二维Gabor滤波器可以提取图像多尺度、多方向的纹理特征.二维Gabor变换是具有高斯函数形式的傅氏变换,由一个高斯函数乘以正弦函数,正弦函数的频率决定特征的尺度,相位决定特征的方向,具体公式如下[20]

其中,x0=xcosθ+y sinθ,y0=−xsinθ+y cosθ,x和y代表像素点的位置,ω0表示滤波器的中心频率,θ表示滤波器的方向,σ表示高斯函数的标准差. exp(jω0x0)代表交流分量,代表直流分量.当直流分量趋于0时,Gabor滤波器对光照强度不敏感.θ和σ不同取值得到一组滤波器,将滤波器组与图像进行卷积得到与图像相同大小的分解图像,这些图像代表纹理特征.

2.3轮廓特征提取

非下采样轮廓波变换(NSCT)[10]可以将图像分解为不同频率和不同方向的子带图像,各个子带图像表示了图像在各个频率和各个方向上的系数,可以看作原图的一张特征图,即轮廓特征图.NSCT交替利用非下采样的塔型滤波器组和非下采样的方向滤波器组,来得到多方向、多尺度的二维分解图像.图2给出了具体分解的过程.

图2 非下采样轮廓波变换Fig.2 Nonsubsampled contourlet transform

如图2所示,NSCT先利用非下采样的塔型滤波器组将图像分解为低通、带通和高通子带图像,然后利用非下采样方向滤波器组对子带图像进行方向滤波,得到各个频域方向的子带图像.具体过程如下:NSCT的非下采样塔型滤波器由多个双通道非下采样滤波器级联构成.设定分解的尺度为j,则在尺度j上的理想低通滤波器包含的区域为理想高通滤波器H1(z)包含的区域为由于每次分解中都只对上次分解结果进行上采样,而不使用下采样,所以保证算法的平移不变性.经过k级非下采样塔型滤波,可以得到k+1个与原图像相同尺寸大小的子带图像.NSCT所采用的方向滤波器组也是一组二通道非下采样滤波器,其理想频域区域是扇形形状,对扇形滤波器采用不同的采样矩阵进行上采样,再对上一级方向分解的子带进行滤波,得到频域的方向分解.当方向滤波器组数目较多时,得到的子带图像代表各个方向的分解图像,具有优异的轮廓和边界保持效果.如果对某尺度下子带图像做t级方向分解,可以获得2t个与原图像相同尺寸大小的方向子带图像.因此,图像经过K级NSCT后可得到个与原图像尺寸大小相同的子带图像,其中tk是尺度k下的方向分解级数[21−22].综上描述,NSCT分解得到的子带图像具有平移不变性、良好的轮廓和边界保持效果,这些子带图像可以用来作为目标识别的特征图.

3 基于深度协同稀疏编码网络的SAR图像目标识别

海洋SAR图像存在严重的相干斑噪声,使得图像像素的灰度值不完全反映地物的后向散射特性,基于单个像素特征进行分类识别往往达不到很好的效果.考虑到图像的统计特性,近邻像素点的特性比较接近,可以联合起来进行协同表示.为了增加不同类别特征的差异性,并且抑制相干斑噪声的影响,本研究提出一个深度协同稀疏编码网络(DCSCN),采用超像素分割的方法将图像进行分割,然后对每个超像素块内像素点对应的特征联合优化,使得同个超像素块的像素特征更趋于相似并平滑掉相干斑噪声.为了获得更丰富的特征,在DCSCN网络前先进行预处理,再通过二维Gabor变换和NSCT来提取纹理特征和轮廓特征.图3给出了整个算法的流程图.

图3 基于深层协同稀疏编码网络算法流程图Fig.3 The flow chart of the proposed algorithm

如图3所示,本文算法先对输入SAR图像进行几何校正、灰度拉伸和增强Lee滤波去噪的预处理过程,再利用二维Gabor滤波器和NSCT滤波器提取图像的特征,并进行超像素分割,然后将各个超像素块特征组输入DCSCN网络进行特征优化和分类识别,最后输出识别结果.

本研究中使用了一种基于几何流的水平集方法(TurborPixels)[23],将SAR图像分割成M 个超像素块{S1,S2,···,SM}.把每个超像素块特征组输入到DCSCN网络进行协同表示和分类识别.下面详细描述了DCSCN网络结构和网络训练过程.

3.1DCSCN网络结构

根据第1节描述,堆叠自动编码器可以学习到图像更高层次的特征,使得不同类别样本特征区分度增大.为了让隐含层单元激励的平均输出较小,对每个自动编码器进行稀疏约束,可以避免参数取值过大,防止过学习.稀疏自动编码器的目标是使得解码输出尽量接近输入,本文为了有效抑制相干斑噪声,希望各个像素特征通过编码器的解码输出与其相应的超像素块特征组的平均特征接近,提出了协同稀疏编码器来对每个超像素块的特征组联合训练学习.将多个协同稀疏编码器堆叠起来构成了深度协同稀疏编码网络(DCSCN),图4给出了网络结构图.图中网络共包含L层,第1层到第L−1层网络为协同稀疏编码器,第L层网络为Softmax分类器.为了进行协同表示,各层协同稀疏编码器的输入对输出进行约束,即每个特征的输出都要与输入的这组特征的平均值尽量接近.因此,在前向逐层训练过程中,每层参数都是将特征组的特征依次输入网络后确定的.完成逐层贪心训练后,整个网络的参数通过后向反馈整体微调.

图4 深度协同稀疏编码网络结构图Fig.4 The structure of deep collaborative sparse coding network

3.2DCSCN网络训练

DCSCN网络需要先确定各层参数,然后再进行分类识别.网络各层参数的优化分为预训练(Pretraining)和整体微调(Fine-tune)两个过程.预训练是逐层优化各层网络的参数.整体微调是从顶层引入标签信息来优化整个网络参数,可以使得网络输出的特征更适合于分类器.

3.2.1DCSCN网络预训练

预训练过程是将训练样本的特征输入到网络,逐层训练得到各层网络的参数.对于第k层网络,参数优化的目标函数为

其中,ρ是稀疏性参数.ρˆj表示第j个隐含单元在所有超像素块特征组编码后的平均激励值,其中可知,j的大小由网络权重和偏置决定[24].ρ是人为设定的接近0的数值,目的是让j的值接近0,这样隐含层的输出值接近0,使得隐含层具有稀疏性.目标方程(6)利用此约束项求解网络权重和偏置,目的是使得网络的隐含层输出具有稀疏性.

根据网络的目标函数,通过梯度下降法来确定网络的参数.对于第k层协同稀疏编码器,设定

根据以上分析,下面给出了利用梯度下降法求第k层网络参数的具体过程:

3.2.2DCSCN网络整体微调

通过预训练逐层学习各层参数,再从顶层加入训练样本标签信息来优化整个网络参数,可以使得网络输出的特征更适合于分类器,即不同类别的样本特征差异更大.整体微调网络参数采用了误差反向传播梯度下降算法,设网络层数为L,则目标函数表示如下

步骤1.设权重系数的修改量为∆WWW,考虑到学习速率η,有

同理,可得偏置系数的修改量

3.2.3分类识别

训练好整个网络的参数后,最后一层Softmax分类器可以用来对样本进行识别.如果样本是目标,则对应的标签为+1;如果样本不是目标,则对应的标签为−1.样本是否为目标的概率计算如下

4 实验内容和结果分析

本文采用人工合成SAR图像和真实SAR图像-北戴河海域Radarsat-2数据进行实验.本文与其他几种常用的识别方法进行比较,分别是支持向量机(Support vector machine,SVM)[25]、联合稀疏表示分类算法(Simultaneous orthogonal matching pursuit,SOMP)[26]、未做改进的堆叠自动编码器(SAE)[24]和稀疏编码-池化分类算法(Lasso-Pooling)[27].Lasso-Pooling算法,先采用Lasso算法对每个像素点稀疏编码得到稀疏向量,然后对超像素分割后同一像素块的各个像素点稀疏向量采用最大值池化(Max pooling)得到一个稀疏向量,最后利用联合稀疏表示分类器进行分类.为了比较各个算法的识别效果,采用总分类精度(Overall accuracy,OA)和Kappa系数(Kappa coefficient,κ)作为识别精度的评价指标.总分类精度反映了整体图像识别的误差性,计算公式如下

Kappa系数反映了样本的识别结果与真实标记类型相一致的概率,计算公式如下

其中,M表示误差混淆矩阵(Confusion matrix),是一个C×C的矩阵,C是类别数量,Mji表示类别j被误分类为类别i的样本数量.N表示总的样本数量.

本文实验还比较了各个算法的计算效率,实验所用的计算平台为PC(Intel Core i7 4.0GHz CPU,32GB RAM),操作系统为Windows 7,所有算法采用Matlab编写.

4.1仿真实验

4.1.1人工SAR图像

为了验证DCSCN网络在目标识别上的可行性和有效性,设计人工SAR图像进行实验.该图像中包含了多个不同形状的目标,图像大小为200×200.通过对该图像的目标识别来说明DCSCN网络的普适性.图5(a)和图5(b)分别给出了人工SAR图像及其相应的目标真值图.

图5 人工SAR图像数据Fig.5 The artificial SAR data

4.1.2网络参数设置

根据第3节介绍,本文分别利用二维Gabor变换和NSCT来提取图像纹理特征和轮廓特征,初始特征会对最后的识别精度有一定影响.根据经验,采用5个尺度、8个方向的二维Gabor滤波器组来提取图像纹理特征,利用3级NSCT分解得到15个子带图像作为轮廓特征,将这些特征堆叠起来构成55维的特征.然后,采用TurborPixels将图像分割为1000个超像素块,将各个小块特征组输入到DCSCN网络中进行特征学习和分类识别.

DCSCN网络的结构和参数对识别精度有很大的影响.考虑到算法的复杂度,设计三层结构的DCSCN,前两层进行特征稀疏编码,最高层进行分类识别.根据实验经验,网络的权重衰减系数λ设置为0.005,稀疏性惩罚因子β设置为0.1,稀疏性参数ρ设置为0.2.各层隐含单元数目对分类识别的精度有明显影响,因此这里详细描述了隐含单元数目的确定过程.由于最高层用于识别,最高层隐含单元数等于类别数,所以只需要分析前两层隐含单元数目对识别结果的影响.实验中,随机选取20%的超像素块作为训练集,其他超像素块用来验证算法的识别精度.通过改变其中一个参数的同时固定另一个参数,来讨论隐含单元数目对结果的影响.

图6(a)和图6(b)分别给出了总分类精度和Kappa系数随着两层隐含单元数目变化的变化情况.实验中,第一层隐含单元数目在20到150之间变化,第二层隐含单元数目在20到100之间变化.实验结果表明,当前两层的隐含单元数目分别为100和40时,网络的识别精度最高.当第二层隐含单元数目一定,第一层隐含单元数目取值在90到110之间时,识别的精度优于其他情况的结果.即第一层隐含单元数目比输入样本特征维度要高,其原因是输入的样本初始特征是非线性的,当隐含单元数目比输入单元数目大时,网络第一层相当于对特征进行高维空间映射,使得特征更加线性化、更利于分类识别.当第一层隐含单元数目一定,第二层隐含单元数目取值在30到40之间时,识别的精度优于其他情况的结果.网络第二层的作用相当于对特征进行降维,降维处理不能降得太低或者太高.这是因为降维维度过低会压缩掉有用信息,而降维维度较高时训练分类器容易发生过拟合现象.

图6 DCSCN网络参数设置Fig.6 Parameter setting of the DCSCN

4.1.3对比实验结果与分析

为了证明DCSCN在SAR图像目标识别中的效果,本文与SVM算法、SOMP算法、Lasso-Pooling算法及未做改进的SAE网络进行对比.对比算法采用的样本特征与输入到DCSCN网络的特征一致,都是由二维Gabor滤波器和NSCT滤波器得到的55维特征.根据前述实验分析,DCSCN网络为三层,前两层的隐含单元数目分别为100和40.SVM采用了高斯径向基作为核函数,参数通过十次交叉验证得到.SOMP算法、Lasso-Pooling算法中的主要参数为稀疏度和重建误差极值,分别设定为10和10−3.SAE网络采用了与本文提出的DCSCN网络相同的结构,都设计了三层结构的网络,前两层的隐含单元数目分别为100和40,最高层进行分类识别.通过五次实验来分析各个算法的识别效果,每次实验随机选取20%的样本作为训练集,其他样本作为测试集,计算五次实验结果的均值和标准差.表1给出了各种算法识别精度和算法效率的结果对比.

根据表1结果,DCSCN识别精度要明显高于其他四种算法.对比SAE和DCSCN实验结果,基于SAE提出的DCSCN网络可以提高目标识别精度,说明本文对DCSCN网络的设计是有效的.DCSCN网络考虑了近邻像素的协同性,通过联合优化得到近邻像素特征表示,能平滑掉相干斑噪声,从而有效降低相干斑噪声对识别结果的影响.由于SVM算法、SOMP算法、Lasso-Pooling算法和DCSCN网络输入的初始特征都是由二维Gabor滤波器和NSCT滤波器分别提取的纹理特征和轮廓特征,而DCSCN网络识别精度得到明显提高,这说明经过DCSCN网络优化后的不同类别特征的区分度更大,更适合于分类器进行识别.对比各个算法的计算耗时发现,DCSCN网络计算效率比SVM算法略差,但要优于其他方法.这是由于SOMP算法和Lasso-Pooling算法的计算复杂度随着样本数成高次方增长,而DCSCN网络计算复杂度随迭代次数、样本数和网络节点数线性变化.因此,基于深度学习神经网络的DCSCN网络计算复杂度低于基于稀疏编码的SOMP算法及Lasso-Pooling算法.

表1 各个算法在人工SAR图像上识别结果对比Table 1 Recognition performance comparison of different algorithms on the artificial SAR image

图7显示了五种算法的目标识别结果图.对比五幅图可知,DCSCN网络表现出更好的识别结果,误分类点比其他方法更少.同时发现,SOMP算法和Lasso-Pooling算法结果图的孤立误分类点也很少,这是因为SOMP算法、Lasso-Pooling算法和本文DCSCN网络都考虑了近邻像素的协同性,而通过空间近邻协同可以平滑掉相干斑噪声,所以这三种算法对相干斑噪声抑制作用明显.由于DCSCN算法有优异的特征表示能力,所以其识别精度明显高于SOMP算法和Lasso-Pooling算法.此外,SVM算法和SAE算法结果的孤立误分类点很多,原因是这两种算法是基于像素的分类识别,未考虑空间协同相关性,相关斑噪声对识别产生很大的影响.

图7 人工SAR图像目标识别结果Fig.7 Target recognition results of the artificial SAR image

4.2浮筏识别实验

为了验证DCSCN网络在海洋浮筏养殖目标识别的有效性,选取北戴河海域作为研究区域.图8(a)和图8(b)是北戴河海域的两个不同传感器的多光谱图像,分别是Landsat-8卫星图像和资源三号卫星图像.图8(c)为Radarsat-2卫星的SAR图像,极化方式为HH,分辨率为5m.比较这三幅图可以发现,多光谱图像不能有效地获取北戴河海域的浮筏目标,而在SAR图像中有清晰的浮筏目标.这是由于海洋散射信号较弱,光谱成像卫星数据难以获取浮筏信息,而SAR是主动式微波成像,利于获取海洋信息.图8(d)为现场测绘时拍摄的实景图片.从图8(c)选取两块海域的图像来验证本文提出算法的效果,选取的图像1和图像2分别如图8(e)和图8(g),图像大小分别为1275×1140和600×600.根据现场测绘的数据绘制出相应的真值图如图8(f)和8(h).

图8 北戴河区域SAR数据Fig.8 The original SAR data of Beidaihe area

在SAR图像1上进行实验,先做几何校正、灰度拉伸和增强Lee滤波去噪,再采用二维Gabor变换和NSCT提取图像纹理特征和轮廓特征.与仿真实验相同,采用3级NSCT分解和5个尺度、8个方向的二维Gabor滤波器得到55维的特征.采用TurborPixels将图像分割为40000个超像素块,将各个小块输入到DCSCN网络中进行特征学习并分类识别.DCSCN网络共三层,前两层的隐含层单元数目分别设置为100和40.网络其他参数的设置与仿真实验相同.同样,为说明本文算法在海洋浮筏养殖目标识别的优越性能,本文与SVM、SOMP、Lasso-Pooling和SAE进行了比较.表2给出了各个算法识别精度和算法效率的对比,这里每个算法效率的统计都是指整个识别过程,即从输入图像到最后得出分类识别结果.图9给出了各个算法目标识别结果图.

根据表2结果,DCSCN网络的总分类精度和Kappa系数都明显好于其他四种算法.结果表明,本文DCSCN网络具有优异的特征表示能力,可以得到区分性更大、更适合分类器的特征.同时,DCSCN通过空间近邻协同约束,有效地抑制SAR图像相干斑噪声的影响,所以在分类精度上明显优于现有的三种方法.此外,DCSCN的算法效率更优,比其他四种算法耗时都少.这是由于DCSCN网络计算复杂度随迭代次数、样本数和网络节点数线性变化,而SVM算法、SOMP算法和Lasso-Pooling算法的计算复杂度随着样本数成高次方增长,所以DCSCN网络计算复杂度较低.在图像尺寸较大、样本较多的时候,DCSCN能够有效地降低计算量,使得计算效率优于其他算法.

表2 各个算法在SAR图像1浮筏识别结果对比Table 2 Recognition performance comparison of different algorithms on the first SAR image

对比图9各个算法的结果图,DCSCN识别效果要明显优于其他四种算法的结果.分析发现,SVM和SAE识别结果图存在较多误分类噪点,而本文算法、SOMP算法和Lasso-Pooling算法误分类噪点较少.这是由于这三种算法都采用了近邻协同约束,可以有效抑制SAR图像相干斑噪声.同时,本文算法的误分类噪点更少,说明本文算法在抑制相干斑噪声方面的效果更好.本文算法要优于SAE算法结果,说明稀疏约束和协同约束能使得深度网络学到区分性更大的特征.此外,在实际SAR图像上的实验结果与人工SAR图像的实验结果得到了一致的结论,充分证明了算法的有效性和适应性.

由于海洋不同区域的后向散射特性存在差异,为了说明本文DCSCN网络对不同海域浮筏的识别能力,对SAR图像2进行相同的实验.与SAR图像1上实验一样,先进行几何校正、灰度拉伸和增强Lee滤波去噪,再采用5个尺度、8个方向的二维Gabor滤波器和3级NSCT滤波器提取出55维的特征,然后采用TurborPixels将图像分割为10000个超像素块,最后将各个小块输入到三层结构的DCSCN网络中进行特征学习和分类识别.表3给出了各个算法识别精度和算法效率的对比,图10给出了各个算法目标识别结果图.

分析图10和表3结果,DCSCN网络的识别精度和算法效率都优于其他四种算法,这一结论和前面分析一致.这充分说明,不同海域即使海洋后向散射特性有差别的情况下,DCSCN网络都能达到较好的浮筏养殖识别结果.

表3 各个算法在SAR图像2浮筏识别结果对比Table 3 Recognition performance comparison of different algorithms on the second SAR image

图9 SAR图像1浮筏识别结果Fig.9 Target recognition results of the first SAR image

图10 SAR图像2浮筏识别结果Fig.10 Target recognition results of the second SAR image

5 结论

本文针对海洋遥感SAR图像严重的相干斑噪声污染和SAR图像特征单一的问题,提出一种深度协同稀疏编码网络,进行SAR图像特征表示和目标识别.通过人工SAR图像和北戴河两个海域浮筏养殖SAR图像的实验,证明本文所提网络的有效性和适用性.结果表明,深度协同稀疏编码网络不仅可以有效优化近邻像素特征组来提高识别精度,而且能有效抑制SAR图像相干斑噪声的影响.此外,深度协同稀疏编码网络计算效率较高,在图像尺寸较大时表现出更好的效率.

References

1 Yu Hang,Jiao Li-Cheng,Liu Fang.Context based unsupervised hierarchical iterative algorithm for SAR segmentation. Acta Automatica Sinica,2014,40(1):100−116(余航,焦李成,刘芳.基于上下文分析的无监督分层迭代算法用于SAR图像分割.自动化学报,2014,40(1):100−116)

2 Zhao Ming-Bo,He Jun,Fu Qiang.Survey on fast CFAR detection algorithms for SAR image targets.Acta Automatica Sinica,2012,38(12):1885−1895(赵明波,何峻,付强.SAR图像CFAR检测的快速算法综述.自动化学报,2012,38(12):1885−1895)

3 Chu Jia-Lan,Zhao Dong-Zhi,Zhang Feng-Shou.Wakame raft interpretation method of remote sensing based on association rules.Remote Sensing Technology and Application,2012,27(6):941−946(初佳兰,赵冬至,张丰收.基于关联规则的裙带菜筏式养殖遥感识别方法.遥感技术与应用,2012,27(6):941−946)

4 Fan Jian-Chao,Zhang Feng-Shou,Zhao Dong-Zhi,Wen Shi-Yong,Wei Bao-Quan.Floating raft aquaculture extraction based on high resolution satellite remote sensing SAR images.In:Proceedings of the 2nd Symposium on Disaster Risk Analysis and Management in Chinese Littoral Regions. 2014.59−63(范剑超,张丰收,赵冬至,文世勇,卫宝泉.基于高分辨率卫星遥感SAR图像的海洋浮筏养殖信息提取.见:第二届中国沿海地区灾害风险分析与管理学术研讨会.2014.59−63)

5 Qazi W A,Emery W J,Fox-Kemper B.Computing ocean surface currents over the coastal california current system using 30-min-lag sequential SAR images.IEEE Transactions on Geoscience and Remote Sensing,2014,52(12): 7559−7580

6 Pan De-Lu,Lin Ming-Shen,Mao Zhi-Hua.Microwave Remote Sensing and Application of Ocean.Beijing:Ocean Press,2013.(潘德炉,林明森,毛志华.海洋微波遥感与应用.北京:海洋出版社,2013.)

7 Collins M J,Allan J M.Modeling and simulation of SAR image texture.IEEE Transactions on Geoscience and Remote Sensing,2009,47(10):3530−3546

8 Liu C J,Wechsler H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition.IEEE Transactions on Image Processing,2002,11(4):467−476

9 Do M N,Vetterli M.The contourlet transform:an efficient directional multiresolution image representation. IEEE Transactions on Image Processing,2005,14(12): 2091−2106

10 Da Cunha A L,Zhou J P,Do M N.The nonsubsampled contourlet transform:theory,design,and applications. IEEE Transactions on Image Processing,2006,15(10): 3089−3101

11 Yang X H,Jiao L C.Fusion algorithm for remote sensing images based on nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(3):274−281

12 Hinton G E,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets.Neural Computation,2006,18(7): 1527−1554

13 Salakhutdinov R,Tenenbaum J B,Torralba A.Learning with hierarchical-deep models.IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(8): 1958−1971

14 Goh H,Thome N,Cord M,Lim J H.Learning deep hierarchical visual feature coding.IEEE Transactions on Neural Networks and Learning Systems,2014,25(12):2212−2225

15 Zheng Yin,Chen Quan-Qi,Zhang Yu-Jin.Deep learning and its new progress in object and behavior recognition.Journal of Image and Graphics,2014,19(2):175−184(郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展.中国图象图形学报,2014,19(2):175−184)

16 Chen X Y,Xiang S M,Liu C L,Pan C H.Vehicle detection in satellite images by hybrid deep convolutional neural networks.IEEE Geoscience and Remote Sensing Letters,2014,11(10):1797−1801

17 Chen Y S,Lin Z H,Zhao X,Wang G,Gu Y F.Deep learningbased classification of hyperspectral data.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094−2107

18 Feng Bo,Chen Bo,Wang Peng-Hui,Liu Hong-Wei.Feature extraction method for radar high resolution range profile targets based on robust deep networks.Journal of Electronics&Information Technology,2014,36(12):2949−2955(冯博,陈渤,王鹏辉,刘宏伟.基于稳健深层网络的雷达高分辨距离像目标特征提取算法.电子与信息学报,2014,36(12): 2949−2955)

19 Li Shuai,Xu Yue-Lei,Ma Shi-Ping,Ni Jia-Cheng,Wang Kun.SAR target recognition using wavelet transform and deep sparse autoencoders.Video Engineering,2014,38(13): 31−35(李帅,许悦雷,马时平,倪嘉成,王坤.基于小波变换和深层稀疏编码的SAR目标识别.电视技术,2014,38(13):31−35)

20 Rai P,Khanna P.A gender classification system robust to occlusion using gabor features based 2D2PCA.Journal of Visual Communication and Image Representation,2014,25(5):1118−1129

21 Zhang Qiang,Guo Bao-Long.Fusion of multi-sensor images based on the nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(2):135−141(张强,郭宝龙.基于非采样Contourlet变换多传感器图像融合算法.自动化学报,2008,34(2):135−141)

22 Yan C M,Guo B L,Yi M.Fast algorithm for nonsubsampled contourlet transform.Acta Automatica Sinica,2014,40(4): 757−762

23 Levinshtein A,Stere A,Kutulakos K N,Fleet D J,Dickinson S J,Siddiqi K.TurboPixels:fast superpixels using geometric flows.IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(12):2290−2297

24 Ng A.Sparse autoencoder[Online],available:http://web. stanford.edu/class/cs294a/sae/,November 8,2015.

25 Chang C C,Lin C J.LIBSVM:a library for support vector machines.ACM Transactions on Intelligent Systems and Technology,2011,2(3):Article No.27

26 Chen Y,Nasrabadi N M,Tran T D.Simultaneous joint sparsity model for target detection in hyperspectral imagery. IEEE Geoscience and Remote Sensing Letters,2011,8(4): 676−680

27 Mairal J,Bach F,Ponce J.Sparse modeling for image and vision processing.Foundations Trend in Computer Graphics Vision,2014,8(2−3):85−283

耿 杰大连理工大学电子信息与电气工程学部博士研究生.主要研究方向为SAR图像处理,模式识别.E-mail:gengjie@mail.dlut.edu.cn

(GENG JiePh.D.candidate at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers SAR image processing and pattern recognition.)

范剑超国家海洋环境监测中心,大连理工大学电子信息与电气工程学部副研究员.主要研究方向为神经网络,模式识别和遥感图像处理.本文通信作者.E-mail:fjchaonmemc@163.com

(FAN Jian-ChaoAssociate professor at National Marine Environment Monitoring Center and Dalian University of Technology.His research interest covers neural network,pattern recognition,and remote sensing image processing.Corresponding author of this paper.)

初佳兰国家海洋环境监测中心工程师.主要研究方向为海域动态卫星遥感应用.E-mail:jlchu@nmemc.org.cn

(CHUJia-LanEngineer at National Marine Environment Monitoring Center.Her research interest covers sea dynamic surveillance remote sensing application.)

王洪玉大连理工大学电子信息与电气工程学部教授.主要研究方向为图像处理,模式识别和无线传感器网络.E-mail:whyu@dlut.edu.cn

(WANG Hong-YuProfessor at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers image processing,pattern recognition,and wireless sensor networks.)

Research on Marine Floating Raft Aquaculture SAR Image Target Recognition Based on Deep Collaborative Sparse Coding Network

GENG Jie1FAN Jian-Chao1,2CHU Jia-Lan2WANG Hong-Yu1

Floating raft aquaculture is widely distributed in the offshore ocean of China.Since raft information cannot be obtained accurately in the visible remote sensing image,active imaging images acquired from synthetic aperture radar(SAR)are applied.However,oceanic SAR images are seriously contaminated by speckle noise,and effective features of SAR images are deficient,which make recognition difficult.In order to overcome these problems,a deep collaborative sparse coding network(DCSCN)is proposed to extract features and conduct recognition automatically.The proposed method extracts texture features and contour features from the pre-processed image firstly.Then,it segments the image into patches and learns features of each patch collaboratively through the DCSCN network.The optimized features are used for recognition finally.Experiments on the artificial SAR image and the images of Beidaihe demonstrate that the proposed DCSCN network can accurately obtain the area of floating raft aquaculture.Since the network can learn discriminative features and integrate the correlated neighbor pixels,the DCSCN network improves the recognition accuracy and has better performance in overcoming the contamination of speckle noise.

Synthetic aperture radar(SAR),deep learning,sparse auto-encoders,floating raft aquaculture,target recognition

Manuscript July 6,2015;accepted January 15,2016

10.16383/j.aas.2016.c150425

Geng Jie,Fan Jian-Chao,Chu Jia-Lan,Wang Hong-Yu.Research on marine floating raft aquaculture SAR image target recognition based on deep collaborative sparse coding network.Acta Automatica Sinica,2016,42(4): 593−604

2015-07-06录用日期2016-01-15

国家自然科学基金(61273307,61301130),中国博士后面上基金(2014M551082),北戴河邻近海域典型生态灾害与污染监控海洋公益专项(201305003),海域使用动态监测和污染监测研究专项资助

Supported by National Natural Science Foundation of China(61273307,61301130),the China Postdoctoral Science Foundation(2014M551082),the Public Welfare Project of Beidaihe Marine Ecological Disasters and Pollution Monitoring(201305003)and the Research of Dynamic Monitoring and Pollution Monitoring of Sea Area

本文责任编委刘跃虎

Recommended by Associate Editor LIU Yue-Hu

1.大连理工大学电子信息与电气工程学部大连1160242.国家海洋环境监测中心大连116023

1.Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology,Dalian 1160242.Na-tional Marine Environment Monitoring Center,Dalian 116023

猜你喜欢

编码器滤波器像素
融合CNN和Transformer编码器的变声语音鉴别与还原
像素前线之“幻影”2000
“像素”仙人掌
从滤波器理解卷积
开关电源EMI滤波器的应用方法探讨
一种微带交指滤波器的仿真
基于双增量码道的绝对式编码器设计
ÉVOLUTIONDIGAE Style de vie tactile
高像素不是全部
基于TMS320C6678的SAR方位向预滤波器的并行实现