基于形态字典学习的复杂背景SAR图像舰船尾迹检测

2017-03-12杨国铮禹晶肖创柏孙卫东

自动化学报 2017年10期

杨国铮禹晶肖创柏孙卫东

舰船在海上航行时会在船的后部产生尾迹.对舰船尾迹进行遥感成像并确定其在图像上的位置和形状,可用于反演运动舰船的航向航速信息,也有助于发现远小于尾迹的弱小舰船目标[1].当前,合成孔径雷达(Synthetic aperture radar,SAR)被广泛应用于对地观测,它主动发射微波并接收地物回波,经过距离向脉冲压缩处理和方位向合成孔径处理后获得图像.由于微波能够穿透云层且不受太阳光照影响,因而可以全天时全天候成像,但不同相位的回波信号叠加在一起会在图像上形成严重的斑点噪声.当SAR对海面舰船成像时,常可观测到4种类型的舰船尾迹:湍流尾迹、开尔文(Kelvin)尾迹、窄V形尾迹和船生内波尾迹[2],然而,它们能否成像却受到舰船因素(如船体吨位、航行状态)、SAR系统因素(如极化方式、雷达频率、观测方向)和海洋因素(如海面风速、海水层化)的影响[3].对于SAR图像舰船尾迹检测方法的研究可以追溯到20世纪80年代末,绝大多数方法都从尾迹的形状特点出发,转化为对线特征的检测,并且为了消除斑点噪声对线特征检测的影响,一般先对SAR图像进行某种形式的滤波预处理和强散射点去除.而后,绝大多数方法利用Radon变换或者Hough变换进行直线检测.这两种变换可以通过沿直线方向的积分而抑制部分斑点噪声,因而有助于提高舰船尾迹的检测率[1].

文献[1,4−5]采用Radon变换进行尾迹线检测,但预处理方法有所不同:文献[1]采用了滑动均值滤波,文献[4]采用了小波相关器方法,文献[5]则采用了随机匹配滤波.为了改善Radon变换的线检测能力,文献[6−7]引入了长度归一化Radon变换,其中文献[6]通过滤波预处理增强暗尾迹,文献[7]则通过识别和剔除图像的奇异区加强噪声抑制能力;文献[8−10]使用窗口Radon变换提高处理效率,它们的滤波预处理则分别使用了中值、滑动均值(Mean-shift)和非线性滤波;文献[11]使用了滑动线段Radon变换,在三维空间中通过各切片的阈值化与归一化实现尾迹线检测;文献[12]首先检测舰船目标并做掩模处理,然后对图像做Radon变换并将变换点的物理特征与实际尾迹变换点的物理特征相比较,匹配情况下保留当前点,再通过恒虚警率(Constant false alarm rate,CFAR)方法进一步舍弃非尾迹点.此外,文献[13−14]采用了灰度归一化Hough变换对SAR图像进行尾迹线检测,不同点在于文献[13]通过变换域的阈值化实现检测,文献[14]则采用CFAR方法实现检测.

除了基于Radon变换或者Hough变换的方法外,学者们也提出了其他一些SAR图像舰船尾迹检测方法.在SAR图像舰船尾迹检测研究的早期,出现了基于证据理论的方法和基于神经网络的方法.前者[15]对同一海区的不同SAR图像进行Radon变换和Wiener滤波,将峰值点赋概率值以标示其属于舰船尾迹、自然场景还是无法确定的可能性,采用Dempster-Shafer算法计算某种可能性的组合值,根据数值大小得出目标是否为舰船尾迹的结论.后者[16]采用样本学习方式,对训练样本中的舰船尾迹提取特征并使用神经网络方法进行特征学习,用于测试样本的尾迹检测.近年来,出现了基于小波变换的方法[17]和基于扫描(Scan)的方法[18].文献[17]对SAR图像进行二维连续小波变换,通过区分舰船尾迹与海面背景的小波能量谱而检测出舰船尾迹.文献[18]沿舰船目标方位向做长度归一化扫描、建立扫描空间,在该空间内使用CFAR方法检测尾迹点,再通过k-均值聚类将尾迹中心点反演为尾迹线.

可以看到,现有的SAR图像舰船尾迹检测方法一般假定海况背景简单,因此通过抑制斑点噪声和强目标点就可以分离出尾迹目标,但实际应用中这一假设往往难以成立.近年来兴起的形态成分分析理论认为,任一信号均可看作若干形态独立信号成分的线性叠加,通过相应字典下各成分的稀疏表示,可以对它们进行有效分离.基于这一思路,本文从舰船尾迹与海况背景的稀疏性出发,提出了一种复杂背景SAR图像舰船尾迹检测方法.该方法针对海面纹理的复杂多变性和舰船尾迹类型的有限性,通过字典学习方式构建海面纹理字典、通过局部解析方式构建舰船尾迹字典,实现了稀疏意义下海面纹理与舰船尾迹的分离.

本文后续内容组织如下,第1节简要描述了复杂背景下的SAR图像舰船尾迹检测问题,在第2节简要介绍稀疏表示、字典学习和形态成分分析相关理论的基础上,第3节详细阐述了本文提出的复杂背景SAR图像舰船尾迹检测方法,第4节对所提方法的有效性进行了实验验证,第5节对全文工作进行总结.

1 问题描述

粗糙海面常被看作是海风作用下的起伏波动表面,由大尺度的近似周期性波浪和小尺度的波纹、泡沫、浪花叠加而成,前者称为海面的大尺度结构、后者称为海面的微细结构.随着海风速度的增大,海面的起伏波动也会增大,使得海面粗糙度增强.因此,通过测量海面风速或海浪波高值可以定量描述海面的粗糙度,也称为海况分级.

图1 不同背景下的SAR图像Fig.1 SAR images with different backgrounds

当SAR对粗糙海面成像时,入射雷达波会形成杂乱无章的散射回波,称为海杂波,强度可以用雷达散射截面积(Radar cross section,RCS)进行度量.从信号处理角度讲,海杂波即海面目标回波信号的背景,当海杂波成像后,其又成为目标图像的背景.在舰船尾迹能够成像的特定的SAR极化方式、入射角范围、波段条件下,海面越粗糙则海杂波的强度变化越明显,成像后便呈现出随机变化的纹理形态.因此,SAR图像复杂背景的本质是大量杂乱无章的海杂波被成像,形成如图1(b)所示的粗糙纹理形态;而简单背景则是近乎平静的海面被成像后所表现出的无纹理或弱纹理形态,如图1(a)所示.本文旨在解决复杂背景下的舰船尾迹检测问题.

由于SAR的成像区域一般较小,通常无法直接利用气象数据对特定时刻、特定海区的海杂波杂乱程度进行定量描述,但是可以借助灰度共生矩阵(Gray-level co-current matrix,GLCM)判定SAR图像中的纹理粗糙程度,进而间接判定海杂波的杂乱程度.一般认为,若GLCM中的非零元素延伸到距离主对角线较远处,即主对角线上的非零元素分布较宽,则认为相应SAR图像的纹理形态较粗糙,或具有复杂背景;反之,若非零元素集中于主对角线附近,即主对角线上的非零元素分布较窄,则认为相应SAR图像的纹理形态不明显,或具有简单背景.具体而言,对于图1(a)所示的简单背景SAR图像和图1(b)所示的复杂背景SAR图像,灰度共生矩阵图分别如图2(a)和图2(b)所示.可以看到,图2(a)主对角线附近向两边扩散的亮点个数少并且亮度高,说明图1(a)所示SAR图像的纹理粗糙度低或者背景简单;而图2(b)中的亮点延伸到了距离主对角线更远的地方、几乎充满整个空间,而且亮度低、呈密集分布态势,说明图1(b)所示SAR图像中存在更细密的纹理或者说具有复杂背景.

图2 不同背景SAR图像的GLCM图Fig.2 The GLCM images from different SAR image backgrounds

2 稀疏表示与形态成分分析

本文所提方法建立于信号的稀疏表示、字典学习和形态成分分析基础之上.该所提方法将复杂背景SAR图像看作是原始输入信号,通过分离信号中的舰船尾迹结构成分与复杂海面纹理成分,实现对尾迹目标的检测.本节将在引出相关理论与符号体系的基础上,给出本文所提方法的基本思路.

2.1 稀疏表示

其中,向量α=(α1,α2,···,αm)T称为表示系数,矩阵Φ称为字典.如果Φ是由标准正交基构成的,则信号x将具有惟一的表示系数α=Φ−1x,此时Φ也称为完备字典,它的每一列ϕi称为原子.在完备字典下,信号的稀疏性会受到信号类型的限制,比如小波变换只能稀疏表示图像的点奇异性,不能最优表示图像的线奇异性.为了灵活地对任意类型信号进行稀疏表示,通常需要增加字典的原子个数,使之远大于原子长度.此时式(1)成为一个欠定的线性方程组,在矩阵Φ行满秩的情况下,会有无穷多关于表示系数α的解,通过限定α的非零项个数最小便可确定唯一解,此时Φ也称为过完备字典.因此,任意信号的稀疏表示过程可以描述为如下的最优化问题:

其中,‖·‖0表示向量的ℓ0范数,即非零项个数.由于观测信号常包含噪声,式(2)可进一步表示为:

其中,∈表示观测信号与原信号间的差异.该最优化问题可采用正交匹配追踪(Orthogonal matching pursuit,OMP)或迭代阈值化(Iterative thresholding)方法进行求解[19−20].

当前有两种字典构建方法,一是构建“解析字典”,如曲线波(Curvelet)和轮廓波(Contourlet)字典,以及最新的弦波(Chordlet)[21]和简单块哈达码变换(Easy block Hadamard transform,EBHT)字典[22]等.二是对训练样本进行学习,得到“训练字典”.相比而言,解析字典的构建速度快,但是只能对特定类型信号稀疏表示;而训练字典能够稀疏表示更复杂的形态成分,但是需要采集样本.考虑到海况背景的复杂多变性以及舰船尾迹类型的有限性,本文利用字典学习方式构建海面纹理字典,利用局部解析方式构建舰船尾迹字典.

2.2 字典学习

字典学习过程可以表示为如下的最优化问题:

其中,t0为给定的正整数,用于限定表示系数中非零项的个数;‖·‖F表示矩阵的F范数.常使用K-SVD方法[23]对信号集进行学习,生成字典Φ.然而K-SVD方法有两点不足:一是样本总数必须固定,二是SVD计算耗时.因此要求字典不能太大、原子不能过长.针对这些不足,文献[24]提出了近似K-SVD方法(Approximate KSVD,AK-SVD),以近似计算代替SVD以提高字典更新效率,同时利用Batch-OMP方法提高稀疏编码效率.文献[25]提出了PAU-DL、OS-DL和APrU-DL方法,其中,PAU-DL是AK-SVD的改进,体现在字典更新阶段用前i−1个矩阵更新第i个矩阵;OS-DL只保留K-SVD的字典更新阶段,通过对αi增加限制条件以达到更新字典Φ的原子ϕi的目的;APrU-DL的字典更新方法与OS-DL相同,但稀疏编码采用批处理的迭代阈值化方法,并通过debiasing处理提高编码质量.为了支持添加样本,文献[26]提出了一种基于随机近似的字典学习方法,表示为如下的最优化问题:

这是一个ℓ1范数正则下的最小二乘问题,Φ表示字典,xi和αi表示样本信号及其在字典Φ下的稀疏表示系数,N表示样本总数.其求解过程包括两个阶段:第一阶段固定Φ,采用基于乔列斯基分解的同伦方法,求使式(3)最小的αi,并将αi与xi保存在矩阵UK×K和VM×K中:

其中,K表示字典Φ的原子数,M表示信号长度.第二阶段根据矩阵U和V的内容通过块坐标下降(Block coordinate descent,BCD)方法对Φ进行更新,即对Φ的第i列进行以下计算:

可以看到,BCD方法能够随新样本加入而持续优化旧字典,每次优化只需存储旧字典以及矩阵U和V、不必进行SVD计算,不仅减少了内存占用,字典更新速度也快于K-SVD方法.

2.3 形态成分分析

稀疏表示和字典学习理论可以应用于信号的形态成分分析.可以将信号x看作由K个独立形态成分线性叠加而成:

其中,xi表示信号x的第i个形态成分.这是一个欠定的反问题,不加限定条件无法从信号x惟一恢复出各个形态成分.如果从稀疏表示的思路出发,限定每一形态成分只能在特定字典下稀疏表示、不能在其他字典下稀疏表示,就可以实现稀疏意义下各形态成分的分离,这就是形态成分分析(Morphological component analysis,MCA)的原理.文献[20]将MCA描述为如下的最优化问题:

其中,∈表示信号分解残差的标准差,Φi表示各形态成分对应的字典,αi表示各形态成分的稀疏表示系数,表示 Φi的伪逆;表示αi的ℓp范数,p的取值通常为0≤p≤1.当p=0时,,即向量αi的非零项个数.

作为一种特殊的形态成分,结构成分xs也称为逐片光滑成分或卡通(Cartoon)成分,反映了信号的真实形态与骨架特征,包含了待检测的舰船尾迹目标.为了使分离出的结构成分更趋于光滑,通常在式(9)中加入全变分(Total variation,TV)正则项,即xs梯度的ℓ1范数,使分离出的结构成分更加光滑.此时式(9)可以改写为:

其中,γ称为正则系数.

对于式(10)的求解,文献[20]采用解析字典和迭代阈值化方法.但是文献[27]指出,当图像包含复杂纹理时,解析字典未必能对图像稀疏表示,因而提出了自适应MCA(Adaptive MCA,AMCA)方法,对复杂纹理进行字典学习,而其他成分仍然采用解析字典.AMCA方法采用图像分块方式学习复杂纹理成分字典,这是因为局部范围内的纹理复杂程度相比整幅图像低得多,易于构建合适的字典.假设图像x由纹理成分x1和另一种形态成分x2组合而成,AMCA方法可以表示为如下的最优化问题:

这是一个ℓ1范数正则化问题,与式(10)在p=0时的ℓ0范数正则化问题等价.其中,µ为正则系数,α1,k表示纹理成分x1的第k个块的稀疏表示系数,α2表示成分x2在相应字典下的稀疏表示系数.对式(11)求解时,AMCA方法首先对成分x1和x2进行稀疏编码,然后根据稀疏表示系数更新成分x1和x2,最后根据更新的纹理成分对字典Φ1进行更新,相当于求解以下的最优化问题:

其中,R(x1)表示对成分x1进行分块.式(12)的求解可以利用x1的所有分块及其稀疏表示系数,从而有:

其中,X1表示x1的各分块按列构成的矩阵,A1表示x1各分块的稀疏表示系数按列构成的矩阵.

3 基于字典学习的复杂背景舰船尾迹检测

如前所述,风速增大时,海面在SAR图像中呈现为复杂的随机纹理形态,淹没了舰船尾迹自身的结构信息,增加了舰船尾迹检测的难度.因此,本文提出利用MCA对图像进行预处理,将包含舰船尾迹的结构成分、海面纹理成分和斑点噪声相分离,与现有方法仅考虑斑点噪声有很大不同.同时,为了弱化SAR工作频率、极化方式、入射角和天气等因素对检测性能的影响,本文提出利用分解出的结构成分对舰船尾迹字典进行更新,以加强特定因素下舰船尾迹字典的针对性.此外,本文同样将舰船尾迹检测问题简化为线特征检测问题,只要图像中存在舰船尾迹,就可以进行检测.综上所述,本文所提方法由以下3个步骤组成:1)利用基于字典学习的形态成分分析分离出舰船尾迹结构成分;2)利用剪切波高频系数重构对结构成分进行增强;3)利用基于Radon变换的直线检测对舰船尾迹线进行检测.

3.1 SAR图像相干成像模型

SAR图像在成像过程中需要对地物回波信号进行方位向合成孔径处理和距离向脉冲压缩处理,具有相干成像性质,会在图像上形成颗粒状的斑点噪声.一般可将SAR图像建模为地物真实RCS与斑点噪声相乘的形式,称为乘性噪声模型,即X=FG,其中,X表示成像获得的SAR图像,F表示地物真实RCS,G表示斑点噪声.斑点噪声的存在是所有相干成像系统都无法避免的,严重降低了SAR图像用于信息提取的优势,因而SAR图像的几乎所有应用都需要对斑点噪声进行去除.然而乘性噪声模型的非线性性质使得去除斑点噪声非常困难,因此学者们提出将该模型转化为加性噪声模型,从而采用传统方法就可以消除斑点噪声.较常见的转化方法是将乘性噪声模型等号两边同时取对数,表示为:

其中,G′表示独立于地物真实RCS对数的加性噪声.然而文献[28]指出,取对数会将对数域的无偏估计映射为图像域的有偏估计,使去噪后的图像产生偏差.而且取对数也增加了图像预处理的运算量.因此,学者们提出了另一种模型转化方法,表示为[29]:

其中,X和F的含义同前,H可以看作依赖于地物真实RCS的加性噪声.采用该模型可不增加图像处理的运算量,比取对数的方式更直接.

3.2 基于字典学习的结构成分与纹理成分分离

根据第3.1节所述,本文将SAR图像由乘性噪声模型转化为式(15)所示的加性噪声模型.在此基础上,本节基于MCA思想进一步将F看作是由包含舰船尾迹的结构成分S、海面纹理成分T和残差部分R线性叠加而成,即F=S+T+R,从而可以将SAR图像X表示为X=S+T+N,其中,N=R+H表示以斑点噪声为主的分解残差.从而通过求解稀疏表示及全变分正则下的最优化问题:

就可以将S和T相分离.式(16)中,αS表示S的稀疏表示系数,αT表示T的稀疏表示系数,γ为正则系数.分离的原理和过程如图3所示,即如果椭圆内的线状结构成分所代表的舰船尾迹片段能够用字典ΦS中箭头所指的原子稀疏表示,并且圆圈内的纹理成分所代表的海面纹理能够用字典ΦT中箭头所指的原子稀疏表示,则最终可以使用字典ΦS和ΦT将X中的舰船尾迹和海面纹理相分离.此过程可以根据每次迭代计算分解出的结构成分对字典ΦS进行更新.

如果将残差N看作SAR图像X的加性噪声,则最优化问题式(16)可解的前提是N应为独立于X的稳定的加性高斯白噪声,即噪声服从均值为0、方差为σ2的高斯分布,且在图像全局范围内具有稳定的均值和方差,否则求解的理论依据便不成立.然而文献[30]指出,现实中很多类型的噪声都是依赖于图像或者信号且全局不稳定的非加性高斯白噪声,比如上述噪声N,但可以通过两项处理使之成为稳定的加性高斯白噪声:一是对图像进行归一化处理、并假设噪声无偏,这对于乘性噪声、胶片颗粒噪声(Film-grain noise)和泊松噪声(Poisson noise)等信号依赖型噪声都成立;二是将图像划分成相互重叠的小块,从而各块内的图像具有稳定的均值和方差.因此,本文所提方法也遵循了这两条原则.

图3 结构与纹理成分稀疏表示与分解过程示意图Fig.3 A schematic diagram of the sparse representation and separation procedure for the cartoon and texture components

在传统的MCA方法求解中,字典ΦS和ΦT通常选取为全局解析字典,如将ΦS选为contourlet字典、将ΦT选为小波字典.然而如第1节所述,海面纹理形态随海面风速不同而时刻变化,使得固定模式下的解析字典并不能很好地对其进行稀疏表示.由于局部小范围内的海面纹理复杂程度相比整幅图像具有更好的一致性,因此本文通过局部样本学习构建更具针对性的海面纹理字典.本文首先利用文献[26]的字典学习方法从100幅大小为600×800像素的典型复杂背景SAR海面图像训练出具有1600个原子的海面纹理字典ΦT,训练时图像块大小取为10×10像素,从而各原子的大小也为10×10像素,该字典如图4所示,每个小块表示一个原子.

对于舰船尾迹而言,虽然其形态相对简单,表现为明显的线特征,但由于实际的SAR图像中存在严重的斑点噪声,因此,学习策略下的解析字典能够更好地对斑点噪声下的舰船尾迹形态进行稀疏表示.本文也采用分块方式并使用剪切波变换(Shearlet transform)构建舰船尾迹的初始字典,即在每个图像块内通过求取剪切波基函数而构建字典.由于舰船尾迹的形态相比于海面纹理更为简单,并且可在更大范围内寻求舰船尾迹的稀疏表示,因此图像块的大小可以设置为比海面纹理字典的原子尺寸略大;而且,如果该图像块划分过小,则能够求取的剪切波基函数的个数也会减少,造成舰船尾迹字典中的原子数减少,不利于对舰船尾迹局部形态进行稀疏表示.因此,本文在构建舰船尾迹字典时选取20×20像素的图像块,对其进行4层剪切波变换,每层的方向分解数设置为18,从而得到一个由64个原子构成的初始舰船尾迹字典ΦS,如图5(a)所示.

图4 海面纹理字典Fig.4 A texture dictionary of the sea surface

图5 初始与最终的舰船尾迹字典Fig.5 The initial and the fi nal ship wake dictionary

根据式(11)给出的分离模型以及式(10)表示的目标函数,可以将包含舰船尾迹的结构成分与复杂海面纹理成分的分离表示为如下的最优化问题:

其中,M表示包含舰船尾迹的结构成分S的分块总数,N表示海面纹理成分T的分块总数,αS,i表示结构成分S的第i个块的稀疏表示系数,αT,j表示纹理成分T的第j个块的稀疏表示系数,∈表示分解残差的标准差.结合迭代阈值化方法以及文献[27]给出的3个计算步骤,本文提出了一种改进的包含舰船尾迹的结构成分与复杂海面纹理成分的分离算法.该算法使用如图4所示的海面纹理字典和如图5所示的初始舰船尾迹字典分别对海面纹理成分和包含舰船尾迹的结构成分进行稀疏表示,并利用每次MCA迭代计算求得的结构成分对舰船尾迹字典进行更新,然后再将更新后的舰船尾迹字典与海面纹理字典共同作用于下次的MCA迭代.算法1给出了本文所提方法的伪代码,在其实现过程中,可以将各个图像块的分别计算整合为对图像块矩阵的统一计算,从而显著提高算法的计算效率.

算法1.基于形态字典学习的复杂背景SAR图像舰船尾迹检测方法.

输入:SAR图像X,海面纹理字典ΦT,舰船尾迹字典ΦS,舰船尾迹字典更新次数Nlearn,形态成分分析的最大迭代次数Niter,正则系数γ,迭代停止条件τ,比值参数η.

1)归一化X:X=mat2gray(X),结构成分初始值S(0)=0,纹理成分初始值T(0)=0,残差部分初始值R(0)=X;U(0)=0,V(0)=0.

3)Forj=1→Nlearn

4) Fori=0→(Niter−1)

10) e)对补偿后的结构成分归一化:S(i+1)=mat2gray(S(i+1)).

11)纹理成分分离:

16)迭代终止:

17) a)求取残差R(i+1)=X−S(i+1)−T(i+1),并归一化:R(i+1)=mat2gray(R(i+1)),

18) b)采取与初始化相同的方案求阈值λ(i+1),

19) Ifλ(i+1)≤τ停止迭代.

20) End If

21) End For

22)字典更新:

24)End For

输出:结构成分S和海面纹理成分T.

对于图6(a)所示的一幅ERS-2舰船尾迹SAR图像,采用本文所提方法进行形态成分分析与舰船尾迹字典的更新,各参数设置分别为Nlearn=2,Niter=2,γ=0.1,τ=0.1,η=0.01,分解出的舰船尾迹结构成分、海面纹理成分以及残差部分分别如图6(b)～图6(d)所示.由图可见,本文所提方法有效分离出了包含舰船尾迹的结构成分与海面纹理成分,斑点噪声分解到了残差部分中.在分解计算结束后,最终的舰船尾迹字典如图5(b)所示,可以看到,与采用纯解析方式构建的初始舰船尾迹字典相比,更新后的舰船尾迹字典更符合斑点噪声下的舰船尾迹形态特征.将该舰船尾迹图像的真值图像作为参考图像,如图9(d)所示,可以分别计算出图6(a)所示的舰船尾迹SAR图像和图6(b)所示的结构成分图像与该参考图像之间的结构相似性指数测量(Structural similarity index measurement,SSIM)值[31],这是一种衡量待评价图像与参考图像相似度的指标,涉及到对待评价图像和参考图像的亮度、对比度以及结构信息项的计算.但由于图6(a)及图6(b)的亮度和对比度与图9(d)的亮度和对比度相比差异较大,将这两项参与计算会使最终求得的SSIM 值过小,考虑到本文关心的只是所提方法是否对舰船尾迹的结构形态进行了增强,因此在计算SSIM 指标时,本文只对结构信息项进行计算,从而可以得到图6(a)的SSIM值为0.9186、图6(b)的SSIM值为0.9239.由于图6(b)的SSIM值高于图6(a)的SSIM值,说明在分解计算后结构成分中的舰船尾迹得到了增强.

3.3 基于剪切波变换的结构成分增强

从图6(b)可以看到,舰船尾迹具有很强的方向性高频特征,为了进一步增加舰船尾迹的显著性,本文提出了基于剪切波变换高频系数重构的舰船尾迹增强方法,并且通过二值化处理进一步加强了舰船尾迹显著性的增强效果.剪切波变换的基函数表达式如下[32]:

图6 本文所提方法对真实SAR图像的分解结果Fig.6 The decomposed results of a real SAR image with our proposed method

它能够较好地响应方向特征.其中,矩阵A称为尺度因子,矩阵B称为方向因子;标量j表示尺度分解数,标量k表示方向分解数;向量p=(x,y),向量m∈Z2且m=(mx,my).结构成分S的剪切波变换可以表述为结构成分与剪切波基函数的内积α=〈S,ψj,k,m〉,可以通过空间域[30]方法或者频率域方法[33]进行求取.本文采用了由以下3个步骤构成的频率域求解方法,如图7所示:1)对图像进行拉普拉斯金字塔处理,得到一幅低通滤波图像和一幅高通滤波图像;2)对高通滤波图像进行傅里叶变换,并沿不同方向做带通滤波,得到剪切波系数;3)将低通滤波图像作为输入再次进行迭代.

图7 剪切波变换的频率域实现框架Fig.7 The frequency domain framework of the shearlet transform

图8 结构成分增强Fig.8 The enhancement of the cartoon component

图9 基于Radon变换的舰船尾迹检测Fig.9 The Radon transform based ship wake detection

对于图6(b)所示的结构成分,设置剪切波变换的尺度分解数j=4、各层的方向分解数k=34,选取剪切波变换高频系数最大绝对值的0.2倍为阈值Tsc,将大于Tsc的高频系数进行重构,得到如图8(a)所示的结构成分重构结果.然后,求取该重构结果的最大值vmax与最小值vmin之差的0.35倍值vd,将Tib=(vmin+vd,vmax−vd)作为双阈值,对该重构结果进行三层二值化处理,得到如图8(b)所示的结果.可以看到,经过这样的二值化处理后,舰船尾迹的显著性得到增强.

3.4 基于Radon变换的舰船尾迹线检测

通常,二值化的舰船尾迹表现为不连续的线特征,对其进行Radon变换[1]和聚类分析可以得到具有较高定位精度的连续尾迹线.本文这里对图8(b)进行Radon变换得到图9(a),将图9(a)最大值的0.6倍作为检测阈值(标记为Trb)对图9(a)进行阈值化,得到图9(b)所示的峰值点检测结果;再对图9(b)进行聚类分析,将求得的聚类中心做逆Radon变换并与原图叠加,得到图9(c)中加粗白线所示的舰船尾迹检测结果.图9(d)为该条舰船尾迹的真值图像.

4 实验结果与分析

为了验证本文所提方法的性能,这里使用21幅复杂背景的ERS-2舰船尾迹SAR图像,在CPU主频3GHz、内存大小8GB的64位Windows电脑上,通过Matlab编程方式进行了性能比较实验.所采用的ERS-2图像的方位向空间分辨率和距离向空间分辨率均为12.5米,图像大小为300×400像素,共包含了湍流尾迹、开尔文尾迹和窄V形尾迹或尾迹臂32条.这些图像由欧洲航天局(European Space Agency,ESA)于1995年发射的第2颗欧洲遥感卫星(ERS-2)所拍摄,该卫星携带了包括SAR在内的多种精密仪器,采用垂直极化方式对地球大气、陆地、海洋和极地冰进行观测,已于2011年退役.

实验中,本文选择了文献[6]和文献[14]方法作为性能比较的对象,分别简记为NRT方法和NHT方法.这两种方法分别采用分块与非线性滤波等预处理方法,改善了尾迹线的检测能力,体现了目前舰船尾迹检测方法的最优水平.对于本文所提方法,涉及到的重要参数有10个,分别是舰船尾迹字典的更新次数Nlearn,MCA计算的最大迭代次数Niter、正则化系数γ、迭代停止条件τ和比值系数η,结构成分增强的剪切波变换层数j、各层的方向分解数k、高频系数的重构阈值Tsc和重构图像的二值化阈值Tib,以及尾迹线的检测阈值Trb,它们共同构成了参数组p=(Nlearn,Niter,γ,τ,η,j,k,Tsc,Tib,Trb).为了缩小最优参数组的搜索空间,本文采用了先根据经验选取参数组的若干合理取值范围,再以手动调整方式逐步优化参数组的基本思路.对于给定的初始海面背景纹理字典和舰船尾迹字典,手动选取最优参数组的过程是:1)根据经验选取参数组的3个合理取值范围;2)在该范围内按一定步长细化调整参数组取值,统计所有实验样本的查全率或召回率(Recall)和查准率或检测精度(Precision),将这两项指标最高时对应的参数组作为候选最优参数组;3)将两项指标下3个候选最优参数组中的最优者作为最优参数组.对于NHT方法,涉及到的重要参数为虚警概率Pfa,它决定了Hough变换域的检测阈值;而NRT方法涉及到的重要参数为变换域阈值Tr.通过采用上述手动选取最优参数的步骤,也能够确定这两种对比方法各自的最佳参数.当求得了全部三种方法在各自最佳参数下的查全率和查准率后,便可以将这两项指标均最高的方法看作是最佳的舰船尾迹检测方法.查全率和查准率的计算方法如下[34]:

图10 三种检测方法的实验结果比较Fig.10 The comparison of experimental results with the 3 detection methods

其中,pt表示正确检测出的舰船尾迹个数,pf表示检测结果中的非尾迹个数,pn表示尾迹总数.

由于本文方法在结构成分与纹理成分分离环节采用了形态成分分析,算法复杂度有所增加,因此实验中也对这三种方法的运行时间进行了对比分析.最优参数下的部分舰船尾迹检测结果如图10所示.图10(b)中加粗白线表示舰船尾迹的真实位置,这是专家给出的舰船尾迹检测结果,可用于对舰船尾迹检测方法的查全率与查准率进行定量评价,也可以通过其空间位置对该检测方法的定位精度加以定量评价.图10(c)～图10(e)中加粗白线表示这三种方法对舰船尾迹的正确检测结果,而加粗灰线则表示错误的检测结果.由图10(c)和图10(d)不难看出,复杂海况背景下,NRT和NHT方法检测出的舰船尾迹大多偏离了真实位置,错检和漏检情况较为严重.由图10(e)可以看出,本文方法对于湍流尾迹以及窄V形尾迹均表现出了更好的检测性能,这是因为本文所提方法不仅能够较好地去除复杂海面背景和斑点噪声对舰船尾迹结构形态的干扰,而且能够有效提升舰船尾迹的显著程度,从而能够得到更准确的舰船尾迹检测结果.表1列出了本文所提方法与其他两种方法的查全率和查准率指标,以及全部三种方法的平均运行时间比较.可以看到,本文所提方法的查全率和查准率指标均高于其他两种方法,进一步说明了该所提方法远优于NRT和NHT方法;但是本文所提方法的平均运行时间也略高于其他两种方法,说明该所提方法检测性能的大幅提升是以运行效率的轻微下降为代价的,因此实际应用中可以通过并行计算等措施改善该所提方法的运行效率.

表1 本文所提方法与NHT和NRT方法的定量评价结果比较Table 1 Quantitative comparison results of the proposed method with the NHT and the NRT method

除了采用ERS-2图像进行性能比较实验外,我们也采用了5幅由ESA于2014年发射的sentinel-1A卫星拍摄的复杂背景舰船尾迹SAR图像,它们的方位向空间分辨率和距离向空间分辨率均为5米,图像尺寸为300×400像素.如图11(a)所示,左边第1幅为水平极化(HH)图像,其余为垂直极化(VV)图像;图11(b)为图11(a)的舰船尾迹真值图像.对于本文所提方法,采用与ERS-2实验相同的最佳参数设定方法,得到舰船尾迹检测结果如图11(c)所示,其中,加粗白线表示正确检测到的舰船尾迹,加粗灰线表示错检.可以看到,对于这5幅图像中存在的全部7条舰船尾迹或者尾迹臂,本文所提方法正确检测6条、错检3条,即本文所提方法的查全率为0.857,查准率为0.667,体现了较好的检测性能.而从舰船尾迹检测结果也可以看到,V形尾迹的检测效果同样略差于单一线状结构的湍流尾迹,比如图11(c)的左起第3幅和第5幅图像中均存在错检.其原因一方面是这两幅图像的背景复杂度较高,使得舰船尾迹的显著程度有所抑制,从而在Radon变换域中无法形成明显的两个峰值点;另一方面是V形尾迹的两条尾迹臂间会发生相互干扰,使得在Radon变换域中,一条尾迹臂变换点的亮度可能高于另一条尾迹臂变换点的亮度,从而在阈值化时易造成亮度偏弱尾迹臂变换点的漏检.

图11 sentinel-1A SAR图像的舰船尾迹检测结果Fig.11 The ship wake detection results of sentinel-1A SAR images

5 结论

SAR图像舰船尾迹检测是一项颇具挑战的重要工作.本文从信号稀疏表示理论出发,提出了一种基于形态成分分析与多字典学习的复杂背景SAR图像舰船尾迹检测方法.该方法通过对100幅复杂背景的SAR海面图像进行离线学习构建海面纹理字典,同时通过解析方式由剪切波基函数构建舰船尾迹字典并根据分解出的结构成分对该字典进行迭代更新,实现了稀疏意义下舰船尾迹结构成分与海面纹理成分的有效分离.而后,利用剪切波变换的高频系数重构增强结构成分,再基于传统Radon变换实现了尾迹线的检测.定性与定量实验结果表明,在复杂海况背景下,本文所提方法的舰船尾迹检测效果明显优于现有的其他尾迹检测方法.

1 Rey M T,Tunaley J K,Folinsbee J T,Jahans P A,Dixon J A,Vant M R.Application of radon transform techniques to wake detection in seasat-a SAR images.IEEE Transactions on Geoscience and Remote Sensing,1990,28(4):553−560

2 Lyden J D,Hammond R R,Lyzenga D R,Shuchman R A.Synthetic aperture radar imaging of surface ship wakes.Journal of Geophysical Research:Oceans,1988,93(C10):12293−12303

3 Chong Jin-Song,Zhu Min-Hui.Survey of the study on ship and wake detection in SAR imagery.Acta Electronica Sinica,2003,31(9):1356−1360(种劲松,朱敏慧.SAR图像舰船及其尾迹检测研究综述.电子学报,2003,31(9):1356−1360)

4 Kuo J M,Chen K S.The application of wavelets correlator for ship wake detection in SAR images.IEEE Transactions on Geoscience and Remote Sensing,2003,41(6):1506−1511

5 Courmontagne P.An improvement of ship wake detection based on the radon transform.Signal Processing,2005,85(8):1634−1654

6 Xing X W,Ji K F,Zou H X,Sun J X,Zhou S L,Li Z Y.An enhancing normalized radon transform method for ship wake detection in SAR imagery.In:Proceedings of the 9th European Conference on Synthetic Aperture Radar.Nuremberg,Germany:IEEE,2012.559−562

7 Zhang Ming-Zhao,Meng Tao,Mu Jian-Hua,Qu Ji-Shuang,Peng Xiao-Jun,Liu Yang,Xia Ke-Han.Method for detecting ship trail of ocean synthetic aperture radar image,China Patent CN102542277A,July 2012(张明照,孟涛,牟建华,瞿继双,彭晓军,刘扬,夏克寒.一种海洋合成孔径雷达图像的舰船尾迹检测方法,中国专利CN102542277A,2012年7月)

8 Wang Shi-Qing,Jin Ya-Qiu.Ship wake detection in SAR images based on Radon transformation and morphologic image processing.Journal of Remote Sensing,2001,5(4):289−294(王世庆,金亚秋.SAR图像船行尾迹检测的Radon变换和形态学图像处理技术.遥感学报,2001,5(4):289−294)

9 Mata-Moya D,Jarabo-Amores P,Jimenez-Chaparro B,de Nicolas-Presa J M,Nieto-Borge J C.Application of meanshift fi ltering to ship wakes detection in SAR images.In:Proceedings of the 8th European Conference on Synthetic Aperture Radar.Aachen,Germany:IEEE,2010.1−4

10 Tang Zi-Yue,Zhu Min-Hui,Wang Wei-Yan.A CFAR detection method of ship wakes in SAR images.Acta Electronica Sinica,2002,30(9):1336−1339(汤子跃,朱敏慧,王卫延.一种SAR 图象舰船尾迹的CFAR 检测方法.电子学报,2002,30(9):1336−1339)

11 Copeland A C,Ravichandran G,Trivedi M M.Localized radon transform-based detection of ship wakes in SAR images.IEEE Transactions on Geoscience and Remote Sensing,1995,33(1):35−45

12 Graziano M D.SAR-based ship route estimation by wake components detection and classi fi cation.In:Proceedings of the 2015 IEEE International Geoscience and Remote Sensing Symposium.Milan,Italy:IEEE,2015.3255−3258

13 Chong Jin-Song,Zhu Min-Hui.Ship wake detection algorithm in SAR image based on normalized grey level Hough transform.Journal of Image and Graphics,2004,9(2):146−150(种劲松,朱敏慧.基于归一化灰度Hough变换的SAR图像舰船尾迹检测算法.中国图象图形学报,2004,9(2):146−150)

14 Ai J Q,Qi X Y,Yu W D,Deng Y K,Liu F,Shi L,Jia Y F.A novel ship wake CFAR detection algorithm based on SCR enhancement and normalized Hough transform.IEEE Geoscience and Remote Sensing Letters,2011,8(4):681−685

15 Tunaley J K E,Sibbald T M,Rey-Cousins M T.Use of the Dempster-Shafer algorithm in the detection of ship wakes from synthetic aperture radar images.In:Proceedings of the 1991 International Conference on Acoustics,Speech,and Signal Processing.Toronto,Ont.,Canada:IEEE,1991.2605−2608

16 Fitch J P,Lehman S K,Dowla F U,Lu S Y,Johansson E M,Goodman D M.Ship wake-detection procedure using conjugate gradient trained arti fi cial neural networks.IEEE Transactions on Geoscience and Remote Sensing,1991,29(5):718−726

17 Chen Jie,Chen Biao,Xu Su-Qin.Detection of ocean features in SAR images with 2D continuous wavelet power spectrum.Acta Electronica Sinica,2010,38(9):2128−2133(陈捷,陈标,许素芹.基于二维连续小波变换的SAR图像海洋现象特征检测.电子学报,2010,38(9):2128−2133)

18 Nan J,Wang C,Zhang B,Wu F,Zhang H,Tang Y X.Ship wake CFAR detection algorithm in SAR images based on length normalized scan.In:Proceedings of the 2013 IEEE International Geoscience and Remote Sensing Symposium.Melbourne,Australia:IEEE,2013.3562−3565

19 Fadili J M,Starck J L,Elad M,Donoho D L.Mcalab:reproducible research in signal and image decomposition and inpainting.Computing in Science&Engineering,2010,12(1):44−63

20 Fadili M J,Starck J L,Bobin J,Moudden Y.Image decomposition and separation using sparse representations:an overview.Proceedings of the IEEE,2010,98(6):983−994

21 He Z,Bystrom M.The chordlet transform with an application to shape compression.Signal Processing:Image Communication,2012,27(2):140−152

22 Sun J,Ren G Q,Wu Q Z.The easy block Hadamard transform:a new adaptive directional hadamard transform for sparse image representation.Optik-International Journal for Light and Electron Optics,2014,125(10):2356−2360

23 Aharon M,Elad M,Bruckstein A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation.IEEE Transactions on Signal Processing,2006,54(11):4311−4322

24 Rubinstein R,Zibulevsky M,Elad M.Efficient Implementation of the K-SVD Algorithm Using Batch Orthogonal Matching Pursuit,Technical Report CS-2008-08,Computer Science Department,Technion-Israel Institute of Technology,Haifa,Israel,2008

25 Sadeghi M,Babaie-Zadeh M,Jutten C.Learning overcomplete dictionaries based on atom-by-atom updating.IEEE Transactions on Signal Processing,2014,62(4):883−891

26 Mairal J,Bach F,Ponce J,Sapiro G.Online learning for matrix factorization and sparse coding.The Journal of Machine Learning Research,2010,11:19−60

27 Peyr´e G,Fadili J,Starck J L.Learning the morphological diversity.SIAM Journal on Imaging Sciences,2010,3(3):646−669

28 Xie H,Pierce L E,Ulaby F T.Statistical properties of logarithmically transformed speckle.IEEE Transactions on Geoscience and Remote Sensing,2002,40(3):721−727

29 Argenti F,Lapini A,Bianchi T,Alparone L.A tutorial on speckle reduction in synthetic aperture radar images.IEEE Geoscience and Remote Sensing Magazine,2013,1(3):6−35

30 Kuan D T,Sawchuk A A,Strand T C,Chavel P.Adaptive noise smoothing fi lter for images with signal-dependent noise.IEEE Transactions on Pattern Analysis and Machine Intelligence,1985,PAMI-7(2):165−177

31 Wang Z,Bovik A C,Sheikh H R,Simoncelli E P.Image quality assessment:from error visibility to structural similarity.IEEE Transactions on Image Processing,2004,13(4):600−612

32 Kutyniok G,Labate D.Shearlets:Multiscale Analysis for Multivariate Data.Boston:Springer-Birkhauser,2012.1−38,239−282

33 Easley G,Labate D,Lim W Q.Sparse directional image representations using the discrete shearlet transform.Applied and Computational Harmonic Analysis,2008,25(1):25−46

34 Agarwal S,Awan A,Roth D.Learning to detect objects in images via a sparse,part-based representation.IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(11):1475−1490 his master degree from the PLA Information Engineering University in 2003.His research interest covers photogrammetry and remote sensing.Corresponding author of this paper.)