合成孔径雷达图像去噪算法研究综述
2018-08-31刘帅奇
刘帅奇,扈 琪,刘 彤,赵 杰
(1.河北大学 电子信息工程学院, 河北 保定 071000; 2.河北省机器视觉工程技术研究中心, 河北 保定 071000;3.河北省数字医疗工程重点实验室, 河北 保定 071000)
合成孔径雷达(SAR)是一种能产生高分辨率遥感图像的相干系统,使用微波波段的电磁波,对接收到的信号的幅值和相位进行处理进而产生图像。与可见光、红外遥感相比,SAR有许多优越性,表现为:SAR具有全天候、全天时产生高分辨率遥感图像的特点,可以不受季节、天气和光照等恶劣条件的限制;穿透能力强,不仅可以穿透雨区、尘埃、云层,还能在一定程度上穿透土壤、植被等;具有多波段、多极化、可变侧视角工作方式,在太空或高空都能有效工作,使用SAR可获得大面积的遥感图像;能产生高分辨率遥感图像,并且与雷达的工作波长、载机的飞行高度、雷达作用距离无关。由于SAR所具有的众多优点,使其已成为森林监测、城市规划、灾害评估等众多领域不可替代的观测工具。
然而,由于SAR成像系统的有限分辨率和相干性,SAR成像过程中总是不可避免地要产生一种称为相干斑的噪声,使得SAR图像的视觉解译变得非常困难,对SAR图像的后续处理产生了严重的影响[1-3]。因此,SAR 图像去噪的主要着眼点在于抑制或者消除相干噪声。
本文对SAR图像的特点进行简要概述,并对近年来主流的三类SAR图像去噪处理算法:基于空域滤波的SAR图像去噪算法、基于变换域滤波的SAR图像去噪算法和基于深度学习的SAR图像去噪算法进行了深入研究,针对SAR图像特点分析了各种算法的性能,最后对SAR图像去噪的发展趋势进行了展望。
1 相干斑噪声形成机理及模型
由于SAR系统的相干性,导致SAR图像表现出粒子散斑,而SAR图像中的斑点噪声与数字图像处理中所遇到的噪声有本质的不同,这是因为它们形成的物理过程有本质上的区别。SAR图像中的斑点噪声是在雷达回波中产生的,是包括SAR系统在内所有基于相干原理的成像系统所固有的原理性缺点,而数字图像处理中的椒盐噪声和高斯噪声等都是在对照片进行采样、量化、压缩、传输和解码等数字化过程中产生或者由照片本身在保存过程中退化所引起的,是直接作用到图像上的。形象地讲,一块均匀场景的SAR图像中,相邻像素点之间的灰度会围绕着某一均值随机地起伏变化,这种现象称为斑点现象。一般情况下相干斑噪声是完全发育的[1],Goodman证明了完全发育的相干斑噪声是一种乘性噪声,其乘性模型为:
F(x,y)=R(x,y)·N(x,y)
(1)
式(1)中,(x,y)表示分辨单元中心像素方位向和距离向的坐标;F(x,y)表示被相干斑噪声污染的图像的强度;R(x,y)表示随机的地面目标的雷达散射特性,即实际上应该观察到的真实的地貌场景;N(x,y)表示由于衰落过程所引起的相干斑噪声过程,其服从具有二阶平稳性,均值为1的Γ分布,且方差与等效视数成反比。随机过程R(x,y)和N(x,y)相互独立。
通常根据相干斑特点进行SAR图像去噪。国内外学者研究的SAR图像去噪算法大体可以分为:基于空域滤波的去噪算法,基于变换域滤波的去噪算法以及近年来逐渐流行的基于深度学习的去噪算法。
2 基于空域滤波的去噪算法
基于空域滤波的去噪方法主要包括Lee滤波[4]、Frost 滤波[5]等经典滤波器以及非局部均值(Non-local Mean,NLM)去噪[6]等。
2.1 经典滤波器
在经典的降斑算法中,自适应空间滤波器早已被研究人员所使用和改进。1980年,Lee引入了第一个基于模型的降斑滤波器—Lee滤波器[7]。它基于线性的斑点噪声模型和最小均方误差模型,通过计算一个像素的邻域来得到增强的像素点。在Frost滤波器[5]中,像素滤波值是局部窗口内像素值与高斯加权函数的线性组合。Kuan滤波器[8]与Lee滤波器类似,但对未滤波的噪声像素值及其局部平均值具有不同的权重。这些滤波器可以通过应用异质性调整来改善,得到的滤波器分别被称为增强的Lee,Frost和Kuan滤波器,改善后的滤波器不仅可以更好地进行噪声抑制,还可以更好地保存纹理信息、边缘、线性特征和点目标响应。但是,这些空间滤波器的性能受滤波器窗口的大小影响很大,较小的窗口不能有效地对噪声进行抑制,而较大的窗口则不可避免地在去噪过程中导致图像纹理细节的丢失。而且,这些滤波算法,在图像的平稳区域,它们往往要么保留散斑噪声,要么擦除异质区域(如纹理区域、边界、线条或点目标)的弱场景信号。
2.2 非局部均值去噪
假设自然图像包含相当数量的自相似性,非局部均值去噪算法使用子块相似性对噪声图像进行滤波,根据当前噪声图像块和相邻块之间的相似性计算权重。实际上,NLM算法通过基于两个子块之间的相似度来确定用于计算平均值的每个子块的参与率。
在NLM方法中使用均方误差作为相似函数,在高度结构化的子块中可能达不到可接受的质量。因此,学者们提出了一些改进的NLM方法,提出了新的相似函数。NLM算法的另一个问题是其计算复杂度非常高。基于这些观点,文献[9-13]中使用不同的权重估计方法对NLM算法进行改进;文献[14-16]中提出频域去噪方案以提高NLM算法性能。尽管非局部均值算法的输出对于去除低水平的噪声是非常理想的,但是当噪声增加时性能恶化。这是因为相似性不能通过噪声子块来完美评估。
在文献[17-19]中,根据相干噪声的性质,通过调整相似性度量等方式将NLM方法应用于SAR图像去噪。特别是,文献[19]中基于概率子块(Probabilistic Patch-based,PPB)的算法被证明可以非常好地适用于SAR图像去噪。为了提高NLM的视觉效果,文献[20]应用广义非局部均值收缩SAR图像的非下采样剪切波系数;文献[21]则将NLM和稀疏表示相结合,从而在斑点噪声抑制过程中消弱人造纹理的产生。
此外,NLM的思想还与变换域去噪方法相结合,产生了一系列具有良好去噪效果的图像去噪技术,例如块匹配三维滤波(Block-matching 3-D Filtering,BM3D)[16]和LPG-PCA[22]。随后,该技术也被扩展到SAR图像去噪领域,如SAR-BM3D相干斑抑制算法[23]和改进相似性度量准则的SAR-BM3D相干斑抑制算法[24]。在对具有相似结构的图像块进行去噪时,所有方法都利用了图像在变换域的稀疏性。在这些方法中,块匹配方法被用来为图像中的每个子块找到一组相似的子块。然而,这种方法面临着如何定义可接受的与参考子块相似程度相关的阈值的困难,同时也有很高的计算成本。
3 基于变换域的去噪算法
相比于在空间域进行去噪,在信号和噪声更容易分离的变换域中执行去噪任务已经被证明是更有效的。基于变换域的去噪算法主要包括基于小波变换和多尺度几何变换的图像去噪算法,例如:小波域SAR图像去噪[25]、轮廓波域SAR图像去噪[26]和剪切波域SAR图像去噪[27]等等。
3.1 基于小波变换的去噪算法
小波变换是一种信号的“时间—尺度、时间—频率”的分析方法,其窗口大小固定不变,但其形状、时间窗和频率窗都可以改变。它具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力。小波变换在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,很适合于探测正常信号中夹带的瞬态反常现象并展示其成分,所以被誉为信号分析的显微镜。与Fourier分析理论相比,小波分析具有两大优点:其一,它是一种时频联合分析方法,能够根据信号不同的频率成分和时间域采样的疏密,自适应地调节时频窗口,同时具有时频域局部化的性能;其二,小波函数可作为许多经典函数空间的无条件基,通过快速离散小波变换能够实现这些空间中的函数逼近。
基于小波域的图像去噪算法,假设噪声主要存在于高频小波分量上,因此可以通过对变换域中的小波系数进行滤波来消除噪声。这个思想已经被证明对加性高斯白噪声降噪是非常成功的。为了使小波适用于SAR去噪,通常对SAR图像进行同态滤波,其中经过对数变换的散斑噪声被视为高斯噪声,并通过阈值[28-29]或对小波系数建模[30-31]在小波域中进行去噪。然而,由于对数运算往往会使去噪后的SAR图像的辐射特性发生畸变,因此在文献[32-33]中提出了基于加性信号相关噪声模型的噪声抑制技术。尽管已经证明基于小波的去噪方法比经典滤波器具有更好的效率,但应用小波变换的局限性在于小波变换的基通常都是固定的,不能充分地表示图像。为了“更优”地表示含线或者面奇异的二维图像,克服小波变换在高维时系数的非稀疏性和缺乏方向选择性,学者们提出了一系列的多尺度几何分析的方法,其中Contourlet和Shearlet两种变换在图像去噪中应用最为广泛。
3.2 基于Contourlet变换的去噪算法
为了更有效地“捕获”图像方向信息,Do和Vetterli提出了更好的表达二维图像各向异性特征的方法—Contourlet变换[34],也称为塔形方向滤波器组。Contourtet变换是由塔形方向滤波器组把图像分解成各个尺度上的方向子带。分两大部分实现:第一部分用拉普拉斯金字塔变换对图像进行多尺度分解以“捕获”奇异点,也称为子带分解部分;第二部分由方向滤波器组将分布在同方向上的奇异点合成为一个系数,也称为方向变换部分。Contourlet变换的最终结果是用类似线段的基结构来逼近原图像。Contourlet不但有足够的方向性,还保持了小波的多尺度特性、时频局部特性。由于Contourlet具有非常好的非线性逼近性能,能将更多的系数集中到更少的Contourlet系数中,因此能够对图像进行更稀疏的表示。
Contourlet变换在SAR图像去噪中的应用非常广泛,例如文献[35]中将非下采样轮廓波与双树复小波变换相结合进行局部混合滤波,保持了图像的平移不变性,改善了图像的视觉效果;文献[36]建立了SAR图像经过复Contourlet变换以后的系数域的高斯比例混合模型,有效地抑制了人造纹理产生。但是,由于Contourlet是基于离散方式提出的,因此它并不符合多分辨分析(Multi-resolution analysis,MRA)理论,在数学理论分析上存在着种种的困难。
3.3 基于Shearlet变换的去噪算法
Shearlet变换[37-38]通过合成膨胀的仿射系统构造而成,是具有Contourlet、Curvelet优点而克服了它们缺点的新型变换。该变换不仅在理论上符合MRA并且能够对图像进行稀疏表示产生最优逼近,且具有灵活的方向选择性,还更易于实现,所以Shearlet 变换很快被应用到边缘提取、目标检测等图像处理任务中。
非下采样剪切波变换[37](Non-subsample Shearlet Transform,NSST)是Shearlet变换的扩展,弥补了其平移鲁棒性差和边缘伪吉布斯失真现象明显等缺陷,可以通过多尺度变换和多方向变换构造。
在图像去噪中应用Shearlet变换不仅可以大幅减少噪声,还能保留源图像更多有用的信息。例如,文献[39]中提出对NSST系数进行子块排序,从而使NSST系数全局最优地表示图像;文献[40]在NSST域中应用循环旋转理论,构造了一种新的最优去噪模型;文献[41]在Shearlet域中构造了稀疏表示模型,提高了去噪图像的峰值信噪比;文献[42]中建立了复Shearlet稀疏域的高斯混合模型,提高了算法的计算速度;文献[43]利用基于贝叶斯估计理论的双变量阈值函数对Shearlet变换系数进行处理,提高了图像的峰值信噪比,而且去噪后的图像更平滑。
为了进一步说明各个算法的优缺点,对TerraSar-X 拍摄的SAR 原始图像进行去噪并对结果进行了分析。去噪算法包括基于空域的去噪算法和基于变换域的去噪算法,分别为Lee 滤波[4],Frost 滤波[5],小波域贝叶斯去噪(BWS)[44],基于稀疏表示的剪切波域贝叶斯去噪(BSSR)[45],基于NSST的图像去噪[46],基于NSST的广义非局部均值去噪(GNL-NSST)[47],基于优化加权像素的广义非局部均值去噪(GNL-OPW)[20]和基于子块排序的NSST域去噪(PO-NSST)[39]。某种测试图像如图1所示。
图1(a)是一幅田地的SAR 图像,图1(b)是一幅森林的SAR 图像,分别对这2幅图像使用上面提到的去噪算法进行去噪。图2是图1(a)用以上方法去噪以后的图像,图3是图1(b)用以上方法去噪以后的图像,从图2和图3我们可以看到,使用Lee滤波和Frost滤波的效果较差;使用BWS和GNL-NSST去噪时图像过于平滑,去掉了一些边缘纹理;使用BSSR和GNL-OPW去噪视觉效果较好,但产生了一些人造纹理;使用NSST去噪产生了边缘模糊;使用PO-NSST进行去噪,相比于其他图像,去噪后的图像可以更好地保持图像边缘和纹理信息,抑制人造纹理的产生。
为了更客观的进行不同算法的比较,计算了上述去噪算法的几种常用的去噪性能参数,其中包括峰值信噪比(Peak Signal to Noise Ratio,PSNR)[39]、等效视数(Equivalent Numbers of Looks,ENL)[39]、边缘保持指数(Edge Preservation Index,EPI)[39]和无参考质量评价指数(Unassisted Measure of Quality,UMQ)[48],其中PSNR 越大表明算法的去噪能力越强,ENL 越大表明算法的去噪后的视觉效果越好,EPI 越大表明算法可以保留更多的细节信息,而UMQ越小说明算法的综合性能越好。表1给出了图2和图3所有SAR 图像的去噪性能参数的实验结果。
表1 图2和图3中去噪图像的性能参数
从表1看出,Lee滤波和Frost滤波去噪后评价指标较差;BWS和NSST去噪后ENL和EPI较低,说明去噪过程中损失了部分细节信息;BSSR、GNL-NSST、GNL-OPW和PO-NSST去噪后各项评价指标较好,说明去噪效果较好,其中PO-NSST各项指标最优,去噪后UM最接近于1,说明该算法综合性能最好。可以看出,在信号和噪声更容易分离的变换域中进行去噪,比在空间域中进行去噪更为有效。
4 基于深度学习的去噪算法
自20世纪80年代以来,机器学习在算法、理论和应用等方面都获得了巨大成功。从2006年起,国外开始了深度学习(Deep Learning,DL)方面的深入研究,并取得了一定的阶段性成果。根据加拿大多伦多大学教授Geoffrey Hinton在《Science》上发表的文章[49]以及Yoshua Bengio、Yann Lecun等人的相关工作,深度学习逐渐被人们关注。深度学习[50]指多层的人工神经网络和训练方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取得权重,再产生另一个数据集合作为输出。其类似生物神经大脑的工作机理,通过合适的矩阵数量,将多层组织链接在一起,形成神经网络“大脑”来进行精准复杂的处理,并通过“逐层初始化”克服深度神经网络在训练上的难度。深度学习将具有多隐层的机器学习模型和海量的训练数据构建起来,用“深度模型”的手段达到“特征学习”的目的,最终提升分类或预测的准确性。
深度学习模型有多种,如深度信念网络、卷积神经网络(Convolutional Neural Network,CNN)、自动编码器等,其各类算法模型有着各自的特点与优势,在语音、图像、自然语言、在线广告等领域的应用取得显著进展。近年来,基于深度学习的方法已经在各种图像处理任务上显示出最先进的结果,如图像恢复[51-52]和超分辨率[53]。
图像去噪可以看成是将一幅含噪图像映射到无噪声图像的问题。因此,有些文献将图像去噪过程看作映射的拟合过程,而神经网络具有较强的映射逼近能力,如文献[54]就是利用多层感知器拟合图像去噪过程,取得一定的去噪效果。近些年,基于深度学习的卷积神经网络在图像处理领域受到广泛关注。相比前向神经网络,卷积神经网络使用卷积操作代替神经网络中的内积操作,具有深度提取图像特征的效果,成为研究图像的理想模型,并取得较好效果。给定一组适当的图像,网络被训练学习一个隐式的数据模型,可以有效地对所有相同类型的新数据进行降斑。因此,学者们将卷积神经网络应用到图像去噪中,取得了很好的效果。文献[55] 构造简洁高效的复合卷积神经网络,并将其用于图像去噪;文献[56]利用残差学习和批量归一化,首次将CNN用于SAR图像去噪;文献[57]利用除法残差法,将分量除法残差层结合到网络中,卷积层被迫在训练过程中学习散斑分量,通过简单地将输入SAR图像除以估计的散斑来获得去斑图像。我们可以看出将卷积神经网络运用到SAR图像的处理分析中,具有重要的研究意义与较大的发展空间。
文献[58]结合了基于模型的优化方法和判别学习法各自的优点,训练了一套快速有效的CNN降噪器集,并利用半二次分割法,将降噪器集成到基于模型的优化方法中以解决其他反问题。受其启发,我们将在未来的研究中结合CNN降噪器集和图像融合方法相结合来获得最佳输出图像,融合后的图像信息表达更加全面,视觉更加清晰。另外,由于多尺度几何变换能够对图像进行稀疏表示产生最优逼近,而且信号和噪声在变换域更易分离,我们提出将深度学习和变换域去噪相结合,即在CNN训练过程中不直接对图像进行训练,而是训练变换域系数,以此获得更好的去噪效果。
5 结论
相干斑抑制是SAR图像理解和解译的重要基础和关键前提,对后续的SAR图像处理有着重要意义。目前SAR图像相干斑抑制研究的一个重点和难点是如何在抑制相干斑的同时,能更好地保留SAR图像的边缘和纹理信息。现有的基于空域滤波的去噪算法、基于变换域滤波的去噪算法和基于深度学习的去噪算法都取得了一定的效果,但也有各自的不足。近年来基于深度学习的方法在图像恢复、超分辨率等图像处理任务中显示出了优良的性能,其主要优点之一是直接从训练数据中学习图像恢复的参数,而不依赖于预定义的图像先验或滤波器。然而,基于深度学习的图像降斑方法的研究还不广泛。因此在此方法基础上对SAR图像进行相干斑抑制具有较大的应用价值和广阔的应用前景。SAR图像品质的要求越来越高,需要成熟的相干斑抑制方法来为后续的图像分割、检测、识别等工作提供良好的预处理效果,保证后续工作有效进行。