基于区域谱聚类的极化合成孔径雷达图像分割
2015-03-27殷君君
杨 帆 杨 健 殷君君
(清华大学电子工程系,北京100084)
基于区域谱聚类的极化合成孔径雷达图像分割
杨 帆 杨 健 殷君君
(清华大学电子工程系,北京100084)
极化合成孔径雷达(Synthetic Aperture Radar,SAR)经常用于地物图像的分割和分类.实际中监测范围广,需要算法快速有效;地物复杂,需要算法能够处理不均匀地物.针对上述问题,提出了基于区域合并和谱聚类的极化SAR图像分割方法.先对图像进行一个区域合并步骤完成粗分割,产生许多具有相似统计特性的区域块,再对过分割的区域块进行谱聚类.多个场景下的实验表明:所提方法相对于传统针对像素点的谱聚类,运算复杂度低;相对于完全进行区域融合的方法,更能适应不均匀地物和大场景分割.
极化;合成孔径雷达;分割;区域合并;谱聚类
引 言
极化合成孔径雷达(Synthetic Aperture Radar,SAR)在包括地物遥感在内的许多领域有广泛应用.极化SAR图像分割在极化SAR图像解译中有重要意义.一个好的分割,可以为后续的许多操作如特征提取、分类、目标识别打下基础.而SAR图像具有强烈的斑点噪声,针对于分割后的区域的操作可以有效降低斑点噪声的影响.例如,Ersahin先将图像分成若干个均匀区域再分类,其分类效果优于Wishart分类[1].
Beaulieu提出了一种基于区域合并的极化SAR图像分割算法[2].该方法基于经典极化SAR的统计模型,即复Wishart分布.匀质的区域往往满足复Wishart分布,但是非匀质区域,比如森林、城市,或者包含多种地物的大场景,或者高分辨率图像往往并不满足复Wishart分布[3].
为解决这一问题,许多异质区域的分布模型被提出,比如Vasile[4]和Ulaby[5]的工作.其中最广泛采用的是乘积模型.在假设雷达散射截面积(Radar Cross-Section,RCS)满足广义逆高斯(Generalized Inverse Gaussian,GIG)分布族中的某种特定分布基础上,K、G0、GH[6]、G1、G2[7]等分布被提出.Bombrun假设RCS满足Fisher分布,从而提出了极化SAR的KummerU分布模型,并基于此设计了相应的区域合并分割算法[8].这些基于某种分布假设的分割算法具有如下缺点:如果参数过少,或者说假设过强,那么模型的适配性往往不太好;如果参数过多,这些参数往往难以通过区域中有限样本点进行准确估计.比如KummerU分布模型,其参数估计较为繁琐,要实现准确的参数估计,往往需要比较大的图像块,必须在窗口大小大于50像素时参数估计才准确[8].
谱聚类方法,如Shi提出的归一化图割(Normalized Cut)[9]是一类基于图的分割方法,光学图像领域的应用证明了它的有效性.其基于点对之间的相似性度量,具有不依赖于分布、不易陷入局部最优等优点.Ersahin[1]设计了基于Wishart距离的相似性度量并将其应用到极化SAR图像的分割.传统的谱聚类针对像素点聚类,计算复杂度很高,于是只能处理很小的区域分割.Ersahin[1]没有解决这个问题而是将图像人为分成若干个子图像,对各个子图像分别分割然后再组装起来.实验表明,这会导致一些分割性能的下降.
值得注意的是,光学图像分割领域中,Tao[10]提出了一种先用mean-shift算法对图像进行过分割,然后再用Normalized Cut的办法对区域块进行聚类的分割方法,有效地降低了运算复杂度.但是以mean-shift为代表的分割方法没有利用极化SAR图像特有的统计特性,其适应空间为欧几里得空间,对于极化SAR图像不适应.
本文提出了一种新的分割算法,在极化SAR分割领域首次应用.它集合了区域合并和谱聚类的优势,先对图像进行基于复Wishart分布的区域合并完成过分割,然后再使用谱聚类算法对区域块进行聚类.本文还对传统的Normalized Cut方法的相似度度量进行了改进,使之更加能够适应基于区域的分割.本方法达到了既降低运算复杂度,避免人为将图像分块处理的作用,又能够处理基于非Wishart分布的异质或大场景图像.
1 方法描述
1.1 区域合并分割算法
分割的作用是将图像P分成具有相同性质的小块S的集合.用整个块S的共有分布参数作为块中每个点x的分布参数,一定会导致似然值的下降.将图像P分割成为若干块S,之后总的图像似然值
式中:L(P)为整个图像P的似然函数;L(S)为单个块S的似然函数.
同理,任意两个块合并时,都会导致似然值的下降[2].在选择合并对象时,优先选择让似然函数下降最少的两个区域块[2].区域块i和区域块j合并的似然函数下降值ΔLi,j为
在计算似然值时,需要用到数据的分布模型.在极化SAR领域,比较经典的分布模型是Wishart分布.基于Wishart分布,式(2)可变为[2]
式中CSi表示区域块i的各点的C矩阵的平均.式(3)的另一种理解是像素点i到其所属类别中心的Wishart距离[11],即式(4)
对一个区域块S中所有的点进行加总,像素点和类别中心Wishart距离总和
式(3)可以理解为第i、j类别合并之后总的类内距的增加量.
均匀区域的地物往往满足复Wishart分布.针对非均匀区域的非Wishart分布,比如K分布、KummerU分布,也可给出似然函数下降的公式[2,8].其中往往需要用到修正贝塞尔函数,运算复杂.且会引入更多参数进行估计.当区域比较小时,样本点少,参数估计往往不准确,从而影响合并算法性能.
较小的邻接区域地物相近,往往比较容易满足同分布.当区域块较大时,地物种类混杂,从而不容易匀质,所以可以先用基于Wishart分布的运算简单的式(3)对极化SAR图像进行区域合并,产生很多小区域,然后再用不依赖于统计分布的方法进一步聚类合并.
并且,在区域合并的过程中,为了使得到的区域较规则,本文法倾向于使得两个共享边长较长的区域进行合并,同时也倾向于将较小面积的区域除去.所以,可以在式(3)上面乘以一个正则项
式中:S1、S2是两个区域的面积;lshare为共享边长.从而dij可以作为一个两区域可合并性的一个度量.值越小,这两个区域越倾向于合并.λ可以调整,当等于0时不引入正则约束.
1.2 改进的基于区域的Normalized Cut聚类方法
一种分割的思路是将整幅图看作若干个点构成的图.通过寻找图的一个切割将其分成几个部分,就完成了分割.Shi和Malik[9]提出的Normalized Cut,就是一个被广泛采用的图割算法.传统上,Normalized Cut方法以像素作为图的一个节点,而一幅遥感图像的像素点数目很多,从而运算复杂度很高.很多文献,如文献[1],都将图像人为地分成一个个同等大小的块,在块的内部完成分割,从而导致了分割性能的下降.
采用一个区域块作为一个节点.而区域块具有和像素点不同的特性.和以往简单照搬基于像素点的相似性不同,本文提出了基于区域的相似性度量.分为特征空间的相似性和邻接关系的相似性.并且本文将极化SAR统计特性引入特征空间相似性度量中.
用式(3)的ΔLi,j衡量两个相邻区域之间的距离.ΔLi,j满足非负性,即ΔLi,j≥0、ΔLi,i=0、对称性,即ΔLi,j=ΔLj,i,因此可以作为两个区域在特征空间上的度量.这样本文构造出的基于极化SAR特征的特征空间相似度度量wFij为
邻接的两个区域在空域上的相似性难以定义,文献[10]采用的办法是相邻区域wSij=1,如果两个区域在空域上不相邻接,则定义空域相似度wSij=0.这样显得太简单,不能很好区分表征区域之间空间的邻接性.
考虑到两个区域共享边界长度占总各自总周长的比例越高,其实也说明两个区域在空域上更近.于是wSij可以更改为
式中:lij表示第i个区域和第j个区域的共享边界长度;σ为调整空域影响系数.
总体的各区域相似度为特征域相似度和空间域相似度的乘积,即wij=wFijwSij.wij最终成为相似性度量矩阵W的第i行第j列元素.
接着求解下面矩阵的前k个特征值所对应的特征向量[9]:
式中D矩阵是对角阵,其对角线元素dii是邻近矩阵W第i行的元素总和.
将特征向量用于对已形成的小区域进一步采用k-means方法进行聚类,最终得到分割结果.
因为运算需要用到矩阵求逆,如果是基于像素点的传统方法,复杂度为O(N3),N为像素数量.因为相似度矩阵W往往稀疏,一些方法如Lanczos可以降低矩阵求逆的复杂度,但运算仍然复杂.然而,如果基于区域块,N为区域块的数量,就可以大大减少复杂度.
2 实验数据分析
2.1 农田极化SAR数据分割结果
实验为机载合成孔径雷达(Airborne Synthetic Aperture Radar,AirSAR)获取的荷兰Flevoland地区的极化SAR数据.分类效果如图1所示.
和图1(d)中结果相比,本文方法运算复杂度较低,因此不需要事先将图像分成若干小块进行.而文献[1]中方法没有进行区域合并预操作,直接将图像人为分成了若干小块,对每一个小块进行了谱聚类,运算复杂度高.图1(c)是本文方法直接分割的结果,相对性能更优一些.
如何量化评价分割的效果?本文采用分割之后的分类准确率作为评价标准.
分割的一个有效作用是可以提高分类的精度.因为已经引入了空域关系,噪声杂点在分割之后已经没有影响,所以分类准确性肯定会有很大提高.用图1(c)中区域作为对像代替像素点进行分类,采用图1(e)中真实地物分类的对应像素点作为训练对像,监督分类之后的结果如表1所示.
在未经滤波情况下,因为斑点噪声的存在,直接进行Wishart分类的效果并不好,Kappa系数为0.59,但此时,基于本文分割方法进一步地分类,Kappa系数已经上升到0.84.这说明基于区域的分割方法能够有效对抗斑点噪声.进行Lee滤波之后再进行分类,Wishart分类的效果大大提升,Kappa系数为0.75,而本文的方法Kappa系数已经提升到0.89.相对于文献[1]中自述的Kappa系数从0.69到0.77的升幅,本文的分割效果显然要更好一些.
同时,本文方法的运算复杂度不高.文献[1]中采用基于像素的Normalized Cut分割,运算复杂度高不得不将图像人为分成若干个块对每个小块进行谱聚类.而本文的方法可以快速对大场景进行谱聚类,甚至可以方便地给出整幅Flevoland极化SAR图像的分割结果,如图2所示.
2.2 海面油膜极化SAR数据分割结果
本文的方法也可以用于海面油膜目标的分割.采用的数据如下:
1)October,1st,1994,8∶14,UTC p.n.44327,North Sea,low or moderate wind condition;
2)October 8th,1994,5∶57,UTC p.n.49939,British Channel,wind speed of 4m/s.
分割结果如图3所示.
2.3 复杂场景极化SAR数据分割结果
前面的农田、海面油膜数据中,地物相对单一均匀,目前绝大多数的工作都是基于这一类地物目标的分割.如果一幅遥感图像中还存在如森林、城区等这些不基于复Wishart分布的不均匀地物,那么分割的难度会增加不少.目前关于这一复杂场景极化SAR分割的研究很少.
本文的方法假设在小范围内,地物相对同质且基于复Wishart分布,但是大范围的分割算法基于谱聚类并不基于分布假设,所以也可以用来处理这一类复杂场景地物分类问题.
图4为旧金山极化SAR图像分割的结果.
可以观察到,在区域合并步骤中,海洋部分因为相对均匀,合并的区域明显偏大一些;而城市、森林因为相对不均匀,合并的较少.最后用N-Cut方法进行谱聚类的最终结果图显示,本方法正确地将不同的地物区分开来.当然,有一些小的目标,比如海中小岛、森林中湖,因为N-Cut方法更看重宏观全局的特点被删除了一些.因为谱聚类是根据全局图像分割,如果设定最终分割块数目比较少,就会导致有些地方过度合并.尤其是斜45°角街道方向的城区、森林区域的HV通道散射都很强,区分起来本身就不容易.
3 结 论
本文提出了一种极化SAR图像分割的新的分步分割算法.本方法结合了基于Wishart分布的区域合并的方法,具有运算快捷、更适用于小区域的优点和谱聚类方法再聚类不依赖于分布更适用于大区域的优点.并且本文改进了谱聚类的相似度矩阵,从而使之适合极化SAR数据,适合基于区域的分割.本方法有两大优势:1)相对于传统的谱聚类的方法,运算复杂度低,能够快速完成较大场景图像分割任务;2)谱聚类步骤不需要复Wishart分布假设,使得方法能够用于城区、森林等不均匀地物的分割.农田、油膜等实验结果证实了方法的有效性.
[1] ERSAHIN K,CUMMING I G,WARD R K.Segmentation and classification of polarimetric sar data using spectral graph partitioning[J].IEEE Trans Geosci Remote Sensing,2010,48(1):164-174.
[2] BEAULIEU J M,TOUZI R.Segmentation of textured polarimetric SAR scenes by likelihood approximation[J].IEEE Trans Geosci Remote Sensing,2004,42(10):2063-2072.
[3] GRECO M S,GINI F.Statistical analysis of high-resolution SAR ground clutter data[J].IEEE Trans Geosci Remote Sensing,2007,45(3):566-575.
[4] VASILE G,OVARLEZ J P,PASCAL F,et al.Coherency Matrix estimation of heterogeneous clutter in high-resolution polarimetric SAR images[J].IEEE Trans Geosci Remote Sensing,2010,48(4):1809-1826.
[5] ULABY F T,KOUYATE F,BRISCO B,et al.Textural information in SAR images[J].IEEE Trans Geosci Remote Sensing,1986,24(2):235-245.
[6] GAMBINI J,MEJAIL M E,JACOBO-BERLLES J, et al.Polarimetric SAR region boundary detection using B-spline deformable countours under the GHModel[C]//Proc XVIII Brazilian Symposiumon Computer Graphics and Image Processing.Natal,Oct 9-12,2005:197-204.
[7] 周晓光.极化SAR图像分类方法研究[D].长沙:国防科技大学,2008.ZHOU Xiaoguang.Polarimetric SAR Image Classification[D].Changsha:National University of Defense Technology,2008.(in Chinese)
[8] BOMBRUN L,VASILE G,GAY M,et al.Hierarchical segmentation of polarimetric SAR images using heterogeneous clutter models[J].IEEE Trans Geosci Remote Sensing,2011,49(2):726-737.
[9] SHI J,MALIK J.Normalized cuts and image segmentation[J].IEEE Trans Pattern Analysis Machine Intelligence,2000,22(8):888-905.
[10] TAO W,JIN H,ZHANG Y.Color image segmentation based on mean shift and normalized cuts[J].IEEE Trans Systems,Man,and Cybernetics——Part B:Cybernetics,2007,37(5):1382-1389.
[11] LEE J,POTTIER E.Polarimetric Radar:Imaging From Basics to Applications[M].CRC Press,2009.
Polarimetric SAR segmentation based on region merging and spectral clustering
YANG Fan YANG Jian YIN Junjun
(Department of Electronic Engineering,Tsinghua University,Beijing100084,China)
Polarimetric synthetic aperture radar(SAR)is often applied to segmentation and classification of terrain.Practically,vastness of scenes monitored requires faster and more efficient algorithms,while complexity of terrain necessitates the capabilities of coping with heterogeneous regions.To solve the above-mentioned problems,an approach of polarimetric SAR segmentation is proposed based on region merging and spectral clustering.Firstly,an over-segmentation step is enforced based on region merging,which creates many small regions with similar statistical properties.Then,spectral clustering is applied on these over-segmented regions.Using several datasets,this method has low computational complexity compared with conventional spectral clustering of pixels and is more adapted for heterogeneous terrain and large-scene compared with traditional region merging method.
polarization;synthetic aperture radar(SAR);segmentation;region-merging;spectral clustering
TP751.1
A
1005-0388(2015)01-0037-06
杨 帆 (1985-),男,湖北人,清华大学电子工程系博士研究生,主要研究方向为极化SAR地物分类、海洋溢油检测等.
杨 健 (1965-),男,湖北人,清华大学电子系教授、博士生导师,主要研究方向为极化SAR应用研究、精确制导、工程中的优化问题.
殷君君 (1983-),女,黑龙江人,清华大学电子系博士后,目前的主要研究方向为全极化和紧缩极化SAR图像的理解、图像分割、紧缩极化SAR在海洋监测中的应用研究等.
杨 帆,杨 健,殷君君.基于区域谱聚类的极化合成孔径雷达图像分割[J].电波科学学报,2015,30(1):37-42.
10.13443/j.cjors.2014022802
YANG Fan,YANG Jian,YIN Junjun.Polarimetric SAR segmentation based on region merging and spectral clustering[J].Chinese Journal of Radio Science,2015,30(1):37-42.(in Chinese).doi:10.13443/j.cjors.2014022802
2014-02-28
联系人:杨健E-mail:yangjian_ee@tsinghua.edu.cn