基于混合Wishart模型的极化SAR图像非监督分类
2017-11-27杨祥立
钟 能 杨 文 杨祥立 郭 威
(武汉大学电子信息学院 武汉 430072)
基于混合Wishart模型的极化SAR图像非监督分类
钟 能 杨 文*杨祥立 郭 威
(武汉大学电子信息学院 武汉 430072)
极化合成孔径雷达图像非监督分类是极化SAR图像自动化解译的重要步骤,但是在非监督分类的过程中如何确定样本类数仍然是十分具有挑战性的问题。由于像素之间具有空间相关性,因此和基于像素的分类方法相比,基于区域的分类方法能得到更加鲁棒的结果。为此,该文提出了一种基于混合Wishart模型和密度峰值聚类的区域级极化SAR图像非监督分类方法。该方法首先使用SLIC算法对极化SAR图像进行过分割,生成多个超像素区域;然后采用混合Wishart模型对超像素区域进行建模,并且利用Cauchy-Schwarz散度来衡量不同超像素区域之间的距离;最后通过密度峰值快速搜索聚类算法得到PolSAR图像的非监督分类结果。在不同极化SAR图像上的实验结果表明了该文方法的有效性。
极化SAR图像;非监督分类;混合Wishart模型;密度峰值
1 引言
极化合成孔径雷达(Polarimetric Synthetic Aperture Radar, PolSAR)是一种先进的对地观测技术,不易受天气时间等因素的影响,能够长期获取感兴趣目标的几何结构和物理特性等信息[1]。作为极化SAR数据信息提取和自动化解译的重要步骤,极化SAR图像分类技术得到了深入的研究。目前,极化SAR图像分类已被广泛应用于土地覆盖分类、灾害监测、地质勘探和城市规划等领域[2]。通常,极化SAR图像分类方法按照是否需要标记样本可以分为监督分类、半监督分类和非监督分类。监督分类方法需要根据已有的先验知识挑选大量的训练样本,因此在缺少先验信息的情况下非监督分类方法更加实用。
极化SAR图像非监督分类方法总地来说可以归纳为两大类。第1类方法通过分析极化散射机理,将极化目标分解理论和统计分布模型相结合来完成分类任务。Lee等人[3]利用Freeman极化分解特征初始化经典的Wishart分类器,在保持每类地物散射特性的同时得到了稳定的分类结果。在此基础上,Ferro-Famil等人[4]利用H/A/α-Wishart分类器对多波段全极化SAR图像进行非监督分类,进一步提高了分类精度。第2类方法主要依赖于图像处理和聚类分析技术。Ersahin等人[5]首先将图理论中的谱聚类方法应用于PolSAR图像的非监督分类,而Kersten等人[6]则利用最大期望聚类方法来得到PolSAR的分类结果,这些方法都取得了良好的分类效果。
但是上述基于单个像素的分类方法容易受到相干斑噪声的影响,在分类过程中利用像素之间的空间相关信息能够得到更加鲁棒的分类结果。Yang等人[1]基于极化协方差矩阵的黎曼几何特性,结合黎曼稀疏编码和稀疏相似性进行PolSAR图像分类。而Song等人[7]利用超像素和谱聚类方法完成了大尺度遥感影像的非监督分类任务。Wang等人[8]将张量聚类分析和马尔科夫场相结合,在分割PolSAR图像的过程中有效地融合了边缘信息。这些方法通过在分类过程中引入空间信息,在一定程度上削弱了相干斑噪声的影响,提高了非监督分类的精度。
合适的分类数目对于非监督分类的性能具有重要的影响。研究人员已经提出了多种模型选择方法来求解最优类别数,例如贝叶斯信息准则和最小描述长度准则。Rodriguez等人[9]提出一种密度峰值快速搜索聚类(Density Peaks Clustering, DPC)算法,能够有效地确定聚类数目,实验结果表现出了良好的性能。针对PolSAR图像,Tran等人[10]和Cao等人[11]基于凝聚层次聚类理论提出了自适应类别数的非监督分类方法,伪似然信息和数据的对数似然函数被用于聚类后的验证。在文献[12]基于超像素的分类框架中,Liu等人通过超像素之间的逐对相似性信息来估计类别数,取得了相当高的分类精度。
本文针对PolSAR图像的非监督分类问题,基于混合Wishart模型和密度峰值快速搜索聚类理论提出一种区域级的极化SAR图像非监督分类方法。首先,使用SLIC过分割算法[13]将极化SAR图像分割成多个超像素区域;然后利用混合Wishart模型对每一个超像素区域进行建模,并通过Cauchy-Schwarz (CS)散度来衡量逐对超像素区域之间的距离;最后通过密度峰值快速搜索聚类确定分类数目并得到最终的非监督分类结果。在EMISAR和AIRSAR数据上的实验结果验证了本文方法的有效性。
2 方法介绍
2.1 极化SAR数据和复Wishart分布
在单基站极化SAR测量中,考虑到互易定理,交叉极化分量Shv=Svh,此时像元内目标的极化信息可以由式(1)中的复向量进行表示,其中h和v分别表示水平极化和垂直极化,T表示转置运算。
对于经过多视处理的极化SAR数据,每一个数据点都可以由协方差矩阵C来表示,其表达式如下:
其中,N为图像视数,H表示厄密特转置运算。
协方差矩阵C满足复Wishart分布,其概率密度函数为:
其中,q在单站极化数据中为3,n为等效视数,Tr(·)表示矩阵的迹,K为归一化因子,表示期望参数。
指数分布族包含高斯分布、Gamma分布和多项式分布等常用的统计分布,其概率密度函数的标准形式为:
式中,λ是原参数,t(x)表示充分统计量,θ被称为自然参数,指代内积运算,F(·)表示对数归一化因子。复Wishart分布也属于指数分布族:
对于极化SAR图像区域建模与场景分类问题,参数n是未知常量,只需针对每个区域估计参数,而n采用全局估计量。在这种情况下,复Wishart分布的参数可以表示为如下形式:
2.2 混合Wishart模型和Cauchy-Schwarz散度
极化SAR图像的数据通常可以由均值协方差矩阵C来表示,并且服从复Wishart分布C~假定通过SLIC算法已经将PolSAR图像分割成多个超像素区域。对于一个超像素区域,可以通过中心化来表示该区域,例如用超像素m内所有像素的协方差矩阵的平均值Cm来表示。然而这种单模型方式并不适合描述异质性区域,因此需要更加合适的理论模型来对异质性区域进行建模。相较于单一的Wishart模型,由简单模型形成的混合模型更加灵活,且不会涉及到很复杂的参数求解问题。本文使用混合Wishart模型[14]来描述超像素区域:
其中,K表示混合模型的分量个数,是混合模型的未知参数,每种分量的分布权重,其约束条件为非负数并且和为1。是第i种Wishart分布的概率密度函数,其参数。
在使用混合Wishart模型完成PolSAR图像的拟合建模之后,超像素区域之间的距离可以由混合Wishart模型之间的差异度来衡量。衡量分布模型之间的差异可以利用信息论散度,但是针对混合模型的KL散度并没有解析解,因此本文采用Cauchy-Schwarz(CS)散度[16]来衡量混合模型之间的距离:
该散度由Cauchy-Schwarz不等式转化而来,只需要考虑的积分。针对指数分布族有限混合模型,的表达式如下:
2.3 密度峰值聚类(DPC)算法
密度峰值快速搜索聚类算法[9,17]可以给出样本聚类数目的参考值,实现样本集的快速聚类。该算法假设理想的聚类中心包含两个基本特性:(1)聚类中心被局部密度小于它的邻居点所环绕;(2)不同聚类中心之间的相对距离较大。该算法通过定义数据量ρi和δi来表征聚类中心的两个基本特性,其中数据量ρi表示数据点i的局部密度,而δi则是数据点i到局部密度大于它的数据点j的最小距离。
相比于计算数据点精确的局部密度值,该算法更加关心局部密度的相对大小,因此局部密度ρi的定义如下:
其中,dij表示数据点i和j之间的距离,dc称为截断距离。当dij>dc时,否则该定义式说明局部密度值ρi为到数据点i的距离小于截断距离dc的数据点的个数。参考文献[9]中的建议,我们在实验中选择合适的截断距离dc使得平均每个样本的邻域点个数为样本总数的2%。数据点i到其最近邻高局部密度值点j的距离的定义式为:
对于局部密度值最大的数据点i,其
计算出每个样本点的ρi和δi值后,以ρi为横坐标,δi为纵坐标绘制决策图。真正的聚类中心拥有较大的ρi和δi值,反映在决策图上即为右上方的离散点。根据决策图确定聚类中心之后,剩余的数据点根据每一类的边界域被一次性分配到距其最近的聚类中心。
3 实验及结果分析
本文选取两幅不同的极化SAR图像作为实验数据集。第1组实验数据为丹麦Foulum地区的EMISAR机载L波段全极化SAR图像,其覆盖区域主要包括农田、森林和一些建筑物。该幅图像的大小为300×150像素,其Pauli基(红色|Shh—Svv|,绿色|Shv|,蓝色|Shh+Svv|)合成伪彩图如图1(a)所示。为抑制相干斑效应,使用窗口大小为5×5的Boxcar滤波器对极化SAR图像进行预处理。SLIC算法的尺度参数NS=10,正则化参数Nm=0.5。NS值越大,超像素越大,Nm越大,超像素越紧凑。在混合Wishart模型的全局训练阶段,当混合模型的分量个数很小时,超像素区域不能被精确地建模;而当模型分量的个数很大时,计算复杂度会相应增加,但是分类性能却没有明显变化。考虑到混合Wishart模型的建模精度和计算复杂度,模型分量的个数K设置为25。本文的对比方法有两组:一组是经典的Wishart-Kmeans聚类算法;另一组是基于超像素之间Bartlett距离[16]的密度峰值快速搜索聚类算法,其中每一个超像素由位于该超像素内所有像素点的协方差矩阵的平均值来表示。
在EMISAR数据上的实验结果如图1所示。图1(b)为超像素分割结果,图1(d)为Bartlett方法的决策图,图1(e)为本文方法的决策图。从决策图中可以观察到,Bartlett方法将整幅图像分为6类,本文方法将整幅图分为7类,它们的分类结果分别如图1(f)和图1(h)所示。比较它们的结果可以看到,两种方法都将各类地物基本区分开来,但是本文方法能够将不同高度的树木区分开来(类3和类4),而Bartlett方法则将它们分为同一类(类3)。为了更好地分析不同方法的分类性能,我们在图1(c)中标记了两块异质性比较明显的区域。Bartlett方法将区域2基本分为了同一类(类3),Wishart方法在区域1和区域2的分类效果都较差,而本文方法不仅将区域2成功区分开来(类3和类4),而且在标示区域的分类结果也更加平滑。第1组数据可视化的实验结果表明本文方法是有效的。
为了进一步评估本文所提出的方法,我们对另一组实验结果进行了定量分析。第2组实验数据是在1989年获取于荷兰Flevoland地区的AIRSAR机载L波段全极化SAR图像,数据所覆盖的农业区域包含多种典型的农作物。该幅图像的大小为400×400像素,Pauli基伪彩图如图2(a)所示,图2(b)为实验区域真实地物类型参考图,其中定义了各种颜色代表的地物种类,包括甜菜、草地、小麦、土豆、大麦、苜蓿、裸地、油菜和豌豆等9类地物。混合Wishart模型分量的个数为K=15。本文选择标记地物的分类精度、全精度(OA)、Kappa系数、F1-score值和纯度(Purity)[18]作为非监督分类结果定量分析的评价指标,其中OA、Kappa系数、F1-score和Purity的数值越大,表明分类精度越高,分类算法的性能越好。
AIRSAR数据的实验结果如图3所示。图3(a)为超像素分割结果,图3(b)和图3(c)分别为Bartlett方法与本文方法的决策图。图3(b)中有7个明显的类中心,整幅图像被分为7类。而图3(c)中则有9个类中心,整幅图像被分为9类。它们的分类结果分别如图3(d)和图3(f)所示。其中图3(g)-图3(i)为只含有标记区域的分类结果图。参考图2(b)中真实地物图能够发现,Bartlett方法的分类结果中只有小麦、大麦、苜蓿和油菜等地物的分类基本正确,而土豆、豌豆和草地则存在不同程度的分类错误,并且整幅图像的大部分区域都被错分成为一大类,分类效果比较差。而在本文方法的分类结果中,除了部分甜菜区域被错误分类成大麦之外,其他几类地物的绝大部分区域都得到了正确的分类。相比于图3(d)中的分类结果,在图3(g)中绝大部分地物的分类精度都得到了提升。与图3(e)和图3(h)中Wishart方法的分类结果相比,本文方法的分类结果更加平滑,匀质性区域分为多类的情况明显减少,例如图3(h)中大麦和油菜中都出现了明显的错分现象。可视化的实验结果表明,本文方法的分类性能比其他两种方法更加良好。
图1 EMISAR数据的实验结果Fig. 1 The experiment results of EMISAR data
为了更加准确地评价不同方法的分类性能,表1中列出了AIRSAR数据中标记区域的定量分析结果。除了甜菜的分类精度较低之外,本文方法对其他地物的分类精度都达到了90%以上,其中OA值和Kappa系数分别为0.9420和0.9336,而且F1-score值和Purity值也分别达到了0.9337和0.9432,这些评价指标都远高于其他两种对比方法。和可视化的分类结果相似,数字化的定量分析指标再一次表明了本文方法良好的分类性能。
图2 AIRSAR数据Fig. 2 AIRSAR data
图3 AIRSAR数据的实验结果Fig. 3 The experimental results of AIRSAR data
表1 AIRSAR数据的分类结果Tab. 1 The classification results of AIRSAR data
本文方法主要分为3个步骤,第1步是使用简单线性迭代聚类(SLIC)算法生成超像素,第2步是利用混合Wishart模型和Cauchy-Schwarz散度计算不同超像素区域之间的距离(MixWishart),第3步是使用密度峰值快速搜索聚类(DPC)得到非监督分类结果。本文实验中EMISAR数据大小为300×150像素,AIRSAR数据大小为400×400像素。表2为不同分量个数的情况下,混合Wishart模型在EMISAR和AIRSAR数据上求解的计算时间。表3列出了本文方法各个步骤在EMISAR和AIRSAR数据上所对应的计算时间。相关程序使用Matlab2014进行编程,执行环境为3.4 GHz的单核Intel CPU。表2和表3中的结果都是取10次试验的平均值,从其中的计算时间可以观察到,本文方法的运算效率较高,具有较强的实用性。
表2 混合Wishart模型不同分量个数的计算时间Tab. 2 The computational time of Wishart mixture models with different components
表3 不同步骤的计算时间Tab. 3 The computational time corresponding to each step
4 结论
本文针对极化SAR图像的非监督分类问题,提出了一种基于混合Wishart模型和密度峰值快速搜索聚类的区域级分类方法。在EMISAR和AIRSAR实验数据上的分类结果表明,该方法能够有效地提高PolSAR图像非监督分类的效果,同时基于区域级的分类也能有效地降低相干斑噪声的影响,得到更加鲁棒的分类结果。在进一步的工作中,我们将探索如何自适应地确定混合Wishart模型的分量个数。
[1]Yang W, Zhong N, Yang X,et al.. Riemannian sparse coding for classification of PolSAR images[C]. IEEE International Geoscience and Remote Sensing Symposium(IGARSS), Beijing, China, 2016: 5698—5701.
[2]田维, 徐旭, 卞小林, 等. 环境一号C卫星SAR图像典型环境遥感应用初探[J]. 雷达学报, 2014, 3(3): 339—351.Tian Wei, Xu Xu, Bian Xiao-lin,et al.. Application of environment remote sensing by HJ-1C SAR imagery[J].Journal of Radars, 2014, 3(3): 339—351.
[3]Lee J S, Grunes M R, Ainworth T L,et al.. Unsupervised classification using polarimetric decomposition and the complex Wishart classifier[C]. IEEE International Geoscience and Remote Sensing Symposium (IGARSS),1998, 4: 2178—2180.
[4]Ferro-Famil L, Pottier E, and Lee J S. Unsupervised classification of multi-frequency and fully polarimetric SAR images based on the H/A/Alpha Wishart classifier[J].IEEE Transactions on Geoscience and Remote Sensing, 2001,39(11): 2332—2342.
[5]Ersahin K, Cumming I G, and Yedlin M J. Classification of Polarimetric SAR data using spectral graph partitioning[C].IEEE International Conference on Geoscience and Remote Sensing Symposium (IGARSS), Denver, USA, 1999:1756—1759.
[6]Kersten P R, Lee J S, and Ainworth T L. Unsupervised classification of polarimetric synthetic aperture radar images using fuzzy clustering and EM clustering[J].IEEE Transactions on Geoscience and Remote Sensing, 2005,43(3): 519—527.
[7]Song H, Yang W, Bai Y,et al.. Unsupervised classification of polarimetric SAR imagery using large-scale spectral clustering with spatial constraints[J].International Journal of Remote Sensing, 2015, 36(11): 2816—2830.
[8]Wang Y, Han C, and Tupin F. PolSAR data segmentation by combining tensor space cluster analysis and Markovian framework[J].IEEE Geoscience and Remote Sensing Letters, 2010, 7(1): 210—214.
[9]Rodriguez A and Laio A. Clustering by fast search and find of density peaks[J].Science, 2014, 344: 1492—1496.
[10]Tran T N, Wehrens R, Hoekman D H,et al.. Initialization of Markovian random field clustering of large remote sensing images[J].IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(8): 1912—1919.
[11]Cao F, Hong W, Wu Y,et al.. An unsupervised segmentation with an adaptive number of clusters using the SPAN/H/α/A space and the complex Wishart clustering for fully Polarimetric SAR data analysis[J].IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(11):3454—3467.
[12]Liu B, Hu H, Wang H,et al.. Superpixel-based classification with an adaptive number of classes for polarimetric SAR images[J].IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(2): 907—924.
[13]Achanta R, Shaji A, Smith K,et al.. SLIC superpixel compared to state-of-the-art superpixel methods[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012, 34(11): 2274—2282.
[14]Yang W, Yang X L, Yan T H,et al.. Region-based change detection for polarimetric SAR images using wishart mixture models[J].IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(11): 6746—6756.
[15]Nielsen F. K-MLE: A fast algorithm for learning statistical mixture models[C]. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Kyoto,2012: 869—872.
[16]Nielsen F. Closed-form information-theoretic divergences for statistical mixtures[C]. International Conference on Pattern Recognition, Tsukuba, 2012: 1723—1726.
[17]谢娟英, 高红超, 谢维信.K近邻优化的密度峰值快速搜索聚类算法[J]. 中国科学: 信息科学, 2016, 46(2): 258—280.Xie J Y, Gao H C, and Xie W X. K-nearnestneighbors optimized clustering algorithm by fastsearch and finding the density peaks of a dataset[J].Scientia Sinica Informationis,2016, 46(2): 258—280.
[18]Cherian A, Morellas V, and Papanikolopoulos N. Bayesian nonparametric clustering for positive definite matrices[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38(5): 862—874.
钟 能(1993—),男,2015年获得吉林大学工学学士学位,现于武汉大学电子信息学攻读硕士学位。主要研究方向为极化合成孔径雷达图像处理。
E-mail: zn_whu@whu.edu.cn
杨 文(1976—),男,教授,博士生导师,2004年获得武汉大学工学博士学位。研究方向为图像处理与计算机视觉。
E-mail: yangwen@whu.edu.cn
杨祥立(1991—),男,2016年获得武汉大学工学硕士学位,现于武汉大学电子信息学攻读博士学位。主要研究方向为极化合成孔径雷达图像处理。
E-mail: xiangliyang@whu.edu.cn
郭 威(1994—),男,2016年获得西安电子科技大学工学学士学位,现于武汉大学电子信息学院信号处理实验室攻读硕士学位。主要研究方向为极化合成孔径雷达图像解译。
E-mail: weige@whu.edu.cn
s: The National Natural Science Foundation of China (61271401, 61331016)
Unsupervised Classification for Polarimetric Synthetic Aperture Radar Images Based on Wishart Mixture Models
Zhong Neng Yang Wen Yang Xiangli Guo Wei
(School of Electronic Information,Wuhan University,Wuhan430072,China)
Unsupervised classification is a significant step inthe automated interpretation of Polarimetric Synthetic Aperture Radar (PolSAR) images. However, determining the number of clusters in this process is still a challenging problem. To this end, we propose a region-based unsupervised classification method for PolSAR images by introducing Wishart mixture models and a Density Peaks Clustering (DPC) algorithm. More precisely, the Simple Linear Iterative Clustering (SLIC) algorithm is first used to segment the PolSAR image into superpixels. Subsequently, the Wishart mixture models are adopted to model each superpixel, and the pairwise distances between different superpixels are measured by Cauchy-Schwarz divergence. Finally, the unsupervised classification result of the PolSAR image is obtained via clustering by fast search and find of density peaks. The experimental results obtained from different PolSAR images demonstrate that the proposed method is effective.
Polarimetric Synthetic Aperture Radar (PolSAR) image; Unsupervised classification; Wishart mixture models; Density peaks
TN957
A
2095-283X(2017)05-0533-08
10.12000/JR16133
钟能, 杨文, 杨祥立, 等. 基于混合Wishart模型的极化SAR图像非监督分类[J]. 雷达学报, 2017, 6(5):533—540.
10.12000/JR16133.
Reference format:Zhong Neng, Yang Wen, Yang Xiangli,et al.. Unsupervised classification for polarimetric synthetic aperture radar images based on Wishart mixture models[J].Journal of Radars, 2017, 6(5): 533—540.DOI: 10.12000/JR16133.
2016-11-30;改回日期:2017-01-16;网络出版:2017-02-17
*通信作者:杨文 yangwen@whu.edu.cn
国家自然科学基金(61271401, 61331016)