基于半监督学习的SVM-Wishart极化SAR图像分类方法
2015-11-01滑文强
滑文强 王 爽 侯 彪
(智能感知与图像理解教育部重点实验室 西安 710071)
(西安电子科技大学国际智能感知与计算联合研究中心 西安 710071)
基于半监督学习的SVM-Wishart极化SAR图像分类方法
滑文强*王爽侯彪
(智能感知与图像理解教育部重点实验室西安710071)
(西安电子科技大学国际智能感知与计算联合研究中心西安710071)
该文针对极化SAR(Synthetic Aperture Radar)图像分类中的小样本问题,提出了一种新的半监督分类算法。考虑到极化SAR数据反映了地物的散射特性,该方法首先利用目标分解方法提取了多种极化散射特征;其次,在协同训练框架下结合SVM分类器构建了协同半监督模型,该模型可以同时利用有标记和无标记样本对极化SAR图像进行分类,从而在小样本时可以获得更好的分类精度;最后,为进一步改善分类结果,在协同训练分类完成后,该方法又利用Wishart分类器对分类结果进行修正。理论分析与实验表明,该算法在只有少量标记样本的情况下优于传统算法。
极化SAR;地物分类;半监督学习;协同训练;支持向量机
1 引言
极化SAR图像分类作为极化SAR图像处理的重要部分,在军事侦察、土地勘察和城市规划等领域都有着广泛的应用前景。目前的极化SAR分类方法主要有3种:无监督学习[1,2]、监督学习[3,4]和半监督学习[5,6]。在极化SAR分类中,无监督方法不需要标记样本,主要采用目标分解的方法根据不同地物的物理散射特性对目标进行分解,如三分量分解[7]和四分量分解[8]。监督方法通常比无监督方法更容易取得较好的极化SAR分类效果,但是监督方法需要大量的标记样本,而实际中很难获取大量的标记样本,如SVM分类器[8]。半监督方法利用大量未标记样本,通过发现未标记样本中的隐含信息结合标记样本信息提高分类精度。半监督学习同时利用已标记样本和未标记样本,弥补了监督学习和无监督学习的不足,已为机器学习领域的研究热点。近年来也有学者将半监督学习方法成功用于极化SAR图像分类,例如,文献[6]中将半监督学习方法用于极化SAR分类,该方法结合了无监督聚类的策略,通过无监督聚类优化分类结果。
协同训练[5]作为半监督学习的一种流行方法,采用两个分类器对大量未标记信息进行对比验证,提取更可靠信息提高分类效果,吸引着大量的学者对其进行深入的研究。本文主要针对极化SAR数据中很难获取大量标记样本的问题,在协同训练的框架下,提出了一种新的极化SAR图像半监督分类方法。该方法利用极化散射分解方法和极化SAR数据固有特性分析提取有效特征信息,在此基础上构造了可进行协同训练的基分类器。然后,采用最近邻分类法和一致性采样法对预测标记进行筛选,利用K近邻算法剔除噪音标签,再把选取的样本和预测标记一同添加到原始有标记样本中,增加训练样本数量,修正分类器。最后结合极化SAR数据的分布特性复Wishart分布,并通过Wishart分类器优化分类结果。实验结果表明该算法具有更好的稳定性和良好的分类效果,并在只有少量样本的情况下可以保持较高的分类正确率。
2 半监督协同训练方法
2.1协同学习模型
最初的协同学习算法是由Blum和Mitchell[9]在1998年提出的,他们假设数据集满足两个基本的条件:第一,每个属性集都足以描述该问题,即如果训练样本足够,每个属性集都可以学到一个强学习器;第二,在给定标记时,每个属性集都是条件独立的。协同训练算法就是利用已标记样本集在两个属性上分别训练得到一个初始学习器,在随后迭代过程中,由未标记样本中,每个学习器挑选出一部分置信度较高的数据进行标记,加入到另外一个学习器的有标记训练集中,得到两个新的标记样本集。协同训练过程就是不断迭代的过程,直到满足终止条件。因此,采用协同训练框架需要解决两个问题:第一,提取特征,构成两个强分类器;第二,在未标记样本中挑选可靠性样本添加到训练样本中。
2.2特征提取
特征提取对极化SAR分类非常重要。目标分解方法作为极化SAR数据特征提取的主要方法,它利用地物目标的不同散射机制,提取不同散射信息将地物目标进行分类。由于单一的目标分解方法不能有效地反映所有地物的散射信息,很难表示边缘或一些复杂的区域。因此本文采用协同训练的方法并结合多种散射特性。
Pauli分解[10]包含的主要散射类型有:奇次散射、偶次散射和π/4偶次散射。其虽然简单,但结果具有一定的抗噪能力,而主要缺点是只能区分两种散射机理:奇次散射和偶次散射。Cloude分解[11]包含所有散射机理的分解定理,其优点是:在不同极化基的基础下能够保持特征值的不变性。Freeman-Durden分解[7],其将协方差矩阵分解成为3种不同的散射机理:由植被的冠层定向偶极子组成的体散射;由二面角反射器所引起的二次散射;由1阶布拉格表面散射引起的面散射。Krogager分解[12]主要是将对称的散射矩阵[S]分解成为3个相干的分量:螺旋体(Helix)散射、球(Sphere)散射及二面角(Diplane)散射。因此由各种目标分解方法得到各种散射分量,并组成21维的散射特征。表1为各种散射分解参数。
表1 散射矩阵分解参数Tab.1 Scattering matrix decomposition parameters
极化散射矩阵主要是雷达发射的入射波与目标散射回波各极化分量之间的线性变换关系。在极化SAR数据实际分析中常将极化散射矩阵转换成极化协方差矩阵,具体表示为:
因此,由各种散射分解组成的21维散射特征和由协方差矩阵组成的9维数据特征集都能够很好地表示极化SAR图像的特性。由SVM分类器采用散射分解特征集组成的S_SVM分类器,由SVM分类器采用9维数据特征集组成的C_SVM分类器(其中SVM都选取径向基核函数和5倍的交叉验证),分别对1989年由ARISAR获取的荷兰Flevoland地区大小为750×1024的4视全极化SAR数据进行分类,分类结果如表2所示。由表2结果可知,在标记样本足够多时这两种特征集组合的分类器都可以得到很好的分类效果,在只有少量标记样本时分类效果较差。
表2 相同样本数不同特征组合时的SVM分类正确率(%)Tab.2 The SVM classification accuracy with the same training samples and different feature combination(%)
由上述分析可知,在标记样本数充足的情况下,这两种特征组合的SVM分类器都能得到很好的分类效果,符合协同训练的特征选择要求,因此,本文分别提取这两类特征:一类是数据本身的9维像素特征,另一类是由不同散射分解方法得到的散射特征。
2.3筛选样本
2.3.1一致性采样方法协同训练方法采用少量的有标记样本学习两个不同的分类器,并用学习的分类器对所有的未标记样本进行标记。因此每个像素点都有两个标记,一致性采样法对所有未标记样本的评价函数[13]定义为:
式中
xi表示任意的未标记样本,P1(xi)和P2(xi)分别为待测样本xi与其周围8邻域范围内5个近邻训练样本点分类结果一样的概率。由式(2)可以看出具有相同标记的样本评价指标要明显高于不同标记的样本。
2.3.2样本选择半监督学习通常利用未标记样本信息选取适当的样本扩充到有标记训练集中,本文采用以下两个步骤选取未标记样本扩充到已标记样本:第一,选取可靠性最高的n个样本,即每次选取每类别可靠性最高的1个样本。首先选取两个SVM分类器标记相同的样本,然后采用最近邻算法[14]的欧式距离判别式,
式中xt表示第t类样本的群聚中心,xj表示为两个SVM分类器标记相同的任意样本。选取距群聚中心距离最小的样本作为最终挑选的样本。
第二,选取分类正确率最差的m个样本,并对其重新标记。因为这些样本很可能是靠近分类界面或在分类界面之间,这些样本很可能是支持矢量对分类界面划分有很大作用。该方法采用式(2)的评价指标,先选取s值最小的m个样本,然后采用最近邻分类算法的判别式(3)对其重新标记,本文中m=1。
2.3.3噪音标签剔除采用上述两种方法筛选的未标记样本和其标签不可避免地会出现标记错误的情况,这种情况对半监督分类结果有很大影响,尤其是已标记样本很少的情况下。因此本文采用K近邻方法[15]剔除即将扩充的训练样本的噪音标签。
K近邻法表示,如果一个样本在特征空间中的k个最相似(即特征空间中最近邻)的样本中的大多数属于某一个类别,则该样本也属于这个类别。即分别求取被挑选的m+n个样本最近邻的k个样本,如果其周围的k个样本有相同的预测标记,则将这个被挑选的样本连同其标记扩充到训练样本中,如果其周围的k个样本中有部分样本与被挑选样本的预测标记不同,则认为该挑选的样本为噪音标签,该样本将不会被添加到已标记的训练样本中,本实验中k=3。
2.4复Wishart分类器
Lee等人在文献[16]中提出了基于最大似然判决准则的Wishart监督图像分类方法,应用最大似然法得到每个像素点相关矩阵与类中心的相关矩阵的复Wishart距离度量为:
式中Z表示任意样本的协方差矩阵,Vt表示第t类样本的聚类中心。
如果任意样本满足:
则认为像素点Z属于第t类。
2.5算法步骤
本实验算法流程如图1所示,具体步骤如下:
步骤1利用经典Lee[17]滤波算法对极化SAR数据滤波。
步骤2依据本文方法提取两类特征,并每类随机选取N个标记样本作为标记训练集L1,L2,剩余样本作为未标记训练集U1,U2。
步骤3用L1训练SVM1分类器,用L2训练SVM2分类器。
步骤4用SVM1预测训练集U1,用SVM2预测训练集U2,并按照本文所述方法挑选未标记样本扩充到已标记样本集L1,L2中,并分别在U1,U2集中删除挑选的样本。
步骤5对步骤3-步骤4进行迭代,直到迭代停止。
步骤6用最终训练的SVM1和SVM2对整幅图进行标记,如果某一点标记相同则将此作为最终标记,如果标记不同,则对所有标记相同的点计算聚类中心,然后用复Wishart分类器对不同标记的样本再分类。
图1 实验流程图Fig.1 Flowchart of the proposed algorithm
3 实验结果及分析
在本实验中,实验数据选取的是1989年由ARISAR获取的荷兰Flevoland地区的L波段的4视全极化SAR数据,该数据大小为750×1024,其Pauli分解RGB合成图如图2(a)所示,真实地物标记如图2(f)所示,根据地物实际情况,该数据中有15类农作物。
图2(b)为本实验分类结果图,图2(g)为本实验分类结果图2(b)对应的真实地物部分,本实验中每类别选取10个标记样本作为训练样本,最终分类正确率80.69%。而对比算法:监督SVM方法、监督Wishart方法和监督SVM-Wishart方法与本文方法每类别选取相同的10个标记样本作为训练样本时,最终分类正确率分别为63.71%,74.33% 和63.01%。因此,当每类别选取10个标记样本作为训练样本时,本实验算法分别比这3种对比算法在Flevoland地区的总体分类正确率高出16.98%,6.36%和17.68%。图3为本文算法每类选取10个训练样本时,扩充训练样本过程中迭代次数与分类正确率之间的关系,由图3可知随着迭代次数的增加分类正确率不断提高,当迭代超过5次之后分类正确率变化很小,说明本文算法具有良好的收敛性,为增强该算法的适应性对其它数据也能有效地收敛,本文采用10次迭代,即迭代10次后迭代终止。图4为监督SVM方法、监督Wishart方法、监督SVM-Wishart方法和本实验分类方法每类别选取不同训练样本数时的分类正确率比较曲线,其中监督SVM方法、监督Wishart方法和监督SVM-Wishart方法的特征集都选取9维数据特征和21维的散射特征组合。由于训练样本很少时,初始的聚类中心与真实聚类中心有很大偏差,随着Wishart迭代次数的增加偏差越大,分类结果越差,由图4中SVM-Wishart和SVM的曲线也可看出,在分类正确率不高的情况下,Wishart迭代反而会使分类正确率降低,因此,本文对比算法中监督Wishart分类方法和监督SVM-Wishart分类方法都选取最好的分类结果,Wishart只进行1次迭代。由图4可以看出随着训练样本数目的增加,本实验分类正确率逐渐增加,当每类训练样本数增加到50以后,分类正确率变化很小,对比算法SVM随训练样本增加,分类正确率逐渐增加,与本实验差异逐渐缩小;SVM-Wishart算法随样本数增加分类正确率逐步提高但提高较小;监督Wishart虽然训练样本数逐渐增加但是对于总体数据来说还是太少,因此分类正确率提高很少。实验结果表明,本文算法明显优于传统算法并在只有少量训练样本时有较高的分类正确率。
图2 Flevoland地区数据的分类结果Fig.2 Classification results of the Flevoland area
图3 扩充训练样本过程中迭代次数与分类正确率Fig.3 The number of iterations and classification accuracy on enlarging training samples
图4 有标记样本数目和分类正确率Fig.4 The number of labeled samples and classification accuracy
4 结论
本文针对小样本问题提出了一种新的半监督分类算法,该算法在训练样本较少时,通过对极化SAR数据分别提取多视角特征,在此基础上构造了协同学习的半监督分类器,通过协同学习策略增加了先验样本数目,然后又利用复Wishart分布方法进一步改善分类结果。实验结果表明该算法明显优于传统的分类算法且在有标记样本很少的情况下保持较高的分类正确率。
[1]Kersten P R,Lee J S,and Ainsworth T L.Unsupervised classification of polarimetric synthetic aperture radar images using fuzzy clustering and EM clustering[J].IEEE Transactions on Geoscience and Remote Sensing,2005,43(3):519-527.
[2]Wang S,Liu K,Pei J J,et al..Unsupervised classification of fully polarimetric SAR images based on scattering power entropy and copolarized ratio[J].IEEE Geoscience and Remote Sensing Letters,2013,10(3):622-626.
[3]Shang F and Hirose A.Use of poincare sphere parameters for fast supervised PolSAR land classification[C].IEEE Geoscience and Remote Sensing Symposium,Melbourne,Australia,2013:3175-3178.
[4]Shi L,Zhang L F,and Yang J.Supervised graph embedding for Polarimetric SAR image classification[J].IEEE Geoscience and Remote Sensing Letters,2013,10(2):216-220.
[5]Hady M and Schwenker F.Co-training by committee:a new semi-supervised learning framework[C].IEEE International Conference on Data Mining Workshops,2008:563-572.
[6]Hansch R and Hellwich O.Semi-supervised learning for classification of polarimetric SAR-data[C].IEEE Geoscience and Remote Sensing Symposium,Cape Town,South Africa,2009:987-990.
[7]Lee J S,Grunes M R,and Famil L F.Unsupervised terrain classification preserving polarimetric scattering characteristics[J].IEEE Transactions on Geoscience and Remote Sensing,2004,42(4):722-731.
[8]He Y and Cheng J.Classification based on Four-component decomposition and SVM for PolSAR images[C].IEEE International Conference on Automatic Control and Artificial Intelligence(ACAI 2012),Xiamen,China,2012:635-637.
[9]Blum A and Mitchell T.Combining labeled and unlabeled data with co-training[C].Proceedings of the 11th Annual Conference on Computational Learning Theory,Wisconsin,USA,1998:92-100.
[10]Cloude S R and Pottier E.A review of target decomposition theorems in radar polarimetry[J].IEEE Transactions on Geoscience and Remote Sensing,1996,34(2):498-518.
[11]Cloude S R and Pottier E.An entropy based classification scheme for land application of polarimetric SAR[J].IEEE Transactions on Geoscience and Remote Sensing,1997,35(1):68-78.
[12]Krogager E.New decomposition of the radar target scattering matrix[J].Electronics Letters,1990,26(18):1525-1527.
[13]Huang J,Shirabad J S,Matwin S,et al..Improving cotraining with agreement-based sampling[C].7th International Conference,RSCTC,Warsaw,Poland,2010:197-206.
[14]边肇祺,张学工,等.模式识别[M].北京:清华大学出版社,2000:136-140.
Bian Z Q,Zhang X G,et al..Pattern Recognition[M].Beijing:Tsinghua University Press,2000:136-140.
[15]Zanchettin C,Bezerra B L,and Azevedo W A.A KNN-SVM hybrid model for cursive handwriting recognition[C].WCCI IEEE World Congress on Computational Intelligence,Brisbane,Australia,2012,6:10-15.
[16]Lee J S,Grunes M R,and Kwok R.Classification of multilook polarimetric SAR imagery based on complex Wishart distribution[J].International Journal of Remote Sensing,1994,15(11):2299-2311.
[17]Lee J S,Grunes M R,and Grandi G.Polarimetric SAR speckle filtering and its implication for classification[J].IEEE Transcations on Geoscience and Remote Sensing,1999,37(5):2363-2373.
滑文强(1987-),男,陕西人,西安电子科技大学博士研究生,主要研究领域为极化SAR图像处理、机器学习等。E-mail:huawenqiang2013@163.com事SAR/POLSAR处理与分析、稀疏表示、机器学习等方面的研究工作。
E-mail:shwang@mail.xidian.edu.cn
侯彪(1974-),男,陕西人,西安电子科技大学教授,博士生导师,智能感知与图像理解教育部重点实验室副主任,IEEE会员,IET西安分会执行委员会委员,中国电子学会高级会员,陕西信号处理学会理事,教育部创新团队成员。主要研究方向为遥感图像解译、压缩感知、稀疏表示等。
E-mail:avcodec@163.com
Semi-supervised Learning for Classification of Polarimetric SAR Images Based on SVM-Wishart
Hua Wen-qiangWang ShuangHou Biao
(Key Laboratory of Intelligent Perception and Image Understanding of Ministry of Education,Xi'an 710071,China)
(International Research Center for Intelligent Perception and Computation,Xidian University,Xi'an 710071,China)
In this study,we propose a new semi-supervised classification method for Polarimetric SAR(PolSAR)images,aiming at handling the issue that the number of train set is small.First,considering the scattering characters of PolSAR data,this method extracts multiple scattering features using target decomposition approach.Then,a semi-supervised learning model is established based on a co-training framework and Support Vector Machine(SVM).Both labeled and unlabeled data are utilized in this model to obtain high classification accuracy.Third,a recovery scheme based on the Wishart classifier is proposed to improve the classification performance.From the experiments conducted in this study,it is evident that the proposed method performs more effectively compared with other traditional methods when the number of train set is small.
Polarimetric Synthetic Aperture Radar(SAR); Terrain classification; Semi-supervised learning;Co-training; Support Vector Machine(SVM)
TN958
A
2095-283X(2015)01-0093-06
10.12000/JR14138
滑文强,王爽,侯彪.基于半监督学习的SVM-Wishart极化SAR图像分类方法[J].雷达学报,2015,4(1):93-98.http://dx.doi.org/10.12000/JR14138.
Reference format:Hua Wen-qiang,Wang Shuang,and Hou Biao.Semi-supervised learning for classification of polarimetric SAR images based on SVM-Wishart[J].Journal of Radars,2015,4(1):93-98.http://dx.doi.org/ 10.12000/JR14138.
王爽(1978-),女,陕西人,西安电子科技大学教授,博士生导师,智能信息处理研究所副所长,智能感知与图像理解教育部重点实验室成员,国家“111”计划创新引智基地成员,IEEE会员,IET会员,中国电子学会会员,中国计算机学会会员。主要从
2014-11-20收到,2015-02-28改回
国家自然科学基金(61173092,61271302)和陕西省科学技术研究发展计划项目(2013KJXX-64)资助课题
滑文强huawenqiang2013@163.com