基于改进模糊均值聚类算法的遥感图像聚类
2012-11-26沈忠阳覃亚丽
沈忠阳,覃亚丽
(浙江工业大学信息工程学院光纤通信与信息工程研究所,浙江杭州310023)
0 引言
模糊C均值聚类算法在遥感图像分类中是一种重要的方法[1]。与其他图像分类算法相比,FCM能够更多地保留原始图像信息。但传统的FCM算法存在以下两个缺点:只考虑图像中的数值特征信息,而忽略了像素间的空间约束关系,有对数据集进行等划分的趋势[2]。在聚类进行之前必须给定类的数目,否则聚类无法进行。针对以上问题,本文给出了利用数据点的密度大小作为权值,借助数据本身的分布特性,从而克服传统FCM算法对数据集进行等划分的趋势。应用聚类有效性指数,聚类有效性指数既可以评价聚类结果的有效性,也可以用来确定最佳聚类数。
1 加权模糊C均值聚类算法与聚类有效性指数
1.1 计算点密度函数的加权系数
如果样本点周围有其它样本点时,则在该样本点处的样本分布密度就大,则该样本点对于分类的影响就越大。因此,这里选取一种点密度函数作为加权系数wj的计算方法。用wj表示样本xj对分类的影响程度。对于每个样本点xi其点密度的表达式定义为:
式中,如果样本点周围的点越多,则zi值就越大。对zi进行归一化:
1.2 WFCM聚类算法
定义WFCM的目标函数的表达式为:
式中,uij表示象元xj隶属于以vi为中心的类别i的隶属度,dij表示象元xi与象元xj之间的欧氏距离,m、c、n分别表示模糊加权指数,聚类数,图像象元个数。目标函数达到极小值时,根据拉格朗日乘数法求得 uij、vi分别为:
1.3 聚类有效性指数
为了解决聚类的类别数的问题,本文应用了一种试探性的、逐步优化的方法来确定类的数目,最后达到自动分类的目的[3]。人们把对聚类结果的有效性验证、寻找最优划分和最佳聚类数等问题称为聚类有效性问题。聚类有效性问题可以通过聚类有效性指数来定量地研究。XB指数是目前广泛使用的指标,VXB指数的值越小,获得的聚类结果越好[4]。其定义为:
1.4 实现加权模糊C均值聚类(WFCM)算法与聚类有效性指标的步骤
(1)选择最小聚类数a和最大聚类数b。选择聚类数c,用for循环实现c=a到c=b。
(2)选择模糊加权指数m,最大迭代次数Tmax,终止误差 ε,初始化隶属度矩阵U(0)以及聚类中心V(0),计算目标函数Jm。通过公式计算升级隶属度获得新的隶属度,如果‖-u(t)‖≤ε,
ij则停止迭代。
(3)计算聚类有效性指数VXB。选择VXB的值最小时的聚类数c作为最佳聚类数。
2 实验结果与分析
实验选取了一幅临沂地区的2008年的LANDSAT遥感影像的RGB伪彩色合成图,图像大小为200×200象素,如图1所示。首先用本文给出的改进的模糊C均值聚类算法对该遥感图像进行分类。在聚类前,要对参数进行设置,最小聚类数a=3,最大聚类数b=8,模糊加权指数 m=2.5[5、6],最大迭代次数Tmax=100,终止误差ε=10-5。聚类数m不同时的聚类有效性指数VXB值如表1所示。
表1 聚类数c不同时的聚类有效性指数VXB值
由表1可知该遥感图像的最佳聚类数是5。聚类数为c=5时该算法的聚类结果如图2所示。根据遥感知识把他们分别分为了水域、裸露地、植被地、交通用地、人工建筑,并用5种不同的颜色表示。相同参数下,传统FCM算法的输出聚类结果如图3所示。改进FCM与FCM算法聚类有效性指数值如表2所示。
表2 改进FCM与FCM算法聚类有效性指数值(算法的有效性评价)
由表2可知,改进后的FCM算法聚类效果优于传统FCM算法。用人工识别的方法,将两种算法的聚类结果图和伪彩色合成图对比,两种算法均对水域进行了较好的分类,本文给出的改进FCM算法对人工建筑分类更精确。尤其是在交通用地如道路的聚类中,FCM算法更多地把裸露地、植被地误分为交通用地。综上所述,本文给出的改进FCM算法,不仅能自动确定最佳聚类数,而且还能实现比FCM算法更精确的遥感图像分类。
3 结束语
本文给出了一种基于改进的模糊C均值算法的遥感图像聚类——基于加权模糊C均值聚类算法与聚类有效性指数的遥感图像聚类。该算法不仅利用了遥感图像的空间信息,而且通过应用聚类有效性指数对不同聚类数时的遥感图像聚类效果进行评价。该改进算法不仅能实现更精确的遥感图像分类,而且能实现根据遥感图像的不同自适应地选择出最佳聚类数。
[1] Dunn JC.A graph theoretic analysis of pattern classification via Tamura's fuzzy relation [J].IEEE Transactions on Systems,Man,and Cybernetics Society,1974,4(3):310 -313.
[2] 刘小芳,曾黄麟,吕炳朝.点密度函数加权模糊C均值算法的聚类分析[J].计算机工程与应用,2004,40(24):64-65.
[3] Rosenberger C,Chehdi K.Unsupervised Clustering Method with Optimal Estimation of The Number of Clusters:Application to Image Segmentation[C].Barcelona:In Proceedings of 15th International Conference on Pattern Recognition,2000:656 -659.
[4] 钟燕飞,张良培,李平湘.遥感影像分类中的模糊聚类有效性研究[J].武汉大学学报(信息科学版),2009,4(4):391-394.
[5] 高新波,裴继红,谢维信.模糊C均值聚类算法中加权指数m的研究[J].电子学报,2000,28(4):80-83.
[6] Nikhl PR,Bezdek JC.On cluster validity for the fuzzy c-means model[J].IEEE Transactions on Fuzzy Systems,1995,3(3):370-379.