基于图像直方图与模糊核聚类的分割方法
2014-07-04郭桂芳朱昌杰彭太乐葛方振
郭桂芳,朱昌杰,彭太乐,葛方振
(淮北师范大学 计算机科学与技术学院,安徽 淮北 235000)
0 引言
图像分割在很多领域中起着重要作用,如计算机视觉、模式识别和医疗成像[1-2].模糊C-均值算法(简称为FCM)由于将像素的隶属模糊性应用到图像分割中,在过去的很长时间内,它在模糊分割方法中应用较多.与其他方法相比,FCM能够从原始图像中获取更多的信息[3].但处理对比度低,噪声大的图像存在不足.有的研究者开始考虑在FCM引入空间约束信息来处理对噪声敏感的图像.
近年来,将核聚类算法应用于图像分割成为一种发展趋势,是一种较权威的具有较好的鲁棒性与普适性的方法[4].来源于统计学习理论的核方法是一种较新的方法.该方法利用非线性映射,把样本映射到高维特征空间.判定样本的类别依据是样本与聚类中心之间的欧氏距离.对于线性不可分的数据能够较好地进行聚类[5].而其他传统的FCM算法,在这种情况下不能实现较好的分类效果.FCM聚类是基于准则函数的非线性迭代优化算法,运算复杂度较大,在特征数和样本数较多时速度慢;并且,初始值的选择直接影响到聚类结果及收敛速度的好坏程度.选择不合适的初始值甚至导致非常慢的聚类速度或是收敛到错误的极小点[6-8].
为了解决传统方法FCM初始值选择问题,论文中提出基于直方图信息结合数学期望理论,寻找聚类中心的新算法.在图像直方图中计算两个相邻波谷之间的聚类中心的灰度级,作为该算法的先验初始值.本文将分类算法分为2步:首先,利用直方图的信息寻找聚类中心;随后,在初始聚类中心的前提下,采用模糊核聚类KFCM[9-10],得到最终分类结果.
1 模糊核聚类算法
设输入空间的样本xi∈RN,i=1,2,…,l, 通过某种非线性映射Φ,映射到特征空间Η,得到Φ(x1),Φ(x2),…,Φ(xl).在高维特征空间中用Mercer核函数形式表示为
模糊核聚类算法的目标函数:
由非线性映射Φ,得
代入Mercer核函数,可得
在更多的核函数中,高斯核函数是普遍使用的核函数[11].利用Lagrange乘数法求解,得到
模糊核聚类算法的具体步骤如下:
Step1:初始化聚类类别数C和加权指数m,从样本点中C个构成初始聚类中心,并设定一个小的正数ε为迭代停止阈值;
Step2:选择核函数,一般为高斯核函数;
Step3:由公式(6)计算并更新聚类中心矩阵Ε;
Step4:由公式(5)更新隶属度矩阵U;
2 聚类中心初始化算法
灰度直方图表示图像中具有某种灰度级的像素个数,属于图像灰度级的函数.反映了图像中某种灰度出现的频率[12-13].通常图像中的一致性目标区域对应直方图中含有1个波峰的邻域.也就是说,要确定图像中的目标区域,可以在全局直方图中找到峰值区域即可.这种阈值技术即寻找波峰和波谷的方法在图像分割中已经被广泛运用.
大多数文献将聚类中心视为直方图中波峰所对应的灰度级,而本文先统计直方图中两相邻波谷之间的所有像素总数,将这些像素的期望值视为“名义波峰值”;然后将所有相邻波谷之间所有的灰度级对应的像素个数与这个期望值比较,把对应像元个数与这个期望值最接近的那些灰度级作为聚类中心.
设A=f(x,y)是尺度为M×N的8 bit 灰度图像.其中A=f(x,y)为图像在像素(x,y)处的灰度值.图像的灰度直方图的数学定义为:
式中,
假设图像中有L个灰度级,R(i)表示L中第i个灰度级所对应的像素总数,则
其中0≤i≤L-int(n/2),z是直方图中与i相邻灰度值的个数,z取整数值,则Tn(i)表示第i个灰度级前后z个像素灰度值的平均值.
当
时,W即为波谷.
在图像灰度直方图中一个波峰处在两个波谷之间,这个波峰可能就是一个聚类中心,设2个波谷的灰度级为(p,q),(p,q)∈V,则p,q灰度级之间的所有灰度级对应的像素个数的期望值为:
平均灰度级等于(或接近于)期望值的两个值作为聚类中心.这样获得的聚类中心个数较多,再把所有的聚类中心组成新的灰度统计图,利用公式(9)-(11)进行运算,就可以减少聚类中心的个数,直到聚类中心达到所设定的初始值.因此,得到聚类中心的灰度值即分割阈值.
算法如下:
(1)利用式(7)计算直方图的统计像素个数;
(2)利用式(9)计算z个i相邻的灰度值的期望值,满足式(10)的V即为波谷;
(3)求两个波谷之间的期望值(利用式(11)),并得到聚类中心,以此类推,得到所有的聚类中心;
(4)把上步骤得到的所有聚类中心,再次利用公式(9)-(11)进行运算筛选,得到初始聚类中心.
3 实验结果与分析
实验分别选用比较经典的Lena.bmp(像素大小为225×225)图像、像素大小为275×183的Vege.bmp和像素大小为259×194的hill.bmp图像.为了检验算法的有效性,从大量实验中选取3组实验结果.
首先,取聚类中心C=4,用本文的核聚类算法与标准的FCM算法作对比,分割的聚类中心结果如表1所示.从表1可以看出,聚类中心的差值≤2.669 1.
表1 聚类中心(C=4)
其次,用本文算法与其他算法(标准FCM算法、KFCM算法)进行分割效果对比.KFCM算法是假定任意的初始聚类中心进行分割,而本文算法先对初始聚类中心进行优化,再进行分割.分割效果对比如图1、图2、图3所示.
在聚类方法中,为了更科学地分析分割效果,评价聚类效果的标准采用分割系数(Partition Coeffi⁃cient,PC)和分割熵(Partition Entropy,PE),这两个指标基于隶属度矩阵并最具代表性,其定义如公式(12)-(13):
图1 Lena图分割效果
图2 Vege图分割效果
图3 Hill图分割效果
在公式(12)-(13)中,C是聚类中心的数目,N是图像像素总数.当Vpc取最大值,Vpe取最小值时,即两个评价函数为最优值,聚类分割效果较好.本文提出的算法和标准FCM算法两个评价函数的对比结果及分割消耗的时间如表2所示.
通过以上实验得到的分割结果可知,本文提出的算法分割效果比标准的FCM多阈值算法能有效地将目标与背景分割开,本文的算法能够增强目标聚类的正确性,有效提高边缘的模糊性,使聚类结果更趋于完整,每个聚类的边缘趋于闭合,分割结果与实际情况更为接近.虽然利用迭代寻找聚类中心,运算时间较长,但得到的最大聚类中心之差较小,如表1所示.可见,本文算法有着良好的分割效果.
表2 两种算法的评价结果
[1]PHAM D L,XU C Y,PRINCE J L.A survey of current methods in medical image segmentation[R].Baltimore:Johns Hopkins University,2000,2:315-337.
[2]PHAM D L,PRINCE J L.An adaptive fuzzyC-means algorithm for image segmentation in the presence of intensi⁃ty in homogeneities[J].Pattern Recognition Lett,1999,20:57–68.
[3]WU Xiaohong,ZHOU Jiangjiang.Possibilistic fuzzyC-means clustering model using kernel methods[C]// Proceed⁃ings International Conference on Computational Intelligence for Modeling,Control and Automation,CIMCA2005 and International Conference on Intelligent Agents,Web Technologies and Internet,2005,2:465-470.
[4]SAIKUMAR T,ANOOP B K,MURTHY P S.Robust adaptive threshold algorithm based on kernel fuzzy clustering on image segmentation[J].CS&IT,2012,4:99-103.
[5]WU Jin,LI Juan,LIU Jian,et al.Infrared image segmentation via fast fuzzyC-means with spatial information[C]//In⁃ternational Conference on Robotics and Biomimetics,2004:742-745.
[6]GYIL S,BENY Z,SZIL GYII S M,et al.MR brain image segmentation using an enhanced fuzzyC-means algorithm[C]//Proc of the Annual International Conference of IEEE EMBS,2003:17-21.
[7]佟伟祥,宋凯.模糊C均值聚类算法在多元图像分割中的应用[J].微处理机,2008,29(5):135-136.
[8]GOKTEPEAB,ALTUN S,SEZER A.Soil clustering by fuzzyC-means algorithm[J].Advances in Engineering Soft⁃ware,2005,36(10):691-698.
[9]刘华军,任明武,杨静宇.一种改进的基于模糊聚类的图像分割方法[J].中国图像图形学报,2006,11(9):1312-1316.
[10]彭秋生,魏文红.基于核方法的并行模糊聚类算法[J].计算机工程与设计,2008,29(8):1881-1883.
[11]张莉,周伟达,焦李成.核聚类算法[J].计算机学报,2002,25(6):587-590.
[12]CHEN Songcan,ZHANG Daoqiang.Robust image segmentation using FCM with spatial constraints based on new kernel-induced distance measure[J].IEEE Trans Systems Man and Cybernetics,2004,34(4):1907-1916.
[13]ZHANG D Q,CHEN S C.Kernel-based fuzzy clustering incorporating spatial constraints for image segmentation[C]//Proceedings of the Second International Conference on Machine Learning and Cybemetics,2003.