K-均值聚类算法在图像分割中的应用
2015-02-25郭秀娟
郭 秀 娟
(吉林建筑大学计算机科学与工程学院,长春 130118)
K-均值聚类算法在图像分割中的应用
郭秀娟
(吉林建筑大学计算机科学与工程学院,长春130118)
摘要:通过研究图像分割方法的现状和存在的问题,结合聚类算法在图像分割中应用的特点,对聚类算法及其应用进行了研究.本文利用聚类分析中的K-均值算法在RGB颜色空间下实现图像分割;将图像分割系统在实际图像中进行验证,取得了较好效果.
关键词:聚类分析;图像分割;K-均值算法
0引言
图像分割作为图像处理的关键技术,其作用是提取图像研究区域的特征部分,为图像识别和分析提供研究依据.尽管人们已经在数字图像的处理中进行了大量有意义的研究和探索,如对图像进行边缘提取和区域分割方面等,但适用于各种图像通用而有效的方法目前还没有形成.因此,对于图像分割的研究一直是图像处理中探索的热点之一.
在众多的分割算法中,基于聚类分析的图像分割方法是图像处理领域中一类极其重要和应用广泛的算法,利用K-均值算法对图像进行分割,目的是要找到在特征空间中的聚类像素值,将每个像素分成不同的簇来实现图像分割.大量的研究表明,多特征融合更有利于获得较好的分割效果;而在对自然图像的分割过程中,由于考虑了像素的空间特性,使得该算法具有较好的鲁棒性[1].
图像分割主要有选择合适的彩色空间和采用合适的分割技术两个方面,笔者选择RGB颜色空间,采用K-均值算法对图像进行分割.
1提取图像特征
在计算机视觉和图像处理中,特征提取是一种重要的手段,主要是借助计算机这个工具实现对图像信息的提取,然后分析每个图像点的图像特征关系.常用的提取方法颜色、纹理、形状和空间关系特征等.当研究区域存在大小及对比度差异较大时,采取特征提取是图像研究的一大显著优势.
图像特征是图像的重要属性,一般应具有可区分性、可靠性、独立性、数量少4个特点;同时具有颜色(灰度)特征、纹理特征、形状特征和空间关系特征.图像特征是通过问题的定义或是应用程序来定义,特征在图像中是人们感兴趣的研究区域,它是计算机图像分析算法的出发点,图像特征的选取决定了一个算法是否成功.由于对同于场景的图像特征提取结果具有相同性,说明特征提取的最重要是具有“重复性”.
Coleman和Andrews与1979年提出了通过聚类算法实现图像分割[2],随着研究的深入,越来越多的学者和工程技术人员将聚类算法应用于图像分割中.鉴于图像分割方法可与像素的无监督分类等效, 也有人提出了用均方差模型在三维特征空间实现聚类的方法[3],但是该方法存在着精度低和边缘不清晰等缺点.因此,人们在不断研究和尝试着新的算法.
在图像特征提取中,较常用的算法有K—均值、C均值聚类(FCM)算法等.本文采用K—均值算法进行图像分割.
2提取颜色特征
特征提取是通过映射或变换的方法将高维空间中的特征用低维空间特征描述.由于颜色和图像中所包含的物体或场景具有相关性,在图像检索技术中应用最为广泛的视觉特征是颜色.该特征较其他特征具有对研究区域的尺寸、方向和角度依赖小的特点.它可以从图像特征检测提取,结果被称为特征描述和特征向量.颜色特征是图像对应区域的场景的表面特性.颜色特征是所有像素区域的贡献的综合效应.因为颜色不依赖于图像研究区域的方向、大小等变化不是没有方向的变化敏感因素,所以在采集图像的局部特征时,颜色特征有优势.但这也是颜色特征的一个缺陷,需要相关方法的补充来完善.
3提取纹理特征
纹理是指在图像中反复出现的局部纹理模式或规则,它不依赖于颜色和强度,但是可以描述图像的特点,是非常有效的图像特征.我们采用图像的灰度共生矩阵来提取纹理特征.灰度共生矩阵反映了图像灰度的综合信息,根据灰度共生矩阵可以计算熵、对比度、相关性、能量等用于对图像纹理特征的统计量.
对比度反映了图像的清晰程度;能量代表是图像灰度分布均匀性的度量值, 图像的纹理粗, 则说明能量的较大;相关度是图像某种灰度值沿着指定方向的延伸长度;同质性表示局部灰度图像均匀性程度,如果图像局部灰度较均匀,则同质性值大.
4基于K-均值聚类的图像分割算法
K-均值聚类算法是假设有k个初始类中心;然后将数据集中的n个对象划分到 k个类中,使所获得的类满足在同一聚类中的对象具有较高相似度,不同聚类中的对象具有较小的相似度.相似度利用各聚类中对象的均值所获得的一个“中心对象”来进行计算的.
4.1 K-均值算法
K-均值算法具有各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开的特点.它是随机从数据集中选取K个点作为初始聚类中心,然后计算各个样本到聚类中的距离,根据距离确定样本类的归属.对新形成的每一个聚类,计算各个样本到聚类中心距离的平均值来得到新的聚类中心,如果相邻两次所求的聚类中心不变,则计算结束.算法的特点是在每次迭代中检验每个样本的分类是否正确.若不正确,则进行调整;如果进行全部调整,必须修改聚类中心,使其进入下一次迭代.如果在一次迭代算法,所有的样本分类正确,则算法结束.
4.2 K-均值聚类图像分割技术
随着模糊聚类技术在图像处理中的广泛应用,目前已经有许多关于采用模糊算法进行分割的技术应用于相关领域,如模糊聚类、模糊边缘检测技术等[4-5].因为模糊技术在进行解决实际问题时常呈现其不确定性,同时图像本身也是一个由复杂性因素构成的集合体, 导致了在进行图像处理的时常常出现不确定性,如灰度值、几何知识等方面,有不随机和模糊技术的特性, 但是模糊技术有很好的抗噪声能力.
图像分割系统流程见图1.
图1 算法流程
算法的实现:
(1) 图片提取.本模块的功能主要是通过系统读操作将图片读入,实现打开图像文件,获取信息.作为以下各步骤处理的原始数据对象.
获取具体过程如下:
char readPath[]= "PictureTest.bmp"; //需要进行分割的图片
readBmp (readPath);//读操作
(2) 聚类分析.在本模块中,选用K-means算法来实现聚类分析.
(3) 图片显示模块.通过在VC++上代码的实现,来显示图片:灰度图和当K取不同值时的K均值聚类法的图片
4.3 实验结果与分析
图2中给出了部分实验结果.
图2 原图
在RGB颜色空间下进行图像分割,在输入的K值不同的情况下,其效果见图3~图8.
图3 K=2
图4 K=4
图5 K=8
图6 K=10
图7 K=20
图8 K=40
通过对比,此系统可以根据K值的不同,按照要求进行图像分割.显而易见,图像的分割效果与选取的K值有很大关系.K值越小,会使某些区域分辨不出来,从视觉来看,与实际图像差别很大;而K值越大,越接近于灰度图像,当大到一定程度,分割效果也不会有明显的变化.因此,选取合适的K值很重要,这也是算法一个较大的难题.
5结论
由于K-均值聚类算法被广泛地应用于图像分割研究中,笔者采用K-means算法实现了RGB颜色空间下的图像分割,通过实验取得了较好的分割效果.但是,由于算法开始选取的中心点是随机的,所以只能达到局部最优;由于难以对K值做出准确估计,且分割图像分割的好坏与K值有一定关系,因此限制了系统的应用.
参考文献
[1] 李苏梅,韩国强.基于K- 均值聚类算法的图像区域分割方法[J].计算机工程与应用,2008,44(16):163-167.
[2] 林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图象图形学报,2005,10(1):1-10.
[3] 王易偱,赵勋杰.基于K均值聚类分割彩色图像算法的改进[J].计算机应用与软件,2010,27(8):127-130.
[4] 杨秀杰,陈平,李法平.基于改进的模糊聚类图像分割技术研究[J].科技通报,2012,28(4):123-149.
[5] 李翠,冯冬青.基于改进K-均值聚类的图像分割算法研究[J].郑州大学学报(理学版),2011,43(1):109-113.
The Application of K-means Clustering Algorithm in Image segmentation
GUO Xiu-juan
(SchoolofComputerScienceandEngineering,JililnJianzhuUniversity,Changchun,China130118)
Abstract:This paper analyzes the present situation of research on image segmentation and major problems to be faced.Based on the characteristics of clustering algorithm for image segmentation,the passage focuses on the clustering algorithm and its application on image segmentation.The realization of image segmentation in RGB colour space using K-means algorithm in clustering analysis;image segmentation system is validated in real images,and has achieved good results.
Keywords:clustering analysis;image segmentation;K-means algorithm
中图分类号:TP 391.41
文献标志码:A
文章编号:2095-8919(2015)06-0063-04
作者简介:郭秀娟(1961~),女,吉林省德惠市人,教授,博士.
收稿日期:2015-04-09.