基于数据融合的獽均值聚类彩色图像分割方法
2018-09-10丁明月庄晓东
丁明月 庄晓东
摘要: 为了实现彩色图像的准确分割,在K均值聚类分割算法的基础上引入数据融合技术,将彩色信息和灰度信息的融合结果作为分割依据。首先完成图像从RGB(red,green,blue)空间到HSV(hue,saturation,value)空间的转换,在HSV空间实现颜色量化并生成彩色直方图,利用直方图阈值技术寻找峰值,进而确定K值的大小,再利用灰度直方图来确定初始聚类中心。在聚类过程中,采用加权融合法对HSV空间的色彩信息和灰度空间的图像信息进行数据融合,得到一个新的融合矢量矩阵,最后利用像素与各质心融合矢量之间的欧氏距离做相似测度完成彩色图像的分割。实验结果表明,该方法与分裂式K均值聚类(fissive Kmeans,FKM)方法相比,不仅能够实现分割区域数的自适应调整,而且各分割区域间的类间方差较大,分割速度快。该方法能够实现对彩色图像比较准确的分割,具有一定的实用价值。
关键词: 彩色图像分割; K均值聚类; 加权数据融合; HSV颜色空间; 类间方差
中图分类号: TP391.41文献标识码: A
图像分割[12]就是把图像分成若干个特定的、具有独特性质的区域,并提出感兴趣目标的技术和过程,它是由图像处理到图像分析的关键步骤。图像分割质量的好坏直接影响后续的图像分析和理解效果。随着计算机硬件设备的不断更新和科学技术的不断进步,彩色图像的分割引起越来越多的关注,准确分割彩色图像成为一个新的研究热点。彩色圖像的分割不仅需要选择合适的颜色空间,还需要采用有效的分割方法。K均值聚类法[35]是最常用的聚类分析方法之一,它是一种无监督模式识别学习方法,聚类后的数据集具有类内对象有高度相关性,类间对象差别较大的特点[6]。利用聚类方法对图像进行分割具有直观、易于实现的优点。但由于彩色图像比灰度图像包含更丰富的信息,单纯的使用灰度或者彩色信息无法取得理想的分割效果。李光等人[7]提出的基于K均值聚类与区域合并的彩色图像分割算法,适用于不同目标间颜色差异明显的图像,但对颜色差异较小的图像效果并不理想;张建等人[8]提出了一种基于分裂式的K均值聚类方法(FKM),由于其初始聚类中心的随机确定,使结果具有一定的随机性。近年来,数据融合技术已广泛应用于图像处理、工业检测、计算机视觉等诸多领域。数据融合[910]能够使不同形式的信息相互补充,以获得对同一目标更加准确的认识。数据融合技术理论上分为像素级、特征级和决策级3个层次[10]。基于此,本文提出一种自适应K均值算法,在K均值聚类分割算法的基础上引入数据融合技术,利用融合结果完成对彩色图像的分割。而本文采用的是像素级融合,通过对HSV空间和灰度空间的数据进行加权融合,进而实现分割过程。实验结果表明,本研究与FKM相比,图像分割效果有明显改善,能够实现对图像较为理想的分割。
1基于K均值聚类的图像分割方法
K均值聚类算法被广泛应用于图像分割中,算法的主要思想是通过迭代过程把数据集划分为不同的类别,使评价聚类性能的准则函数达到最优,从而使形成的每个聚类内紧凑,类间独立[11]。利用K均值聚类算法进行图像分割的具体步骤如下:
1)将图像数据划分为预先设定好的K个簇,为每个簇定义初始聚类中心。
2)将图像数据中的每个点与距它最近的中心联系起来,直至再无数据点与相关中心相联,这标志早期聚合已完成。
3)根据早期聚合结果重新计算K个聚类中心。
4)当获得K个新的中心时,需要重新将图像数据集中的点与距它最近的新中心相绑定,并进行循环迭代,直到准则函数收敛,使平方误差函数值最小,即
J=∑Kj=1∑ni=1‖x(j)i-Cj‖2(1)
式中,‖x(j)i-Cj‖2为图像数据点x(j)i到簇中心Cj的距离度量,也指示n个数据点与其各自簇中心的距离。
2颜色空间的选择
彩色图像包含了丰富的色彩信息,所以选择合适的颜色空间对于图像的分割结果至关重要。常见的RGB颜色空间将所有颜色看做是由三原色(红、绿、蓝)合成,它与硬件设备直接相关,但是R、G、B数值和色彩的三属性没有直接联系,不能揭示色彩之间的关系。而HSV空间[12]是人们根据颜色的直观属性构建的颜色空间,它使用色调、饱和度、亮度来表示颜色,比较直观,符合人类的视觉特性,通过对其各分量独立处理,可以实现对彩色图像的有效处理,所以本文选取HSV颜色空间为数据融合的彩色信息源。在图像处理中,HSV空间通常由RGB转换得到,其转换公式为
V=max(R,G,B)255(2)
S=0,max(R,G,B)=0max(R,G,B)-min(R,G,B)max(R,G,B), max(R,G,B)≠0(3)
H=0°,max(R,G,B)=min(R,G,B)60°×G-Bmax(R,G,B)-min(R,G,B)+0°, R=max且G≥B60°×G-Bmax(R,G,B)-min(R,G,B)+360°, R=max且G3自适应的K均值聚类图像分割方法
3.1聚类数目与初始聚类中心的确定
传统的K均值聚类算法需要先指定K值,再进行像素聚类。本文提出一种自适应K值的确定方法,首先计算图像的彩色直方图,再通过直方图的峰值来确定初始聚类数目K,具体的算法步骤如下:
1)对图像的HSV各分量进行非等间隔量化,其量化级分别为16,4,4,生成其彩色直方图H[13]1。
2)利用高斯平滑滤波器对直方图进行平滑,滤波器窗口为1×5,其协方差δ为15,生成新的直方图H2。
3)寻找初始峰值集合P1,去除P1中小于阈值T1的小峰值,其中T取08~09 S(S为图像的大小),得到的峰值集合为P2。
4)寻找P2中距离小于T2的相邻峰值,去除较小的一个,得到峰值集合P3,P3中包含的峰值数量即为聚类数目K,本文中T2取10。
本文实现的聚类是基于图像的彩色信息和灰度信息,聚类过程中主要使用图像的彩色信息,所以初始聚类中心是通过图像的灰度直方图来确定[1415],该确定方法在一定程度上降低了算法的复杂度。
3.2加权数据融合
在聚类过程中,本文通过数据融合技术为每个像素点构造一个新的融合矢量,再利用该矢量之间的欧氏距离做相似测度来实现分割。
在HSV颜色空间中,H和S分量包含图像中所有的色彩信息,V分量与颜色信息无关,它只表示图像的亮度信息,所以本文只考虑包含色彩信息的H和S分量,舍弃V分量,从而克服亮度变化对分割结果的影响[1617],但对彩色图像,不仅包含色彩信息,还包含丰富的灰度信息。为了能够实现对彩色图像的准确分割,本文对图像的色彩信息与灰度信息进行数据融合,使用加权融合法,其算法为
式中,x1,x2,x3分别为H分量、S分量和图像灰度化结果G;w1,w2,w3均为权重因子;Y为融合矢量矩阵。
本文的权重因子主要由各种信息对图像处理效果的影响大小确定。一般而言,HSV颜色空间中的色调H是最重要的分辨性视觉特征,颜色之间的差异主要由颜色色调的差异描述[18],所以在本次数据融合中,設定H分量的权重最大,灰度分量G次之,S分量最小。经过多次实验,最终将各权重因子确定为040,025,035。
3.3算法实现
算法流程图如图1所示。本文算法的具体实现步骤如下:
1)将原始RGB图像灰度化并转换到HSV颜色空间。
2)在HSV空间进行颜色量化,并生成彩色直方图。
3)在直方图中利用阈值法寻找最佳峰值个数作为聚类数目K。
4)计算灰度图G的直方图,通过对所有灰度值均分确定初始聚类中心。
5)通过迭代确定最终的聚类中心。
6)通过加权数据融合算法计算新的融合矢量矩阵。
7)利用欧氏距离做相似测度实现图像分割。
4实验结果与分析
为测试本文方法的有效性,对大量的自然彩色图像进行实验,实验环境为Matlab R2012a编程环境,测试图像均来自Berkeley图像分割库。为客观评价本文方法,与文献[8]中提出的FKM算法进行对比实验。
4.1实验结果
本文使用两种方法对大量图像进行实验,Bird图像的分割结果对比如图2所示,Coco图像的分割结果对比如图3所示,Church图像的分割结果对比如图4所示,Ship图像的分割结果对比如图5所示。
由图2b可以看出,虽然目标的整体轮廓都已分割出来,但是背景区域出现了过分割,而通过本文方法不仅对目标和背景准确分割,对图像四周的深浅色区域也能比较准确地划分;由图3b可以看出,出现欠分割现象;而图3c中,对颜色差异不明显的区域实现了较准确的分割。在图4和图5中,FKM的分割结果出现了大量噪点,且图4b和图5b中,天空的区域未正确分割,而在图4c和图5c中,同一分割区域内部颜色比较均匀,说明区域内部具有较高的一致性。由图2~图5可以看出,本文提出的分割方法能够实现对不同颜色区域的较好分割,即使针对颜色差异不明显的图像,且同时说明K的自适应性能有效改善图像过分割和欠分割现象,具有一定的鲁棒性。
4.2分割质量评价
分割质量的评价较为复杂,常分为主观评价和客观评价两类。在客观评价方面,比较经典的评价准则[19]主要有:区域间对比度、区域内部均匀性、时间复杂度、形状平滑测度、区域位置差异、区域形状面积差异、过分割率、欠分割率等。本文使用的评价准则是区域间对比度和时间复杂度。
区域间对比度可以计算2个区域的灰度对比度或者类间方差,本文使用类间方差,以所有区域的类间方差中最小值为准,2个区域的类间方差[20]为
SEC=NN+M(U1-U)2+MN+M(U2-U)2(7)
式中,N是第1区域的像素点个数;U1是第1区域的平均灰度值;M是第2区域的像素点个数;U2是第2区域的平均灰度值;U是2个区域的平均灰度值。
通过2种准则,对本文方法和FKM的分割结果进行评价。图2~图5中,3幅图像的评价结果如表1所示。
从量化评价结果中可以看出,与FKM方法相比,本文方法的分割结果中各区域间的对比度更大,说明类间差别较大,分割效果更好;而在算法复杂度方面,对于同一幅图像,本文方法的分割速度明显高于FKM,时间复杂度较低,实时性较强。
5结束语
为了提高彩色图像分割的准确性,本文提出一种自适应K均值算法,在聚类过程中利用加权数据融合算法将图像HSV空间和灰度空间的3种信息进行融合,再通过融合结果完成图像分割过程。实验结果表明,该方法能够实现自适应分割,而且采用彩色信息和灰度信息做分割依据,能够对图像中颜色差异较小的区域进行正确分割,对图像的细节也能做到较好的处理,使各区域具有较均匀的紧密度,且时间复杂度低。该研究具有一定的实用价值。
参考文献:
[1]许新征, 丁世飞, 史忠植, 等. 图像分割的新理论和新方法[J]. 电子学报, 2010, 38(S1): 7682.
[2]李光, 王朝英, 侯志强. 基于K均值聚类与区域合并的彩色图像分割算法[J]. 计算机应用, 2010, 30(2): 354358.
[3]Siddiqui F U, Isa N A M. Enhanced Moving KMeans (EMKM) Algorithm for Image Segmentation [J]. IEEE Transactions on Consumer Electronics, 2011, 51(2): 833841.
[4]王易循, 赵勋杰. 基于K均值聚类分割彩色图像算法的改进[J]. 计算机应用与软件, 2010, 27(8): 127130.
[5]Jia L, Li M, Zhang P, et al. SAR Image Change Detection Based on Multiple Kernel KMeans Clustering with LocalNeighborhood Information[J]. IEEE Geoscience Science and Remote Sensing Letters, 2016, 13(6): 856860.
[6]Alik K R. An Efficient KMeans Clustering Algorithm[J]. Pattern Recognition Letters, 2008, 29(9): 13851391.
[7]李光, 王朝英, 侯志强. 基于K均值聚类与区域合并的彩色图像分割算法[J]. 计算机应用, 2010, 30(2): 354358.
[8]张建, 宋刚. 基于分裂式K均值聚类的图像分割方法[J]. 计算机应用, 2011, 31(2): 372374.
[9]滕召胜, 罗隆福, 童调生. 智能监测系统与数据融合[M]. 北京: 机械工业出版社, 2000.
[10]李树涛, 唐艳, 王耀南. 基于色彩通道融合的火焰图像分割[J]. 湖南大学学报: 自然科学版, 2001, 28(4): 6468.
[11]王爱莲, 伍伟丽, 陈俊杰. 基于Kmeans聚类算法的图像分割方法比较及改进[J]. 太原理工大学学报, 2014, 45(3): 372375.
[12]杨红颖, 吴俊峰, 于永健, 等. 一种基于HSV空间的彩色边缘图像检索方法[J]. 中国图像图形学报, 2008, 13(10): 20352038.
[13]唐朝红, 刘鑫淼, 黄静. 基于HSV颜色直方图的图像检索算法性能分析[J]. 电子制作, 2017(7): 6465.
[14]Dhanachandra N, Manglem K, Chanu Y J. Image Segmentation Using KMeans Clustering Algorithm and Subtractive Clustering Algorithm[C]∥ICCN 2015: 11th International Conference on Communication Networks. Bangalore India: Elsevier, 2015, 54: 764771.
[15]Pugazhenthi A, Sing H. Automatic Centroids Selection in KMeans Clustering Based Image Segmentation [C]∥International Conference on Communication and Signal Processing. Melmaruvathur, India: ICCSP, 2014.
[16]張国权, 李战明, 李向伟, 等. HSV空间中彩色图像分割研究[J]. 计算机工程与应用, 2010, 46(26): 179181.
[17]蔡式东, 杨芳. 一种基于HSV空间和粗糙集的彩色图像分割方法[J]. 光电子技术, 2011, 31(1): 59.
[18]常小红, 濮黄生, 见伟平. 一种基于HSV颜色空间模糊量化的图像检索方法[J]. 医疗卫生装备, 2011, 32(4): 1922.
[19]郭琦, 孔斌, 郑飞. 图像分割质量评价的综述[J]. 仪器与仪表学报, 2007, 28(8): 613618.
[20]Ostu N. A threshold Selection Method from GrayLevel Histogram [J]. IEEE Transaction Systems Man and Cybernetics, 1979 (9): 6266.