APP下载

基于色度直方图的颜色聚类算法

2015-10-28喻钧刘飞鸿王占峰杨俊娜

应用科学学报 2015年1期
关键词:色度像素点直方图

喻钧,刘飞鸿,王占峰,杨俊娜

1.西安工业大学计算机科学与工程学院,西安710021 2.总后勤部建筑工程研究所,西安710032

基于色度直方图的颜色聚类算法

喻钧1,刘飞鸿1,王占峰2,杨俊娜1

1.西安工业大学计算机科学与工程学院,西安710021 2.总后勤部建筑工程研究所,西安710032

提取目标背景的主色是迷彩设计中的重要步骤,通常采用的颜色聚类算法具有监督性的缺陷.为此,提出一种基于色度直方图的、无监督的颜色聚类算法.该算法采用CIE 1931色度系统建立色度直方图,根据像素点在该坐标系的分布规律自动生成聚类中心.逐一计算像素点与各聚类中心的色度的欧氏距离,将像素点与最近的聚类中心归于一类.实验结果表明,采用该聚类算法能够准确提取主色,自动分割彩色图像,且比普通聚类算法的时间效率更优.

迷彩设计;颜色聚类;CIE 1931;色度直方图

在军事工程的迷彩伪装中,伪装效果的好坏主要取决于迷彩是否与目标周围的自然背景相融合,也就是说,迷彩能否反映目标背景的颜色、纹理等基本特征.迷彩设计的首要环节就是提取目标背景的主色.对于自然背景图像,主色提取通常采用基于颜色空间的聚类算法[1-2],但需要预先确定聚类数目(即算法的有监督性),这往往带有一定的主观性[3-5].为了弥补这类算法有监督性的缺陷,曾有人尝试利用颜色空间各通道的统计规律实现算法的无监督性,但常用的RGB、LAB、XYZ等颜色空间的三维分量之间具有相关性,因此这种方法的聚类结果不稳定[6].若通过降维方法将三维的空间信息投影到二维平面或一维直线,虽然易于确定阈值,且能保留三维通道之间的相关性,但聚类结果依赖于降维时所采用的数学方法[7-8].

由于色度系统是一种定量描述颜色空间的平面坐标系统,除了用色度信息描述颜色之外,还能根据色度平面内的距离描述人眼的视觉差异[9].因此,本文提出一种无监督的颜色聚类算法,首先采用CIE 1931色度系统描述图像的颜色,并在色度坐标平面上进行直方图统计,以生成图像的色度直方图;然后利用图像像素点在色度平面的分布规律进行无监督的颜色聚类,从而自动提取出目标图像的主色.

1 颜色的描述

研究表明,电磁波在380~780 nm的波长范围内能够刺激人眼视细胞,使其产生电脉冲信号;然后大脑处理相应的信息,形成视知觉[10-11].色度系统是在单色光谱的颜色匹配实验基础上建立起来的,它是联系可见光谱和视知觉的纽带.本文采用色度系统对颜色进行定性和定量的分析,但由于色度空间种类繁多,选用合适的色度空间是图像处理的首要问题.

1.1彩色像素点的色度表示

根据颜色匹配实验,国际照明委员会(Commission Internationale de L'Eclairage,CIE)建立了一系列的色度系统.CIE 1931是一个与颜色采集、表示设备无关的色度系统.它贴近颜色匹配实验事实,不仅可以表示人眼感知到的所有颜色,还能表示颜色视觉规律,预测同一种颜色的色度坐标值范围[12].由于它最贴近人眼视觉,本文采用CIE 1931系统描述图像的颜色.

为了定量描述图像颜色,首先录入CIE 1931标准色度观测者的光谱色品坐标值(2◦视场,5 nm间隔),生成CIE 1931色度坐标系[12];然后输入彩色图像,将像素点颜色信息从RGB转化到CIE 1931.转化函数[x,y]=F(r,g,b)的相关细节参见文献[13].转化过程如图1所示,其中图1(a)是根据色品坐标值生成的马蹄形曲线,图1(b)为标准Lena图像.将Lena图像的颜色信息转化到CIE 1931上,获得的色度分布如图1(c)所示.可以看到像素点在马蹄形区域内的分布疏密有致,其中色度密集分布在马蹄形光谱曲线的长波区域附近,这与Lena图像为暖色调的事实相符.

图1 彩色图像的色度分布Figure 1 Chromaticity distribution of a color image

1.2人眼色差与颜色聚类

人们在使用颜色空间时,马蹄形区域内每一个坐标点对应于人眼可识别的一种颜色,但人眼通常难以区分色度值特别相近的颜色.实际上,色度值相近的点对应于同一种颜色知觉. 1942年,麦克亚当(Macadam)设计了一个视觉实验来记录观察者对色彩变化的感知,实验结果如图2所示.

图2中的每个小椭圆区域都包含多种色度值信息,但只对应于人眼可识别的一种颜色.本文综合直方图统计方法,结合像素点的聚集规律,实现了无监督的颜色聚类,达到了自动识别图像主色的目的.

图2 麦克亚当椭圆Figure 2 Ellipse of Macadam

2 颜色聚类算法设计

人眼观察物体时首先捕获的是颜色.人脑对颜色信息进行分析、处理之后,形成拓扑几何特征的视觉感知,这些颜色信息就是人眼自动识别对象的基础.本文参考人眼形成视知觉的感知规律,提出了一种无监督的颜色聚类算法.

2.1主色与聚类中心

主色通常是指图像中出现概率最大的颜色,它往往对应着图像中分布面积最大或者出现最多的物体目标.为了分割出图像的主要目标,通常采用的聚类算法是有监督性的,即聚类中心的生成是随机的,这就可能导致算法在多次执行后获得的结果不同.为避免聚类结果的局部性,本文利用色度系统的全局性,统计图像中出现的所有颜色.

如图3所示,输入辣椒图(a),可获得图(b)所示的色度分布;然后根据文献[14]的分类标准,按照色纯度和主色调将色度坐标划分为若干个小区域,统计其中像素点密度最大的4个区域,提取这些区域对应的颜色,获得图(c)所示的4种主色.按照分布密度的大小从上到下依次排列,即主色1出现的密度最大,主色2次之,依次类推.主色3和4的色调难以区分,但原始的辣椒图中至少出现了7种颜色.通过人工判读可知,按照密度由大到小排列的4种主色依次为紫、红、绿、橙黄.多次执行聚类后的结果不变,说明文献[14]的方法能够解决局部性问题.然而,该算法是有监督性的,初始聚类数需要手动输入,可能出现颜色误分类的结果;同时,有监督的聚类容易使图像的中、小目标被忽略.因此,仅仅根据色度密度的分布还不能有效地聚类颜色.

图3 基于色度分布密度的主色提取Figure 3 Extracting dominant colors from the image based on the chromaticity distribution

为了达到理想的聚类效果,并有效地识别出图像中的小目标,需要找出像素点在色度系统中的分布规律.为此,本文建立色度直方图系统,然后利用色度直方图获得像素点的聚集规律,实现无监督的颜色聚类.

2.2色度直方图的生成

基于CIE 1931色度坐标,对输入图像进行直方图统计,生成色度直方图系统.CIE 1931色度坐标值通常精确到小数点后6位,如440 nm的单色光谱的色度值为(0.164410,0.010860).实际上,采用高精度的数据并不能更准确地描述颜色,却增加了大量的系统开销.为此,本文降低精度为小数点后3位,并用其色度坐标值描述图像的色度信息.

生成色度直方图的详细步骤如下:

步骤1在CIE 1931坐标系上截取x轴和y轴[0,1]的区间,以0.001为间隔分别采样1 000个点,划分相应平面坐标区域为1 000×1000个小方格区域,默认一个小方格对应一种颜色.

步骤2读取图像数据并将其转化为CIE 1931色度坐标值,按照小方格区域的色度值进行聚类(色度坐标值精度为小数点后3位).(cx,cy)对应步骤1中的一个小方格,转换公式如下:

步骤3统计步骤2中小方格区域内分布像素点的数目,生成色度直方图H(cx,cy)=n,其中n为相应小方格区域中的像素点数目.

辣椒图的色度直方图如图4所示,底面x轴、y轴分别对应CIE 1931的x轴、y轴,z轴表示n的大小.

图4 Peppers的色度直方图Figure 4 Chromaticity histogram of the Peppers image

观察并分析图4可以发现,多个峰值周围的像素值存在明显减小的趋势,这说明波峰附近聚集着大量像素点.不同的波峰对应的颜色差异较大,也就是说,波峰区域代表的颜色就是输入图像的主色.因此,需要提取出色度直方图的峰值点,以生成初始聚类中心.

2.3无监督的聚类算法设计

图4所示的色度直方图的峰值起伏规律明显,具有明显的梯度特征.根据像素点的密度、梯度信息,提出颜色聚类算法的步骤如下:

步骤1生成色度直方图系统,如2.2节所述.

步骤2读入图像I,采用色度直方图表示其颜色信息,记为G(x,y,z),G(x,y,n)= H(cx,cy).

步骤3对色度直方图进行高通滤波,确定需要识别的最小目标,并设定其像素点数量的阈值为Nmin,滤波公式为

步骤4设置整合区域的阈值S(表示同一区域内像素点间的最小距离),遍历直方图(x,y,n).如果两个数据点(x1,y1)和(x2,y2)满足

就将这两个数据点归到同一个区域.经过区域合并,形成m个区域Uk,其中k=1,2,···,m.

步骤5在连通域Uk中寻找极值点,其极值点坐标(xk,yk)即聚类中心,记为Ck,k= 1,2,···,m.

步骤6遍历整个图像I,在CIE 1931系统中计算像素点(xij,yij)和m个聚类中心Ck的欧氏距离dijk,欧氏距离的计算公式为

将每个像素点与其最近的聚类中心聚为一类.遍历完成后,图像I的所有像素点被聚为m类.

3 无监督聚类算法的实现

本文采用MATLAB编程实现2.3节提出的无监督的颜色聚类算法.

3.1基于色度直方图的主色提取

初始化参数Nmin=50,S=17,对图4所示的色度直方图进行高通滤波、区域整合,得到7个子区域.求解出这7个子区域的极大值,如图5所示.多次执行该聚类算法,获得的初始聚类中心始终不变.通过提取图4中相应的峰值,获得极大值对应的颜色信息,如图6所示.

图5 Peppers聚类中心Figure 5 Clustering centers of the Peppers image

图6 聚类中心对应的颜色Figure 6 Colors for each clustering centers

图6所示的主色分别对应于图3(a)场景的辣椒及其背景,可以看出利用色度直方图峰值点提取主色的方法是有效的.

3.2基于色度直方图的颜色聚类

对图3(a)执行2.3节提出的聚类算法.辣椒图中的像素点被自动划分为7类,每类对应图6中的一种主色,聚类结果如图7所示,由此可以辨别出辣椒图中各种对象(青椒、红椒、黄椒、大蒜等)的颜色.

图7 本文算法的聚类结果Figure 7 Clustering result using this algorithm

由于光照等条件的影响,图7中的单个辣椒表现出不止一种颜色.采用本文算法进行聚类后,能够明显地识别辣椒表面不同的颜色.例如,一个青椒可以表现出橙色的边缘、白色的斑点,红椒表面的颜色可以有层次感,由底向上的颜色亮度越来越高.

4 验证性实验及结果分析

4.1算法有效性的验证实验

为了验证本文算法的有效性,用模糊C均值聚类(fuzzy C-means,FCM)算法进行对照实验.

将3.1节所获得的初始聚类中心数“7”代入FCM算法公式中;设置迭代停止阈值ε=0.000001,模糊加权指数m=2.聚类结果如图8所示,可以看出同一辣椒表面的不同颜色以及图像背景的纹理都能够被有效地识别.然而,与图7相比,图8中的黄椒没有被识别出来,且黄椒和红椒分为一类.这是因为FCM算法根据隶属度进行颜色聚类,而其隶属度仍基于RGB空间的欧氏距离,仍然存在如1.2节所述的局限性.因此,FCM算法的聚类结果不能准确反映图像的主色.

图8 FCM算法的聚类结果Figure 8 Clustering result using FCM algorithm

另外,本文还验证了算法的执行效率.分别采用FCM算法和本文算法对经典的Lena图像进行聚类,比较运行算法占用的CPU时间.通过MATLAB的Profile Viewer获得算法运行的时间开销(见表1),它表示FCM算法执行了大约6 min,表2表示本文算法执行不超过10 s.因此,本文算法的时间开销更小,耗费的资源更少.

表1 FCM算法执行时间Table 1 Execution time of FCM algorithm

表2 本文算法执行时间Table 2 Execution time of this algorithm

4.2算法适用性的验证实验

为验证本文算法的适用性,本文选择两幅差异较大的典型图像(Lena人物图像和Berkeley风景图)进行验证性实验,实验结果如图9和10所示.其中,图9和10中的(a)为原始图像;图(b)为原始图像对应的色度直方图;图(c)为是提取色度直方图的波峰,即聚类中心;图(d)为聚类中心对应的颜色,即图像主色;图(e)为使用本文算法聚类后的结果.

图9 Lena验证实验组图Figure 9 Group of Lena images for the verifcation experiment

图10 Berkeley验证实验组图Figure 10 Group of Berkeley images for the verifcation experiment

本文的聚类算法主要依据像素点分布在CIE 1931色度空间的直方图统计规律,具体地说就是其色度坐标系的坐标信息以及梯度信息.观察图9的Lena组图,根据图(b)的波峰波谷分布规律提取色度直方图的波峰点,并将其作为聚类中心,从而自动提取出图9(a)的主色信息.对比图9(d)的主色和图9(c)的波峰点可知,在色度图上相邻的像素点,其颜色也相近.聚类结果9(e)显示了本文算法的聚类结果.类似地,Berkeley组图也展示了同样的效果.上述实验表明,本文算法能够无监督地聚类出图像的主色.

5 结语

本文提出一种基于色度直方图的、无监督的颜色聚类算法.通过建立图像的色度直方图,提取了图像像素点的色度值,及其在色度平面坐标上的梯度信息,自动生成初始聚类中心,从而提取了图像主色.验证实验表明,本文算法取得了较好的图像分割效果,且时间效率更优.

在迷彩设计中,本文只关心目标背景的主色和纹理特征,而并不关心目标背景中各种对象的类别.因此,在进行主色提取时,使用本文算法不仅弥补了FCM等算法有监督性的缺陷,而且使获得的主色更加准确,从而提高了迷彩设计的自动化程度,使设计出的迷彩更具科学性.

[1]喻钧,初苗,田少辉,胡志毅.迷彩设计中背景图像聚类方法的比较[J].应用科学学报,2009,27(5):475-479. Yu J,Chu M,Tian S H,Hu Z Y.Comparison and analysis for image clustering methods of camouflage design[J].Journal of Applied Sciences,2009,27(5):475-479.(in Chinese)

[2]Yang Y,Guo L,Wang T,Jao W,Shao G,Feng Q.Unsupervised multiphase color-texture image segmentation based on variational formulation and multilayer graph[J].Image and Vision Computing,2014,32(2):87-106.

[3]吕明磊,刘冬梅,曾志勇.一种改进的K-means聚类算法的图像检索方法[J].计算机科学,2013,40(8):285-288. Lü M L,Liu D M,Zeng Z Y.Novel image retrieval method of improved K-means clustering algorithm[J].Computer Science,2013,40(8):285-288.(in Chinese)

[4]张春凯,王丽君.基于遗传算法的一种改进的K-均值聚类算法[J].计算机工程与应用,2012,48(26):144-147. Zhang C K,Wang L J.Improved K-means clustering algorithm based on genetic algorithm[J].Computer Engineering and Application,2012,48(26):144-147.(in Chinese)

[5]何月,申铉京,龙建武,张博.基于塔形信息的空间约束FCM图像分割算法[J].计算机工程,2011,37(22):209-210,214. He Y,Shen X J,Long J W,Zhang B.Image segmentation algorithm for spatial constraints FCM based on pyramid information[J].Computer Engineering,2011,37(22):209-210,214.(in Chinese)

[6]Jung C R.Unsupervised multiscale segmentation of color images[J].Pattern Recognition Letters,2007,28(4):523-533.

[7]Celik T,Tjahjadi T.Unsupervised colour image segmentation using dual-tree complex wavelet transform[J].Computer Vision and Image Understanding,2010,114(7):813-826.

[8]陈坤,马燕,刘俊.一种自适应无监督彩色图像分割方法[J].小型微型计算机系统,2013,34(4):887-891. Chen K,Ma Y,Liu J.An adaptive unsupervised method toward color image segmentation[J]. Journal of Chinese Computer System,2013,34(4):887-891.(in Chinese)

[9]袁兴生,王正志,项凤涛.基于视锥细胞色适应生理机制的颜色恒常性计算[J].中国图象图形学报,2013,18(5):537-544. Yuan X S,Wang Z Z,Xiang F T.Color constancy algorithm based on biological mechanism:color adaptation of cone cells[J].Journal of Image and Graphics,2013,18(5):537-544.(in Chinese)

[10]Tanaka S,Moon C H,Fukuda M,Kim S G.Three-dimensional visual feature representation in the primary visual cortex[J].Neural Networks,2011,24(10):1022-1035.

[11]Nixon M,Aguado A S.Feature extraction and image processing[M].[S.l.]:Access Online via Elsevier,2008.

[12]Schanda J.Colorimetry:understanding the CIE system[M].[S/l.]:Wiley-Interscience,2007.

[13]徐洋,郭冬霄,程安宇,郑太雄.基于CIE1931的颜色识别方法研究[J].电视技术,2012,36(5):126-130. Xu Y,Guo D X,Cheng A Y,Zheng T X.Research on color distinguish technology based on CIE1931[J].Video Application and Project,2012,36(5):126-130.(in Chinese)

[14]喻钧,刘飞鸿,王占锋,初苗.基于光谱色的迷彩主色提取方法[J].兵工自动化,2014,33(1):72-75. Yu J,Liu F H,Wang Z F,Chu M.Extraction method of dominant colors of pattern painting based on spectrum colors[J].Ordnance Industry Automation,2014,33(1):72-75.(in Chinese)

(编辑:管玉娟)

Color Clustering Based on Chromaticity Histogram

YU Jun1,LIU Fei-hong1,WANG Zhan-feng2,YANG Jun-na1
1.School of Computer Science and Engineering,Xi'an Technological University,Xi'an 710021,China 2.Architectural Engineering Institute,General Logistics Department,Xi'an 710032,China

In camouflage design,extracting the dominant color from target background is an important step.A drawback of common color clustering methods is the requirement of supervision.This paper proposes an unsupervised color clustering algorithm based on the chromaticity histogram.The chromaticity histogram is established according to the CIE 1931 system.The cluster center is automatically generated based on the distribution of pixels in the coordinate system.Euclidean distances in the chroma space are calculated one by one between pixels and each cluster center.These pixels are clustered around the nearest clustering center.Experimental results show that the proposed clustering algorithm can accurately extract the dominant color,and automatically segment the color image.In addition,the algorithm uses less time in image segmentation than common algorithms.

camouflage design,color clustering,CIE 1931,chromaticity histogram

TP751

0255-8297(2015)01-0095-10

10.3969/j.issn.0255-8297.2015.01.011

2014-06-29;

2014-11-04

中国博士后科学基金(No.2013M532180)资助

喻钧,教授,研究方向:图像处理,E-mail:jyu0117@163.com

猜你喜欢

色度像素点直方图
统计频率分布直方图的备考全攻略
符合差分隐私的流数据统计直方图发布
用直方图控制画面影调
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
基于改进色度模型的非接触式心率检测与估计
景德镇早期青白瓷的器型与色度
如何提高苹果的着色度
基于直方图平移和互补嵌入的可逆水印方案
基于Node-Cell结构的HEVC帧内编码