APP下载

图像检索中颜色特征提取方法的研究

2013-09-20侯方姜秀华

关键词:分块直方图检索

侯方,姜秀华

(中国传媒大学信息工程学院,北京100024)

1 概述

近年来,随着计算机技术、多媒体技术和网络通信技术的日益发展,尤其是Internet网络的快速发展和大范围普及,数字图像正以惊人的速度增长,我们需要一种快速而准确的查找方法来从海量图像数据库中找到所需要的图像。从20世纪70年代至今,图像检索技术由基于文本的图像检索发展到现在的基于内容的图像检索。

基于内容的图像检索(CBIR)是图像特征相似性匹配的过程,而用于检索的图像特征分为底层视觉特征和高层语义特征,现在一般使用颜色、形状和纹理等这些底层视觉特征。一个典型的CBIR系统一般由两部分构成:图像特征提取子系统和图像查询子系统。图像特征提取子系统主要是负责图像的存储和特征提取,并以特征信息索引库形式存储图像特征信息的表达式,图像查询子系统则完成基于内容的检索功能。基于内容的图像检索技术经过多年的研究,目前已经开发出了一些系统,而比较知名的有IBM公司研制的QBIC[1],美国哥伦比亚大学开发的WebSEEK和VisualSEEK[2]系统和MIT多媒体实验室Photobook系统等。在这些图像检索系统中,都提供了颜色属性的检索功能。

颜色特征是每个物体都有的非常重要的视觉特征,而且对图像质量和尺寸的变化、旋转和噪声有很强的鲁棒性。在大多数情况下,颜色是描述一幅图像最简单而有效的特征,在基于内容的图像检索中颜色特征是被最广泛采用的底层特征。

本文主要介绍图像检索系统中关于颜色特征的相关理论知识和几种常用的的典型的颜色特征提取方法。

2 颜色空间特征的相关理论

常见的用来表示颜色的颜色空间有RGB颜色空间、HSV颜色空间和CIEL*a*b*颜色空间等,颜色空间的选择对颜色特征提取非常重要,一般选用符合人眼视觉特征的颜色空间。

2.1 RGB颜色空间

RGB颜色空间是图像显示中的一种最常用的颜色空间,它以红、绿、蓝作为三基色,依据三基色原理,红、绿、蓝按照不同比例相加混合成各种颜色。尽管RGB颜色模型计算简单,也被广泛的应用于CRT显示彩色图像,但是RGB颜色空间不具备视觉一致性,各颜色维之间的相关性很强,我们要改变一种颜色时,就要对三个通道上的颜色全部进行改变。另外,它不是一个均匀视觉的颜色空间,两种颜色之间的视觉差异不能采用该颜色空间中两个颜色点之间的距离来表示,不符合人眼对颜色的感知,因此需要另一种符合人的视觉心理的颜色模型来表示颜色。

2.2 HSV颜色空间

HSV[3]颜色空间是一种面向视觉感知的颜色模型,以人类对颜色的感觉为基础,把颜色用三个分量来表示:色调H(hue)、饱和度S(saturation)、亮度V(value)。HSV颜色空间直接对应于人眼的视觉三要素,通道之间各自独立,所以HSV颜色空间具有视觉一致性;每个分量直接对人眼的视觉感受起作用,颜色之间感觉上的距离与HSV颜色空间坐标上点的欧几里德距离成正比,所以HSV颜色空间是一个均匀的颜色模型,比RGB空间更符合人眼的视觉特性。但是计算机只能识别RGB颜色空间,因此在图像处理中需要使用以下公式把图像从RGB空间模型转换到HSV空间模型:

其中:max=max(R,G,B),min=min(R,G,B),h∈[0,360],(s,v)∈[0,1]。

2.3 CIEL*a*b*颜色空间

CIEL*a*b*颜色空间[3]是1976年由国际照明委员会(CIE)公布的,是一种均匀的颜色模型。Lab模式由三个通道组成,一个通道是亮度L,另外两个是色彩通道a和b,人眼对亮度分量L敏感,对两个颜色分量的变化不敏感。均匀颜色空间模型本质上仍是面向视觉感知的颜色模型,只是在视觉感知方面更为均匀,对于CIEL*a*b*空间,颜色之间的差别完全可以用欧氏距离来测量。CIEL*a*b*颜色空间也可以由RGB颜色模型转化得到。

3 颜色特征

3.1 颜色直方图

颜色直方图是基于颜色的CBIR系统中最早使用,同时也是最常用的一种特征表示方法,它反映了图像中各种颜色的比例分布。颜色直方图实质就是统计图像中每种颜色出现的频数,所以它计算简单,而且具有平移、旋转和缩放不变性。颜色直方图可以用一个一维向量来表示:

其中hk表示第k种颜色在该图像中的像素频数:

上式中k代表图像的颜色特征值,L代表颜色特征值的个数,nk是图像中具有特征值为k的像素个数,N是图像像素的总数。

但是颜色直方图丢失了颜色的空间分布信息,因此在两幅完全不相关的图像具有相同的颜色直方图时,就会降低检索效率。鉴于颜色直方图的这种缺点,许多改进的方法被提了出来,如:累加颜色直方图,分块颜色直方图,局部颜色直方图等。

当图像中的特征向量不能取遍所有值时,颜色直方图中就会出现很多零值,从而影响直方图的相交运算,就会使匹配结果不能反映两图之间的颜色差别。为了解决这个问题,累计直方图被提了出来。

累计直方图的定义如下:

既然每天基本只拍一张照片,不如尝试拍摄更有力的作品,既能向观众透露整体叙事的一些信息,又能独立存在,这会是一项有趣的挑战。在365天的项目中给自己设定叙事以外的挑战,既能给予你更多思考空间,也能给你更多动力,促使你完成项目。

hk表示k种颜色的像素累加频数。实验表明,累计直方图检索图像的效果一般都优于直方图。

3.2 颜色矩

颜色矩[4]是 StriCker和 Orengo提出的一种简单而有效的颜色特征描述方法,由于颜色的信息主要集中在低阶矩,所以图像的颜色分布仅使用颜色的一、二和三阶矩就可以表达。与颜色直方图不同的是颜色矩不需要对特征进行向量化,但是图像低阶矩的检索效率比颜色直方图的检索效率要低,所以在实际应用中常将颜色矩同其它图像特征联合使用。

3.3 颜色的空间信息

颜色的空间分布特征对于区分图像的内容也是十分重要的,因为两幅颜色空间分布明显不同的图像可能会存在相同的颜色直方图,这对只采用颜色直方图的检索算法的检索精度有很大的影响。所以我们可以将颜色的空间信息和颜色直方图结合起来,弥补直方图特征的缺点,使检索结果更加精确。

3.4 颜色空间的量化

图像中的颜色一般会非常多,这样就会使直方图矢量的维数非常多,矢量维数的增加又会占用更多的存储空间和使计算量增大,而且人眼对颜色的分辨能力也有限,不能区分所有颜色。因此,需要对颜色空间进行量化以减少颜色的维数。颜色的量化方法一般有等间隔量化、非等间隔量化和聚类[14]。

4 几种基于颜色直方图的特征的提取方法

4.1 基于分块的直方图

传统的直方图方法只是统计图像的全局颜色信息,而丢失了图像的空间分布信息,检索效率会受到影响。为了提高检索精度,需要在直方图的基础上引入空间信息。为了加入空间信息,一般是把图像划分为若干块,然后分别计算每个子块的颜色直方图。

常用的分块方法是将图像平均分成m×n块,这种分块方法虽然简单,但是没有突出图像中间的主体部分和充分限制背景的范围。于是Stricker M和Dimai A[5]提出了下图的分割方法,对每个区域求颜色矩的同时对中央区域1赋予较大的权值(见图1)。赵莹[6]提出了一种图像重叠分块的方法,把图像平均分成3×3的子块后,又将这9块合并成4大区域(见图2):P1={1,2,4,5},P2={2,3,5,6},P3={4,5,7,8},P4={5,6,8,9}。P1、P2、P3 和 P4这四部分彼此相互重叠,中央部分5重叠了4次,权重为 4,(2、4、6、8)重叠了 2 次,权重为 2,(1、3、7、9)只重叠了一次,权重为1。通过重叠的方式,不仅可以突出图像中间的主体部分和限制背景范围,还一定程度上避免了因分得过碎而破坏物体完整性的缺点,并保留了足够丰富的颜色信息。

图1 一种图像划分方法

但是当图像发生变形时,如旋转和物体有位置变化,则以上的划分方法就无法正确匹配。

图2 图像重叠分块方法

中心圆和各圆环的半径:

式中,R是以M为圆心的最大半径。等间隔环形分块法,分割后的各圆环的面积并不相等:中心圆的面积最小,所含像素点也最少;而越外面的圆环面积越大,所含像素点也越多[7]。基于这种方法不利于突出中央主体部分,余芳[8]提出了一种等面积的圆环分块方法,使中心圆和各圆环的面积相等(见图4)。这样不仅保持了环形分块的优点,也更有利于突出图像中央主体部分。

中心圆和各圆环的半径:

图3 等间隔的图像环形块方法

4.2 模糊量化直方图

图4 等面积的图像环形分块法

颜色量化可以降低颜色直方图的维数,同时好的量化方法可以更好的表达图像中颜色空间的分布信息,更接近人眼的视觉感知性。J.R.Smith[9]、张磊[10]和曹莉华[11]等人提出了不同的量化方法,但是这些方法存在两个问题:忽视了量化边界处附近的颜色的相似性和连续性;忽视了人对颜色主观感知的模糊性。汪子强[13]等人提出了基于主观视觉感知的模糊颜色量化方法,统计模糊量化直方图,从而更好地近似人的视觉感知。

以Zadeh[12]提出的模糊集合理论为依据,汪子强提出了基于HSV颜色空间的32色模糊颜色量化方法。设论域U为整个HSV颜色空间,对于不含色彩信息的灰度,把其分为四个模糊子集G={黑,深灰,浅灰,白};对于含有色彩信息的空间,根据人的主观感知性研究,人眼对HSV空间的三分量存在感知独立性,因此对三分量分别进行模糊划分,把色调大致分为七个模糊子集:{红,橙,黄,绿,青,蓝,紫};对于饱和度分为两个模糊子集:{深色,浅色};对于亮度分为:{亮,暗}。于是,由三个分量的模糊子集笛卡尔积就得到了28个模糊子集C,加上灰度的4个模糊子集就得到了32个模糊子集F(U)=G∪C。然后根据颜色隶属度函数 μA(μ)(A⊂F(U),μ∈U)来计算给定颜色对模糊子集A的隶属度。于是,由隶属度函数可以得到每种颜色对32个模糊子集的隶属度。

由隶属度函数可以得到模糊量化直方图,对于M×N的图像I和模糊子集,A⊂F(U)可以得到模糊量化直方图如下:

通过实验表明基于模糊量化直方图的方法更接近人的主观视觉感知,具有较高的检索准确性。但是为了能够更好的表达图像的颜色特征,还需要我们进一步的研究得到更好的量化方法。

4.3 主颜色直方图

主颜色是指图像中占的比重比较大,而且在表达图像语义上起重要作用的颜色,在颜色空间中利用聚类方法将颜色聚类成主颜色,并利用直方图表示主颜色信息。聚类是颜色量化的一种常用方法,常用的聚类方法有K-means方法[8]、模糊C均值聚类算法 (FCM)[16]和GLA算法。

李有峰[14]提出了一种基于图像前景和背景主颜色提取方法,用K-均值聚类的方法提取图像前景和背景的主颜色,该方法不仅能够降低颜色特征向量的维数,而且对图像的旋转以及目标物体的大小都不敏感。曾接贤[15]等人提出一种改进的K-均值聚类方法,在HSV颜色空间中,用K-均值聚类算法对H和V两个分量进行聚类,并根据图像各个分量的直方图特点来选取分类数目和初始聚类中心。

聚类时每个颜色区域的颜色很多,如果只用中心颜色来代替的话,不能反映真实的颜色分布情况。而且聚类是对颜色的刚性量化,容易在量化边界上出现颜色划分的和人眼的感知不一致的情况,即感知上相同的颜色被划分到不同的量化区域,而感知上不同的颜色却被划分在同一区域。基于上述原因,方珍红[16]等人提出了一种基于聚类的加权颜色特征的算法,该算法在模糊C均值聚类(FCM)方法上加以改进后对HSV空间上的颜色进行聚类,然后计算加权的主颜色直方图。

传统的颜色直方图是给出图像颜色的整体描述,每种颜色都是同样的权重。然而颜色被聚类后,颜色被量化后的区域中所包含的颜色比较多,而且每种颜色对视觉感知的重要程度也不一样,所以方珍红等人提出加入隶属度权重参数,即按照FCM聚类后的类中心为每个颜色区域的主颜色,其他颜色按照隶属度uik的权重进行频数统计,可以得到主颜色直方图,

定义如下:

式中,uik为颜色i对k类中心的隶属度函数,ni为第k个颜色区域内颜色i的像素个数,m为第k个颜色区域内的颜色个数。实验表明,利用主颜色的直方图比传统的颜色直方图有更好的检索效果,同时不同距离颜色的权重不同也较为精确地表达和描述了图像。

目前对于图像颜色特征的提取还没有哪种方法可以对所有类型图像都能达到最好的效果,所以有时候要针对不同类型的图像使用不同的提取方法。

5 结束语

基于颜色的图像检索系统一直是研究领域的热门,经过多年的研究已经有了一定的成果,本文简单的介绍了目前在图像检索系统中常用的颜色空间、颜色特征和几种颜色特征的提取方法,并对在直方图的基础上做各种改进的颜色特征的提取方法,进行了分析。但是基于底层特征进行检索并不能得到很好的检索效果,今后的研究方向应该是底层特征和高层语义相结合并且加入相关反馈系统。

[1]Flicker M,Sawhney H,Niblack W.et al.Query by image and video content:The QBICsystem[J].IEEE computers,1995,28:23-32.

[2]Smith J R,Chang S.VisualSEEK:A fully automated content-based image query system[C].ACM multimedia,1997:87-98.

[3]韩轩.基于颜色和空间特征的图像检索技术研究[D].厦门:厦门大学,2008.

[4]Stricker M,Orengo M.Similarity of color images[C].SPIE Storage and Retrieval for Image and Video Databases III,1995:381-392.

[5]Stricker M ,Dimai A.Color indexing with weak spatial constraints[C].SPIE Proceedings 2670,1996:29-40.

[6]赵莹.基于颜色分布的图像检索系统[J].微计算机信息,2007,23(6-3):266-268.

[7]周兵,沈钧毅,彭勤科.一种新的基于对称色彩空域特征的图像匹配方法[J].小型微计算机,2005,26(1):147-150.

[8]余芳.基于颜色特征的图像检索技术研究[D].北京:中国石油大学,2007.

[9]Smith J R,Chang S F.Tools and Techniques for Color Image Retrieval[C].SPIE ,1996,(2670):426-437.

[10]Zhang Lei,Lin Fuzong,Zhang Bo.A CBIR Method Based on Color-Spatial Feature[C].Proceed ings of the IEEE Region the 10th Conference,1999:166-169.

[11]曹莉华,柳伟,李国辉.基于多种主色调的图像检索算法研究与实现[J].计算机研究与发展,1999,36(1):96-100.

[12]李凡.模糊信息处理系统[M].北京:北京大学出版社,1998:85-136.

[13]汪子强,郭磊.基于模糊颜色量化的图像检索[J].计算机应用研究,2005,22(9):162-164.

[14]李有峰.基于颜色和纹理特征的图像检索相关算法研究[D].成都:电子科技大学,2009.

[15]曾接贤,王军婷,符祥.K均值聚类分割的多特征图像检索方法[J].计算机工程与应用,2013,49(2):226-230.

[16]方珍红,谢明元,杨玲.一种新的基于加权颜色特征的图像检索算法[J].激光与红外,2013,43(4):471-474.

猜你喜欢

分块直方图检索
面向量化分块压缩感知的区域层次化预测编码
符合差分隐私的流数据统计直方图发布
钢结构工程分块滑移安装施工方法探讨
关于4×4分块矩阵的逆矩阵*
基于FPGA的直方图均衡图像增强算法设计及实现
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
用直方图控制画面影调
懒交互模式下散乱不规则分块引导的目标跟踪*