一种HSV颜色空间量化的藏毯图像检索方法
2016-05-16孙琦龙张明亮
孙琦龙+张明亮
摘要:针对国内外还没有可供研究人员和公众使用的藏毯类非物质文化遗产数字化资源平台这一状况,论述了在藏毯图像中运用颜色特征实现图像检索的可行性。根据藏毯图像的颜色特征,分析了目前一些HSV颜色空间量化的缺陷,按照图像颜色在HSV空间中相同或不同的分布特点,提出了一种改进的188维颜色空间量化方法。通过对藏毯图像采用平均分块的策略,将一幅图像平均分为25个子块,每一个子块的像素数为6400。经过对实验数据的分析,比较了不同维数颜色空间量化的查准率与时间消耗,最终实现了在藏毯图像检索中采用188维颜色空间量化的方法。
关键词:计算机应用;藏毯;图像;量化;特征
中图分类号:TP311 文献标识码:A DOI:10.3969/j.issn.1003-6970.2016.03.009
0引言
非物质文化遗产的保护和继承,是当今全世界所有国家、地区和民族面临的新课题,加牙藏毯织毯技艺已经被国务院列为第一批国家级非物质文化遗产项目。2014年,加牙藏族织毯技艺传习所又被列为非物质文化遗产传习所,其传统工艺的保护已引起人们的关注和重视。藏毯在藏族传统艺术的基础上,吸收、融合了汉族、印度和尼泊尔宗教艺人的精华,并且形成了具有自己独特的藏族艺术风格的工艺美术品,其图案设计和色彩源于藏传佛教文化,艺术价值极高,是珍贵的非物质文化遗产。随着近年来非物质文化遗产保护工作的不断深入,以及非物质文化遗产数字化、信息化的科技进步,全国各地的非物质文化遗产数据库建设步伐在不断加快。借助于藏毯的数字化保护服务平台,在分析藏毯的纹理特征、色彩分布和形状特征的基础上,即可以支持基于文字以及图像属性的查询,又可以通过提取藏毯图像的关键特征值来实现基于内容的图像检索。本文在研究基于内容的图像检索技术基础上,经过改进,提出并实现了一种基于HSV颜色空间的藏毯图像检索方法。
1基于内容的图像检索方法
基于内容的图像检索(Content-Based Im-ageRetrieval,CBIR)近年来已成为提高图像检索的有效手段,传统的基于文本的图像检索技术,通过图像的描述文字和用户输入的关键字进行比较,检索结果不仅效果差并且不能对未标注文本信息的图像进行检索。基于CBIR技术的图像检索系统,采用相似性匹配算法计算关键图像特征与特征库中图像特征的相似度,然后按照相似度从大到小的顺序将匹配图像反馈给用户。用户可根据自己的满意程度,选择是否修改查询条件,继续查询,以达到令人满意的查询。CBIR的实现依赖于两个关键技术:图像特征提取和匹配。目前比较成熟的检索算法大部分是基于图像的颜色、纹理、形状特征来检索,而在基于内容的图像检索中,作为图像最直观而明显的特征和基本要素,颜色特征是在基于内容的图像检索中最早、最广泛使用的视觉特征,常用的颜色特征包括颜色直方图、颜色距、颜色聚合向量、颜色协方差矩阵等。
2 HSV颜色空间
相对于其它图像特征,颜色特征非常稳定,不局限于图像的大小和方向,并且对于旋转、平移、尺度变化,甚至各种变形都不敏感,表现出相当强的鲁棒性,因此在基于内容的图像检索中发挥着重要的作用,这也使得颜色特征成为图像检索中应用最为广泛的底层视觉特征。
2.1颜色模型
2.1.1 RGB
在RGB模型中,红,绿、蓝这3个基本颜色的不同组合构成了所有颜色,将这三种颜色划分成256(0-255)个等级。各个分量的数值越小,亮度越低。数值越大,亮度越高。如(0,0,0)表示黑色,而(255,255,255)又表示白色。一般通过一个真彩色像素用8位表示三个颜色分量时,需要24位(3个字节)来表示RGB的三种颜色,总共可以表示16777216种。
2.1.2 HSV
HSV(hue,saturation,value)模型对用户来说是一种直观的颜色模型,直接对应于人眼的视觉特征,H表示色度、S表示饱和度、V表示亮度。模型对应于圆柱坐标系中的一个圆锥形子集,它包含RGB模型中的R=I,G=I,B=I三个面。色度H用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,品红为300°;从圆锥横截面的圆心到横截面圆周点的距离被定义为饱和度(S),饱和度S取值范围为0~1,S取值越大,表示色彩越纯,取值越小,表示色彩越灰。从圆锥的横截面圆心到圆锥顶点的距离被定义为亮度(V)。亮度V表示色彩的明亮程度,取值范围为0~Ⅰ,Ⅴ和光强度之间并没有直接的联系。
2.2颜色特征
颜色直方图是目前最常用的颜色特征提取方法,绝大多数对颜色特征的提取和描述算法都是以颜色直方图为基础。其主要做法就是统计图像中各种颜色出现的频数,它不关心颜色所处的空间位置。颜色直方图将颜色空间划分为若干小的颜色区间,每个区间对应于颜色直方图的一个柄,然后统计落在每个小区间的像素数量,最终得到颜色直方图。在颜色直方图坐标中,横坐标表示颜色柄的划分值,纵坐标表示每个柄区间中包含的图像像素总和。直方图均衡主要用于处理图像由于过度曝光或者曝光不足造成的前景背景过量或过暗的情况,可以增强图像的对比度,扩展图像灰度范围。
3传统的HSV颜色空间量化
如果分别对HSV颜色空间的三个分量:H、S、V建立颜色直方图进行特征提取和匹配,则会带来检索的低匹配性。所以要对H、S、V三个分量进行非等间隔分割,将色调H分成8份;饱和度S的范围由圆心向圆周过渡,将其分为三份;亮度V划分为Black,Gray,White三份,各自量化区间为:
按照以上的量化区间,HSV颜色空间被划分为72个不同的空间区域,再通过量化公式I=9H+3S+V计算,将三个简化后的颜色分量合成一维特征向量值,Ⅰ的取值范围为[0,71],这就将整个HSV颜色空间量化为72种颜色,最终得到72柄的一维颜色直方图。
4一种改进的HSV颜色空间量化方法
4.1颜色空间量化
由于藏毯图案较鲜艳且复杂,所以采用颜色量化聚类方法,用少量主体色代表整个藏毯图像的特征。将藏毯图像从RGB颜色转换到HSV颜色空间后,计算颜色之间的距离来测量图像的相似度。在理论分析中,虽然采用比较高维的量化可以提高检索精度,但目前的数据库表一行的容量最大为8060字节,所以只能使用降维方法。根据以往的经验分析,在藏毯图像的某些空间中可能会出现像素稀疏的情况,所以把HSV颜色空间量化成188维。根据图像颜色在HSV颜色空间188维中的相同或不同的分布特点,均匀地选取若干个量化点,然后将其他量化点按颜色相似距离最短的原则组合为一个聚类,从而达到既能聚类出代表图像的颜色又能减少颜色数目的目的。本文采用的预处理办法是直方图均衡,采用直方图均衡的目的是去除光照条件对灰度的影响。具体聚类如下:
H:H空间分为45类,取值为0~44,h均匀间隔为8,即h=(0,8,16,32……,360),
S:S空间分为4类,S取值为0~3,S均匀间隔步距0.25(0.173,0.423,0.673,0.923),
V:V空间分为4类,V取值为0~3,V均匀间隔步距0.25(0,0.25,0.5,0.75),
然后按照以上的量化级构造一维特征矢量,把3个颜色分量合成一维特征矢量:
L=4H+3S+V,根据上述公式,计算L的取值范围为[0,187],最终获得188柄一维直方图。
4.2图像分块策略
对藏毯图像采用平均分块策略,将一幅图像平均分为25个子块,用于存储这25个子块的颜色特征。根据藏毯图像的基本特征,对图像子块的权重做等分处理,既各个子块的权重为1/25。本文实验中以普通藏毯图像为例,每个子块分类的结果如下:数组中的每个数字代表该类中像素点的个数。由于实验图像库中图像大小是400×400个像素点,所以平均分成25个子块后,每一个子块的像素数为6400。
4.3实验结果
通过以上实验数据对比,188维量化时的查准率略高于155维量化时的查准率,二者时间消耗也相差不大,大概在5s左右。虽然188维量化时与652维量化时查准率有所下降,但时间的消耗也较低,652维量化消耗的总时间为45s,188维量化消耗的总时间为32s。综合以上分析,说明采用188维量化方法,在藏毯图像的检索中较为可行。
5结语
为了更好的开展藏毯类非物质文化遗产的预见性保护工作,本文根据藏毯图像的颜色特征,分析了目前HSV颜色空间量化的缺陷,按照图像颜色在HSV空间中相同或不同的分布特点,提出并实现了一种改进的188维颜色空间量化方法。通过对藏毯图像采用平均分块的策略,经过反复实验和对实验数据的分析,比较了不同维数颜色空间量化的查准率与时间消耗,最终找到了一种较为合适的提高藏毯图像检索查准率的方法,为非物质文化遗产的保护和继承提供了技术支撑。