基于分数维的彩色图像检索研究
2011-05-21魏聚波穆维新申金媛刘润杰
魏聚波,穆维新,申金媛,刘润杰
(郑州大学 信息工程学院,河南 郑州 450001)
随着20世纪90年代多媒体技术以及信息技术的飞速发展,使得基于内容的图像检索技术 (Content-Based Image Retrieval,CBIR)应运而生。CBIR技术主要对图像内容通过机器进行自动分析,直接根据图像视觉特征信息建立索引,并通过图像特征向量间的近似度量进行图像相似性匹配,从而实现图像的检索。该技术涉及多个学科,融合多领域相关技术,以致力于对图像的鲁棒性理解。
目前基于内容的图像检索技术表现为提取图像低层特征信息,如:颜色、纹理、形状等;运用相关数学方法计算查询图像与图像库中图像的相似匹配度,以便获取与查询图像相似相关的图像。由于图像的单一特征不能准确描述图像内容的所有相关信息,检索精度相对较低,很多研究者提出了融合多特征的图像检索技术,并取得了一定的研究成果[1]。
Mandelbrot[2]首次提出分形(Fractal)的概念,并用分形维数来度量、分析和评价纹理和形状。Pentland[3]在1984年研究提出分形维数来刻画图像表面所具有的粗糙度信息,与人类的感知粗糙度有很强的相关性,能区分光滑和粗糙纹理特征。分形维数作为图像特征,被广泛应用于图像的相关分析、处理方面,越来越成为研究热点。
颜色特征是人类视觉最重要的感知特征,具有最直观,最明显,而且对图像分辨率、尺寸、旋转等变化不敏感的特点[4],成为CBIR研究的主要特征。
本文基于分形维数表示自然表面的粗糙程度与人类的感知判断具有极强的相似相关性,来描述图像的纹理信息;结合接近人眼感知颜色信息的HSV颜色空间模型特征,作为图像的相似匹配特征信息。分别计算图像HSV空间模型中各个色彩通道下的分形维数,并将其非线性量化,提出了HSV颜色空间分形维数量化直方图的概念,使图像粗糙度与分形维数呈近似线性比例关系,以便于图像粗糙度之间的相似匹配度计算。综合颜色直方图与分形维数量化直方图,作为图像间相似匹配特征,实现图像检索。
1 分形维数特征提取
1.1 分形维数概念
Mandelbrot用分形集合的自相似性质来定义分形维数,设在Rn空间里的一个有限集合A,若A可以完全被若干个互不覆盖的子集a覆盖时,集合A就是自相似的,是一个分形集合。其分形维数D可由下式计算:
其中,r是覆盖子集的尺度因子r=a/A,Nr是尺度因子r时,覆盖子集的个数。
1.2 分形维数计算
图像分形维数的计算方法主要有:ε-毯子法、分形布朗运动法、盒子法等。本文运用由N Sarkar和B.B.Chaudhuri[5]提出的差分计盒维数法(Differential Box Counting,DBC),该方法是一种简单、有效的计算图像分形维数的方法。计算过程描述如下:
将大小为 M×N 的图像分割成为 s×s的网格(1<s<M/2,且s为整数),令r=s/M。 设图像为三维空间中一曲面 z=f(x,y),(x,y),坐标轴表示图像平面,z轴表示图像的灰度值L。则(x,y)平面被 s×s 的网格覆盖,有一系列 s×s×s′的小盒子,其中 s′=s×max(L)/M。 设位置在(i,j)的网格中,图像的灰度最大值和最小值分别被包含在第k和第l个网格内,则第(i,j)的网格中的差分值 nr(i,j)为:
而整幅图像在比例因子为r时的差分值为:
根据不同的比例因子r算出不同的Nr值,然后利用公式(1)应用最小二乘法即可求得图像的分型维数FD。
1.3 分形维数非线性量化
虽然DBC计算分形维数虽然能够遍历图像维数范围(2~3),但仍然有对局部高维估计不足的缺点。为解决DBC对高维部分饱和估计的缺陷在相似匹配计算中的影响,经过实验分析DBC计算分形维数与粗糙度的比例关系,将图像分形维数用函数y=x4分段非线性量化,使得分形维数与粗糙度形成一个近似线性尺度。具体步骤如下:
1)因为图像分形维数取值范围在2~3之间,将分形维数取值范围归一化,取得decimalD=(FD-2)的值(取值范围为:0~1)。
2)把0-1之间的数值平均分成10段,并将第i段平均分成i4个单位,共计个单位。
3)计算分形维数decimalD落在第几单位,就是该图像的分形维数量化直方图的值。该值与图像粗糙度近似线性比例关系。
量化前后分形维数与图像粗糙度的比例关系如图1所示。
2 颜色特征提取
颜色特征是人类视觉最重要的感知特征,具有最直观,最明显,而且对图像分辨率、尺寸、旋转等变化不敏感的特点。表现出相当强的鲁棒性,是描述图像内容信息最简单有效的特征,被广泛应用于图像检索中。常用的颜色空间模型有:RGB模型、HSV模型、CMYK模型、HIS模型、Lab模型。每一种颜色空间模型都有自己的优缺点,研究者根据自己需要来选择所用模型。
图1 分形维数与粗糙度尺度量化前后关系图Fig.1 Factal dimension and the relationship of roughness scale before and after quantization
HSV颜色空间(H色调、S饱和度、V亮度)直接反映了人类视觉观察色彩的方式,具有:1)亮度分量与图像的色彩信息无关;2)色调分量和饱和度分量与人类视觉感受色彩方式紧密相关等特点。有助于计算机模拟人眼视觉感知图像色彩进行相关处理。为此本文选取HSV颜色空间进行图像检索。
根据人眼对颜色感知的特性,在不显著降低图像质量的情况下,为减小计算量以降低存储空间和提高处理速度,对HSV颜色空间按照公式(3)量化:
3 相似匹配计算
由于分形维数和颜色特征均与图像的尺度、旋转、变换等不敏感的特性,首先把图像预处理归一化为[256×256]的标准图像。分别计算图像HSV空间各个颜色通道以及灰度图像下的分形维数FDH、FDA、FDV,得出累积HSV颜色空间分形维数量化直方图HistFD。综合颜色直方图HistC求得图像特征向量:
其中wFD是分形维数量化直方图权重。通过直方图相交法求得查询图像与图像库中图像的相似度。
4 实验结果与分析
本文所用图像库是标准测试图像库Corel中的1 000幅图像作为数据库,该图像库是有10个语义,每个语义包含100幅图像的图像库,语义类别分别为:非洲、海滩、建筑、汽车、恐龙、大象、鲜花、骏马、雪山、食物。根据分形维数与图片大小的比例关系,实验显示分形维数量化直方图权重wfd=12检索精度最高。图像库中所有图像检索精度数据如图2所示。
图2 传统颜色直方图法与本文综合方法检索精度图Fig.2 Precision of normal and proposed method
图2结果显示本文提出的检索方法得出的检索精度比传统直方图方法的检索精度平均提高了19%,平均检索精度达到80%以上。
图3 鲜花语义检索结果Fig.3 Retrieval result of flower semantics
从检索结果可以看出,融合了HSV颜色空间各个通道下的分形维数特征信息的图像检索系统,提高了检索精度,检索结果更加符合人类视觉感知特性。以下是对图像库中部分语义图像的检索结果(每幅图中的第一张图为检索目标图像)。
图4 骏马语义检索结果Fig.4 Retrieval result of horse semantics
5 结 论
为寻求图像检索结果接近人眼感知图像查询的目的,本文综合运用了与人类感知图像相似的两种特征信息:HSV颜色空间模型颜色颜色特征,以及表述纹理信息的分形维数特征。实验结果表明该方法符合人类视觉感知特性,检索结果明显优于传统的颜色直方图方法。图像的分形维数特征信息能够较准确的表述图像视觉信息,以后的深入研究将注重在图像分割中分形维数的运用。
[1]孙劲光,尹达.基于颜色和纹理特征的图像检索技术研究[J].河北工业大学学报,2008,37(6):23-30.SUN Jin-guang,YIN Da.Research of image retrieval based on color and texture feature[J].Journal of Hebei University of Technology,2008,37(6):23-30.
[2]Mandelbrot B B.The fractal geometry of nature[M].上海:上海远东出版社,1998.
[3]Pentland A P.Fractal based description of nature sciences[J].IEEE Trans on Pattern Analysis and Machine Intelligence 1984,6(6):661-674.
[4]Swain M J,Ballard D H.Color indexing[J].International Journal of Computer Vision,1991,7(1):11.
[5]Sarkar N,Chaudhuri B B.An efficient differential box-counting approach to compute fractal dimension of image[J].IEEE Trans on Systems,Man and Cybernetics,1994,24 (1):115-120.
[6]Ritendra D,Dhiraj J,Li J.Image retrieval:ideas,influences,and trends of the new age[J].ACM Computing Surveys,2008,40(2):5.