基于直方图的图像检索
2009-11-17丁兵兵
丁兵兵
【摘 要】本文描述了基于直方图的图像检索的一种方法。由于进行基于内容的图像搜索时,研究对象具有多样性和复杂性的特征,文中介绍的方法都有一定的局限性。本文只是着眼于图像分层和直方图的特征对图像进行检索,提高检索精度和速度。
【关键词】图像检索 直方图 分层方法 颜色模型 阈值
多媒体数据库是指存储和管理大量多媒体对象的数据库,如音频数据,图像数据,视频数据,序列数据以及超文本数据(包含文本,文本标记和链接)。由于音频视频设备,CD-ROM和因特网的流行和普及,多媒体数据库系统变得日益普遍。典型的多媒体数据库系统包括NASA的EOS,各种图像和音频视频数据库,人类基因数据库和因特网数据库。本文主要考虑的是图像数据的相似性搜索。
图像的产生,从最古老的人工绘制,印刷复制,照相摄影,制版冲洗,到现代的计算机合成,其中的发展变化,使图像的产生方式,存储形式和传输方式,日益简单方便。尤其是数字技术,计算机及网络技术的发展和普及,使图像成为大众化数字信息的一种形式。强大的数字处理能力,使人们可以利用相应的软件,随心所欲的对数字信息进行编辑,复制和发行。数字图像强大的优越性,使对图像信息的使用渗入到社会各行各业和人们生活的每个角落。
如今,对数字图像的使用包括国防军事,工业制造,医疗卫生,新闻媒体,大众娱乐和家庭生活等的各个方面。在如此广阔的应用背景下,产生了大量的各式各样的图像数据库。对图像数据库的查询和管理成了一个迫在眉睫的研究课题。图像数据库检索查询研究的目的就是实现自动地、智能化地检索,查询和管理图像。使查询者可以实现方便,快速,准确地查找。使管理者可以从大量单调地人工管理工作中解放出来,实现管理工作地无人干预。
对图像数据库相似搜索,主要考虑两种图像多媒体标引和检索系统:(1)基于描述地检索系统,主要是在图像描述之上建立标引和执行对象检索,如关键字,标题,尺寸和创建时间等,这种方式若手工完成是很费力的,若自动完成,检索结果质量通常较差很难满足日益复杂的图像数据库形式。(2)基于内容地检索是现在最为流行地方法,它支持基于图像内容地检索,如颜色构成,纹理,形状,对象和小波变换等。这种检索方式使用视觉地特征标引图像并基于特征相似检索对象,在实际应用中比较需要。
人们已经提出了几种在图像数据库中基于图像特征标识地相似检索方法:基于颜色特征检索;基于形状特征检索;基于纹理特征检索。其中,基于颜色特征检索地方法中,颜色特征包括了图像颜色构成地颜色直方图,直方图具有天然地旋转不变性且包含较多信息,但是单纯使用颜色直方图方法来检索往往起不到理想效果,原因是由于直方图中不包含任何有关形状,位置和纹理地信息,因此具有相似颜色构成地两幅图像可以包含极为不同的形状或纹理,这样在语义上是完全不相关的,这样就使得一个直方图可对应多幅图像的现象;如何简单度量两个直方图之间的相似程度方法不一,影响检索效果;图像数据库检索所要求的尺度,旋转,平移不变性一直是各种匹配方法的基本要求。本文提出了一个新的基于直方图的图像数据库检索方法。
一、分层直方图
表达图像颜色的方式有很多,常见的颜色模型有RGB,HIS,CMYK,CMY等。RGB属于基本模型,是数字图像处理的主要表达方法。CMY和CMYK常见于印刷业。HIS较适合人眼习惯描述物体。本文中采用RGB模型并进行归一化处理。
1.分层
由于直方图较难反映图像的空间信息,不同图像可能对应同一直方图(如图1)现有解决方法有将一副图像分成多个子块或将颜色信息与纹理,形状信息联系起来。本文提出了一个按照图像比特平面分层计算其直方图的模型。假设图像由8个比特平面组成,其范围从最低有效位的位平面0到最高有效位的位平面7,在8比特字节中,平面0包含图像中象素的最低位,而平面7包含了最高位,图2说明了这些概念。在较高阶位(特别是前四位)包含了大多数在视觉上很重要的数据,其他位平面对图像中更多的微小细节有作用,把数字图像分解成位平面后,可以看到每一位在图像中的相对重要性,对于图像的位平面而言,只需抽取其最高两位和最低一位既可以描述改图像了,然后在分别计算其对应的直方图即可。本文中,抽取位平面是利用灰度阈值变换函数进行处理的,最高位平面是把图像中0到127中的所有灰度映射到一个灰度级0,把129到255间的灰度映射为另一个灰度级255,第二个位平面即第6个平面按照这种方法,把图像中0到63的所有灰度映射到一个灰度级127,其他灰度映射到一个灰度级0上,第0个位平面一样,把0到7的灰度级映射到一个灰度级15,其他映射到0上,然后分别计算所得位平面图的直方图,当然也可以取更多位平面,不过这样计算量也会增大,三个位平面图已经足够了。对于彩色图像,R,G,B各灰度图分三个位平面直方图,再加上原图像的直方图,共要10个直方图,这样足以检索到希望的图像了。(如图3)
2.归一化处理
(1)颜色模型。我们可以认为任何颜色都可以由R,G,B三种颜色按一定比例调和而成,由于光强变化引起的物体表面颜色变化可以通过RGB颜色模型的归一化解决。
(2)直方图。图像f(x,y)是一个离散函数,设Sk为f(x,y)的第k(k=0,1,2……N-1)级灰度值,Nk为具有Sk的象素个数,N为图像象素的总数。对于同一幅图像,若尺寸变更或压缩前图像象素数和灰度级各为N1,S1,尺寸变更或压缩后图像象素数和灰度级为N2,S2。一般地,因为N1=CN2,Nk1=CNk2(C为常数),经归一化后P(Sk)=NK/N后,直方图相对灰度变化范围为0-1,图像变化前后地归一化直方图一致,解决了尺度变化造成地影响。
3.特征向量
直方图包含地信息多,变化范围广,本文采用惯性比方法来简明表达它。由1知,仅用10个直方图表示一个图像,则用10个参数即可完整表达1幅图像。直方图地极惯性矩In与改图形地最小包络矩形地极惯性矩Im之比,即u=In/Im称为惯性比。惯性比无量纲且0
4.相似性判断
判断两个直方图是否相等有很多方法。有Swain和Ballad提出的直方图相交,欧几里德距离,海明距离等,本文采用海明距离来度量两个直方图的相似程度。假设要查询图像为Q,储存图像为I,则海明距离为
Dqi=Qv-Iv该值越小,则两图越接近,否则相差就越大。
5.阈值
因为图像数据库中图像数量多,图像之间的差异很大,若每幅图像都进行以上判断较浪费时间,因此先求出R,G,B三个相对灰度直方图的平均值AvgR,AvgB,AvgG,并使Avg=(AvgR,AvgB,AvgG)/3,如果Q_Avg和I_Avg相差太多,则不必进行特征向量判断即可认为两图不同。
二、结论
本文利用了位平面对图像进行分层求直方图,并通过将直方图归一化处理解决尺度变化问题,还使用惯性比使标识图像变得简单,分层求直方图解决了将图像颜色和空间信息结合起来,避免了单一使用直方图时的问题。
参考文献:
[1]冈萨雷斯.数字图像处理.
[2]郭嗣倧,陈刚.信息科学中的软计算方法.
[3]王文惠,周良柱,万建伟.基于内容的图像检索技术的研究和发展.2001计算机工程与应用.
[4]范明,孟小峰等译.数据挖掘.概念与技术.
[5]欧宗英,王亮申.矩常量―几何形状标识的新方法.机械科学与技术,2002.