基于形状特征的图像检索方法的研究与实现
2010-04-25郭晓娟成继福
郭晓娟,成继福
(河南科技学院,河南新乡 453003)
在基于内容的图像检索中,形状检索是一个重要的方面.所以,形状的提取和描述在基于内容的图像检索系统中占有重要的地位.对于自然界的物体,形状可能比颜色和纹理包含更多的语义信息,所传递的语义往往更具体、更准确[1],但是,形状的描述仅仅是在一定的程度上体现人们对形状的感知,给人感觉完全不同的形状可能有相同的特征量.
物体和区域的形状是图像表达和图像检索中的重要特征,但不同于颜色或纹理等特征,形状特征的表达必须以对图像中物体或区域的划分为基础.由于当前的技术无法做到准确而鲁棒的自动图像分割,图像检索中的形状特征只能用于某些特殊应用,在这些应用中图像包含的物体或区域可以直接获得.另一方面,由于人们对物体形状的变换、旋转和缩放主观上不太敏感,合适的形状特征必须满足对变换、旋转和缩放无关,对形状相似度的计算也带来了难度[2].
1 形状特征提取算法
通常来说,形状特征有两种表示方法:一种是轮廓特征,一种是区域特征.前者只用到物体的外边界,而后者则关系到整个形状区域.下面将详细分析一种典型的形状特征提取法——Hu不变矩算法.
形状不变矩(Moment Invariants)是基于区域的物体形状表示方法.基于区域形状的中心矩和归一化中心矩原理,Hu提出了一系列具有旋转、缩放和平移无关的七个矩特征[3].计算方法如下:
一幅数字图像 f(x, y)的二维(p+q)阶矩定义为
通过公式(4)~(10),可以计算得到图像的Hu不变矩.Hu不变矩具有对平移、旋转及缩放的不变性,易于实现.而且其适用面较广,对输入图像质量要求不是很高,一般不需要对图像进行预处理,可以降低整个算法的时间复杂度.除了上述几种方法之外,近年来在形状的表示和匹配方面的工作有很多进展,但设计一种符合人们主观判断的形状相似度量算法还是一个有待解决的难题.
2 相似性度量算法
距离相似性度量方法就是利用相关距离计算函数,计算被检对象和目标对象的特征序列之间的结果,用该计算值来判别对象之间的相似性程度.一般情况下图像都是多维特征矢量表示的,通过计算特征矢量在特征空间的距离可以得到两个图像的相似度[4].以下分别对目前在基于内容图像检索系统中常用到的几种距离度量算法[5]进行分析.
欧几里德距离是简单的距离公式,也是在CBIR中应用较广的距离公式,它可以单独用于颜色直方图和纹理特性的匹配.但欧几里德公式完全不考虑向量各维之间的关系,而且各维必须是同等重要的,这就大大影响其使用范围和有效性,故又引入加权欧几里德距离.加权欧几里德距离
式(14)中的wi是各分量的加权系数.加权欧几里德距离考虑不同维之间的不同重要性,由于CBIR系统通常抽取了大量的特征,不同特征的重要性都是不同的,因此加权欧几里德距离在CBIR系统中应用很广,可单独用于颜色直方图、纹理、形状或它们的联合向量.
3 基于形状特征检索的实验结果与分析
本实验实现了经典算法Hu不变矩来提取形状特征的检索方法,所采用的相似性度量方法为欧氏距离,实验所用到的数据分别来自UIUC图库中的鸟类的egret(共97幅),蝴蝶类的zebra(共91幅)和Caltech101图像库中chair(共60幅),strawberry(共30幅)等4类图库.所采用示例图像分别为egret类中的egr002.jpg,chair类中的image_0001.jpg,zebra类的中zeb001.jpg,strawberry类中的image_0001.jpg.
不同测试图例的结果如表1所示.
表1 不同图例基于形状的检索结果比较
在表1中,相关图像数,是测试图库中与示例图像相关的图像数;检索结果总数,是对不同测试图库使用共生矩阵进行纹理检索得到的数目,检索的阈值默认为0.4,检索的最大值默认为100,本次实验中阈值的设置为0.3,检索的最大值采用默认值.这两个参数用户可以自己设置,不同的参数设置可以得到不同的检索结果数.检索结果相关图数是检索结果集中与示例图像相关的图像数,检索结果相关图像数同时影响着查准率和查全率.本实验中,随着所选取的测试图例的不同、参数不同而得到不同的检索结果数目;查准率和查全率是一组相互影响的评价标准,两者共同决定了检索效果.
Hu不变矩具有较好的旋转、平移和尺度不变性,适用于对具有放置平移和尺度变化、旋转变化的图像进行检索.在同样条件下,综合考虑到查准率和查全率后,由表1可以看出,对于背景单一而对象形状突出的图像如strawberry类、chair类的检索效果较好;对背景相对简单,对象的形态各异的图像检索如egret类和zebra类也能得到较好的检索效果.当然表中的数据也会随着测试图例与图库的变化而变化,但是从总体来看,四类测试图例的平均查准率与查全率分别为60.675%和68.9%,所以利用Hu不变矩进行检索也可得到较好的检索效果.
4 结束语
本文在研究与分析了纹理特征提取算法Hu不变矩以及相似性度时算法的基础上,利用UIUC和Caltech101图像数据库,验证了采用Hu不变矩的形状特征提取算法的有效性,最后对不同图像数据库采用同一种特征提取方法的检索结果进行比较.可以看出,对背景相对简单,对象的形态各异的图像还是具有较好的检索性能,可以得到较好的检索效果.但由于文中所用的图像数据库种类比较单一且数量也不是很多,检索的速度比较快,如果使用种类繁杂的大量网络数据库图像进行检索时,该实验系统的检索速度会比较慢,这也是下一步需要解决的问题.同时对图像进行单一特征检索不能很好地描述图像的特征,以后的研究会趋向于多特征以及相关反馈等方面的研究.
[1]吕娜,孙杨民,黄国丰.对图像检索应用概况的研究[J].情报科学,2002,(20):3-5.
[2]樊亚春,耿国华,周明全.用不变矩和边界方向进行形状检索[J].小型微型计算机系统,2004,25(4):652-659.
[3]冈萨雷斯.数字图像处理(第二版) [M].阮秋琦,阮宇智,译.北京:电子工业出版社,2002:224-272.
[4]Sameer A,Rangachar K,Ramesh J.A survey on the use of pattern recognition methods for abstraction, indexing and retrieval of images and video[J].Pattern Recognition,2002,(35):945-965.
[5]李瑜,李磊.基于内容的图像检索的方法研究[J].计算机科学,1999,(26):8-10.