APP下载

基于主颜色的彩色图像索引技术

2014-01-03张水利

电子测试 2014年7期
关键词:查准率直方图分量

张水利

(延安大学物理与电子信息学院,陕西延安,716000)

0 引言

图像检索就是根据对图像内容的描述,在目标图像集合中找到具有指定特征或包含指定内容的图像。根据使用的图像特征不同,图像检索可以分为色彩方法、纹理方法和形状方法。计算图像的色彩特征更方便、快速,因此色彩方法是图像检索中常用的方法。图像的颜色直方图是图像中各种色彩出现的频率,它反映图像的颜色特征,而且不因图像的几何变换而改变,是检索中经常使用的特征。颜色索引技术( color indexing) 作为一种图像相似检索方法最早在文献[3] 中提出, 它的核心思想是计算图像的颜色分布, 即颜色直方图(color histogram),并利用直方图相交算子(histogram intersection) 计算图像之间的相似度。对多媒体数据的检索,早期的方法是用文本将多媒体数据进行标识,这显然不是基于多媒体信息本身内容的检索,对多媒体数据中包含的信息是一种极大的浪费;基于内容的检索是多媒体数据库的关键技术,如何实现这种技术,是值得商榷的,而最好的方法是使用无需领域知识的检索方法,因此,基于颜色的方法就是实现的关键;而颜色直方图检索是利用颜色进行图像检索的最常用的方法。本文针对检索图像具有某种特定的颜色特征,在RGB 颜色空间,提出了一种基于主颜色特征的彩色图像检索算法,在检索过程中,引入了各颜色分量的权重来表示各颜色分量在图像检索过程中的贡献,利用MATLAB 语言环境进行检索实验,并取得了预期的检索性能。

1 算法描述

1.1 特征提取

对于查询图像和数据库分别计算查询图像的R、G、B 分量的统计直方图。

图像的统计直方图是一个一维的离散函数:

其中k 代表图像的特征取值,L 代表特征可取值的个数,nk是图像中具有特征值为k 的象素个数,n 数图像象素的总数。

在MATLAB 语言环境中,用imhist 语句分别计算R、G、B这三种颜色分量的统计直方图,即每一颜色分量中特定颜色的象素点的数目。

1.2 距离度量

这里首先选用直方图相交算法的公式:

分别计算查询图像各颜色分量与数据库图像各颜色分量的统计直方图相交距离,相交距离越大越相似。距离为1 说明两幅图像完全相同,距离为0 说明两幅图像差别最大。用P1、P2、P3分别表示查询图像与数据库图像之间的红色、绿色、蓝色分量的直方图相交距离;Wr、Wg、Wb 分别表示红色、绿色和蓝色分量的权重(加权系数),且有Wr+Wg+Wb=1,并由此得到本实验过程中的距离度量公式:根据所选查询图像对各颜色分量的要求不同,Wr、Wg、Wb 的取值不同。

1.3 性能评价

检索算法的优劣通常采用两个性能指标:查准率(P) 和查全率(R) 来评价检索算法。查准率指返回的结果集中有效图像的比率,用于测量系统排除无关图像的能力。查全率指返回的结果中有效图像占数据库中所有相似图像的数量的比率,用于测量系统检索相关图像的能力。将查全率R 作为x轴,查准率P 作为y 轴,绘制一条查准率vs 查全率曲线,称为PVR 曲线。设PVR 曲线为f(x),则f(x)与xy 轴围成的面积为。称S(f) 为PVR 指数,记为E(如图2)。由于P, ,可得 。E 越大,图像检索性能越好;E 越小,图像检索性能越差。E=1,那么图像检索性能达到最佳,其PVR曲线为f(x,y)=1

2 检索结果及评价

本实验选取由红色为主色调的小汽车所组成的图像库, 在检索时将Wr 取值偏大,Wg 和Wb 取值相同, 图2 到图七分别列出了Wr、Wg、Wb 取不同值时得到的检索结果(列出了排在前十位的相似图像,相似度从左到右,从上到下降序排列):

为评价Wr、Wg、Wb 取值不同时,检索性能的好坏,在同一坐标系里绘出了Wr、Wg、Wb 取值不同时的PVR 曲线如图8所示:

由PVR 曲线可以看出,Wr =0.9 的检索效果最好,随着Wr 的增大,检索效果越来越好,并不是说Wr 可以无限制的增大,到某一程度也可能会使检索性能下降。因此可以得出,对于一幅真彩的RGB 查询图像来说,如果其红色分量较多,那么就可以在检索过程中可以适当增加红色分量的权重(加权系数),反之,就可增加蓝色或绿色分量的权重。而如果查询图像是黄色的,因为黄色是基于红色和绿色之间的颜色,那么在检索过程中,就将红色和绿色分量的权重取值相同并且大于蓝色分量;同样,当是紫色图像时,紫色是位于红色和蓝色中间,就可将红色和蓝色分量的权重取值相同并且大于绿色分量的权重。即在确定各颜色分量的权重时,要根据具体的情况而定。

3 结语

在基于内容的图像检索中,颜色是最容易说明的特征,主色调可以反映图像的总体概貌。通过图像检索算法能够将用户指定的多种主色调通过适当的扩展用于匹配,从而获得更好的检索结果。一幅图像能够胜过千言万语,图像的深刻内涵用区区几个字符是难以表达出来的,利用图像检索技术能够使用户较容易记住任何物体的颜色特征,这种方法更值得我们采用。

[1] 石军, 常义林. 图像索引技术综述[J]. 西安电子科技大学学报(自然科学版),2003,30(4):486 ~491.

[2] 王宇生, 陈纯.一种新的基于色彩的图像检索方法[J].计算机研究与发展,2002,39(1):105- 109.

[3] Swain M.J,Ballard D.H.Color indexing[J] .International Journal of Computer Vision, 1991,7(1):11- 32.

[4] 张水利.彩色图像检索方法研究[D].太原:太原理工大学,2006:25.

[5] 韦素云, 吉根林. 基于加权颜色直方图和颜色对的图像检索系统[J]. 南京师范大学学报( 工程技术版), 2005,5(1):53- 56;164- 168.

猜你喜欢

查准率直方图分量
符合差分隐私的流数据统计直方图发布
帽子的分量
一物千斤
用直方图控制画面影调
基于数据挖掘技术的网络信息过滤系统设计
论《哈姆雷特》中良心的分量
大数据环境下的文本信息挖掘方法
基于深度特征分析的双线性图像相似度匹配算法
中考频数分布直方图题型展示
基于空间变换和直方图均衡的彩色图像增强方法