基于区域的图像检索算法
2015-12-25裴志松唐昌华
裴志松 唐昌华
(长春工业大学人文信息学院,吉林 长春 130122)
0 引言
基于区域的图像检索技术是一门被广泛研究的信息检索技术。该项检索技术由系统对图像进行提取与识别,解决了传统的基于关键词检索中的各种问题。特别是随着网络技术与多媒体技术、数据库技术相互融合,检索系统开发需求的不断扩大,是一个颇具生命力的研究方向,针对这一方向深入研究,将具有很大的理论价值和广泛的应用前景。
1 基于区域图像检索综述
常用的图像检索技术大致可以分为基于边界检测和基于区域两种方法。包括:边界检测分割法和区域检测法。边界法先检测出图像中的边缘点,然后按照一定的策略把这些边缘点连接成轮廓,封闭边界所包围的像素就组成了相应的区域。
基于区域的方法是把图像中的各个像素依据一定的规则分到各个区域中,这些区域的外围像素就会构成了区域的边界,所以关键是如何确定像素分类的规则。实际规则中应用的区域分割技术主要有两种:一种是阈值化算法,另一种是特征空间聚类。特征空间聚类的方法是对阈值分割的一种推广方式。它采用特征空间点来表示图像空间中的元素,通过将特征空间的点聚集成团,然后再将它们映射回原图像空间,来达到取得分割的结果。通常在高维特征空间的聚类,如果只用一个特征往往不能解决的问题,所以,特征空间聚类通常采用多个特征。通常采用的方法有K-均值、模糊聚类、ISODATA 聚类、概率聚类等。区域分割技术有两种基本形式,一种是根据单个像素,逐渐合并以形成所需的分割区域,另一种是从全局的出发,逐渐分裂切割到所需的分割区域,对应的两种典型算法分别是区域生长和分裂合并。
2 基于区域的图像特征的提取
在众多提取参数中,可以选择颜色特征作为K-均值聚类的中心,根据每一个小的区域的颜色的均值和标准差的平均值,可以计算出它的纹理特征,进而对图像进行提取,计算的步骤如下:
(1)在图像中,选择一个点作为提取点,然后将其他点都设置为黑色。
(2)通过转换,将图像的颜色模式转变成灰度图像。
(3)在刚才的灰度图像上,根据算法,作四层小波变换。
(4)在变换后的每个高频子带上,计算他们的平均能量,如公式1所示。
(5)做四层小波变换后,获得的12个能量值,用合适的比例,组成一个纹理特征向量。
式中,X(i,j)表示纹理图像,E 表示能量,M、N 是纹理图像的维数。
每一个单体特征可以定义为,如公式2 所示:
式中,rij表示在区域j 特征i 的向量,维数为K。
图像的特征定义为,如公式3 所示:
3 基于区域的图像特征的相似性检测
在进行图像匹配的时候,可以获得各种不同的特征值,但是对于图像检索的共享大小不同,所以我们需要对他们进行进一步的归一化处理,规定相似度S 都在0 到1 之间,并且在某个特征rij内部进行。并且,在计算S 之前,同时要求将特征向量的各分量rijk(表示第i 种方法,第j个区域,第k个分量)统一进行归一化操作,否则采用S 的线性组合来计算总体相似度S 就变得没有意义。把这种对rijk的归一化称为特征内的归一化。
特征内部的归一化可以使特征向量rij与的各分量与rijk具有同等的重要性。因为特征向量的不同分量,都具有不太相同的含义,所以,经过归一化之后,它们各自的变化幅度也可能有很大不同,如果直接用来计算相似度就会引起很大偏差。所以必须要将特征向量的各分量,都统一的归一化到一定的范围中去。所以,我们定义特征向量V=rij,则每一特征向量rij的归一化过程可以如下:
假设数据库中共M 幅素材,而m 为素材的索引值,可以这样定义,如公式4 所示:
表示第m 幅素材的特征向量,而K 是特征向量V=rij的维数。如果我们将所有素材的Vm累积在一起,就能获得维数为M×K 的矩阵,如公式5 所示:
其中vm,k是特征向量Vm(对应于第m 幅素材)的第k个分量。为了保证个分量能有相同的重要性,矩阵的第k 列是维数为M 的一个列向量,记为vk。最终将每列中的元索,都统一归一化到指定的值域标准内,这样就可以保证在计算两个向量之间的相似度。
根据以上计算,如果能够融合高斯归一化方法,可以获得更好的结果。假设列向量vk是一个高斯数列,可以首先计算该数列的标准方差σk和平均值声μk,然后式6 来实现高斯归一化,公式定义如公式6所示:
通过结果分析,将公式6 的分母部分,都替换为经过σk单独归一化后,数列中的某个值位于区间[-1,1]范围中的概率大约为68%。如果用式6,则根据高斯归化后,其数值在区间[-1,1]范围中的概率已经达到了99%。所以可以认为数列,通过该方法所有值都己经在[-1,1]范围中了,高斯归一化方法的优点在于,即便是数列中存在一些异常的数值,比如过大或者过小,在计算向量间的相似度时,也不会导致分量rijk重要性有所偏差,达到了预期的效果。
4 结束语
通过使用的图像库SIMPLIcity 系统提供的测试集。它是从Corel图像库中抽取的500 幅图像,分为:人、医疗器械、建筑物、老虎、山峰、食物等,每类一百幅。分别是使用基于区域的方法对其进行检索,结果均达到了理想的要求。
[1]吕英华,唐昌华,孔俊,等.A Content-Based Image Retrieval System Using RBF Neural Network[C]//DCDIS 国际会议.2007,10.
[2]章毓晋.图象工程——图象理解与计算机视觉[M].北京:清华大学出版社,2000.
[3]WY Ma and B Manjunath.Netra:A Toolbox for Navigating Large Image Databases[C]//Proc.IEEE Int’l Conf.Image Processing.2012:568-571.