APP下载

基于变换域中的自适应纹理图像检索

2020-06-10秦智康张衡阳

液晶与显示 2020年3期
关键词:纹理灰度检索

秦智康,张衡阳

(空军工程大学 信息与导航学院,陕西 西安 710077)

1 引 言

图像搜索在电子商务、医学影像、图像处理等领域都有重要地位。近年来,硬件技术的快速发展和计算机能力的增长为移动互联网爆炸式增长提供了条件,也导致互联网能获取大量图像数据。由于空间和时间的限制,图像以压缩格式表示。主流的图像检索系统分两个阶段运行:索引和搜索。在索引阶段,使用一组图像特征属性(例如颜色、形状、纹理和布局)来表示数据库的每个图像。提取的特诊存储在特征数据库中[1]。在搜索阶段,当用户进行查询时,计算查询信息的特征向量。根据相似性标准将该向量与特征数据库中的向量进行比较,再将最相似的图像返回。学术界和工业界一直研究如何更高效地实现图片检索,孙世然等采用图像信息熵来提取图片的纹理特征,同时利用Gabor滤波器进一步提升了特征准确性,从而改进了检索的准确率[2]。许喆等采用局部哈希的策略对图像特征点进行聚类操作,并利用映射链投票来降低复杂度,提升检索精度[3]。王力采用Hadoop分布式系统采集图像SURF特征,并利用K-Means聚类方法将相似度高的图片进行聚合,提高了处理速度[4]。文献[5]采用多特征融合的图像检索算法,结合全局和局部特征来提升检索的成功率。文献[6]利用颜色直方图和GWLBP结合,实现了图像的良好分类,提升了检索效率。

目前为止,对于图像搜索的研究在变换域中关于纹理特征的利用还不够充分[7],大多采用固定的参数实现纹理特征的提取[8-12],本文研究工作将重点放在变换域中的特征提取,并利用自适应的方法动态调整变换域的参数,从而更加适用于更多类型的图片。

2 本文算法核心结构

图1显示了基于内容的图像检索系统的基本框图。

图1 本文系统核心框架图

本文提出的方法比较了使用DWT的基于内容的图像检索与融合欧几里德距离(L2)、曼哈顿距离(L1)和标准欧几里德距离(标准L2)的相似性匹配的纹理的性能。使用离散小波变换分解图像分量。在DWT之后,使用GLCM获取图像的低频分量(LL)用于纹理特征提取,然后将所有列车图像的最终特征向量存储在数据库中,同时对查询图像执行相同的过程。最后通过使用L1、L2、标准L2的加权总和作为实际距离,检索前5个相似图像。

2.1 离散小波变换

用Wφ来表示图像变换结果,尺寸为N1×N2的图像函数s(n1,n2)的二维DWT可以表示为

(1)

(2)

其中:i={H,V,D}表示小波函数的方向指数;j0表示任何起始标度,其可以被视为j0=0。

与其他变换相比,DWT[6]的特点是同时考虑到了时间和频率特性,同时具有较强的鲁棒性,因此在很多领域得到广泛应用。从第一级到第三级的二维离散小波变换结果如图2所示,其中L为低频分量,H为高频,数字1和2为离散小波变换的分解级别。子图像LL是低频分量,它是原始图像的近似子图像;子图像HL是水平方向上的低频和垂直方向上的高频分量,它表示原始图像的水平边缘;子图像LH是水平方向上的高频和垂直方向上的低频分量,它表示原始图像的垂直边缘;子图像HH是高频分量,它表现出原始图像的倾斜边缘。显示原始图像的大部分能量包含在LL2低频区域中。并且相同尺寸的其他区域以不同角度反映图像的边缘特征。这里使用二维离散Haar小波变换来分解图像。

图2 二维离散小波变换结果

2.2 图像特征提取

图像的一个重要特征是纹理。为了描述区域的纹理特性,在图像处理中使用3种方法,这些方法是统计、结构和光谱的方法。统计方法通过光滑、粗糙、颗粒状、丝滑等来指定纹理的分类。常见的二阶统计方法是灰度共生矩阵。

灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)方法基于条件概率密度函数,它包含了具有相似灰度值的像素位置的信息,包括方向和距离。在给定了方向和距离的情况下,可以计算符号灰度级像素i、j,如式(3)所示:

(3)

其中行数和列数等于图像中的灰度界别。矩阵元素p(i,j|d,θ)是由距离d分开的两个像素的相对频率,可以看到,GLCM是通过使用方向、距离、位置这3个属性的灰度级共现矩阵来提取纹理特征。

相似度:它返回一个值用于衡量GLCM中元素分布的紧密程度。其范围为[0 1]。

(4)

图像能量:灰度共生矩阵中的平方元素之和称为能量。其范围为[0 1]。恒定图像的能量为1。

(5)

相关性:返回一个像素与整个图像上领域的相似度。它的范围是[-1 1]。对于完全正相关或负相关的图像,相关性为1或-1。

已经使用诸如欧几里德、曼哈顿和标准欧几里德距离的距离测量来确定特征向量的相似性。在本文实现的算法中,欧几里德距离、标准欧几里德距离以及曼哈顿距离都用于比较图像之间的相似性。两个图像之间的距离主要用于查找、查询图像与数据库中图像之间的相似性。

欧几里得距离:欧几里德距离的平方根与相应值之间距离的平方和。

(6)

曼哈顿距离:它计算从一个数据点到另一个数据点距离的相应样本的差异总和。

(7)

标准欧氏距离:将欧几里德距离根据标准化算法计算出来。标准值=(原始值-平均值)/标准偏差。

(8)

2.3 自适应算法

相关反馈(RF)算法可以交互式地提高检索系统的有效性。传统的相关反馈算法由3个步骤组成:(a)系统对用户提供的查询模式进行初始搜索,返回少量图像;(b)用户指出哪些检索到的图像是有用的(相关的);(c)系统根据用户的相关性判断自动重新构造原始查询。此过程可以继续迭代,直到用户满意为止。

本文提出以下算法来确定查询图像与图像数据库中图像之间的相似度:

步骤1:输入需要查询的图像I;

步骤2:将RGB颜色空间图像转换为HSV颜色空间;

步骤3:将图像分成3个相等的非重叠水平区域;

步骤4:计算3个区域的颜色通道,以对应从查询图像I中的相似度;

步骤5:使用公式(6)、(7)、(8)计算两个图像之间的距离d并存储到距离矩阵dm中;

步骤6:数组d按升序排序,与查询图像I相比,对应于d的第一元素的图像是最相似的图像。

本文采用交互式遗传算法(IGA)来实现自适应[13]。在图像检索的早期阶段,系统的准确率较低,返回的结果也较少,在这种情况下先由较少的几个结果作为父代执行遗传操作,并让用户反馈效果,根据这些相关性反馈,重新计算查询图像与数据库中图像之间的相似性。当用户对检索结果满意时,系统终止。

用户输入查询图像,最初执行所有数据库图像的特征提取。执行每个查询图像的特征提取,完成使用交互式遗传算法的相似性测量结果显示。如果用户满意,则显示的结果是最终结果并且搜索结束。如果用户不满意,根据用户对检索结果的反馈再次使用遗传算法来搜索结果,并通过调整用户判断来计算相似度函数。如果用户仍不满意,则重复此步骤。在实际应用中,仅使用单个特征的检索结果可能是低效的,因此会导致整个遗传算法的执行次数过多,效率低下,因此为了获得更加高效的结果,本文使用颜色和纹理特征的组合。查询图像与数据库中图像之间的距离计算如下:

d=w1×d1+w2×d2,

(9)

其中:w1是颜色特征的权重,w2是纹理特征的权重,d1和d2是计算的距离。

3 实验和结果分析

本文用查准率度和召回率衡量检索系统的性能。查准率p等于检索到的相关图像数除以数据图像集中总的相关图像数,召回率r等于系统中检索到的相关图像数处于检索到的总的图像数[14]。

本文采用CIFAR-10数据集进行测试,CIFAR-10数据集有50 000训练图片和10 000测试图片[15],含有10类彩色图像,图像规格是32×32。考虑颜色和纹理特征的组合不仅能够表达更多的图像信息,还能从不同方面描述图像以获得更详细的信息以获得更好的搜索结果。同时对于不同图片,其特征信息的权重也有所不同,本文对CIFAR-10中不同类型图像的权重设置如表1所示。

表1 不同类型图像的权重选择

通过本文算法,经过训练之后,输入不同的图片类型,输出结果如图3所示。

图3 检索结果

通过检索结果可以看到,本文算法搜索出的前5张的图片准确度相对较高,都能够搜索出正确的结果。

本文的对比实验采用传统的GA算法、GA+传统的DCT变换以及本文提出算法。表2总结了不同训练迭代次数下的召回率和查准率对比,可以看到,在增加训练次数的情况下,不同的算法都在召回率和查准率上有所提高,同时本文算法准确率都优于对比的传统算法。

表2 检索查准率和召回率对比

4 结 论

提出了一个基于灰度共生矩阵的二维离散Haar小波变换算法,改进了基于内容的图像检索,该灰度共生矩阵用于提取图像的纹理特征、并采用IGA算法进行自适应。算法充分考虑了颜色特征,纹理特征和形状特征,并融合了欧式距离、标准欧氏距离以及曼哈顿距离作为相似度度量。通过实验可以看出,本文提出的算法能有效搜索到相似图片,同时在召回率和查准率上都优于传统算法,训练迭代次数为30,60,100的情况下,本文算法的准确率达到67%以上。实验证明本文的算法对于图像检索有较高的参考价值。

猜你喜欢

纹理灰度检索
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
基于最大加权投影求解的彩色图像灰度化对比度保留算法
专利检索中“语义”的表现
消除凹凸纹理有妙招!
基于像素重排比对的灰度图彩色化算法研究
国际标准检索