基于遗传算法的图像多特征权重自动赋值方法
2019-11-16张晓丽肖满生叶紫璇
张晓丽 肖满生 叶紫璇
摘 要:在图像检索中,如何有效提取图像特征是基于内容的图像检索中的一个难点。针对该难题,提出了一种基于遗传算法的图像多特征权重自动赋值方法。首先使用灰色直方图提取颜色特征并利用树形小波提取纹理特征,然后利用遗传算法的全局最优解搜索功能自动确定各特征的权重。实验结果分析表明:在灰度图像的相似性检索中,基于遗传算法的多特征权重自动赋值方法与其他方法相比,平均查全率增加将近8%,平均查准率增加将近9%,说明该方法有较高的检索精确度。
关键词:树型小波;特征融合;遗传算法;图像检索
中图分类号:TP391 文献标识码:A
Abstract:In image retrieval,how to effectively extract image features is a difficult point in content-based image retrieval.Aiming at this problem,the paper proposes an automatic multi-feature weight assignment method based on genetic algorithm.First,the method uses gray histogram to extract color features and uses tree wavelet to extract texture features.Then the genetic algorithm's global optimal solution search function is used to automatically determine the weight of each feature.The experimental results show that in the similarity search of gray image,the multi-feature weight automatic assignment method based on genetic algorithm has increased the recall rate by 8% and increased the precision rate by 9%,compared with other methods,which proves the high retrieval accuracy of this method.
Keywords:tree wavelet;feature fusion;genetic algorithm;image retrieval
1 引言(Introduction)
圖像检索通常包含基于标注的图像检索(ABIR)和基于内容的图像检索(CBIR)[1]。ABIR必须主观地标记或注释,不仅耗时,而且一些图像难以用简单的关键词准确地标记和描述,因此它们的应用受到限制[2]。根据图像的纹理,灰度或颜色特征检索CBIR,其检索效率高于ABIR。近年来,它一直受到学者们的青睐。已经提出了许多关于CBIR[3-5]的具体算法。在CBIR方法的研究中,目前基于颜色和纹理特征的图像分析和识别方法在医疗学科的图像中具有重要的应用。国内外许多专家学者在此基础上提出了许多图像分析和识别方法[1,4],如张永库[6]等提出了基于底层特征综合分析的检索算法,该方法的准确度较高,检索速度较快,但针对不同特征的权重值分配存在着局限性;B.G.Prasad等[7]提出了一种通过区域匹配来检索图像的技术,该技术基于MPEG-7框架内的颜色、形状和所在位置的组合特征,使用集成的颜色、形状和位置特征对每个图像内的主要区域进行索引,每个特征的权值是通过手动进行设置,在检索图像时有很大的主观性;YoungDeokChun等[8]在基于内容的图像检索方法中,使用多分辨率颜色和纹理特征组合来进行有效地检索图像,该方法的检索速度快,但选取合适的特征权值需要大量时间。上述图像检索方法虽然在检索精度和性能上得到了很好的发展,但是在多特征融合过程中其特征权重的确定是通过手动的方式完成,并不能自适应地选择权重,具有很大的主观随意性,因而检索精度不高。基于此,本文对手工给定权重的方式进行改进,提出了基于遗传算法的图像多特征融合权重自动赋值的方法,并通过实验验证其有效性。
2 图像特征提取(Image feature extraction)
2.1 颜色空间的选择和颜色特征提取
(1)色彩空间选择及颜色量化
通过构建颜色模型来恰当地运用于颜色。HSV颜色空间是一种以视觉感知为中心的颜色模型,其中H是色调的颜色,即光的颜色;S是饱和度,即颜色度,它与某种色调的纯度有关;V表示亮度,其是指人眼感知光的亮度和暗度。色调,饱和度和亮度可以用三维主轴表示,如图1所示。
该图的垂直轴表示黑白部分的亮度变化,圆周上的点表示相异的色调,并且从圆周到圆心的过渡表示饱和度渐渐减小。HSV空间具备两个性质:一是亮度分量与图像的色彩信息无关;二是色调和饱和度成分与人们对颜色的感受密切相关。这些性质使HSV色彩空间成为通过使用人类视觉系统感知色彩特征的理想选择。在确定颜色的空间模型之后,颜色需要进行量化。由于人眼与某些颜色的细微差别难以区分,因此细微的颜色可被视为一种颜色,将颜色空间分成几个小的颜色间隔。为了减小计算量,HSV空间根据人的颜色的感知而不均等地量化。通过分析发现,人眼对色调和饱和度不敏感是因为低饱和度和亮度非常高或低。对色调和饱合度和度,人类视觉系统对色调更敏感,因此采取以下定量策略:首先,根据人眼的分辨能力,将色彩空间分为16个部分,将饱和度和亮度分为四个部分;其次,物体的色彩与光的波长和频率相关,据波长和频率的差异,色调不是等间隔的,饱和度和亮度的非等间隔量化基于不相同的颜色范畴和人类视觉感知,量化公式如下:
(2)颜色特征提取
颜色直方图用于计算特定颜色空间中图像的各种颜色出现的频率,一般的颜色直方图方法不考虑每个像素颜色的空间位置分布信息,只在整个图像上汇总颜色分布信息,图像通常被分成3×3块能够获得颜色像素点的空间分布信息。位于图像的中间部分是图像的主要内容,且占有较小区域的是周围的背景部分,因此这类均匀分割的方法并未突出显示图像中间的主体部分,在内部,它会损害其完整性,并且更有可能包含一些不重要的对象的颜色信息。分析了全局直方图和分块直方图的优缺点后,本文提出了一种新的检索方法,即对每个子块设置加权值,并且关键区域和中间部分的图像设置为具有大权重且面积大,具体方法如下:
(1)与人眼视觉的特点相结合,把实例图像M平均分成16个单元,如图2所示。
(2)图像的四角区域占的面积小,主体在中间部分,在设置区间权重时把中间部分的权重值设为较大使其面积大,使其为9块,从而检索精度和排序效果得到明显的提高,如下为设置各区间和权重:
(3)对每一个区间实行直方图提取,与该区间的权重相结合,取得整个图像的颜色特征向量,并以9*256的直方图矩阵的形式保存。
2.2 小波變换分析与纹理特征提取
(1)小波变换分析
传统的小波变换采用的是一种塔形的信号分解方式,如图3所示,图中、、代表不同层的低频信息,、代表不同层的高频信息。也就是说,信号在低频信道上连续分解。
树型小波变换是由Tianhomg Chang等人提出的,树小波变换可分两种类型:完全树型小波变换和不完全树型小波变换。当每层被分解时,不完全树型小波变换在每个频道中不被分解,而是选择性地分解。图4显示了变换分解过程的示意图。在一阶段小波变换后,四个子图像(四个节点)是由原始图像转换得来,并进行小波变换在每个子图像(节点)上获得四个子图像(四个子节点)。这样重复,由于这类分解形式类似于四叉树,因此被称为树型小波变换,图中的LL代表图像分解后的低频分量,LG、GL、GG代表三个不同方向高频量。
(2)纹理特征提取
3 基于遗传算法图像灰度、纹理特征权重值自适应获取(Adaptive acquisition of image grayscale and texture feature weights based on genetic algorithm)
3.1 自适应遗传算法
遗传算法是一种通用的全局搜索算法,它模仿生物进化过程,以找到最佳的问题解决方案。通过个体在问题域的适应度选取子类中个体,并在每一代用于从自然遗传学中的算子生成新一代个体的过程。该算法从初始种群开始,对每个个体的适应度函数进行评价,在所有个体中,有两个个体具有最高的适应值是从群体中选出的,这两个个体被称为父母,并使用交叉和变异算子,形成新个体。因此,一个群体的解决方案被采用并用于形成新的一代群体,一直重复直到满足一些条件。
特征融合算法在传统上需要手动调整检索系统中特征权重的值,多次反馈才能找到最佳权重值[8],为了使检索图像的精度更准确,本文引入遗传算法来获得权重的最优解,并自动分配各个特征的权重值。即首先从图像中提取颜色和纹理特征,利用HSV颜色空间提取颜色特征,即图像的色调直方图和值通道,然后提取纹理特征,如能量。
通过上述实验,在四类图像的检索中,分别比较了基于固定权重的多特征融合图像检索和基于自动赋值多特征融合图像检索,得到了不同的检索结果:(a)、(b)、(c)和(d)中的建筑物、非洲人、巴士和鲜花,基于自动赋值方法检索的比基于固定权重的图像检索更好。实验证明,本文提出的自动分配权重值方法可以根据用户提交的不同图像自动设置图像特征的最佳权重。根据对比实验,本文提出的方法基本上可以达到适合权重输出的理想检索结果。
4.2 实验数据对比
本文设计的图像检索系统使用了实验测试库中的四种类型的图像进行了实验。通过查准率、查全率和检索效率对实验结果进行了分析和评价。本文中的平均查准率(AP)和平均查全率(AR)是每类图像的查准率和查全率的平均值。表1显示了不同类型图像检索的平均查准率和平均查全率。
从表1可以看出,两种方法中基于遗传算法的自动赋值的图像检索方法获得的四种图像的平均查准率(AP)和平均查全率(AR)几乎都大于基于固定权重的图像检索方法的值。本文提出的基于遗传算法的图像多特征权重自动分配方法在图像内容匹配检索中具有较好的性能。同样,两种方法执行检索时间中基于遗传算法的运行时间略短于基于固定权重的运行时间,但差异不大,因此运行时间效率没有单独列出做讨论。
5 结论(Conclusion)
通过分析基于内容的图像检索技术,提出了一种基于遗传算法的图像多特征权重自动赋值的方法,通过上述实验,验证了该方法的有效性。基于自动权重分配遗传算法的图像检索优于基于固定权重的图像检索。具有自动权重分配的图像检索系统可以根据用户提交的待检测图像自动设置图像特征的最佳权重。基于固定权重的图像检索需要多次反馈才能找到最佳权重。基于遗传算法的图像多特征权重自动分配图像检索系统可以在一定程度上实现检索效果,但仍存在许多不足之处,还有很多地方需要进一步改进。检索系统仅使用颜色和纹理。结合基础物理特征进行检索。精度高或低,无法达到很好的检索效果。因此,系统需要结合形状基本特征或应用图像的高级语义特征,以提高检索效率。
参考文献(References)
[1] Van Hieu,V.,Huy,et al.A novel method normalized data and refine weights for combination features in content-based image retrieval[J].Vietnam.RD-ICT J.Res.Dev.Appl.Inf.Commun.Technol,2016,1(35):63-75.
[2] ZHOU Zhengzhong,ZHANG Liqing.Content-based image retrieval using iterative search[J].Neural Processing Letters,2018,47(3):907-919.
[3] Douik,A.,M.Abdellaoui,L.Kabbai.Content based image retrieval using local and global features descriptor[C].Advanced Technologies for Signal and Image Processing (ATSIP),2016.
[4] NISHANT S,VIPIN T.Content based image retrieval based on relative locations of multiple regions of interest using selective regions matching[J].Information Sciences,2014.259:212-224.
[5] SUDHIR,BABOO LDSS.An efficient CBIR technique with YUV color space and texture features[J].Computer Engineering and Intelligent Systems,2011,2(6):778-785.
[6] 張永库,李云峰,孙劲光,等.基于多特征融合的图像检索[J].计算机应用,2015,35(2):495-498.
[7] B.G.Prasad,K.K.Biswas,S.K.Gupta.Region-based image retrieval using integrated color,shape,and location index[J].Computer Vision and Image Understanding,2004(94):193-233.
[8] Young Deok Chun,Nam Chul Kim,Ick Hoon Jang.Content-Based Image Retrieval Using Multiresolution Color and Texture Features[J].IEEE Transaction on Multimedia,2008,10:1073-1084.
作者简介:
张晓丽(1994-),女,硕士生.研究领域:数字图像处理.
肖满生(1968-),男,硕士,教授.研究领域:智能信息处理及智能计算.本文通讯作者.
叶紫璇(1996-),女,硕士生.研究领域:数字图像处理.