基于用户反馈优化的图像检索系统
2017-07-29张宇
【摘 要】 基于内容的图像检索是图像检索研究领域的核心内容。与传统的依赖文字检索图像的方式不同,基于内容的图像检索是通过提取图像的特征信息并利用各种分析算法,学习算法将这些特征映射成反映图像本质的语义特征。本课题首先介绍了传统的图像处理技术和一些底层特征的提取方法,然后依据近似匹配的相关算法对底层特征进行分类,提出了根据用户选择满意样本来优化分类结果的思路。
【关键词】 图像检索 底层特征提取 近似匹配
一、需求分析
本文是通过提取图像底层特征,利用近似匹配算法建立分类模型,并由用户反馈优化分类样本已达到基于内容的图像检索。本系统要满足以下功能:加载目标图像,并可提取其基本特征信息;建立被用于检索的图像库和其对应的底层特征库;反馈给用户近似的检索结果及优化选项;能够对检索结果作出数字化评估。该系统在建立特征库后,通过算法的计算和用户的优化,找到语义程度上最满意的结果,以达到满足本课题的要求。
二、详细设计
本文在规划图像检索的过程中时,不仅需要提取出图像底层的多方面重要特征,还需要将这些特征转化成向量或数值,一方面方便记录特征信息以对其建立索引,使之便于处理和存储,另一方面使其適应近似匹配算法.以便利用这些特征为图像分类。在检索算法的设计中,如何利用用户的反馈,动态地优化特征的选择和分类的方法是本课题设计的核心。本部分分三个部分,分别介绍了底层特征的具体提取算法,近似匹配算法和反馈优化检索的设计过程。
2.1 图像颜色特征
颜色空间对于相关颜色以数字形式表示是一个很重要的成分,是数字化颜色理论的重要组成部分。RGB颜色空间是图像处理中最常用的颜色空间,它通过互相垂直的坐标轴表示一幅图像在红、绿、蓝三个色度上的分布情况。
2.2 图像纹理特征
方块编码(Block Truncation Coding),是一种快速有损图像压缩技术。其原理是将图像划分成若干子图像块,然后统计子图像块的平均值,将块中低于平均值的像素点置为0,高于平均值的点置为1,这样就将图像二值化,可以作为二电平输出,不但传输速度快,且重建时可保持均值。
2.3 近似匹配算法
在将图像的颜色、形状、纹理等底层特征提取出来并记录后,这些特征就变成向量的形式供近似匹配算法使用以达到比较图像间相似度的目的。不同的近似匹配算法计算出的相似结果也不同,对于不同的特征和相似性需求,需要采用多种近似匹配算法,再对结果评估后确定合适的一种。
三、系统测试
对于本软件的检索方式,分为综合检索和基于单一特征检索两种。其中单一特征检索是根据目标图像所提取出的一种特征向量(如灰度颜色直方图)与特征库中其他图像的同一特征向量做比较,找寻最近的图片,以此来反映该特征的检索能力;而综合检索则是将所有7个主要的底层特征按流程逐一检索,每一步采纳用户反馈的信息,最后综合所有特征向量,在反馈信息修正下进行检索,以此来融入用户反馈的内容达到精确检索的目的。对于检索的结果,本软件也提供了数值化的评估方式,通过多种数据具体地反映检索效果。
在CBIR的测试中,查全率(recall)和查准率(precision)是评价检索效果的主流方法。其中查全率表示检索到有效的图像占图像库中所有有效图像的比例,而查准率表示有效图像占所有返回结果的比例。定义如下
S检索到的有效图数目,u为检索结果中无效图的数目,v为在图像库中有效但未被检索到的图像数目。
四、结论
本课题设计并实现了基于用户反馈优化算法的图像检索系统,该系统能够将用户对检索结果的评价转化为检索方法的改进参数,使系统在交互过程中动态地达到图像精准检索的目的。在设计过程中,图像底层特征信息的提取和检索优化的算法是主要解决的问题。在实现的过程中既遇到了棘手的问题和难点,也学到了图像处理和分类的许多方法技巧。
【参考文献】
[1] 孙君顶.图像特征提取与检索技术[M].北京:电子工业出版社,2015.
[2] 王永明,王贵锦.图像局部不变性特征与描述[M].北京:国防工业出版社,2010.
作者简介:张宇(1993—),女,汉族,山东青岛人,管理学学士,单位:天津师范大学管理学院企业管理系,研究方向:企业管理。