基于内容的图像检索
2018-02-23曾倩倩张婷婷
曾倩倩 张婷婷
摘要 多媒体信息已经成为现代人们生活中不可或缺的一个部分,网络技术的介入功能也在不断地发展当中,网络上发布的信息也由单一的文本逐渐发展为由图像、视频、音频组成的综合信息。而且,随着自媒体时代的到来,各种移动终端的普及使得网络信息的增长呈现出一种指数型的增长。因此,怎么能在浩如烟海的数据库里达到一个快速、高效的检索图像已经越来越被人们所关注,也是我们现在需要着重研究的一个课题。本文主要研究在图像检索中图像的特征表示模型以及多信息融合的问题。
【关键词】图像检索 特征表示模型 多信息融合
1 图像检索的发展过程
在传统的图像管理方式来说,一般是以文本系统为主的一种检索。要是用户想要查询一副图像的时候,需要一个一个文件进行浏览才能够很好的找到所需要的图像。但是随着图像文件数量的大幅度增加,传统的查找方式显得太低效,因为以文件储存的方式對图像的使用和操作相对简单,这种以文件管理图像的方式一直到现在依然在使用。
在上世纪七十年代的时候,数据库的专家就已经着手研究怎么才能对图像数据以更好的方式更搞笑的方式管理,那个时候,主要方法是对一些图像进行一些标注或者建立一些关键词来进行更有效的检索,然后再将图像的储存路径和图像上面标注的关键词建立一种联系。八十年代,随着改革开放的进行,多媒体技术开始发展,在图像的获取、创作及其储存技术都得到了相当大的发展,但是对于图像信息的管理依然没有更多的重视。到了九十年代,计算机视觉技术和www的发展开始壮大起来,网络上的多媒体信息的产生、创作、储存、传输以及访问量都呈现一个指数上涨的趋势,大部分都是图像信息。因此,只是简单的对图像加入一些标注和关键词已经远远不够了,为了突破传统检索的很多弊端,很多专家开始把研究方向改为在图像中包含的信息作为图像索引。也就是基于图像内容的图像检索方法。
因此,尽管基于内容的图像检索在近年来获得了相当大的发展,但是依然有着很多的关键性的问题迟迟得不到很好的解决,限制着图像检索的性能。
2 基于文本的图像检索的问题
在前面已经提到,早期的时候,图像检索大多数都是以关键词和自由文本的方式来进行检索,在这样的方式下,文本标注的质量以及准确度直接影响着后续图像的检索的高效性。除此之外,因为图像的涉及范围比较广泛,现有的技术根本达不到对图像自动生成文本描述,因此大多数的TBIR系统依然采用的是人工标注,这样的技术主要存在着以下的问题:
(1)工作量大。随着自媒体时代的发展,每个人都是一个图片的形成终端,因此网络上图片的数量较之以前增长迅速,用以前人工标注的方式对每隔图片进行标注相应的文本几乎成了一项不可能完成的工作,这样的繁琐以及耗时,无疑成为了现在的最主要的问题,但是没有进行文本标注的图片是不能被检索出来,这就使得现有的技术形成了一个相当大的矛盾。
(2)不同的人对一幅图像有着完全不同的理解,即使是同一个人,换一个工作环境或者心态,也会造成对一幅图像理解的差异,这就使得在文本标注上的个人主观性,与工作人员所经历的事情以及当时环境有着很大的影响,不利于后续的图像检索的进行。
(3)图像所包含的信息是全方位的,所包含的信息也是巨大的,然而文本标注毕竟有限,不能起到一个很好的标注作用,不能起到检索的关键作用。
(4)因为图片的复杂性以及世界性,也就伴随着语言上的差异,世界各地的人用不同的语言上传的图像可能不能被其他语种的人很好的检索,这就给索引的建立以及后续文本的标注和匹配造成了很大的障碍。
3 基于内容图像检索的研究现状
在图像检索技术发展了这么多年的基础上,基于内容的图像检索技术已经去的了不小的进步,各种新方法层出不穷。有一些著名的学术期刊经常会发表文章介绍图像技术的发展,而且这些新技术在应用方面已经去的了很有效的成果,也得到了社会上的广泛关注和支持。很多大学现在都在开展关于这方面的研究,取得了很大的效果。
尽管如此,基于内容图像的检索依然有较多的关键问题需要我们大力关注。现不说其他各种特征提取的方法,单单从基于内容的图像检索的发展方向上来说,本来我们是希望根据图像的内容来判定图像之间的相似的程度来实现我们最开始想要的图像检索,这里面我们所说的内容是指人们对图像的普遍理解,而不只是图像本身所包含的视觉特征,在实际情况中,传统意义上的视觉特征并不能很好的表达图像索要表达出来的东西。所以,这些年来,很多专家开始研究对高层的基于语义的图像检索技术。一幅图像所包含的最高层语义应该是它表现出来的情感特征以及感性的信息,这就随之发展出来了基于感性内容的图像检索技术。现在发展的方向就是多媒体的感性信息处理,这就又给人们对图像信息的处理提出了一个新的挑战领域。
3.1 基于内容的图像检索的特点
3.1.1 从图像的内容中提取信息线索
基于图像所包含内容的检索突破了以前基于关键词以及标注检索的局限性,现在的直接对图像进行分析处理并且提取其特征的方式,让我们在检索图像中更好的接近我们想要找到的图像。
3.1.2 提取图像特征的方法多种多样
我们现在对图像的特征提取可以是颜色、形状、纹理、轮廓、空间结构等各种特征,大大丰富了传统方式下对图像提取的准确度,让人们可以能在有限的时间内更高效的提取出图像的特征,找到自己想要的图像。
3.1.3 人机交互进行检索
现在的图像多种多样,纷繁杂乱,使得人们对于大量的图像不能进行一个很好的辨识,而如果计算机可以把这些特征都已经分析完整,就可以让人们在检索图像中更快更精确的饿着到自己想要的图像,大大提高图像的检索效率。因此,在使用基于内容的图像检索系统时,人与计算机是在互相配合的情况下进行检索的,这就是人机交互作用的优点所在。
3.1.4 基于内容的图像检索仅仅是近似匹配
在我们检索的过程当中,我们找到的图像知识一种相似度交稿的近似匹配,我们还需要一步一步的逐步求精,不断的缩小图像的范围,才能更好的找到自己想要找的图像。
3.2 关于CBIR的研究发展的方向
3.2.1 特征提取
一副图像的主要特征可以包括两个方面,一方面是图像的低层特征,另一方面是图像的语义特征。底层特征主要包括的内容是图像的颜色、背景、形状、轮廓、纹理以及空间结构等基础的特征,这些基本特征完全可以通过计算机自动进行或者是人机交互的方式完成。图像的语义特征指的是对图像内容的抽象特征,是一种定性特征。语义特征的提取不能直视依靠计算机完成,因为计算进不能进行人的思维的阐述,所以,语义特征的提取一般是通过人工或者是人机交互的方式来完成。在CBIR进行检索的时候,可以在不用的应用领域做出不同的特征或者特征组合进行检索,比如,在卫星系统当中,对于图像的纹理特征提取是最为重要的,而在商标的配准系统中,商标的形狀以及颜色构成特征是最为重要的。在图去玩这些主要特征之后,图像检索的主要任务就变成衡量图像之间的相似度,然后完成整个图像的检索。
3.2.2 有效检索
怎么样才能有效的完成一副图像的检索,首先解决的就是有效储存的问题以及选取合适的相似度的问题。对于一些图像的特征,他们之间有可能完全没有任何的顺序存在,也可能具有多重的相关特征,因此,在图像的检索问题上,需要选择一种合适的数据结构模型使得图像检索变得高效、精准。目前,我们在图像检索中常用的数据结构模型有:k-d树,R-树及变种等等。在这种数据结构模型中,每一种都有着自己的优点及其缺点,因此我们在图像检索的过程中,需要首先考虑我们要提取的图像的特征。与此同时,合理的相似度量的方法也是进行有效图像检索的关键所在,现在常用的相似度量方式主要有以下几种:欧氏距离、城区距离、二次式距离、直方图交等。不同的相似肚量方法也有着自己的优缺点,有自己的使用范围,所以在图像检索中的选择也需要做出一定的选择才能达到图像检索的有效性。
3.2.3 用户接口
图像检索的最后是要交付于用户的,所以在图像的检索系统中,用户接口也是一个相当重要的一环,他起到了一个把用户和检索系统连接起来的作用。用户可以通过这个接口选一种合适自己检索的查询机制来检索结果。
4 小结
本文结合了这么多年类的图像检索的发展经验,对图像检索现有的问题提出了一些自己的看法,关于图像检索的发展和现在的检索所需要完善的地方做出了一些分析。但是由于本人的学识及其阅历有限,不能够分析的面面俱到,希望能够以此文引起广大学者以及有关专家的关注。
参考文献
[1]张贝贝,基于内容的图像检索若干关键问题研究[D].辽宁师范大学,2013.
[2]雷亮.互联网环境下图像检索若干问题研究[D].重庆大学,2011.
[3]李勇,基于内容的图像检索技术研究[D].吉林大学,2009.
[4]王禹,基于内容的图像检索技术研究[D].中国人民解放军信息工程大学,2003.
[5]唐昌华,一种基于内容的图像检索方法的研究[D],东北师范大学,2007.