内容图像检索的特征及策略分析
2016-09-05孙亮
孙亮
(兰州文理学院 数字媒体学院,甘肃 兰州 730000)
内容图像检索的特征及策略分析
孙亮*
(兰州文理学院数字媒体学院,甘肃兰州730000)
在我国图像检索技术不断发展的当下,基于内容的图像检索实现了较快的发展,且已经逐渐取代了传统基于文本的图像检索方式,通过对图像所具有的视觉信息特征进行提取和利用能够直接建立索引,实现检索。基于此,本文首先对内容图像检索进行了概述,然后分别对内容图像检索的特征和策略进行了分析研究,为内容图像检索在各个行业领域的应用提供参考借鉴。
内容;图像检索;特征;策略
为了满足计算机用户对图像数据信息的实际需求,越来越多的搜索引擎都相继提供了图像检索服务,与传统机遇文本的检索技术相比较而言,基于内容的图像检索技术可以对图像内容实现直接的分析和特征提取,以其为根据建立索引同时进行检索,打破了传统检索技术的局限性,具有快速和高效的特点[1],在众多行业领域中实现了广泛的应用。加大对内容图像检索技术的研究对于丰富信息处理理论、推动图像技术发展和解决信息膨胀问题等方面具有十分重要的现实意义。
1 图像数据特征
图像数据,指的是用数值所表示的各像素的灰度值的集合,图像数据的特征表示是建立在图像理解的基础之上的,其特征主要包括了以下几点:
其一,颜色特征:颜色是图像数据最为基本的一个特征,主要包括了平均亮度、颜色直方图和主导颜色等,是对图像数据进行有效区分和判断的一个重要参考;通常情况下,不同的图像数据基本上不会出现颜色特征相同的现象[2]。
其二,纹理特征:纹理指的是图像数据在局部上所具有的不规则、宏观以及有规律的一种重要特征,主要包括了方向性、粗糙性和对比度等,一般对纹理特征进行准确描述的难度较大,是纹理特征索引对相关图像数据进行提取的基础依据[3]。
其三,轮廓特征:对图像数据的轮廓特征进行提取需要依靠边缘检出,将检出的边缘通过连接或编组而形成具有意义的图像事件,例如直线、曲线和各种轮廓线等,其同时也是图像理解工作中的一项基本内容。
2 内容图像检索的特征分析
2.1内容图像检索技术理论
基于内容的图像检索技术,指的是利用传统数据库对相关文字信息进行存储和管理之外,在对图像库进行建立的过程当中,将从图像中所提取出来的目标特征,如颜色、形状和纹理等,将其和与之相对应的特征向量同时存储在图像库当中,在对图像数据进行检索和查询的时候,采取图形表达的方式,通过提取图形体征向量来实现相似度的匹配,从而得到所需要的图像数据。内容图像检索技术实现了传统模式识别技术、现代多媒体人机交互技术和其他高科技技术之间的有机结合,在图像存储和管理中的应用具有较高的价值[4]。
2.2内容图像检索技术的特征
内容图像检索技术实际上是根据媒体和媒体对象的内容以及其与上下文之间所具有的联系为基础而进行的检索。内容图像检索技术具有以下几方面的特征:
(1)从图像数据中直接提取信息线索:内容图像检索打破了传统以文本为基础的检索方法的固有框架,能够对图像内容进行直接的分析,对其特征和语义实现直接的提取,并将其作为依据实现对索引的建立,有效的避免了因人工描述主观性而导致的检索失败[5]。
(2)内容图像检索是近似匹配寻优:与常规数据库检索相区别的是,由于图像数据内容具有较强的复杂性,内容图像检索对图像数据内容的表示并不是一种精确性的描述,而是通过相似性匹配的方法来实现逐步的精准,对查询结果的范围予以不断的缩小,直至对目标对象实现定位。
(3)大型数据库中的快速检索:由于实际的图像数据库中的数据量十分巨大,且图像数据具有海量、高维以及非结构性等特点,因此要求内容图像检索技术也能够与常规的信息检索技术相同,在大型数据库当中实现快速和准确的检索。
(4)具有较强的交互性:内容图像检索实现了用户主动的参与到检索的过程当中,对信息和意图实现主动提供,并对查询结果的获取具有一定的监督作用。
(5)基于特定领域知识:内容图像检索在现阶段都是针对特定的领域和需求而实现应用的,相关系统的开发往往是相对独立的,例如图书资源的检索、教育信息的检索和交通监控安全系统等。
3 内容图像检索的策略研究
3.1内容图像检索系统
以内容为基础的图像检索通常情况下会应用到模式识别、图像处理、数据库、机器学习和人工智能等模型和方法,内容图像检索系统实际上是介于用户和图像数据库二者之间的一种信息交互、查询和服务系统,内容图像检索系统的基本架构如图1所示,主要包括了查询模块、匹配模块、描述模块、提取模块和验证模块。
图1 内容图像检索系统架构示意图
在内容图像检索系统当中,查询模块主要是为了满足用户对相关数据进行查询和检索的实际需求,而提供的多种查询手段。描述模块的主要作用是将用户的实际需求进行转化,从而实现对图像内容的特征进行表达和描述。匹配模块的功能就是将图像的特征描述作为基础,按照设定的测度在图像数据库中进行搜索、匹配和排序。提取模块则是将匹配排序的结果作为依据,将图像库中所有满足条件的图像呈现给用户,供其进行选择和使用。验证模块的实际作用则是针对所提取出来的图像与用户的实际需求之间的符合情况进行验证;当验证结果为不满意的时候,通过对查询条件的修改而重新进行检索。
3.2内容图像检索方法
3.2.1特征检索方法
(1)颜色。颜色对于图像检索和目标识别来说是一种极为重要的视觉性线索,因为颜色对于尺度和方向而言具有旋转不变的特点,因此颜色特征在图像分类中具有十分显著的应用效果。以颜色为基础的图像检索方法的实现是较为容易的,因此在内容图像检索中实现了较为广泛的应用。常用的颜色图像检索方法主要包括了以下几种。
颜色直方图:颜色直方图是应用最为简单和频繁的一种颜色特征,所反映的是图像颜色的组成和分布,也就是有多少种颜色,不同颜色出现的频率等,能够对图像中颜色的全局分布特点实现简单的描述,具有尺度、平移和旋转不变色的特点[6]。颜色直方图检索方法的中心思想是对颜色空间实现适合性的选择,同时应用量化方法对不同颜色实现量化,对量化后的通道在整幅图像中的占据比重进行统计。
颜色相关图:颜色相关图对颜色跟随距离变换的空间关系实现了详细的描述,也就意味着颜色相关图一方面能够对图像的颜色信息予以统计,另一方面还能对不同颜色之间的空间关系予以表达。颜色相关图图像检索方法的核心思想是利用颜色对相对于距离的分布来实现对图像信息的描述。这种方法不仅体现了不同颜色之间的空间相关性,而且还体现了总体像素和局部像素分布的相关性,具有易计算、特征范围小的优点,与颜色直方图检索方法相比,其实际的检索效率更高[7]。
颜色矩:颜色矩图像检索方法的主要思想是在颜色直方图的基础上,对每种颜色通道的均值、方差和偏差进行计算,并使用这些统计信息来代替颜色的分布情况,从而描述出颜色特征,包括了一阶矩(均值)、二阶矩(方差)和三阶矩(斜度)等;且颜色矩图像检索方法不需要对颜色空间进行量化,其特征向量的维数较低。
3.2.2纹理
纹理是一种和物体的表面材质具有相关性的图像特征,是内容图像检索系统当中的一种重要方法。由于不同材料的纹理之间是相互区别的,因此针对不同的材料通常需要设计出不同的纹理分析方法,一般情况下是将典型不同纹理的图像进行分类,从中确定某一种应用中不同图像所具有的纹理特征。纹理分析是计算机视觉研究领域中的一项重要内容,其方法主要包括了结构方法和统计方法两大类。其中的结构方法是假设图像由较小的纹理基元排列而成的,其所应用的是句法分析法,通常情况下仅适用于规则的结构纹理;统计方法则又包括了传统统计方法、以模型为基础的方法以及以频谱分析为基础的方法[8]。
3.2.3形状
形状是内容图像检索中较为常用的一种特征,由于用户能够根据图像和物体的形状来实现对目标的识别,因此形状是物体刻画中最为基础的一种本质特征。当前,对形状特征实现描述的方法主要包括了以区域为基础的方法和以边缘为基础的方法。其中,基于区域的形状特征的实现是对区域内部中的灰度分布信息予以利用,其核心思想是采取分割法对图像中感兴趣的区域予以提取,并以该区域中像素的颜色分布为依据对图像的特征实现提取,通常适用于区域内颜色分布较为均匀的图像检索。基于边缘的方法,顾名思义,就是对图像的边缘信息实现利用,在完成边缘信息提取的基础之上,采用偏心率、周长和兴趣点等对物体的形状予以描述,通常适用于边缘处较为清晰且容易实现获取的图像检索[9]。
3.3高维索引方法
3.3.1维度压缩
维度压缩的实现有KL变换和列向聚类这两种方法。KL 变换方法及其变种方法在人脸识别、特征图像和信息分析等领域中已经实现了较为广泛的应用。相关的研究证实绝大部分的实际图像集,也就是视觉特征向量,都能够较好的实现维度压缩,且不会对检索质量产生不利的影响。图像检索属于动态性系统,在图像集合当中会不断的增加新的内容,而KL变换方法具有较强的索引更新功能。另外,列向聚类也可以实现维度压缩,其技术已经在图像信息检索中实现了较好的应用。
3.3.2多维索引
多维索引方法在计算几何、数据库和模式识别这三个领域当中实现了广泛的应用,其中最具有代表性的技术包括了K—d树、R树、R+树、R*树和四叉树等[10]。地理信息系统和计算机辅助设计系统的发展对于空间索引提出了越来越高的要求,且图像检索也呈现出新的特征和现实需求,因此多维索引方法的重点研究内容为如何标识和改进与表达高维度特征向量相适合的索引技术,而聚类法和神经网络法通常被认为是具有一定发展前景的方法。
4 结束语
通过以上对内容图像检索相关问题的分析和研究,共总结出以下几点结论:
(1)图像是对三维图像的一种二维投影,其在形成的过程当中会受到多种因素的影响,如摄影质量、环境光特性和目标反射特性等;图像数据的特征主要包括了颜色特征、纹理特征和轮廓特征等,使得图像理解面临着巨大数据处理量的实际问题。
(2)内容图像检索技术实际上是在建立图像库的过程中,从图像中对目标特征予以提取,将其和相对应的特征向量存入在图像库当中,在对其进行检索的时候,只需要提取图像特征向量进行相似度的匹配,即可得到图像检索的结果。
(3)内容图像检索的特征主要体现在可以直接从图像内容中提取信息、方式近似匹配寻优、大型数据库中的实时检索、交互性较强和以特定领域知识为基础等方面。
(4)内容图像检索是建立在对物体图像特征信息的识别、处理以及图像数据库的基础之上,对特征提取的质量会对匹配结果产生直接的影响,因此在今后还需要在技术支持方面加以努力。
[1]李长隆.基于内容的图像检索技术在信息化建设中的应用[J].科技展望,2015,25(25):7.
[2]王波,陶佰睿,李敬有,等.面向达斡尔族语言保护传承的内容图像检索技术应用研究[J].科技通报,2014(11):225-229.
[3]吴勇,罗腾元,王美珍,等.可定位图像采集与检索方法研究[J].计算机工程,2014(7):217-222.
[4]余明艳,丘衍航,刘海员,等.内容图像检索IALA算法的设计与实现[J].科技通报,2013,29(2):103-105.
[5]李兰,刘洋.基于内容的小波变换图像检索方法[J].计算机科学,2015,42(2):306-310.
[6]丁学东,刘渊,谢振平,等.增量学习语义属性的图像内容检索系统增强[J].计算机应用研究,2014,31(1):273-276.
[7]王玉兰,王剑雄,赵翊君,等.基于图像内容的检索技术的研究[J].河北建筑工程学院学报,2014,32(4):103-106.
[8]邵振峰,李德仁,朱先强. 基于旋转不变纹理特征的多尺度多方向图像渐进检索[J]. 中国科学:信息科学,2011(3):283-296.
[9]戴芹,刘建波,刘士彬. 综合多特征遥感图像智能检索方法的概念设计[J]. 地球信息科学学报,2011(3):401-408.
[10]宋广为,刘程军,王庆鹏,等.一种新的基于本体论描述的内容图像检索模型[J]. 信息与控制,2012(3):319-325.
(责任编辑陈葵晞)
孙亮,男,河北唐山人。 副教授,硕士。研究方向:多媒体技术,网络技术,数据挖掘。
TP391.41
A
2095-4859(2016)02-0159-04