一种基于形状和遗传算法的图像检索方法
2014-05-30吴晓燕
吴晓燕
摘要:人们在图像检索的过程中就希望能够简便、快速、有效的检索出目标图像,从而顺利达到解决问题的目的。但是随着互联网与多媒体技术的不断发展,数字图像数据库已存储了大量的图像资源,因而这给人们快速、准确寻找到所需图像并有效利用图像资源出了一个大难题。面对这一情况,研究者们提出了一种基于遗传算法的内容图像检索方法,利用其最优群体搜索的优势大大提高与缩短了图像检索的精度与时间。在此,该文将着重分析一种基于形状和遗传算法的图像检索方法。
关键词:遗传算法;图像检索;形状;内容;方法
中图分类号:TP312 文献标识码:A 文章编号:1009-3044(2014)09-2026-02
当今是一个快餐式消费的时代,人们在高新科技的支持下开始接触到大量的数字图像信息,通过这些丰富的图像资源来了解世界以及解决工作需求。但是,面对存储量极大的数字图像数据库,这给人们快速、准确寻找到所需图像并有效利用图像资源出了一个大难题,为此人们不懈的研究出多种图像检索方法以攻克这一难题。据调查,当前主要以文本方式的图像检索系统来满足人们对图像检索的需求,这种图像检索系统是建立在图像文本关键词索引基础上,以相关数据库技术做辅助来实现,简单易行,较为成功的案例有“谷歌图像搜索引擎”。不过这种基于文本的图像检索方法存在局限性,因图像文本信息具有多义性,个人对图像关键词的理解有偏差,所以这在一定程度上会影响检索效果的准确性。
对此,近些年的图像检索方法开始趋向于以内容为基准的思路,通过提取图像特征(包括纹理、色彩、形状、空间关系等)并建立图像特征矢量库,如此人们就可以通过这种方法在图像数据库中检索出匹配图像。只是这种基于内容的图像检索方法的有效性取决于图像的特征提取及匹配选择,一般图像的特征提取与匹配选择使用一种有效的检索方法从大量的图像特征中提出去最有效的特征。但由于现实中存储在特征库中的图像多以向量形式为主,可能出现几十维、上百维的特征向量存储,这不利于用户检索出最优特征的图像。为解决这一不足,该文将尝试利用形状和遗传算法来优化图像的特征提取,进而方便用户快速检索出最优匹配的图像。
1 遗传算法的编码过程
在基于内容的图像检索方法中运用遗传算法能够有效提高检索效果的准确性,利于满足用户对图像检索提出的快速、准确等高要求。而在检索过程中需要历经5大步骤来实现:①首先在图像检索系统的图像库中随机抽取大于0幅的S幅图像,这些图像将成为第1代样本群体,以交互式遗传算法的标准向用户呈现样本;②系统根据用户搜索的对象需求来提取出每幅图像,并由用户来评价第1代样本群体中的图像;③这时,上一步骤中用户对图像的评价是系统计算出每幅图像对应染色体适应度值的主要依据,而后通过选择、交叉、变异等系列程序对第1代染色体图像群体进行遗传操作,以便促成新一代染色体群体的生成;④系统依据新一代群体的染色体状况从图像库中提取出数目为S的图像,进而向用户呈现交互式遗传算法的新一代图像样本群体;⑤用户在新一代样本群体中寻找所需图像,若找到匹配图像即可结束检索,反之回到步骤②继续操作。不过,在交互式遗传算法图像染色体的编码过程中,图像问题的解需由域空间转变为遗传算法空间,所以需要兼顾重视到图像的物理特征及相关遗传操作。
1.1 图像颜色特征的抽取
图像作为一种以视觉特征为主的表现载体,颜色特征是最容易简单、分辨的视觉特征之一,其独立在图像其他特征(如尺寸、方向等)之外,不易受其他因素的干扰。因此,在图像检索方法中以颜色特征为基准,将图像RGB颜色值作为物理特征的首选,这是基于内容的图像检索方法的一大特色。如以图像I为例,分辨率为[m×n],像素p的位置处于[(i, j)],其中(0[≤i 不过,若是在图像特征表述中直接使用这些数据并将其作为图像检索过程的话就会产生两方面的问题:①由于图像存在分辨率、颜色特征向量长度的不同,在遗传算法过程中图像染色体通过对应图像的特征向量元素表示,特征向量的长度不同就会影响染色体长度的不同,这会令遗传算法变得复杂化,且不易于控制;②鉴于一般图像的分辨率较大,这会导致在图像特征分析、抽取及遗传算法实践过程中消耗系统较多的时空资源,所以在此之前需要预先处理图像的原始特征数据。当然,通过图像颜色特征的抽取实验可得出一个经验,就是鉴于人们大多关注图像的大体特征及明显特点,因而在图像检索领域中不需要考虑每个像素的特征值,可以根据具体情况来决定。 1.2 图像形状特征的抽取 在进行图像形状特征的实际抽取过程中,人们常采用关键点特征的方式来描述图像的轮廓形状,不过这种方式常常容易忽略到关键点之间轮廓曲线上的特征。因此,正确的图像形状特征抽取需要利用关键点来分割图像形状的轮廓,对于轮廓段的特征提取只需关注关键点间轮廓段上的四个结构系数即可,就是线性、对称性、方向性、归一化长度。 如图1,这是一个图像的轮廓分隔段情况,将曲线AMB的中点用M来表示,AB的中点用P来表示,那么该图像关键点轮廓段上的四个结构系数就可以如下定义:①线段AB的长度与分隔段曲线AMB长度的比值范围是[0,1],是线性系数(q)的定义;②∠MAB与∠MBA两角的差值范围是[-π,π],是对称性(e)的定义;③∠MPA值的大小范围是[0,2π],是方向性(g)的定义;④分隔段曲线AMB与整个轮廓线长度的比值范围是[0,1],是归一化长度系数(P)的定义。通过这四个结构系数不仅将图像关键点形状特征清晰描述,而且还将分隔段曲线上的结构特征描述得十分详细清楚。
因此,在对一幅图像进行形状特征抽取时,首先需要提取N个关键点,进而划分出图像的N段曲线,通过上述方式计算的得出图像的结构系数M,且(M=4N)。于是,每个曲线段都有e、g、p、q四个形状参数,在提取图像矩特征、形状特征的过程中就可得出一组图像的特征向量,即[f=[?1,?2,?3,?4,?5,?6,?7,ei,gi,pi,qi];i=1,...,N]。
1.3 基于遗传算法的特征提取
实际上,运用遗传算法来提取图像特征的原理与图像颜色特征抽取、图像形状特征抽取的原理相似。首先,假设在一幅图像的轮廓上选取8个关键点,那么这幅图像的轮廓就由8个曲线段组成,按每个曲线段有4个形状参数来计算,这幅图像共有32个形状参数,通过上述图像特征向量公式可得出:[f=[?1,?2,?3,?4,?5,?6,?7,ei,gi,pi,qi];i=1,...,8]。于是乎,这幅图像共有39个特征被提取而出,但要在这么多的图像特征向量中检索出最优向量难度非常大,因而可以使用遗传算法来检索出一组最优的特征向量来描述图像。遗传算法的是研究者借鉴达尔文生物进化论而提出的一种科学方法,在进行高维空间内的图像特征向量空间搜索时,可以模拟自然界强者生存的进化演变原理来得到最优检索结果,从而提高图像检索的效率与准确性。
一般情况下,GA(遗传算法,genetic algorithm)可以定义为一个8元组,即[GA=(C,E,PO,M,Φ,Γ,Ψ,T)]。若在基于形状的遗传算法的图像检索中应用GA进行参数最优选取时,主要分为9大步骤:①进化代数以T来表示,取T=0;②编码图像特征中的[μpq](中心矩参数)、[f](形状参数);③以P(T)表示初始种群,通过随机选择来获得;④个体的适应度函数值E可使用样本测试集来测试选择结果,进而得出非准确率即为E;⑤对GA条件进行判别,若条件满足可终止计算步骤,并直接进行第⑨步骤的操作;⑥取T=T+1;⑦应用选择算子在[P(T-1)]中选择[P(T)];⑧运用交叉、变异来操作[P(T)],而后转到第④步骤进行操作;⑨将最佳的[μpq](中心矩参数)、[f](形状参数)输出,而后测试集中的样本,最终取得图像的最佳特征。
2 实验结果与仿真
通过上述形状和遗传算法的图像检索过程分析,对此我们可以在系统中开展仿真实验,从而检验加入了形状和遗传算法的内容图像检索方法的具体实验结果。在此,该文将在Corel图像库中随机提取出1206幅图像进行仿真实验,这些图像是一个测试集,在实验之前已将所有图像的特征向量计算而出,而后运用不同的计算方法来检索这一测试集中的所有图像,检索次数达到121次。同时,以PSO算法的检索结果为例,将其运用遗传算法得出的检索结果进行对比,进而简洁、清晰的比较出两种算法的优异性。