一种改进的显著性区域提取模型
2012-08-10邳艳芹
于 明,邳艳芹
(河北工业大学信息工程学院,天津 300401)
责任编辑:任健男
在视觉上,人们总是能迅速地把目光集中在自己感兴趣的方面。显著区域是图像中最能引起人们的兴趣且是最能表现图像内容的区域[1]。图像的显著区域提取即寻找图像中可能引起人眼视觉关注的区域。虽然人们的感兴趣区域是相当主观的,但由于人的视觉系统和注意机制存在着共性,使得图像中的一些区域总能对人眼产生刺激。
视觉关注是人类视觉系统捕获外界场景中有意义部分的一种机制。对于视觉注意机制,目前大部分的研究是如何建立自底向上的模型,其中最具影响力的是Itti和Koch等人提出的Saliency模型[2],利用人的视觉感受野、侧抑制神经网络模拟了人的视觉注意力机制。但该模型最终的显著区域的范围是固定的形状,不利于后期的处理并且存在漏检测和检测顺序不合乎人类视觉注意特征的情况。
本文借鉴Itti模型算法的思想提出一种改进的模型算法,该模型采用Achanta等人[3]提出的频域调和(Frequency-tuned)的显著性检测方法来提取图像的颜色特征,避免出现显著区域反转现象;加入形状低层特征提取,采用倒数函数来代替方向提取时的Gabor函数滤波,以达到改善显著图的目的。
1 Itti模型的原理
Itti模型分为显著图的计算和注意区域的选择与转移两大部分。图1为Itti算法的模型框图。该模型分别选取了3个低层的属性作为图像的特征即图像的亮度、颜色和方向。整个过程可叙述如下:首先将输入的图像分解为9层高斯金字塔形成多尺度的图像,再用函数滤波器依次滤波各个尺度的图像,然后应用中央—周边算子算法得到各个特征的特征图,通过跨尺度合并以及归一化计算得到三个特征的显著图,将得到的三幅显著图进行线性融合得到总的显著图,最后通过神经网络胜者取全的方法得到注意区域。
2 改进的Itti模型
文献[4]中在生成方向特征函数时提到了一种利用倒数函数来代替Gabor特征函数,显著目标投影的显著度明显的低于显著目标自身的显著度,在很大程度上减少了对显著目标误判的可能,取得了较好的效果。文献[3]中提出了频域调和的显著性检测方法,用所得到的图像的高频信息来作为图像的显著信息。人眼对物体的轮廓形状信息会有较强的感知能力,即便是在根据颜色、亮度和方向信息对物体进行注意后,轮廓也能提供重要的特征信息,它是帮助判断物体整体形态的重要依据[5]。本文在此基础上借鉴Itti模型的思想,提出了一种改进的Itti模型的方法。该模型具体框图如图2所示。
2.1 视觉特征的提取
想要更加全面的描述一幅自然图像,就要针对其各个方面的视觉属性选择多种简单图像特征。本文基于Itti模型[2]的基本方法提取图像的颜色、亮度、方向和形状4个低层特征来获得图像各个特征的特征图。
2.1.1 亮度特征的提取
设r(t),g(t)和b(t)分别表示原始图像中的红色、绿色和蓝色通道,其中t表示图像的尺度,将原始图像的尺度设置为0,则亮度特征图的计算方法公式为
高斯金字塔的结构非常形象准确地模拟了人眼的多分辨特性。采用中央—周边算法跨尺度合并计算不同分辨力图像之间的差来提取特征图。亮度特征计算为
式中:c是非线性尺度空间中表示的高分辨力的尺度因子,s是对应的低分辨力下的尺度,c∈{2,3,4},s=c+δ,δ∈{3,4}。将上述特征图进行合并得到亮度显著图,公式为
式中:⊕表示多个尺度下相应的特征显著图经线性插值调整到同一大小后相加,N为分别将各个显著图的显著值标准归一化到(0,1)区间。
2.1.2 方向特征的提取
Itti模型中方向特征是对输入图像采用Gabor滤波后得到 O(σ,θ),θ∈ {0°,45°,90°,135°},经过大量实验证明发现该方法产生的方向显著图不能准确地突出整个显著性目标而仅仅突出了显著目标的边缘。借鉴文献[5]的思想,本文利用倒数函数替代Gabor函数来提取方向特征,倒数函数表达式为
参照文献[5]中的参数设置,将倒数滤波函数中的参数设置为:γ=1,δ=2.33(经验值)。
方向特征是对输入的图像采用上述倒数函数滤波后得到 O(σ,θ),其中 θ∈ {0°,45°,90°,135°},方向特征计算为
将上述特征图进行合并,得到方向显著图公式为
从图3中可以看出,使用倒数函数生成的方向显著图可以有效地补充原方法生成的方向显著图中显著目标内部空虚的现象。
2.1.3 颜色特征的提取
显著区域即为变化强烈的区域,也就是频谱中的高频成分。由于Itti模型在提取颜色特征时可能会出现显著区域反转现象,因此可以通过过滤掉图像中的低频部分,提取其高频部分作为图像的显著区域。
这里采用Achanta等人[3]提出的频域调和的显著性检测方法。先将颜色变化到均匀的CIELab颜色空间,再对变换后的图像进行高斯低通滤波,最后求原图与滤波后的图像的差的平方,即为颜色的显著图,记为
图3 方向图
式中:Iu为像素值的算术平均;Iwhc为原始图像经过高斯模糊得到的。
从图4中可以看出,利用频域调和的方法得到的颜色显著图,省去了Itti算法中的中央—周边算法,该算法得到的颜色显著图中块效应有所减少,并且能较好地避免显著区域反转现象。
图4 颜色图
2.1.4 形状特征的提取
本文在Itti模型的基础上加入了轮廓特征提取,添加形状通道的目的是用来提取目标物体的整体轮廓。目前虽然有Canny,Sobel以及Roberts等算子用来提取图像边缘,但提取结果有的过于精细有的又过于粗略,容易对最终结果造成干扰。本文借鉴文献[5]采用Sobel算子进行边缘提取。其形状特征计算为
将上述特征图进行合并得到形状显著图,公式为
2.2 图像特征图的合并
在各特征图中的显著信息都是互补的,对通过计算得到的4个特征图相继提取出了不同类型的显著图,将它们用线性方法结合起来,适应不同类型图像的显著区域提取。将4个显著图进行线性相加得到
3 实验结果分析
本文在 Intel Pentium 1.6 GHz、内存1 Gbyte、MATLAB 7.6.0(R2008a)的实验环境下进行。采用文献[5]应用的图像库中的图像,选择几幅场景图为本文的实验图。图5为两种模型提取的效果对比图。图5a表示原始图像,图5b表示利用Itti得到的显著图,图5c表示用本文的模型方法得到的显著图。从图5可以看到,本文改进的模型算法所得到的显著图较为清晰,块效应也有所降低且显著区域也较为突出,本文的模型算法要优于经典的Itti模型算法。
图5 两种模型提取的显著图
4 结论
本文基于Itti的模型算法提出了改进的模型算法。由于目标物体的轮廓能够提供重要的信息,因此加入了边缘特征的提取;在方向特征图提取时引入倒数函数来代替Gabor函数,这样可以改善采用Gabor函数提取方向特征图时带来的显著目标内部空虚的现象。在颜色特征图提取上采用了频域调和的显著性检测方法,这样不仅简化了程序、提高了效率,更避免了显著区域反转现象的出现。综合分析得知,本文算法较Itti模型算法在效率上有所提高,精度上更加准确。但同时也存在明显的不足:当图像较小、图像中的显著目标也较小时,提取出来的显著目标的轮廓不是很清晰,且模型算法的效率也不高。
[1]王国营,梁春迎.一种图像显著区域的提取方法[J].计算机应用,2010,30(6):1619-1621.
[2] ITTI L,KOUCH C.Computational modeling of visual attention[J].Nature Reviews Neuroscience,2001,2(3):194-230.
[3] AEHANTA R,HEMAMI S,ESTRADA F,et al.Frequency-tuned salient region detection[C]//Proc.IEEE Conference on Computer Vision and Pattern Recognition(CVPR2009).[S.l.]:IEEE Press,2009:1597-1604.
[4]李志强.视觉显著性模型研究及其在影像处理中的应用[D].上海:上海交通大学,2009.
[5]彭素静.基于视觉感知机理的显著区域研究[D].重庆:重庆大学,2009.