舰船图像显著性区域检测技术研究与仿真
2017-08-07张亚伦杨露菁陈煜康刘树衎
张亚伦杨露菁陈煜康刘树衎
(海军工程大学武汉430033)
舰船图像显著性区域检测技术研究与仿真
张亚伦杨露菁陈煜康刘树衎
(海军工程大学武汉430033)
图像显著性区域检测技术是图像分析领域的重要研究内容,在舰船目标识别和红外成像处理过程中具有重要意义。论文介绍了显著性检测技术中常用的五种算法:Itti算法、剩余频谱算法、FT算法、MZ算法和AC算法,并以实际舰船图片为例,针对每种算法进行了仿真实验,对各种算法的检测效果进行了比较分析。仿真结果显示,综合考虑处理后图像的清晰度、抗噪性、分辨率和运算时间等性能因素,FT算法对海上舰船图像的处理具有最好的效果。
图像显著性区域检测;模式识别;Itti算法;剩余频谱算法;FT算法;MZ方法;AC方法
Class NumberTP391.41
1 引言
图像显著性区域检测是当前图像分析技术和数字图像处理领域中的一个重要研究课题,是实现图形形式化描述、图像分类、图形模式识别等高层图像处理的基础。图像显著性区域检测利用计算机技术,结合特定算法原理,能够从图像中快速提取和定位感兴趣的物体,因此在诸如图像分割[1]、图像比对及检索[2]等领域具有十分重大的研究意义,能够用于完成人脸及指纹识别、机器视觉分析等工作。
在图像分类、异常区域检测、目标定位、图像影像的分割分类等问题中,都需要使用显著性区域检测进行图像的预处理:显著性检测能够分析出目标可能出现的大致区域,使后续的图像分析操作能把重点放在这一显著性区域,从而节约图像处理的运算时间,提高计算分析的时效性。
2 图像显著性区域检测算法
为了解决图像显著性区域检测问题,人们进行了大量的探索研究:1998年,Itti等提出了基于多尺度中心-周围算子模型的图像显著性区域检测技术[3];2007年,Hou和Zhang提出了基于剩余频谱理论的分析算法[4],即SR(Spectral-Residual)算法;2008年,Guo等提出了基于傅里叶变换相位谱的检测算法[5];2009年,Achanta等提出了基于频率调谐的检测模型[6]。
此后研究发现,最能引起人类视觉注意的因素是对比度。通过计算图像中不同物体、不同区域的像素差异程度,能够对图像进行更加科学合理的分割处理。2003年,Ma和Zhang提出了基于局部对比方法的显著性区域检测模型[7];2008年,Achanta等基于局部对比度提出了有名的AC算法[8],将会在下文中予以介绍。此外,还有Goferman等于2012年提出的改进的CA算法[9]。
此外,随着人工智能技术的不断发展兴起,基于相关新技术的显著性检测方法被陆续提出:Menon等于2010年在模拟人脑脑岛机能的基础上,提出了能够对视觉信息进行聚类分析的显著性检测方法[10];Liang等于2012年提出了结合分割算法的显著性区域检测算法法[11];Lang等于2012年提出了基于稀疏和低秩表示的显著性检测方法[12]。
2.1 Itti算法
Itti算法由Itti等提出,其计算过程如下:
1)特征提取
输入的图像基于RGB颜色空间,定义r,g,b作为图像的红绿蓝三个通道,图像的强度特征为I=(r+g+b)/3,并提取图像的宽频调谐颜色特征。而后,通过Gabor滤波选取4个方向θ∈{0°,45°,90°,135°}的特征量,从而得到强度特征、4个宽频调谐颜色特征量、4个方向特征。
2)建立高斯金字塔
对步骤1)所得的9个特征量进行多尺度分解,建立9层的高斯金字塔。
3)建立图像特征图
定义一个中心-周围算子,先进行插值使其具有相同大小,然后对应相减并取绝对值,其数学定义为Θ=|p-q|,即表示不同尺度空间的特征图相应点的差值,其中p表示在中心尺度c∈{2,3,4}下的一个像素,q表示在周围尺度s=c+δ,δ∈{3,4}下的一个像素。
第一组特征图是通过对强度特征I进行上述运算得到,可得到6张强度特征图;第二组特征图对颜色特征进行计算,可得到12张颜色特征图;第三组特征图对局部方位信息进行计算,该信息是由强度图I通过Gabor滤波器滤波而得,得到24张方位特征图。
4)特征图融合
定义标准化操作N(·)如下:将每幅显著图中每个像素的显著值归一化到区间[0,M]。再找出全局最大值M以及其他局部最大值的平均值m。对特征图的每一个位置分别乘以(M-m)2,将每幅特征图中潜在的显著区域位置进行放大。将上一步骤生成的共42张特征图进行标准化,然后通过线性插值调整到同一大小并相加,分别计算得到强度、颜色和方向上的显著图。
5)生成显著图
将上一步骤所得的三个特征显著图,再次进行标准化操作然后合并,最终生成显著图。
2.2 SR算法
Hou和Zhang提出的剩余频谱算法基于编码理论和信息理论。编码系统有一条基本原则是抑制频繁出现的特征,而从信息理论角度出发:信息可分为冗余部分和变化部分。人们的视觉对变化部分更敏感。视觉系统的一个基本原则就是抑制对频繁出现的特征的响应,同时对非常规的特征保持敏感。即将图像分为两部分:
H(图像)=H(新颖信息)+H(先验知识)
先验知识部分是被编码系统抑制的冗余部分,而新颖信息部分则被认为是输入图像的显著图。对大量图像的log频谱研究发现了如下规律:
定义A(f)是图像的振幅谱,P(f)是图像的相位谱,L(f)是图像的对数谱,由振幅谱取对数得到R(f)为图像的剩余谱。
SR方法十分简单,可分为以下三个步骤:
1)将输入的图像进行傅里叶变换,使其变换到频域,并计算其振幅谱和相位谱;2)对振幅谱求自然对数,将其转换为对数谱,然后计算剩余谱;3)对剩余谱和相位谱进行反傅里叶变换,再进行高斯模糊滤波,即可得到显著图。
2.3 FT(Frequency-Tuned)算法
Frequency-tuned(FT)算法的基本思想是,图像变换到频域时,可分为低频和高频两个部分:低频部分反映图像的整体信息,如物体的轮廓,基本的组成区域;高频部分反映了图像的细节信息,如物体的纹理。而图像显著性区域检测更多地用到低频部分的信息。设ωlc为低频截止频率,ωhc为高频截止频率,为了突出大的显著对象,ωlc需要尽可能的低;为了得到较好的轮廓信息,ωhc需要尽可能的高。图像的最高频的部分应舍去,该部分很可能是物体的纹理或者噪声。
为保证DoG滤波器(Difference of Gaussian)带宽[ωlcωhc]足够大,FT算法采用N个DoG带通滤波器组合的方法。组合滤波器表达如下
σ为高斯滤波器的标准差,ρN决定了组合DoG滤波器的带宽,(x,y)为像素点坐标。为舍去图像的最高频部分,σ的标准差要小,这时,可使用二项式滤波器近似提高算法的运算速度。
最终,FT方法用CIELab颜色空间,则图像像素的显著值计算公式可表达如下
其中,Iμ是图像在CIELab颜色空间的算术平均值,Iωhc(x,y)是原图像通过高斯模糊滤波(使用二项式滤波器)后图像的某一像素点,‖‖·是L2范式,即计算Iμ与Iωhc(x,y)之间的欧式距离。
2.4 MZ(Ma-Zhang)算法
MZ方法的基本思想不再是实现计算机算法模拟视觉感知机制,而是注重图像的性质以及计算机的计算能力,其核心思路是:对于目标是否显著起决定性作用的因素是对比度。
MZ方法的具体处理步骤如下:
1)对图像进行预处理:调整图像大小并保持其长宽比不变,将图像从RGB颜色空间转换到CIELUV颜色空间;图像去噪,使用滤波器进行平滑处理。
2)生成显著图:定义感知域(Perceive Field)的概念,对应于人眼的感知区域。将输入图像分解为M×N个感知单元(图像像素大小为M×N,即一个像素为一个感知单元Perceive Unit)。则一个感知单元在其感知域上的对比度定义为
其中,Θ表示为感知单元所在的感知域,Θ越小,感知域越敏感。p(x,y)表示感知单元,q表示感知域中的其他像素,d[] ·表示计算p(x,y)和q之间的距离,可以根据不同的应用选择合适的距离函数。C(x,y)表示感知单元与感知域内其他所有像素的差值的和。将所有像素的对比值C(x,y)规范到区间[0,255],即可得到显著图。
2.5 AC(Achanta)算法
AC算法中,图像像素的显著值由一个局部区域R1与其周围邻域R2的局部对比度的计算得出,该局部区域R1可称为一个感知单元(也可以是一个区域),通过改变该感知单元的邻域R2大小,从而实现多尺度的显著性计算。且这样得到的显著图分辨率与原图是一致的。这个局部对比度,是指在这个感知单元平均特征向量和它的邻域平均特征向量的差。AC算法的基本步骤如下:
1)输入图像,将图像从RGB颜色空间转换到CIELab颜色空间;2)在不同的尺度下计算显著性值:在某一图像尺度下,位于(x,y)的像素点基于对比的显著值定义为局部区域R1的特征平均向量和周围邻域R2的特征平均向量的欧氏距离;3)将上一步骤所得的不同尺度的显著图直接相加,按照下述公式计算,得到最终显著图:
3 检测结论
3.1 实验环境
仿真实验的硬件平台设置为:Intel®Core™i7-4710MQ CPU@2.50GHz、8.00GB RAM,操作系统为Window 7旗舰版Service Pack 1,仿真软件为Matlab R2017a。
3.2 样例图片
本文选取两幅来自互联网上的典型海上船只图像,其中一幅中仅有单艘船只,另一幅包含多艘船只。且多艘船只的航向不同,能够更全面地分析算法。如图1所示。
3.3 实验结论
参数设置如下:Itti算法中,设置中心尺度为c∈{2,3,4},周围尺度为s=c+δ,δ∈{3,4},方向特征选取4个方向为θ∈{0°,45°,90°,135°};MZ算法中,感知域大小选取为Θ=5×5;AC算法中,邻域宽度大小为WR2=N/8,N为图像宽度。最终得到图像检测结果,如图2和3所示。
下面从四个方面分析仿真结果:
1)物体显示的清晰度:FT算法、AC算法都能令人较为满意地将整个船舶高亮地显示出来;SR算法、MZ算法只能够将船舶的轮廓即船舶与海面背景的边界高亮显示出来,其内部细节被忽略;Itti基本不能将船舶的整体显示出来。
2)物体边界提取:Itti算法基本不能描述船舶边缘信息;其余算法对于边界的描述都比较准确,但是MZ算法得到的边缘信息不十分显著。
3)抗噪性:AC算法不能完全滤除船舶周围噪声,Itti算法不能很好滤除海面噪声,另外三种算法都能较好滤除海面海浪的噪声信息。
4)分辨率:Itti算法使用的高斯金字塔分解图像,得到的显著图分别率较低,是由插值算法将其转换为原分辨率,实际上降低了显著图分辨率;SR算法得到的也是分辨率较低的显著拓扑图。其他3种算法显著图分辨率与原图像一致。
4 算法效能比较与分析
使用原图像建立相应的人工分割图4。
通过计算算法所得图像的P值、R值(即查准率与查全率)、F值(P和R的几何平均值)和运算时间,可以对几种检测算法的性能进行较为全面的比较。因此,选取包括上述两幅图在内的7幅海上船舶图像分别利用5种算法进行显著性区域检测,其性能比较结果如图5所示。
综上所述,通过观察所得显著图结合计算所得P、R、F值,考虑到运算时间的因素,本文认为FT算法是检测海面船舶图像显著性的最佳算法,通过该算法所获得的显著图的各项性能都比较好,且运算时间很短。
5 结语
本文详细介绍了显著性检测技术中常用的五种算法:Itti算法、剩余频谱(SR)算法、FT算法、MZ算法和AC算法,并选取两幅海上船舶图像分别利用每种算法进行了仿真实验,最终对各种算法的检测效果进行了比较分析。结论显示,FT算法在相同条件下较其他算法而言具有较为优秀的检测效果和实时性。
[1]W.H J.Unsupervised Extraction of Visual Attention Objects In Color Images[J].IEEE Trans.Circuits Syst.Video Technol,2006,16(1):141-145.
[2]Chen T,Cheng M,Tan P,et al.Sketch2Photo:Internet Image Montage[J].ACMSIGGRAPH Asia,2009,28(5):89-97.
[3]L.ITTI,C.KOCH,E.NIEBUR.A Model of Saliency-based Visual Attention for Rapid Scene Analysis[J]. IEEE Transaction on Pattern Analysis and Machine Intelligence,1998,20(11):1254-1259.
[4]X.Hou,L.Zhang.Saliency Detection:A Spectral Residual Approach[C]//2007 IEEE Conferece on Computer Vision and Pattern Recognition,Minnesota:IEEE.2007:1-8.
[5]C.Guo,Q.Ma,L.Zhang.Spatio-temporal Saliency Detection Using Phase Spectrum of Quaternion Fourier Transform[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Anchorage:IEEE,2008:1-8.
[6]R.Achanta,S.Hemani,F.Estrada,et al.Frequency-tuned Salient Region Detection[C]//Proceedings of the International Conference on Computer Vision and Pattern Recognition,Los Alamitos:IEEE.2009:1597-1604.
[7]Y.F.Ma,H.J.Zhang.Contrast-based Image Attention Analysis by Using Fuzzy Growing[C]//Proceedings of the 11th ACM international conference on Multimedia.California:ACM,2003:374-381.
[8]R.Achanta,F.Estrada,P.Wils,et al.Salient Region Detection and Segmentation[C]//Computer Vision Systems of Lecture Notes in Computer Science,Heidelberg:Springer,2008:66-75.
[9]Goferman S,Zelnik-Manor L,Tal A.Context-aware Saliency Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34(10):1915-1926.
[10]Menon V,Uddin L Q.Saliency,Switching,Attention and Control:A Network Model of Insula Fiinction[J]. Brain Structure and Function,2010,214(5-6):655-667.
[11]Liang Z,Chi Z,Fu H,et al.Salient Object Detection Using Content-sensitive Hypergraph Representation and Partitioning[J].Pattern Recognition,2012,45(11):3886-3901.
[12]Lang C,Liu G,Yu J,et al.Saliency Detection by Multitask Sparsity Pursuit[J].IEEE Transactions on Image Processing,2012,21(3):1327-1338.
Technological Study and Simulation of Ships’Image Salient Region Detection
ZHANG YalunYANG LujingCHEN YukangLIU Shukan
(Naval University of Engineering,Wuhan430033)
Image salient region detection is an important topic in the current image analysis.This kind of technology has a significant impact on the infrared imaging process and ships'pattern recognition.This paper introduces five algorithms of image salient region detection,including Itti algorithm,SR algorithm,FT algorithm,MZ algorithm and AC algorithm.Furthermore,the paper completes the simulation experiment with real ships'photos by each algorithm.After comparing and analyzing the result of various algorithms,taking clarity and resolution into account,it's showed that FT algorithm has the best effect.
image salient region detection,pattern recognition,Itti algorithm Spectral-Residual algorithm,Frequency-Tuned algorithm,Ma-Zhang algorithm,Achanta algorithm
TP391.41
10.3969/j.issn.1672-9730.2017.07.019
2017年1月20日,
2017年2月27日
张亚伦,男,硕士研究生,研究方向:模式识别与智能系统,大数据分析与挖掘。杨露菁,女,博士,教授,研究方向:辅助决策,模式识别与智能系统。陈煜康,男,助理工程师,研究方向:模式识别与智能系统。刘树衎,男,博士,讲师,研究方向:模式识别与智能系统。