基于局部控制核的彩色图像目标检测方法*
2016-12-22贺康建周冬明聂仁灿
贺康建,周冬明,聂仁灿,金 鑫,王 佺
(云南大学 信息学院,云南 昆明 650504)
基于局部控制核的彩色图像目标检测方法*
贺康建,周冬明,聂仁灿,金 鑫,王 佺
(云南大学 信息学院,云南 昆明 650504)
在图像处理问题中,对图像中给定目标进行检测和定位时,为提高目标检测的速度与可靠性,引入一种基于图像局部控制核的目标检测算法。利用参考图像同等大小的窗口遍历目标图像,得到一系列与参考图大小相同的子图,然后计算参考图和目标子图的局部控制核,得到图像特征信息的数据矩阵。为了提高运算速度,对数据矩阵用局部保留投影方法降维。再用相似性判决准则将参考图像与目标图像中子块的特征矩阵进行相似性分析,查找与参考图像最相似矩阵所对应的图像区域即为检测结果。实验结果表明,该算法对目标定位具有较高的可靠性与准确度。
图像分析;数据矩阵;相似性判决;目标检测
0 引言
近年来计算机技术快速发展,计算机智能为人们的日常生活带来诸多方便。随着人们需求的日益增长,目标检测与定位逐步进入到人们的实际生活中[1,2],随着对人体动作识别、人机交互技术的深入研究,计算机视觉系统也变得越来越智能。使用计算机进行特征检测、目标跟踪、目标检测及定位等技术得到了研究人员的广泛关注,这些技术也开始应用到人们的日常生活中。本文采用图像局部控制核算法[3],实现了对不同目标的快速检测与定位。目前对于目标检测及定位问题,有关研究人员提出了许多新颖的算法,但大多数算法需要进行繁琐的训练和预处理过程。如参考匹配法[4]将隐马尔科夫统计模型引入到目标参考匹配,此方法的局限性是无法从图像内容来解释并确定隐马尔科夫模型的参数,只能通过一系列的实验来选择最优参数,这一问题限定了图像识别中隐马尔科夫模型[5]的进一步应用。还有一种多检测目标自动定位监测技术主要是基于图像像素的单阈值分割法[6]的运用,此类定位方法过程繁琐耗时。本文提出采用图像局部控制核算法来对目标进行快速的配准、检测与定位[7]。
1 算法描述
本文采用局部控制核[8]的方法,获取图像像素点的几何结构信息,提取出图像的结构特征,将目标图像分割成与目标参考图像大小一致的一系列子图,参考图像即为所需查找定位的目标,最后分析包含图像特征信息的数据矩阵之间的相似性来达到目标检测的目的。算法流程图如图1所示。
图1 算法流程图
1.1 局部控制核函数LSK
局部控制核函数(Local Steering Kernel,LSK)是在评估梯度的基础上通过分析像素值的差异来获取图像的局部数据结构,用所获取的结构信息确定核的形状和大小,用径向对称函数来表示局部核函数,表达式如式(1):
其中,P2是局部窗(P×P)中像素点个数,是空间坐标。Hl为转向矩阵,其表达式为:
其中,h是一个全局平滑参数。矩阵Cl是通过计算每个像素点的梯度向量G得到的协方差矩阵,其表达式如下:
式中,矩阵V和S是梯度向量G的SVD奇异值分解。其中,c=(s11+1)/(s22+1),K是半径为 P的圆形区域均值滤波器,α是灵敏度参数。转向矩阵Hl通过编码图像中存在的局部几何结构信息,来调整局部核的形状和大小。选用高斯函数表示K(·),可以得到如下LSK描述子:
在像素点 x处,将函数 K(xl-x;Hl)归一化,用来描述图像内在的局部几何结构,因此,在参考图像和目标图像中分别得到如下算子:
式中,n和nT分别是在参考图像Q和目标图像T中计算LSK所用到的子块数目。
1.3 矩阵相似性判决准侧
本文采用余弦相似性准则[10],通过计算特征矩阵 FQ和FTi之间的距离来度量参考图像Q与目标图像子块Ti之间的相似性。余弦相似性的定义是两个归一化向量的内积,表达式如下:
用余弦相似性准则度量FQ和这两个矩阵的相似性时,用下面的公式计算矩阵内积:
并定义 ρi=ρ(FQ,),将式(12)改写成加权平均的形式如下:
得到ρi以后,就可以分析参考图像Q和目标图像Ti之间的相似性关系。如果夹角为0°,意味着方向相同、线段重合;如果夹角为90°,意味着形成直角,方向正交;如果夹角为180°,意味着方向正好相反。为更好地体现向量间的差异,用与1-的比值来衡量两向量的相似度,即 f(ρi)=/(1-),f(ρi)∈[0,∞]。这样,就将相似度的范围从[0,1]扩展到[0,∞]之间,可以更好地突出向量间的微小差异,更能体现两者的相似程度。
1.4 保留最大相似区域
在图像中目标的检测与定位过程中,设定一个整体阈值 τ0,将 f(ρi)与 τ0作比较,若 f(ρi)>τ0就认为目标图像与参考图像相似,最终的定位与检测的准确度与相似度可以通过调节τ0来实现。这样就可以得到一个相似区域,然后,进行非极大值抑制,即只保留 maxf(ρi)的对象,就是最终的检测与定位结果。maxf(ρi)>τ0表明目标图像中有需要检测的参考图像,maxf(ρi)<τ0,则目标图像中不存在所感兴趣的对象。
所有相似性区域子图块位置和保留最大相似区域实验结果如图2所示。
图2 所有可能区域与定位结果
2 实验结果与分析
为了验证该算法的有效性,本文选取两组图作为实验数据。其中一组图像是对卫星接收器进行定位,如图3所示。
图3 实验1
实验结果如图4所示。图4中,不同颜色代表不同的相似度,蓝色(区域1、3)到红色(区域2、4)表示的相似度依次增强,实验选取的参考图像为目标图像中最左侧的图像,所以定位结果中最左侧的定位结果为红色,与参考图像最为接近。图4(c)中可以看到检测出不同的相似区域,可以通过调节整体阈值来决定不同相似度区域的取舍,最终定位出结果。
下面给出另一组人脸检测与定位实验,并分析灵敏度α对准确度与计算复杂度的影响,实验结果如图5所示。
图4 实验1结果
图5 实验2
由于式(3)中参数灵敏度α影响检测的准确度与运算速度,在实验中,选取α=1.0。从表1与图5中可以看出,灵敏度α越小,计算出的显著性区域即与参考图相似的子块区域越大,检测结果越准确,但需要很大的计算复杂度;α越大,相似性区域越小,检测时间越短,但有可能造成检测目标的缺失,如图5(e)中所示。
3 结论
本文采用的目标定位算法对图像中的参考图像目标进行定位,该算法不需要过多的预处理和训练过程,只需要输入一个参考图像来获取所需定位目标的结构信息矩阵,再用局部保留投影(LPP)对图像矩阵进行降维,提取显著特征,进而与目标图像的相似特征进行匹配,用余弦相似性方法作为判决依据。由实验得知,该算法是一个通用的定位算法,参考图像和目标图像里的定位图像不需要严格一致。从实验1看出,在目标图像中,定位目标的角度、方向、亮度和目标大小等信息不一致,仍准确定位出3个目标;在实验2中也可以看出,在复杂的图像背景下,输入的参考与检测目标有一定的差异,仍能检测定位出人脸信息,说明本算法的有效性和通用性。
表1 灵敏度α对检测时间的影响
本文算法的局限在于,检测目标图像中的目标时,目标图像中目标的大小应大致与参考图像大小一致,这样对检测图像分割成一系列与参考图像大小一致的子图块时才能进行特征点相似性判决。针对目标图像中目标大小与参考图像大小不一致的问题,可以通过缩放参考图像来解决。在参考图像与目标图像存在形变时,若目标的局部几何形状特征明显,能提取出特征,则可以通过调节相似度阈值τ0来实现对目标进行检测与定位,但会造成定位精度下降。有关算法的参数设置,目前没有自适应的优化参数方法,只能做大量实验选取最优参数,随着这一问题的解决,必会使此算法得到更广泛的应用。
[1]喻鑫,明德烈,田金文.前下视红外图像中复杂地面背景下的目标定位[J].红外与激光工程,2007,6(6):988-991.
[2]杨威,付耀文,潘晓刚,等.弱目标检测前跟踪技术研究综述[J].电子学报,2014,42(9):1786-1793.
[3]SEO H J,MILANFAR P.Training-free,generic object detection using locally adaptive regression kernels[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2010,32(9):1688-1704.
[4]任仙怡,张桂林,张天序,等.基于奇异值分解的图像匹配方法[J].红外与激光工程,2001,30(4):200-202.
[5]刘小军,王东峰,张丽飞,等.一种基于奇异值分解和隐马尔可夫模型的人脸识别方法[J].计算机学报,2003,26 (3):340-344.
[6]陈果,左洪福.图像的自适应模糊阈值分割法[J].自动化学报,2003,29(5):791-796.
[7]邓集洪,魏宇星.基于局部特征描述的目标定位[J].光电工程,2015,1(1):58-64.
[8]KUMAR Y,GAUTAM J.Training-free video indexing scheme using local steering kernel[J/OL].(2012)[2016].http://www.tjprc.org/files/2-15-1371044563-1.Training%20free%20video.full.pdf.
[9]WONG W K,ZHAO H T.Supervised optimal locality preserving projection[J].Pattern Recognition,2012,45(1):186-197.
[10]YE J.Cosine similarity measures for intuitionistic fuzzy sets and their applications[J].Mathematical&Computer Modelling,2011,53(53):91-97.
Target detection method based on local steering kernel of color image
He Kangjian,Zhou Dongming,Nie Rencan,Jin Xin,Wang Quan
(Information College,Yunnan University,Kunming 650504,China)
In image processing,aiming at the given target detection and localization of the image,in order to improve the speed and reliability of target detection,this paper introduceds a new target detection algorithm based on image local steering kernel(LSK).Using the same size window of the query image traversal target image,the paper gets a series of sub-graphs the same size as the query image,then calculates the LSK of the query image and the target sub-graphs,the image feature information data matrices are obtained.In order to increase the computing speed,the method of local preserving projection is used to reduce the dimension of the data matrices.Further,the similarity judgment criterion is used to analyze the similarity between the query image and the target sub-graphs,the target area,which is similar to the query image,is the detection result.The experimental results show thatthe algorithm of target location is of high reliability and accuracy.
image analysis;data matrix;similarity judgment;target detection
TN911.73;TP181
A
10.16157/j.issn.0258-7998.2016.12.023
贺康建,周冬明,聂仁灿,等.基于局部控制核的彩色图像目标检测方法[J].电子技术应用,2016,42 (12):89-92.
英文引用格式:He Kangjian,Zhou Dongming,Nie Rencan,et al.Target detection method based on local steering kernel of color image[J].Application of Electronic Technique,2016,42(12):89-92.
2016-06-21)
贺康建(1990-),男,硕士研究生,主要研究方向:图像融合、人工神经网络。
周冬明(1963-),通信作者,男,博士,教授,主要研究方向:神经网络、信号处理技术、图像融合,E-mail:zhoudm@ynu.edu.cn。
聂仁灿(1982-),男,博士,副教授,主要研究方向:图像处理、人工神经网络。
国家自然科学基金(61365001,61463052)