基于主方向的旋转不变HOG特征
2015-12-02罗滨朱长仁任云
罗滨+朱长仁+++任云
摘 要: 特征提取是目标检测与识别领域的研究热点之一,HOG(Histogram of Oriented Gradient)特征由于其对图像局部信息良好的几何和光照不变性,在行人检测、车牌和人脸识别等计算机视觉邻域得到了广泛应用,但是HOG不具有旋转不变的特性,使得该特征在实际应用中存在着一些局限性。针对该问题,提出一种具有旋转不变性的HOG特征提取方法,首先根据图像梯度信息提取主方向并设置为参考方向,接着旋转主方向至参考方向,在旋转后的图像上得到旋转不变的HOG特征。并且设计了一种面向图像匹配的相似性度量准则,它以单个图像块(Block)特征向量为基元,与待匹配图像中对应块及其邻域块特征向量的相似度共同作为度量标准,增强了旋转图像在像素平移情况下的匹配效果。实验结果表明,提出的改进HOG特征具有良好的旋转不变特性。
关键词: 梯度方向直方图(HOG); 方向标准化; 图像匹配; 相似性度量
中图分类号: TN911.73?34; TP391.4 文献标识码: A 文章编号: 1004?373X(2015)22?0084?04
0 引 言
随着信息产业的高速发展,物质生活日益丰富的同时,人们对计算机视觉技术的需求也越来越高。图像特征提取作为计算机视觉领域一个重要的研究方向,在医学、刑侦和军事等方面都发挥着重要的作用,吸引着大量的国内外研究者。对于图像特征,至今为止都没有一个精确的定义,包括性能的衡量往往由具体问题或者应用所决定,但是作为模式识别的起点,对图像的描述都应具有精确性、独特性和鲁棒性等特点。
近年来,研究者们提出了大量图像特征描述子,Lowe提出了SIFT(Scale?invariant feature transform,尺度不变特征转换)特征[1],在尺度空间中寻找具有尺度、旋转、位置等不变性的极值点,这些特征点构成对图像的不变性描述,取得了良好的效果,作者随后在2004年对其进行了完善[2]。SIFT算法稳定,可以检测到较多的特征点,但是计算复杂度高,Bay等针对上述问题提出了SURF(Speeded?Up Robust Features,快速鲁棒特征)特征[3],利用积分图、Hessian矩阵快速构造图像尺度空间,大幅提升了检测速度。SIFT和SURF都具有尺度、光照和旋转不变性,但是构造描述子的过程繁杂,效率依旧难以满足实时性的应用需求。Dalal在2005年的CVPR上提出了HOG[4](Histogram of Oriented,梯度方向直方图)特征应用于行人检测,并达到了2006年PASCAL人体检测挑战赛最佳结果,获得了极大的成功。受此启发,国内外许多研究者将目光转向了HOG特征,其中包括许多HOG特征的改进[5?12]。
HOG的优势在于它有很好的几何和光学不变性,并且计算效率高。但是,HOG本身存在一些局限:
(1) 计算梯度前不能进行平滑使得 HOG不具备多尺度分析能力。Zhu等使用积分图[5]加速HOG特征的计算,实现了多尺度分析;Bosh等结合空域金字塔核提出了PHOG(Pyramid of Histogram of Orientation Gradient,方向直方图金字塔)特征[6],通过对ROI区域的多分辨率分割,构建金字塔图层,加权连接各图层的梯度方向直方图得到PHOG;Pedro等结合HOG特征,提出了用于目标检测的判别训练、多尺度可变部件模型[7?8](DPM),将一种挖掘难例的间隔敏感方法与隐藏变量SVM(Latent variables SVM)结合起来,实验证明其方法在平均精度上达到HOG特征人体检测的2倍。
(2) HOG不具备旋转不变性。汤彪等提出了基于旋转不变HOG特征的图像匹配算法[12],该算法改进了Block划分方式,用环形图像区域划分方式代替常规的方形图像区域划分方式,并对梯度进行RGT (Radial Gradient Transform)变化,获得旋转不变的直方图信息,在角度差异图像间的匹配取得了不错的效果。但是,这种算法舍去了目标本身的方向信息,缩小了适用范围。
本文提出了一种基于主方向的旋转不变HOG特征方法,并优化了特征的相似性度量。在特征提取方面,首先根据梯度信息计算得到图像主方向,然后以主方向作为归一化参考方向,获取旋转不变的HOG特征。在相似性度量方面,本文以单个图像块(BLOCK)特征向量为基元,与待匹配图像中对应块及其邻域块特征向量的相似度共同作为度量标准,增强了存在少许相位差异的旋转图像之间的匹配效果。实验结果表明,与传统HOG特征相比,利用本文提出的改进HOG特征在图像间存在角度差异的时候,依然能够保证匹配的准确度。
下面首先简要介绍HOG特征提取基本思路,然后描述基于梯度信息的主方向提取算法,其次叙述基于主方向HOG特征的图像匹配算法,最后给出相关实验与结果分析。
1 HOG特征提取基本思路
梯度方向直方图是一种稠密的统计特征描述,其主要思想是:将一幅图像分成许多连通区域,分别计算和统计各区域的梯度信息构成直方图,最后将直方图连接起来就可得到HOG特征。
4 结 语
本文方法通过统计图像全局的梯度方向信息,得到梯度主方向,并以此作为参考方向对图像进行方向归一化,提取图像的HOG特征,使之具有较好的旋转不变性。图像匹配的实验结果表明,在图像存在角度差异的情况下,本文算法具有良好的匹配效果,总体性能明显优于传统的HOG特征。
参考文献
[1] LOWE D. Object recognition from local scale?invariant features [C]// Proceedings of the 7th the IEEE International Conference on Computer Vision. Kerkyra: IEEE, 1999: 1150?1157.
[2] LOWE D. Distinctive image features from scale?invariant key points [J]. International Journal of Computer, 2004, 11(60): 91?110.
[3] BAY H, TUYTELAARS T, ESS A. Speeded up robust features (SURF) [J]. Computer Vision and Image Understanding, 2008, 110(3): 346?359.
[4] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection [C]// Proceedings of 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Diego: IEEE, 2005: 886?893.
[5] ZHU QIANG, AVIDAN S, MEI Y, et al. Fast human detection using a cascade of histograms of oriented gradients [C]// Proceedings of 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. [S.l.]: IEEE, 2006: 1491?1498.
[6] BOSH A, ZISSERMAN A, MUNOZ X. Representing shape with a spatial pyramid Kemel [C]// Proceedings of the 6th ACM Intemational Conference on Image and Video Retrieval. New York, USA: ACM Press, 2007: 1091?1096.
[7] FELZENSZWALB P. A discriminatively trained, multiscale, deformable part model [C]// Proceedings of the 26th IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, AK: IEEE, 2008: 1?8.
[8] FELZENSZWALB P. Object detection with discriminatively trained part based models [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9): 1627?1645.
[9] 芮挺,曹鹏,张金林,等.基于高斯混合建模的多尺度HOG行人头肩特征检测[J].山东科技大学学报:自然科学版,2013,32(2):90?93.
[10] 霍亚松,张锟.非重叠低维度梯度方向直方图[J].模式识别与人工智能,2014,27(3):242?247.
[11] 吴博.HOG特征红外图像匹配技术研究[D].武汉:华中科技大学,2011.
[12] 汤彪,左峥嵘,李明.基于旋转不变HOG特征的图像匹配算法[EB/OL].[2013?01?24].http://www.paper.edu.cn/releasepaper/content/201301?1025.