APP下载

基于局部显著性特征的人体检测方法

2012-10-27李嘉懿戴声奎定志锋

通信技术 2012年4期
关键词:直方图算子梯度

李嘉懿, 戴声奎, 定志锋

(国立华侨大学 信息科学与工程学院,福建 厦门 361021)

0 引言

人体检测的关键问题是如何选择和提取行人的显著性特征。

在早期的研究中,边缘特征[1]经常被使用。Gavrila和 Philomin[2]选取边缘模板为特征,将边缘图像和模板数据集进行倒角距离的比较,并做了实验,结果表明,边缘特征受背景杂波影响较大,检测能力不是很健壮;哈尔(Haar)特征应用在人脸检测卓有成效,并越来越多的应用在人体检测。Viola[3]等人将哈尔特征使用到检测监视系统中的运动人体,并结合级联分类器,提高检测率;最近几年来,基于梯度方向直方图(HOG,Histograms of Oriented Gradient)特征备受关注。Dalal和 Triggs[4]提出了HOG特征,并且采用SVM分类器对HOG特征进行训练和分类,人体检测的准确度得到显著提升。Zhu等人[5]在Dalal等人的基础上,结合了AdaBoost与HOG特征,取得较好的检测结果。但由于HOG计算的复杂性导致使用 HOG特征的人体检测无法实现实时,因此局部二值纹理模式(LBP[6-7],Local Binary Patterns)特征成为另一种有效的人体特征描述算子。LBP度量和提取图像局部的纹理信息,对光照具有不变性。LBP是典型的结构与统计相结合的纹理分析方法。

以人体轮廓特性的强度、方向、宽度、结构、连续性等属性为出发点,将人体轮廓的梯度特性和结构特性有机结合,提出一种基于脊模型的局部显著性特征提取方法。该特征提取方法以Sobel和LBP为基础,使用改进的LBP和简化的梯度方向直方图作为局部显著性特征。

1 局部显著性脊模型

结合HOG[8]和LBP,为了描述人体轮廓的显著性,提出结合了梯度和结构的局部显著性特征的脊模型,如图1所示。该特征不再是单一特征,而是人体轮廓多种特性的组合,因此能够更全面的描述人体。模型的上升沿和下降沿表示脊边缘;顶部表示边缘的宽度和强度。类似于HOG,下面采用简化的梯度方向直方图来描述轮廓的方向。

图1 脊模型——局部显著性特征模型

1.1 简化的梯度方向直方图

HOG特征使用了9个不同的方向,并且采用了3次插值,计算复杂。因此提出角度梯度,从 4个方向描述图像的梯度变化,如图2所示,这样在一个区域内统计得到一个角度梯度向量直方图。因此,提出的四方向梯度直方图是原HOG九方向的简化,同时利用积分图可以进一步提高检测速度。

图2 角度梯度

1.2 改进的LBP算子

图3给出了一个基本的 LBP算子,应用LBP算子的过程类似于滤波过程中的模板操作。逐行扫描图像,对于图像中的每一个像素点,以该点的灰度作为阈值,与其周围3×3的8邻域进行二值化,按照一定的顺序(如从左上点开始按照顺时针方向)将二值化的结果组成一个8位二进制数,以此二进制数的值(0~255)作为该点的响应。

在整个逐行扫描过程结束后,会得到一个LBP响应图像,这个响应图像的直方图(255维)被称为LBP统计直方图或LBP直方图,它常常作为后续识别工作的特征,因此也被称为LBP特征。

图3 LBP算子

LBP的主要思想是以某一点与其邻域像素的相对灰度作为响应,正是这种相对机制使LBP算子对于单调的灰度变化具有不变性。

改进的或模式LBP是在LBP的3×3区域中心点8邻域二值化的基础上,进一步对其4方向(135°方向,90°方向,45°方向,0°方向)分别进行或操作,将结果编码为一个4位的二进制数,以此二进制数的十进制数的值(0~15)作为该点的响应,如图4所示。在整个逐行扫描过程结束后,会得到一个或模式LBP响应图像,与其对应的有一个16维的或模式LBP直方图。

图4 或模式LBP算子

或模式LBP在LBP的基础上,将LBP得到的8位二进制编码简化为4位二进制编码,使得十进制数取值范围从[0,255]缩减至[0,15],大大减少计算量。

1.3 局部显著性特征的提取

基于脊模型的局部显著性特征的人体检测方法是在基于梯度的检测上,提取人体轮廓的边缘性质。人体轮廓的边缘性质有:强度,方向,宽度,结构,连续性等。

HOG和 LBP毕竟都是单一特征,描述人体皆不够全面,于是现在又有了多特征融合的趋势。如:颜色,局部纹理,梯度直方图,边缘,运动特征等。

局部显著性脊特征的提取采用了分块的思想。实验所取的训练图片大小均为112×40像素,经过Sobel算子卷积运算后,得到一张大小为110×38像素的 Sobel梯度图像,进而可以得到一张 108×36的角度梯度图像和 108×36的或模式 LBP响应图像。分别对108×36的角度梯度图像和108×36的或模式LBP响应图像分块。取24×18像素大小的块,再将块平均分成4个单元,每个单元的大小为12×9像素点,如图5所示。

图5 分块,分单元示意

图6 块移动示意

统计块的或模式LBP直方图,得到一个16维向量L。以单元为单位,分别统计一个块中4个单元的角度梯度直方图,可得到的4个4维向量,并将其合并为一个16维向量。统计块的角度梯度直方图。取归一化的角度梯度直方图向量作为一个块的角度梯度直方图的16维向量B。因此一个块就可以用一个32维特征(L, B)来表示。

块移动的步长为一个单元的大小。如图6所示。由AEFD开始,下一次移动到BGHC,再下一次移动到EIJF,如此从左到右,由上到下移动。因此遍历整张图片将有()×()=24个块,于是整张图片可用一个 24×32=768维的向量表示局部显著性脊特征。局部显著性脊特征的提取如图7所示。

图7 局部显著性脊特征的提取

1.4 训练

选用正、负样本各1000,尺寸均为112×40像素,训练过程如图8所示。首先,将正样本和负样本通过SVM训练,得到基本分类器;其次,使用该基本分类器对负样本进行密集扫描,将得到的困难样本(即分类错误的负样本:负样本检测出目标对象,而判定为正样本)同原来的正、负样本一起对基本分类器进行二次训练,得到最终的分类器。

图8 训练过程

2 实验结果

部分检测图片如图9所示。

图9 部分检测图片

对1126张正样本,3653张负样本进行检测,检测结果如表1所示。检测率为89.08%。本算法存在一定的缺陷:对于具有明显垂直边缘的柱子、树木等物体可能会被误检。这是由于垂直边缘是人体的明显特征之一,所占权重比较大。

表1 检测结果

3 结语

提出了一种基于脊模型的局部显著性特征提取方法。该特征结合了梯度和结构,是在 Sobel梯度图基础上,进行或模式LBP算子扫描以及角度梯度计算,再提取或模式LBP直方图向量以及角度梯度直方图向量得到的[9-12]。创新点在于,该特征不是单一的特征,而是结合了梯度和结构的特征,并且用768维的特征比较真实的描述出了人体的轮廓。

提出的局部显著性脊特征利用了积分图,并且简化了梯度方向,有效减少计算复杂度,提高检测速率,但较之HOG描述人体的特征维数少,因此检测率还有待提高。局部显著性脊特征的提取在块以及单元的大小的选择,Sobel算子以及梯度算法选择等方面,还可以做进一步研究,以期有更好的效果。

[1]余萍,崔少飞,赵振兵,等.图像配准中的边缘提取方法的研究[J].通信技术,2008,41(06):161-163.

[2]GAVRILA D, PHILOMIN V.Real-time Object Detection for “Smart” Vehicles[C]// Proceedings of the Seventh IEEE International Conference.New York:IEEE Computer Society Press, 1999:87-93.

[3]VIOLA P, JONES M J, SNOW D.Detecting Pedestrians Using Patterns of Motion and Appearance[C]//Proceedings of Ninth IEEE International Conference.New York: IEEE Computer Society Press, 2003:734-741.

[4]DALAL N, TRIGGS D.Histograms of Oriented Gradients for Human Detection[C]//Proceedings of Conference on Computer Vision and Pattern Recognition.New York: IEEE Computer Society Press, 2005:556-893.

[5]ZHU Q, AVIDAN S, YEH M C.et al.Fast Human Detection Using a Cascade of Histograms of Oriented Gradients[C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition.New York: IEEE Computer Society Press,2006: 1491-1498.

[6]WU J,GEYER C, REHG J M.Real-Time Human Detection Using Contour Cures[C]//IEEE International Conference on Robotics and Automation (ICRA).New York: IEEE Computer Society Press, 2011: 860-867.

[7]WANG X, HAN T X, YAN S.An HOG-LBP Human Detector with Partial Occlusion Handing[C]// Proceedings of the Twelfth IEEE International Conference.New York: IEEE Computer Society Press, 2009:32-39.

[8]周柯.基于 HOG特征的图像人体检测技术的研究与实现[D].武汉.华中科技大学:2008.

[9]唐崇武,李会方,何俊婷,等.改进的直方图均衡图像增强算法及实现[J].信息安全与通信保密,2009(12):72-74.

[10]高智芳,张新家.基于小波变换的除噪方法及其应用研究[J].信息安全与通信保密,2007(06):102-104.

[11]石明慧.一种基于小波变换的信息隐含技术[J].通信技术,2002(03):68-69,72.

[12]陈晓彬.基于小波的自动对焦算法研究[J].通信技术,2010,43(06):210-212.

猜你喜欢

直方图算子梯度
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
一类截断Hankel算子的复对称性
符合差分隐私的流数据统计直方图发布
一个带重启步的改进PRP型谱共轭梯度法
一个改进的WYL型三项共轭梯度法
随机加速梯度算法的回归学习收敛速度
拟微分算子在Hp(ω)上的有界性
Heisenberg群上与Schrödinger算子相关的Riesz变换在Hardy空间上的有界性
基于FPGA的直方图均衡图像增强算法设计及实现
一个具梯度项的p-Laplace 方程弱解的存在性