APP下载

基于ROI区域强分辨力HOG特征的视频行人检测*

2013-05-14陈淑荣

网络安全与数据管理 2013年7期
关键词:分辨力分类器行人

张 璐,陈淑荣

(上海海事大学 信息工程学院,上海 201306)

行人检测是计算机视觉和模式识别领域中的研究热点,在视频监控中有广泛的应用。目前,用于行人检测的方法主要分为3类:(1)基于运动信息的方法[1-2],根据行人运动信息(如步态)实现行人检测,实时性好但只限于运动行人;(2)基于先验知识建模的方法[3],利用已知先验知识构建人体模板和待测目标进行匹配,但模板的初始参数难以获取;(3)基于特征统计分类的方法[4-9],根据训练数据获取有效分类器对输入检测窗口进行检测,实现简单且检测效果较好,是目前静态图像行人检测的主流方法,但对视频行人检测速度较慢。因此,如何保证视频行人检测的准确率,并提高检测速度是一个急需解决的问题。

1 本文行人检测方法

视频录像中行人的不同姿势、复杂的背景变化对算法的检测准确率和检测速度都提出了严格要求。本文提出利用视频中的运动信息获取ROI区域,结合Fisher准则挑选强分辨力行人HOG特征,并结合SVM分类器检测行人。其中,训练部分采用正负样本库提取强分辨力HOG行人特征,并通过SVM训练得到强分辨力HOG特征的行人分类器。检测时利用帧间信息获得ROI区域,通过多层次缩放ROI区域获取所有检测窗,并利用强分辨力行人HOG特征来表征检测窗中行人,通过训练好的分类器实现对视频中行人的检测。该算法框架如图1所示。

1.1 视频图像ROI目标区域提取

视频帧图像中存在大量的非人区域,全局扫描需要很多冗余计算。本文采用三帧差分法获取运动目标前景,进行二值化处理、形态学处理和前景块扩展,获取ROI目标区域。具体实现步骤如下。

图1 行人检测系统框架

(1)采用三帧差分法获取运动目标前景。当前帧的前景帧差图为:

其中,IL(x,y,i)、IL(x,y,i-1)、IL(x,y,i-2)分别为第 i帧、第i-1帧和第i-2帧的亮度分量,d为帧间图像对应像素点亮度差的绝对值。

(2)对目标前景图进行二值化处理和形态学处理。二值化处理为:

其中,D为初始阈值,D(x,y)为二值图对应像素点的亮度值。经过膨胀、腐蚀二值图像,获得消除了噪声、微小运动区域的目标前景块。

(3)根据行人体型特征参数,对比目标前景块,获取有效的行人目标前景块。通过设置行人宽高比(w∶h)特征阈值,除去过窄、过小等不符合行人特征的目标前景块。

(4)扩展行人目标前景块,以确保行人不出现在ROI目标区域之外。矩形扩展长度为:

其中,u是 0~1的一个值,w、h分别表示前景块的宽、高。

(5)标记扩展后的行人目标前景块集合,构建 ROI区域以进行后续的特征提取和检测。ROI目标区域提取如图2所示。

1.2 强分辨力行人特征提取

1.2.1 多尺度HOG特征

HOG特征是通过计算局部区域的梯度方向直方图描述目标形状特征,对光照变化和小量的偏移不敏感。DALAL N提出的基本HOG是在 64×128的检测窗内提取105个16×16等大小的 Block特征块,利用这些特征块构成描述符来训练和检测行人。

等大小的基本HOG特征块对描述行人较大的部位(如头部、身体等)的整体信息能力有限,因此本文构建HOG特征时采用了多尺度[6]方法,对于 64×128检测窗,Block 块的大小选取依次从 16×16 到 64×128,宽高比(w∶h)分别取 1∶1、1∶2 和 2∶1, 共获得 452 个不同尺度的 Block块。

在特征块提取过程中,为避免特征块交叠而引起的重复计算,引入“积分图[6]”思想,每个像素点的特征由9维向量表示,即:

其中,G 为像素点梯度幅度值;λ=(0,…,jk,…0)表示像素点梯度方向,jk=1,k为梯度方向落在的区间。HOG特征简化为:

其中,s(x,y)表示点(0,0)到(x,y)直线上的像素向量累加,h(x,y)表示点(0,0)到(x,y)连接矩形内像素向量累加。对于矩形区域内的直方图,统计可通过计算矩形4个顶点的值获得。矩形区域像素值可表示为:

其中,h(x1,y1)、h(x2,y2)、h(x3,y3)、h(x4,y4)分别为矩形的4个顶点。

为了减少光照变化和阴影的影响,在计算特征时采用了L2-norm归一化因子,即:

其中,xi为归一化前特征值,i为 Block块中特征数目,e为略大于0的常数。

1.2.2 基于Fisher准则的行人强分辨力特征选取

由于高维HOG特征向量存在大量冗余信息,不仅影响提取、分类速度,某些维度向量还可能降低检测的精度。本文利用Fisher准则[5]分类特性挑选分类贡献较大的强分辨力行人特征块。通过计算两类样本特征的类间离散矩阵sb与总类内离散度矩阵 sw的比值F(j)作为输出权值,利用直线将行人特征、非行人特征区分开来,将分类的过程转化为特征点在直线投影的过程,根据行人Block块特征点距离直线远近来判断Block块的描述能力。Fisher准则提取强分辨力特征的实现步骤如下。

(1)遍历检测窗中每个 Block 块(fi),根据式(9)~式(12),利用 Fisher准则计算每个块的输出权值 F(j)。

其中,mi是两类样本均值的均值向量,Ni是样本类的样本数目。

其中,Sb、Sw分别为样品类间离散度矩阵值、总类内离散度矩阵值;F(j)为块输出权值,F(j)越大,Block 特征块区分能力越强。

(2)依次对各个 Block块的F(j)从大到小降序排列。

(3)从降序序列中挑选新特征集fselect:

逐次添加一个fi直到fselect分类结果达到预期目标。利用SVM验证分类效果,获得最优强分辨力行人特征f′select。

(4)对强分辨力特征 f′select进行 SVM训练获得分类器,用于后续ROI目标区域行人检测。

1.3 ROI目标区域行人检测

通常ROI目标区域采用的检测窗大小固定,而待检测视频图像中的目标位置、大小是随机变化的。为避免行人漏检,本文采用多层次穷尽搜索获得检测窗。将ROI区域按照一定的步长逐步缩放,直到达到预先设定的尺度。在不同尺度下分别进行行人检测,并将所有结果融合处理、标记。行人检测结果如图3所示。

2 实验及结果分析

本文实验在MATLAB2008a上实现,计算机环境配置为3 GHz CPU和2 GB内存。采用的数据来源于INRIA行人数据库和PETS2006视频库。在提取强分辨力行人特征时,分别将 INRIA样本库中的 1 000个正、负样本用于训练和检测,并利用强分辨力HOG行人特征分类器对PETS2006视频库的视频行人进行检测。实验采用libsvm工具包,选用线性SVM训练分类器。

文中通过对单尺度基本HOG扩展,得到Block数为452的多尺度HOG,并利用Fisher准则分别对不同尺度HOG进行降维处理,获得不同维数的强分辨力特征,结合SVM分类器验证不同尺度、不同维度的特征检测效果。实验结果如表1所示。

表1 不同HOG特征块数的检测对比

实验表明,扩展后的多尺度HOG特征,SVM分类准确率显著提高;相同特征维数下 (表中只列出Block数为105、30、10的特征),多尺度特征比单尺度特征具有更高的检测准确率且降维幅度越大,多尺度特征优势越明显。

文中采用设定最低检测率来提高检测速率,利用SVM分类的效果来选择最佳分辨力特征。如表1所示,在多尺度下,当选取特征块数为10时,保证了行人检测的准确率,提取、检测的速率比基本HOG都有所提高,检测速率提高了9.7倍。本文取多尺度下Block数为10的特征集作为f′select,训练分类器进行行人检测和分类。

实验通过ROI目标区域提取,大大降低了检测窗口数量,并与传统 HOG全局扫描算法、Adaboost[3,8]算法作比较。由于本文算法ROI目标区域大小直接受行人数量、大小影响,实验选取统一的单行人视频序列进行测试,帧像素大小为720×480。实验结果如表2所示。

表2 几种算法性能比较

[3,8]提到的 Adaboost算法是利用一系列弱分类器组合强分类器,根据每个样本分类结果修改权值进行下一层分类训练,训练分类器时依次对每个特征集单独训练,耗费时间很长。本文算法采用Fisher准则提取的强分辨力行人特征训练分类器,特征整体一次投影实现一次分类,具有优势。

实验证明,本文算法比全局扫描减少了检测窗数量,显著提高了检测的速率;在保证准确率的前提下改进单尺度HOG,利用多尺度降维HOG进一步提高行人的检测速率。本文算法不仅大幅度提高了行人检测的速率,而且保证了视频行人检测准确率在90%以上。

本文针对传统HOG特征在行人检测中存在高维度计算的问题,提出一种利用视频运动信息和强分辨力行人HOG特征相结合的视频行人检测算法。利用INRIA行人库和PETS2006视频库验证了算法的有效性。后续将针对夜间、雨天等复杂背景,进一步验证和改进算法。

参考文献

[1]刘鑫,刘辉,强振平,等.混合高斯模型和帧间差分相融合的自适应背景模型[J].中国图象图形学报,2008,4:729-734.

[2]王成亮,周佳,黄晟.基于高斯混合模型与 PCA_HOG的快速运动人体检测[J].计算机应用研究,2012,29(6):2156-2160.

[3]周晨卉,王生进,丁晓青.基于局部特征级联分类器和模板匹配的行人检测 [J].中国图象图形学报,2010,15(5):824-829.

[4]DALAL N,TRIGGS B.Histograms of oriented gradients for human detection[C].IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR2005,2005,1:886-893.

[5]孙昀,刘富强,李志鹏.基于稳定区域梯度直方图的行人检测方法 [J].计算机辅助设计图形学报,2012,24(3):372-377.

[6]黄茜,顾杰锋,杨文亮.基于梯度向量直方图的行人检测[J].科学技术与工程,2009(13):3646-3651.

[7]姚雪琴,李晓华,周激流.基于边缘对称行和HOG的行人检测方法 [J].人工智能及识别技术,2012,38(5):179-182.

[8]种衍文,匡湖林,李清泉.一种基于多特征和机器学习的分级行人检测方法 [J].自动化学报.2012,38(3):375-381.

猜你喜欢

分辨力分类器行人
超二代像增强器分辨力随输入照度变化研究
毒舌出没,行人避让
路不为寻找者而设
不同数学函数算法对SPECT空间分辨性能检测影响分析
基于实例的强分类器快速集成方法
我是行人
曝光闯红灯行人值得借鉴
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
64层螺旋CT空间分辨力评价方法解析