APP下载

基于HOG随机森林分类器的人体识别

2013-08-13梁琛华

电视技术 2013年15期
关键词:鲁棒性识别率分类器

梁琛华,常 青

(国防科技大学ATR重点实验室,湖南 长沙 410073)

责任编辑:任健男

随着社会经济的发展以及人们安全意识的提高,对重要场所的安全警戒要求也越来越高。目前,智能视频监控得到了较快的发展,因其具有对监控场景中的目标进行实时监测、跟踪以及行为识别的独特优势,得到了广泛的关注。其中,红外视频警戒以其全天候、抗隐蔽能力强的特点在侦察、夜战、安全警戒中发挥了极为重要的作用。

在红外视频监控系统中,对目标的识别尤为重要,因为往往需要对特定目标(人)进行识别,而在较为复杂的场景中,常常会因为背景环境中的车辆、建筑、动物、电线杆以及风吹草动等影响,造成误检及漏检。

为了对人体目标进行有效的识别,需要选择目标的相应特征进行分类器的学习,就特征提取而言,常见的有利用其几何特征,比如宽高比、形状复杂度、紧密度等,但往往较难区分视场中的树叶、电线杆等伪目标;或者利用灰度特征,但当背景区域亮度与人体相近,比如房屋、海边等区域,甚至比人体更亮时,难以识别出人体目标。

此外,为了提高识别率,需要选择相应的算法对目标特征进行学习,以形成分类器。常见的有基于AdaBoosting的学习,但该算法实时性较差,不能满足本文场景中实时处理的要求,且在学习过程中需要大量的样本。此外有基于二叉树的学习,虽然算法速度最快,但识别性能太差。还有基于SVM分类器的学习,在实现目标的二分类时效果较好,但在解决多类分类的时候存在困难,同样不适合本文的场景特征。

为了适应复杂场景中的不同目标分类,实时处理,并要求有较好的鲁棒性,本文将HOG(Histogram of Oriented Gradient)算法对图像局部区域外观和形状的良好表征和随机森林分类器稳健的目标分类性能有效结合,提出了一种针对复杂场景的基于HOG的随机森林分类器的人体识别模型。

1 HOG特征提取

在对人体目标进行目标分类训练之前,需要对感兴趣目标的特征进行相关的提取,并且该特征要尽可能最大程度地区分感兴趣目标和其他目标,而HOG能够对图像的局部区域特征进行描述,它通过计算局部区域上的梯度方向直方图来构成人体特征,能够很好地描述人体的边缘和轮廓特征[1-3],并且对光照的变化、目标的少量偏移以及目标的远近不敏感,因此可以较好地表征人体与其他目标的差异。

HOG的流程图如图1所示。

图1 HOG特征提取流程图

HOG特征计算的具体步骤如下:

1)对于输入的视频逐帧处理,并提取感兴趣的矩形区域。

2)建立方向坐标系,将-90°~ +90°平均分成NSTAGE个区域,并且得到各区域的正切范围,便于后面根据各区域的梯度范围进行目标的分类。

式中:i∈[1,NSTAGE -1]。

因为正切值在-90°和+90°的位置为无穷大,为了方便计算,定义

3)对于图像中的某一点的像素I(x,y),其一阶梯度为:

水平方向为

垂直方向为

4)根据各点像素的一阶梯度值dx(x,y)和dy(x,y)获得各点的梯度方向α(x,y)和梯度幅值Z(x,y)。

梯度方向为

梯度幅值为

5)根据各点像素的梯度方向α(x,y)确定该梯度幅值在坐标系中所处的范围,并对各区域的梯度幅值累加求和。

若 α(x,y)< Stage[k+1]且α(x,y)> Stage[k],则HOGvector[k]+=Z(x,y),其中 k ∈[0,NSTAGE]。将各区域梯度值进行二范数的归一化,各区域梯度幅值的二范数为

二范数归一化为

获得HOG特征向量:将各个区域归一化后的向量连接起来,得到HOG特征向量,并且,该特征向量作为生成随机森林分类器的训练特征。

2 随机森林分类器

2.1 各分类器的比较

为了实现对人体目标的有效分类,需要基于HOG特征向量,选取适合的算法进行学习,生成分类。学习算法很多,下面简要介绍几个常见的算法。

1)Boosting[4]

它是判别分类器的组合,分类决策是由各个子分类器的加权组合决定的,在逐个训练分类器的时候,数据样本的权重会被重新分配,使之能够给予错误数据更多的注意力。训练不断地进行,直到总错误低于某个特定的阈值,Boosting算法有较高的准确率,不需要先验知识,只需要选择合适的迭代次数,但速度过慢,需要大量数据进行训练,且易受到噪声影响。

2)决策树[5]

它是一个判别分类器,该树在当前节点通过寻找数据特征和一个阈值,最优划分数据到不同的阈值,处理流程是不停地划分数据,并向下到树的两端节点之一。和其他算法相比,其性能不为最优,但速度最快。

3)SVM[5]

支持向量机分类器,需要设定一个高维空间中任意两点的距离函数,采用基于最大类间隔的线性分类技术,得到某种意义上较优地区分类别的非线性分类器,当数据有限时,该算法可以获得较好的性能,SVM算法对大规模训练样本难以实施,且解决多类分类存在困难。

以上几种是目前较为常见的学习方法,然而各自均存在一定的局限性,而随机森林学习算法却能够很好地解决这一问题。

2.2 随机森林的原理

随机森林可以通过收集很多树的子节点对各个类别的投票,然后选择获得最多投票的类别作为判断结果。随机森林包含随机选择的多个决策树,此外,它继承了树的很多属性,通过构造不同的训练集增加分类模型间的差异,从而提高模型的分类能力。此外,为了提高鲁棒性,随机森林使用袋外(out of bag)方法来检验分裂,随机森林的具体流程如图2所示。

图2 随机森林分类器

由图2所示,多个分类器的组合模型,其性能远优于单个决策树的预测,鲁棒性较好。

2.3 基于HOG的随机森林分类器的建立

1)首先,从实验场景中提取感兴趣的正样本53个和负样本169个,如图3所示。

图3 训练样本图

2)提取样本的HOG特征向量HOGvecor,并设置参数responses的值。正样本:responses=1;负样本:responses=0。

3)通过以下代码对样本进行学习、训练,生成分类器:

4)调用随机森林预测函数对目标特征进行预测,并且将返回值r转换成整数来标志是否预测正确,代码为:

5)使用不同数量的testsample(包括正反样本)验证分类器的识别率。

2.4 实验结果

为了验证不同测试样本数以及梯度区域分类数目对识别结果的影响,采用不同的数据进行观测,此外,本文对比了不同分类器的性能。

1)选取15个正样本,33个负样本,HOG分成10个区域,各分类器的识别率如表1所示。

表1 HOG分成10个区域时各分类器的识别率

2)选取15个正样本,33个负样本,HOG分成40个区域,各分类器的识别率如表2所示。

3)选取15个正样本,33个负样本,HOG分成60个区域,各分类器的识别率如表3所示。

表2 HOG分成40个区域时各分类器的识别率

表3 HOG分成60个区域时各分类器的识别率

通过表1、表2、表3的结果可知,通过一定数量的测试样本对4种分类器进行检测,随机森林分类器的识别效果最佳,并且随着HOG区域细分程度的增加,分类越精细,识别率越高。

3 复杂场景中的人体识别

前文简要介绍了HOG特征的提取,并且基于HOG产生的特征向量,进行随机森林分类器的学习,建立了随机森林分类器,并利用测试样本验证了随机森林分类器的性能优于其他分类器。为了进一步说明该分类器在复杂场景中的鲁棒性,选择一些复杂的场景进行验证。

测试视频为红外摄像机拍摄所得,环境温度0~10℃,分辨率为384×288。程序运行环境为:VC++2008,OpenCV 2.10,Intel Core i5-2430M/2 Gbyte 内存。

1)场景一:街道,如图4所示(原图为彩色图片)。

场景说明:图4a中右下方狗的目标框为绿色;图4b中中心汽车的目标框为黄色;图4c中左上方的吊车的目标框为蓝色;图4中的人体目标框均为红色。

场景分析:街道环境较为复杂,有电线杆、树木、运动的吊车、宠物以及汽车的出现。从图4a知,没有将狗(绿框)识别成人体目标;从图4b知,没有将汽车(黄框)识别成人体目标;从图4c知,没有将运动的吊车(蓝色区域)识别成人体目标;从图4d知,当视场中出现多人体目标时,没有出现漏检,分类器鲁棒性较好。

2)场景二:草原,如图5所示(原图为彩色图片)。

场景说明:图5中,人体目标框为红色。

场景分析:草原环境中,背景灰度和人体目标差异较小,且存在电线杆、风引起草坪的晃动等干扰,从图5a和图5b中可知,分类器均能较好地识别出人体目标,并且无虚警,分类器鲁棒性较好。

3)场景三:野外,如图6所示(原图为彩色图片)。

图6 野外场景下人体目标的识别

场景说明:图6中,人体目标框为红色。

场景分析:野外环境中,存在电线杆,有许多土坡,并且树木较多,地面杂草丛生,因此在风大的时候会对目标识别产生一定的干扰,从图6a和图6b中可知,分类器能够较好地识别出人体目标,无虚警,分类器鲁棒性较好。

以上3个场景是比较有代表性的复杂场景,此外还有河套、海边、工地等其他复杂场景,就不一一列举了,它们有以下一个或几个特点:1)视场中存在汽车、宠物等其他运动物体;2)存在电线杆、灌木桩等物体;3)当环境中风较大时,引起的树叶和草丛的晃动会带来干扰;4)背景温度较高,比如房屋、村庄、海洋等,造成背景环境和人体灰度接近,带来干扰。

针对以上复杂环境,基于HOG的随机森林分类器依然可以较好地对人体目标进行准确识别,不会出现误检和漏检,鲁棒性较好。

4 总结

本文通过对ROI区域HOG特征的提取和学习,并对一定数量的正负样本进行训练,建立了基于HOG的随机森林分类器,并通过测试样本验证了该分类器的鲁棒性。此外将基于HOG的随机森林分类器与二叉树、SVM和AdaBoosting等算法进行比较,验证了其优越性。最后,将生成的分类器用于街道、草原以及旷野等复杂场景,观察到在不同情况下均可以实现对人体目标的准确识别,在视频监控中发挥着重要的作用。

[1]胡仕玲,顾爽,陈启军.基于HOG的物体分类方法[J].华中科技大学学报,2012(11):124-126.

[2]李晖,曲仕茹.基于分层梯度方向直方图和SVM的人体识别[J].计算机测量与控制,2010,18(11):2062-2064.

[3]TRIGGS D.Histogram of oriented gradients for human detection[C]//Proc.the IEEE Conference on Computer Vision and Pattern Recognition.[S.l.]:IEEE Press,2005:886-893.

[4]董乐红,耿国华,高原.Boosting算法综述[J].计算机应用与软件,2006(8):27-29.

[5]于玲,刘彦隆,郭建军.DWT和Fast PCA与SVM在人脸识别技术中的应用[J]. 电视技术,2012,36(23):172-176.

猜你喜欢

鲁棒性识别率分类器
基于类图像处理与向量化的大数据脚本攻击智能检测
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
基于确定性指标的弦支结构鲁棒性评价
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于非支配解集的多模式装备项目群调度鲁棒性优化
高速公路机电日常维护中车牌识别率分析系统的应用