基于图像的人数统计方法综述
2018-09-20范欣欣
范欣欣
摘要:人数统计一直是计算机视觉系统研究的一个重要内容,近年来广泛用于多种场合,利用图像信息对教室中的人数进行统计已经成为主流。文章首先通过对近年来的相关文献进行整理和归纳,总结出适用于教室环境中的人数统计方法,并将适用于教室环境中的人数检测算法分成3类进行讨论:基于人头检测的方法、基于肤色检测的方法、基于人脸检测的方法;其次,对典型的算法针对教室人数进行了仿真重现;最后对各种算法进行了分析和总结。
关键词:人数统计;教室环境;人头检测;肤色检测;人脸检测
人数统计作为数字图像处理和计算机视觉领域中的重要内容,具有很强的研究意义和应用价值。目前,人数统计已经成为商场、旅游景点、火车站、机场等统计客流量的重要方法。在教育方面,人数统计也大有用武之地。人数统计已经成为衡量课堂出勤率的新标准。同时,人数统计可以应用于自习教室,方便学生了解自习室的空座位的情况。此外,可以通过检测教室和自习室中的人数自动地决定照明、取暖和制冷电器的使用情况,从而达到减少达到节能的作用。人数统计具有较强的针对性,对于不同的环境,所采用的人数统计方法也有所不同。对于商场、旅游景点、路口等人群活动量比较大的地方常采用运动目标检测方法,如:选择光流检测法、帧间差分法、背景消减法等[1]。而针对教育方面,以上方法不适用于教室场景,在教室场景中人员基本上处于坐姿,运动的幅度不会过大。本文主要针对教室、自习室环境中的特点研究人数统计经常使用的方法,并对其进行讨论。
1 人数统计常用的方法
早期的人数统计多是通过人工目测或点名统计的方法,既浪费人力又无法高效地实现精准的人数统计。随着计算机视觉的迅速发展,基于图像的人数统计逐渐占据主流,其高效性和准确性都已经有了非常大的提高。人数统计是从摄像头拍摄的图像中检测人,并统计数目的过程。人数统计的关键是要确定人体的某个或某些特征标准,并对这些特征进行描述。根据人数统计所采用的检测对象不同,常用的人数统计方法可分为:基于人头检测的方法、基于人头肩检测的方法、基于肤色检测的方法、基于人脸特征检测的方法、基于头发纹理检测的方法。
本文通过分析目前人数统计的发展和研究现状,将人数统计分为3类进行介绍和讨论:基于人头检测的方法、基于人脸检测的方法、基于肤色检测的方法。
1.1 基于人头检测的方法
基于人头的检测主要是针对人头部的颜色空间和形状特征、人头肩的形状特征“ Q ”这两个方面进行检测。
何扬名等[2]提出了利用人头轮廓特征进行人头识别的方法,先检测图像中的轮廓区域,然后根据轮廓所包围的面积筛选出人头区域,再利用人头的圆形形状对人头进行识别。
顾德军[3]提出了一种利用头部的颜色特征和形状特征进行检测的方法,选取人头部的特征点,对其进行椭圆拟合并采用最近邻匹配方法进行计数。该方法主要适用于人群不是过于稠密和遮挡较少的人群。
李娜等[4]提出了一种比例自适应模板匹配的算法,对人体头部进行识别。根据图像采集设备的成像特点对基本模板进行大小比例缩放,从而使模板适应于不同场景中的对象和目标。
周鑫[5]采用机器学习的方法,提出两阶段人头肩检测算法。利用AdaBoost算法和HOG特征构造第一阶段人头分类器,再利用支持向量机(Support Vector Machine,SVM)算法和对象请求代理(Object Request Broker, ORB)特征构造第二阶段分类器,对人头进行检测和识别。
1.2 基于肤色检测的方法
肤色检测应用于教室环境主要是对图像中出现的人体脸部肤色区域进行筛选、检测、识别的过程。人体的肤色在颜色空间上具有较强的聚类特性[6]。不同人的肤色差异主要是由图像的亮度信息引起的,受色度影响较小,利用这一特性可以区分图像中的肤色区域和非肤色区域,以此将待检测图像中的肤色区域或类肤色区域筛选出来,达到识别人脸肤色的目的。以肤色作为检测的标准,通过对待检测图片进行肤色检测,统计出肤色区域,从而实现对教室中的人数进行统计的目的。
雍宝虎等[7]从视频中取一帧作为待检测图像,由于肤色像素在不同的色彩空间上聚类程度不同,其选择在YCbCr色彩空间上建立肤色模型,利用基于形态学的开闭操作对待检测图像进行预处理,然后采用AdaBoost算法訓练分类器并对待检测区域进行人脸检测,最后统计检测出来的人脸区域作为教室中学生的人数。
毕雪芹等[6]利用肤色聚类特性在YCbCr色彩空间建立高斯模型,并通过AdaBoost算法构造级联分类器检测肤色区域,对人脸区域进行肤色筛选。
张争珍等[8]针对肤色在不同色彩空间的聚类效果不同,提出了一种基于YCgCr色彩空间的肤色识别算法,在YCgCr色彩空间拟合之后,再利用高斯模型进行人脸肤色检测。该方法可以在检测过程中有效地去除非肤色区域的影响。
1.3 基于人脸检测的方法
人脸检测是人脸识别的一部分,已成为近年来的研究热点。人脸检测是指计算机在包含有人脸的图像中检测出人脸,并给出人脸所在区域的位置和大小等信息的过程[9]。
在教室环境中,学生上课时基本上处于抬头的状态,面部的信息很容易被捕捉到,因而很自然想到通过检测人脸来达到识别“人”的目的,从而对人数进行统计。
目前基于人脸检测的人数统计的方法非常之多,本文根据教室和自习室环境中的特点,介绍3种较适合用于教室和自习室环境中的基于人脸检测的人数统计方法:基于特征的方法,基于先验知识的方法,基于统计理论的方法。
1.3.1 基于特征的方法
基于特征的人脸检测方法主要包括两种:基于模板匹配的方法、基于特征不变性的方法[2]。
模板就是一幅已知的小图像,而模板匹配就是在一幅大图像中搜寻目标[10]。模板匹配的首要任务在于找到适合的人脸模板。
基于特征不变性的方法是指人脸的不变特征,如:眼睛、眉毛、鼻子、纹理等。利用各种方法检测这些特征,通过检测到的特征来确定和识别待测区域是否为人脸[11]。
1.3.2 基于先验知识的方法
基于先验知识的方法就是基于规则的方法[12],是根据已知的人脸特征:轮廓特征、形状特征、几何器官分布特征、对称性特征以及它们的综合特征等先验知识,制定一定的规则对图像中的目标区域进行检测,若符合标准则被检测为人脸。
姜军等[13]提出了一种基于先验知识的快速人臉检测算法,其采用人脸镶嵌图模型,根据人脸图像的灰度和边缘信息建立知识库,并采用多级检测步骤来加快检测速度。该方法可以适用于复杂背景下,针对多人、人脸面部表情变化不是特别大的情况。
1.3.3 基于统计理论的方法
基于统计理论的人脸检测方法是通过对大量的人脸样本和非人脸样本进行训练和分析后,建立一种人脸分类器,由分类器进行人脸检测[14]。人脸分类器的质量往往受样本的影响比较大,因此样本往往要符合不同环境的特点。基于统计知识的方法主要包括:子空间的方法、隐马尔可夫方法、支持向量机方法、AdaBoost方法、神经网络方法。
子空间方法主要可分为两类:主成分分析法和线性判别分析法[11],其中最常用的就是主成分分析(Principal Component Analysis,PCA)法。
SVM是在统计学习基础上建立的一种机器学习算法。SVM方法最早是由陶勤勤[15]提出的,Osuna将该方法应用于人脸检测中。
基于Adaboost算法人脸检测方法是当前比较流行的并广泛和其他方法结合使用的一种检测方法。
神经网络的优势在于其可以较为准确的自动捕捉潜在的人脸面部特征,而不需要过多的主观观念确定人脸面部特征,基于神经网络的方法主要包括BP神经网络和卷积神经网络(Convolution neural network,CNN)。
2 典型方法的仿真测试
基于人头检测的方法,本文采用一种基于分水岭分割算法的例子对人头进行检测。从一堂课的教学图像视频中抽取一帧作为待检测的图像,以黑色头部为对象,根据人头部的颜色特征:黑色和形状特征:椭圆形,对教室图片进行图像进行一系列的形态学处理,之后采用分水岭算法对处理过后的图像进行分割,统计分割出来的各个头部对象块,作为课堂上学生的总人数。
图冲,对原始图像(见图1(a))设置合适的阈值进行二值化操作,将黑色(主要用来标记头发)变为白色,其余背景变成黑色(由于分割的目标是较暗的头部区域),得到二值化后的图像(见图1(b))。
计算梯度幅值,并将其作为分割函数,对二值化后的图像进行分割,得到如图2(a)的分割结果,由于图像中存在大量的污点,对分割的结果影响很大,采用一系列的形态学操作对图像进行去噪,并能保留图像中的原始形状,如图2(b)所示。
如图3所示,根据形态学操作后的图像计算前景标记和背景标记,通过利用前景标记和背景标记来修改梯度幅值图像,最后采用分水岭算法对标记后的梯度幅值图像进行分割。
用颜色标记出用分水岭分割后的结果如图4所示。由于摄像头的位置是在教室前方,拍摄的照片中脸部范围居多,采集的头部信息较少,若采用教室后方的摄像头进行采集图像,则采集的头部信息会居多,在进行形态学处理后的再使用分水岭分割算法会得到更好的分割效果,从而会
4 结语
本文将适用于教室和自习室环境中的人数统计算法分为3个主要类别来讨论:基于人头检测的方法、基于肤色检测的方法、基于人脸检测的方法。其中肤色检测算法也可归为人脸检测算法中,但随着肤色检测算法的应用越来越广泛,肤色检测在人数统计中的地位也逐步提高,因此本文将肤色检测算法单独列为一类进行讨论。基于人头检测算法是室内人数统计最实用的方法,其对角度、光线等的依赖程度不高。基于肤色检测的人数统计算法对实地环境条件的要求较高,如:背景、光线等。人脸检测的方法较为完善,并且已经逐步成为一个较为成熟的研究方向。近年来许多专家和学者为了提高检测的准确性和更好地适用于特定的环境,结合多种检测方法进行人数统计,这也成了一种新的研究趋势。目前,随着人数统计研究的逐步深入,其应用也越来越广泛,不仅可以用于大型超市、商场、旅游景点的客流量分析,而且在教室和自习室环境中也具有较强的实用价值。
[参考文献]
[1]张丙坤.基于人头检测的人数统计算法研究[D].西安:西安科技大学,2013.
[2]何扬名,戴曙光.利用轮摩特征进行人头识别的方法[J].计算机工程与应用,2010(29):164-166.
[3]顾德军.基于视频图像处理的人数自动统计技术研究[D].南京:南京航空航天大学,2010.
[4]李娜,方卫宁.基于视频流的地铁人群目标识别[J].北京交通大学学报,2006(1):96-99.
[5]周鑫.基于改进ViBe和机器学习的行人头肩检测方法[D].南昌:华东交通大学,2017.
[6]毕雪芽,惠婷.基于肤色分割与AdaBoost算法的人脸检测[J].国外电子测量技术,2015(12):82-86.
[7]雍宝虎,李岚,邓勇.基于肤色分割和AdaBoost算法的人脸检测[J].科学技术与工程,2013(11):3119-3122, 3225.
[8]张争珍,石跃祥.YCgCr颜色空间的肤色聚类人脸检测法[J].计算机工程与应用,2009(22):163-165.
[9]陈雅茜,雷开彬.人脸识别技术综述[J].西南民族大学学报(自然科学版),2007(4):878-880.
[10]何东健.数字图像处理[D].西安:西安电子科技大学出版社,2015.
[11]孙宁,邹采荣,赵力人脸检测综述[C].北京:中国通信学会通信理论与信号处理专业委员会,2005:8.
[12]赵丽红,刘纪红,徐心和.人脸检测方法综述[J].计算机应用研究,2004(9):1-4.
[13]姜军,张桂林.一种基于知识的快速人脸检测方法[J].中国图象图形学报,2002(1):8-12.
[14]郑青碧.基于图像的人脸检测方法综述[J].电子设计工程,2014(8):108-110.
[15]陶勤勤.基于卷积神经网络和改进支持向量机的人脸检测[D].合肥:合肥工业大学,2016.