基于视频图像的人脸检测
2014-08-11姚俊
姚俊
(上海交通大学自动化系,上海 200240)
基于视频图像的人脸检测
姚俊
(上海交通大学自动化系,上海 200240)
视频图像的人脸识别技术发展,促进了数字视频监控等系统的广泛应用。本文对基于特征、模板、统计理论等视频图像的人脸检测基本方法进行了介绍,对人脸检测系统的图像采集、图像处理、特征定位、人脸识别处理等设计进行了阐述,对人脸检测方法的改进进行了尝试。
人脸检测 视频图像 数字技术
信息技术数字化、智能化在安防监控领域的发展,诞生了智能人脸识别技术人。人脸识别综合了光电技术、网络工程等技术,它作为自动人脸识别的关键环节,在安全识别、刑侦、信息检索等方面得到广泛的应用。
人脸图像检测既是人脸识别系统的主要组成部分,也是人脸信息处理中的一项关键技术,在基于内容的图像检索、视频会议、可视电话、远程视频监控以及人机交互等方面都有着很重要的应用价值。但在人脸视频图像中,由于人脸本身复杂的细节变化、人脸多姿态、各种遮挡、光照不均匀、以及复杂背景时,人脸检测和识别普遍存在计算量大、速度慢、鲁棒性差的弱点。
1 人脸检测及方法
1.1 人脸检测内涵
人脸检测作为人脸识别系统的一个组成部分,在实际中主要是在图像中准确标定出各种复杂环境下的人脸的位置和大小,然后进行统一人脸位置以及图像信息的格式。
由于人脸图像中包含的模式特征十分丰富,如直方图、颜色、模板、结构及Haar等特征。如果将其中有代表典型意义的有用的信息挑出来,就可以利用这些信息,实现实现对人脸检测。人脸检测以及定位子系统的准确性和性能将直接关系到整个人脸识别系统的可行性、实时性。
1.2 人脸检测基本方法
(1)迭代算法。本算法是自动从多个弱分类器的空间中挑选出若干个分类器,构成一个分类能力很强的强分类器。其改变数据分布,根据每次训练集中各个样本的分类是否正确以及上次的总体分类的准确率来确定每个样本的权值。将修改过权值的新数据送给下层分类器进行训练,最后将每次训练得到的分类器融合起来,作为最后的决策分类器。
(2)基于特征的方法。本方法是利用人脸的等先验知识导出的规则进行人脸检测。边缘和形状特征人脸及人脸器官具有典型的边缘和形状特征,如人脸轮廓、虹膜轮廓等都可以近似为常见的几何单元。纹理特征人脸具有特定的纹理特征,纹理是在图上表现为灰度或颜色分布的某种规律性,其在不同类别的纹理中有其不同特点。颜色特征人脸的皮肤颜色是人脸表面最为显著的特征。
(3)基于模板的方法。本方法是通过计算人脸模板和待检测图像之间的相关性来实现人脸检测功能的。其通过使用人工定义的方法来给出人脸通用模板。对于待检测的人脸图像,分别计算眼睛、鼻子、嘴等特征同人脸模板的相关性,由相关性的大小来判断是否存在人脸。通用模板匹配方法的优点是算法简单,容易实现,但是它也有自身缺点,如模板的尺寸、大小、形状不能进行自适应的变化,从而导致了这种方法适用范围较窄。
其也可以通过设计一个可变模型,利用监测图像的边缘、波峰和波谷值构造能量函数,当能量函数取得最小值时,此时所对应的模型的参数即为人脸面部的几何特征。这种方法存在的不足之处在于能量函数在优化时十分复杂,消耗时间较长,并且能量函数中的各个加权系数都是靠经验值确定的,在实际应用中有一定的局限性。
(4)基于统计理论的方法。本方法是指利用统计分析与机器学习的方法分别寻找人脸与非人脸样本特征,利用这些特征构建分类器,使用分类进行人脸检测。它主要包括神经网络方法,支持向量机方法和隐马尔可夫模型方法。基于统计理论的方法是通过样本学习而不是根据人们的直观印象得到的表象规律,因此可以减小由于人眼观测不完整和不精确带来的错误而不得不扩大检测的范围,但是这种方法需要大量的统计特性,样本训练费时费力。
2 人脸检测系统设计
2.1 视频图像采集
人脸检测之前,首先要采集影像视频信息,并以指定的多媒体格式进行存储。人脸识别检测系统的视频图像采集、存储的处理:
(1)设计并生成基础构件,然后进行连接。基础构件包括图像管理器、图像捕获管理器。
(2)枚举系统中的视频设备,循环查找可用的视频设备,然后绑定到图像捕获管理器,将图像捕获管理器连接到图像组件管理器中。
(3)系统枚举可用的视频图像压缩器,选择对应的压缩器,连接到图像管理器。
(4)捕获各种环境下的人脸视频影像,系统保存为指定视频格式的文件。
2.2 运动图像处理
本系统的目标是从视频影像背景中提取编号区域的影像信息,为了方便对视频影像中的目标进行分类和处理,从而获得有效的人脸影像区域。由于检测系统是基于运动影像的,因此只需用考虑运动变化中的影像像素信息。对于运动检测的工作,主要的处理方法有:背景剪除法、时间差分法、光流分时法等方法。
2.3 人脸特征定位
人脸特征定位目的是排除非人脸区域。实时采集的人脸影像在某些环境下并不是出于正面的位置。在人脸特征定位系统中,通过对人脸的主要器官:眼、耳、鼻、口等部位进行验证,旋转人脸等多种技巧来确定人脸区域。在系统中,主要考虑到视频监控系统的环境布局等因素,参考了眼睛在几何与灰度色彩方面特征来定位眼睛,据此来确认最终的人脸区域,采取从局部到整体的策略。
2.4 人脸识别处理
人脸识别系统是整个系统的核心,在纷繁复杂的识别技术中,主要使用K-L的特征脸识别算法EigenFace。考虑到人脸特征的分类情况,可以充分利用特征分类的详细信息,这样可以改善识别的性能。在综合了这两种识别方法的基础上,还要考虑到光照、摄像机方向对识别结果的影响。由于大多数情况下,实时视频监控系统周围的环境、光照、方向都不是确定的,因此必须要消除光照等因素的影响,从而提高系统的识别效率和性能。
3 人脸检测方法的改进
人脸的检测方法尽管很多,并且一定的成效。为了尽量减小由外界环境和自身因素以及由算法本身缺陷造成的影响,提高检测效率和精确性,人脸检测的还有许多需要改进。
3.1 不变矩理论的应用
不变矩理论是计算机视觉、模式识别、图像处理的重要内容,基于区域的不变矩理论最早是由Hu提出来的,在人脸检测中主要应用了Hu矩处理的旋转、缩放、平移三不变的特性。此特性与Adaboost算法结合使用,弥补Adaboost在旋转角度过大或者完全侧面人间不能检测的缺点,实验结果证明这是可行的。
3.2 改进的基于肤色的检测方法基于彩色图像的肤色模型来检测人脸的方法,取得了一定效果,但是,既需要训练大量的人脸和非人脸样本,也容易受到光线和复杂背景的影响,鲁棒性也会因此变差。特别是用RGB色彩空间时因为RGB同时包含了亮度和色度信息,相关性较高,随着环境和亮度的变化使得人脸检测变得复杂繁琐。
改进方法,把RGB彩色空间转换到YCrCb空间:首先进行光补偿,将各个像素的R、G、B分别扩展到最高的255。Y是亮度分量,Cb是蓝色色度分量,Cr是红色色度分量。转换成YCbCr彩色空间具有将亮度和色度空间相分离的特点,肤色聚类效果也很好,而且该空间计算方法简单,速度快,易于实现。
将转化后的Cb分量与Cr分量图作差得到初级图像,最后利用自动阈值将灰度图像处理成二值图像。通过以上做法得到了人脸,但手,胳膊,颈部都显示出来。再结合眼部特征进行检测确定是否存在人脸及其人脸的位置。结合肤色特征通过图像差分方法提取清晰准确的活动区域,有效地解决了视频中人脸检测的问题。
3.3 基于FCM的多重决策树的分类方法
决策树是数据挖掘中的一种分类方法主要用于分类和决策,根据FCM划分的结果,构建一个自顶而下的树经过若干次分类划分为原来混杂的样本集,最终分裂为以一个个类别纯度高的子集。使树的每一个节点表示一个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点表示一个类或类的分布,树的最顶层节点是根节点。实验证明这种检测方法提高了检测的速度而且具有很好的检测性能。
4 结语
人脸检测是一项在困难中不断发展的技术。目前,人脸的检测方法取得了许多成功,由于光照、遮挡等环境变化和人脸本身复杂性,检测的精确度和鲁棒性仍然存在缺点和不足,随着模式识别技术的发展,相信肯定可以在可以预计的将来,做到在图片以及视频中迅速准确地定位到概定的目标。
[1]熊平,徐敏.基于视频的实时人脸识别的研究与实践[D].长沙:中南大学,2010.
[2]冯东青,丁锴.视频中基于肤色模型的人脸检测[J].计算机应用与软件,2010,27.
[3]张建明,汪大庆.基于视频的实时人脸检测研究[D].镇江:江苏大学,2010.