人脸检测及识别技术综述
2013-04-23王昊
王昊
【摘 要】人脸检测与识别技术因为其巨大的应用价值以及市场潜力,已经成为图像工程领域研究的热点。目前,国内外的文献中涉及到的人脸检测和识别算法有很多种,本文对近些年来在期刊和会议上发表的有关人脸检测和识别技术的文章进行了归纳总结,概括介绍了一些人脸检测和识别的典型方法,分析了这些方法的特点及理论依据。
【关键词】人脸检测;人脸定位;特征提取;人脸识别
0.引言
在现实生活中,很多情况下都需要进行身份验证。人脸是人体最重要的外貌特征,由于脸部信息可以通过如摄像头等非接触的方式取得,所以非常适合作为身份鉴别的依据。与指纹识别、虹膜识别等诸多生物识别技术比较而言,人脸识别技术的独特之处还表现这种识别技术具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受。该技术被广泛应用于国家安全、军事安全和公安、司法、民政、金融、民航、海关、边境、口岸、保险及其他民用安全控制系统等领域当中。此外,人脸识别技术的研究还涉及生理学、心理学、人工智能、模式识别、图像处理等多个学科领域,因此它具有重要的理论研究价值。
1.人脸检测
人脸检测问题起源于人脸识别技术。人脸检测从总体上可分为两大类:基于先验知识的人脸检测方法和基于后验学习和训练的人脸检测方法。
1.1基于先验知识的人脸检测方法
基于先验知识的人脸检测方法自上而下,依据人脸面部器官的对称性、灰度差异等先验知识,将人脸面部器官之间的关系编码并制定出一系列的准则。当待测图像中的某些区域符合该准则,该区域就被检测为人脸。
此类方法所使用的特征可以分为灰度特征、形状特征、结构特征、纹理特征和颜色特征。
1.1.1灰度特征
多个人脸图像的平均就是一个简单的人脸模板,同时,人脸的眉、眼、嘴、前额、鼻梁、下颌、脸颊等区域的灰度值较高,因而人脸具有特定的灰度分布特征。对人脸区域进行水平和垂直方向的灰度投影,根据极小值点位置即可得到眼、鼻、嘴等各自所处的区域。因此基于灰度特征建立人脸模板可以检测人脸。
1.1.2形状特征
从人脸子器官的形状和相互位置关系出发,提取人脸特征。人脸轮廓、眉毛轮廓、嘴唇轮廓、鼻侧线等可以近似视为椭圆、弧线、线段组合等简单的几何单元。与灰度特征相比,形状特征对光照变化具有一定的鲁棒性。Graf等首先利用带通滤波器选择出一段频率,然后根据形态学的知识设定一系列的阈值找出眼睛、嘴巴等区域,最后依照以上位置检测出人脸。Leung等提出任意图匹配的方法,其主要目的是用准则正确表达出面部特征的几何分布。
1.1.3结构特征
人脸具有对称性。正面人脸是左右对称的,对应的灰度特征和形状特征基本相同。眉毛、眼睛、鼻子和嘴巴等区域是按照一定比例关系组织在一起的。各个器官自上而下排列,两眼和嘴中心构成一个三角形。
1.1.4纹理特征
人脸图像具有一定的纹理特征。灰度共生矩阵或者Gabor小波等频域特征可以表征人脸图像的纹理特性。
1.2基于后验学习和训练的人脸检测法
这一方法实际上是将人脸检测问题转化为统计模式识别的二分类问题。通过对大量的“人脸”与“非人脸”样本进行训练,得到“人脸”与“非人脸”分类器,通过判别图像中所有可能区域属于哪类模式的方法实现人脸的检测。此类人脸检测方法主要有基于Adaboost级联分类器的方法,基于概率模型的方法,基于支持向量机的方法等。
2.人脸识别
2.1特征脸(Eigenface)方法
以主成分(Principal Component Analysis ,PCA)分析理论为基础的人脸识别方法称为特征脸方法。PCA是通过K-L变换展开的网络递推实现, K-L 变换是一种常用的特征提取方法,对消除模式特征之间的相关性、突出差异性有最显著的效果。特征脸识别方法就是把含有人脸图像的区域作为一种随机向量,继而用K-L变换得到其正交基底。这些基底中特征值较大的基底具与人脸的形状相似,所以称之为特征脸。而这些基底的线性组合可以表述和充分接近人脸的图像,就可以对人脸进行识别和合成。识别过程是首先得到由特征脸组成的子空间,将人脸图像映射到该子空间上,进而比较其与标准的人脸图像在特征脸空间中位置的差异。
2.2奇异值分解方法
奇异值特征是一种代数特征,它用于反映图像的本质属性。在某种程度上,奇异值特征除了具有比例不变性、旋转不变性等重要性质,在某种程度上还具有代数和几何的双重稳定性。利用这一特性,可以用奇异值分解对人脸图像矩阵提取出图像的代数特征后进行匹配识别。在奇异值分解的基础上利用奇异值分解方法可以产生多种人脸识别方法。例如基于图像集似然度的人脸识别方法,是用人脸图像集中每个人脸图像的奇异值向量构造出一个特征矩阵,再用待检测人脸的特征矩阵与已知的各类人脸图像的特征矩阵做似然度的对比,判断待检测人脸属于人脸图像集中的哪一类。
除了上述几种典型的方法之外,灰度模板、可变形模板、弹性属性图、频域特征表示法、光流形状模型、光照锥模型等也是较常用的人脸表示方法。
2.3弹性图匹配技术
弹性图匹配技术是对几何特征进行分析的基础上,结合对灰度分布信息进行小波纹理分析的识别算法。早期,Lades等人提出了针对畸变不变性物体的动态链接模型,用稀疏图形来描述物体,用局部能量谱的多尺度描述标记顶点,其拓扑连接关系用边来表示且标记为几何距离,然后应用塑性图形匹配技术来寻找最近的已知图形。随后,Wiscot等人对改技术进行了改进。由于该方法保留了人脸图像的空间信息,提取了描述人脸图像的局部特征,并在一定程度上允许人脸从三维投影到二维引起变形的情况,因此这种方法具有典型代表性。
2.4人工神经网络方法
在人脸识别技术的发展过程中,神经网络的应用研究从未停止。人工神经网络最早应用于人脸识别技术的是一种单层的自适应网络WISARD。后期多使用多层感知器(MLP)识别人脸图像,其方法是直接将原始的未经任何处理的人脸灰度图像送入MLP的输入层,却常常导致输入节点的数目过多。为了解决这个问题,研究者们将图像进行采样、分割或映射等处理后送到MLP中记性分类,大大提高了识别的精确度。除MLP外,研究人员还提出了许多不同的神经网络结构,取得了较为理想的识别效果。
3.总结与展望
本文结合人脸检测与识别技术的发展状况,对人脸检测技术和人脸识别技术分别进行了综述。由于各方面对身份验证这一人机交互技术需求的激增,作为身份验证中最重要技术的人脸检测与识别技术正日益受到重视。在世界范围内已经成为了研究的热点。人脸检测与识别技术牵涉面十分广泛,理论问题也非常多,目前出现形成一个专题的趋势。
客观的说,在目前条件下,实现100%成功的人脸检测与识别几乎是不可能的,由于社会各方面巨大的需求,同时也是巨大的动力,人脸检测与识别技术这一研究热点仍将不断发展,新方法、新思路将会不断涌现,必将推动人脸检测与识别技术进一步产业化。