人脸识别技术和算法综述
2009-07-28庞珊珊熊建设
庞珊珊 熊建设
摘要:人脸识别是人工智能领域的一个研究热点,是一种基于信息处理的模式识别。这篇论文简要介绍了人脸识别技术的特点、研究背景和识别系统的构成,重点介绍了几种在人脸识别中常用的算法及其评价。总结了现存的研究困难,对人脸识别技术未来的发展和应用做出了展望。
关键字:人脸识别;特征提取;特征脸;神经网络
1 引言
生物特征鉴别技术是利用人体生物特征进行身份认证的一种技术,具有安全可靠、特征唯一、不易伪造、不可窃取等优点。在不同的生物识别方法中,人脸识别有其自身特殊的优势,例如,非侵扰性;采集设备简单,使用快捷;通过人脸识别身份符合人类的习惯,正是由于这些良好的特性,人脸识别的相关研究越来越受到人们的重视,并取得了很好的成果。随着人脸识别技术的飞速发展,它被越来越多的应用于海关监控、企业安全与管理、刑侦等领域。
人脸识别按照信息的来源可以分为两类:基于静态人脸识别和基于动态的信息识别。对于动态识别研究的相关技术还比较欠缺,本文只对静态人脸识别的相关算法进行阐述。
静态人脸识别系统主要有三个步骤:人脸的检测和定位、人脸的特征提取和人脸识别,在这些步骤之前还应有预处理这一步,即对采集到的图像先进行预处理,以达到位置校准和灰度归一的目的,然后寻找人脸,如果有则确定人脸的位置并提取人脸,然后提取人脸特征,最后根据提取的特征进行识别。下面对人脸识别中的常用算法进行介绍。
2 几种常用的算法
2.1 基于几何特征的人脸识别算法
这类识别方法将人脸用一个几何特征矢量来表示,用模式识别中的层次聚类的思想设计分类器达到识别目的,常采用的几何特征有眼睛、鼻子、眉毛、嘴等重要的局部特征,脸型特征及五官在脸上分布的几何特征。识别所用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等等。在这种基于几何特征的识别中,不同特征的相似性度量主要依赖于特征矢量的匹配情况进行判决,例如,基于欧氏距离的判决。
基于几何特征的识别方法的优点有:符合人类的习惯,易于理解;对光照变化不是很敏感,具有一定的抗干扰能力。存在的问题:从图像中抽取稳定的特征比较困难,当有遮挡时会出现误提取;当面部表情变化很大,或者姿态变化很大时,鲁棒性较差;几何特征模型的准则过于简单,一般的几何特征只描述了器官的基本形状与结构关系,忽略了细节特征,会使部分信息丢失。
2.2 基于特征子空间(特征脸)的人脸识别算法
特征脸方法是人脸识别技术中的一种典型方法,又称为主成分分析法(PCA)。SIROV ICH和KIRBY 首先采用PCA算法来表示人脸。它根据一组人脸训练样本构造主特征向量空间,即特征子空间(特征脸),这些特征向量是由图像的生成矩阵的主特征值所对应的特征向量组成,这些主特征向量所占的能量是总能量的90%(一般取这个数)以上,其余的小能量向量被剔除。生成矩阵可以是图像的协方差矩阵、总类内离散度矩阵等等。这个子空间是降维的,维数比原数据空间要小得多,任何一幅待识别人脸图像都可以向此特征空间投影并获得一组坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。任何一幅人脸图像都可以表示为这组特征向量的线性组合,其加权系数(图像向空间投影得到的系数)称为该图像的代数特征。识别的时候,将待识别的图像投影到这个特征子空间,将得到的投影系数与各个已知人脸图像的系数进行比较,通过一定的准则,例如k-近邻法,取未知样本的k个近邻,看这k个近邻中多数属于哪一类,就把待识别的图像归入哪一类。特征脸方法比较简单易懂,得到了广泛的使用,但单独使用的计算量较大,所以PCA经常与其它方法配合使用,例如小波变换与PCA的结合 ,使PCA的降维效果得到改善。
2.3 基于模板匹配的人脸识别算法
模板匹配有静态匹配和弹性匹配两种,首先介绍一下静态匹配。静态模板匹配方法:设计一个库,其中存储了已知人脸的若干模板,这些模板可以是整张人脸的灰度图像,可以是各生理特征区域的灰度图像,还可以是经某种变换的人脸图像。待识别的图像经过相同的变换后,还要进行尺度归一化和灰度归一化的处理,得到与库中的图像大小、取向和光照条件均相同的图像。然后计算待识别图像和库中图像的匹配度,与哪一类的匹配度最好,就将待识别图像判为哪一类。静态模板匹配存在的问题:因为库是固定的,如果人脸表情变化较大,或者有新的模式出现,那么这个模板就不适用了,也就是说静态模板匹配方法不灵活。考虑这个问题,下面提出弹性模板匹配。
弹性模板匹配是根据待测人脸特征的先验知识,定义一个特征参数模型,这些参数反映相对应特征形状的可变部分,为了得到这组参数,根据图像的边缘、峰值、谷值和强度信息及特征形状的先验知识设计合适的能量函数。我们要求的参数就是使能量函数取极小值时的参数。这种算法的优点是显然的,它比静态模板匹配法要灵活,鲁棒性要强一些,但是也有缺点:对参数的初值依赖度高,容易陷入局部最小;计算时间长。
2.4 基于神经网络的人脸识别算法
人工神经网络是在生物神经网络的基础上发展起来的,心理学家McCulloch和数学家Pitts 合作提出了形式神经元的数学模型,成为人工神经网络的开端。神经网络方法在人脸识别上比其他类型的方法有其独特的优势,它避免了复杂的特征提取工作,可以通过学习获得其它方法难以得到的关于人脸识别的规律和规则的隐性表达。
神经网络是以并行方式处理信息,存储方式是分布式的,如果能用硬件实现,那么将能显著提高速度。神经网络把模型的统计特征隐含在神经网络的结构和参数中,对于人脸这类复杂的、难以显示描述的模型,基于神经网络的方法具有独特优势。神经网络的鲁棒性比较好,但是训练慢,并可能陷入局部最优。
2.5 基于隐马尔科夫模型的人脸识别算法
隐马尔科夫模型是一种参数表示的、用于描述随机过程统计特性的概率模型。最早由Samaria 提出了关于人脸的隐马尔科夫模型。隐马尔科夫过程是一个双重的随机过程:一个潜在的过程称为“状态”过程,另一个可观测过程称为“观测序列”,观测序列是由隐含的状态过程决定的。
用HMM进行人脸识别,既考虑了各器官的不同特征,又考虑了相互关联,该模型的参数能较好的表征具体的人脸模型。HMM方法的鲁棒性较好,对表情、姿态变化不太敏感。
以上介绍了5中人脸识别中的常用算法,除此之外,还有其他的一些算法,比如,基于弹性图匹配的算法,基于SVM的人脸识别算法,遗传算法等等。
3 总结与展望
以上介绍了几种常用的人脸识别算法,从分析中可以看出,每种方法都有其优缺点,因此根据这些方法的特点,将这些方法结合起来使用,例如Nefian提出了基于2D-DCT的HMM方法。但是由于人脸识别是一项跨学科的研究课题,在研究过程中面临着相当程度的难度,由于人脸易受表情、光线和附着物等的影响,在研究过程中有一些的困难,具有一定的挑战性。前面介绍的算法只是在一定程度上解决了一些问题,应用方面还有待进一步提高。
尽管如此,人脸识别技术在经过这么多年的发展后,取得的成绩是不可抹杀的,人们提出了很多新的方法,Paul和Michael J.Jones提出基于haar特征的算法 ,采用级联的boosted分类器进行分类,速度较以往的分类器提高了15倍,识别分类效果很好。
近年来,由于反恐、国土安全和社会安全的需要,世界上各个国家都对安防领域加大了投入。而身份验证是安防的一个核心领域,在这种大环境下,生物特征识别将迎来一个快速发展的时期,从而人脸识别技术的应用会得到快速发展。
参考文献
[1]尹飞,冯大政.基于PCA算法的人脸识别[J].计算机技术与发展,2008,18(10):31-33.
[2]杨绍华.一种基于小波变换和PCA的人脸识别改进方法[J].吉林工程技术师范学院学报,2008,24(9):62-65.
[3]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.
[4]Samaria F.Yong S.HHM based architecture for face identification[J].Image and Computer Vision,1994(12):537-583.
[5]Paul Viola, Michael J.Jones. Pobust Peal-time Object Detection[J].Cambridge Research Laboratory, 2001.
作者简介:庞珊珊(1984-),女,硕士研究生,研究方向:模式识别,图像处理;熊建设,副教授,研究生导师。