APP下载

基于深度神经网络的实时人脸识别

2013-10-08邢健飞罗志增席旭刚

关键词:人脸人脸识别正确率

邢健飞,罗志增,席旭刚

(杭州电子科技大学智能控制与机器人研究所,浙江杭州310018)

0 引言

人脸识别技术因其具有的实用价值,吸引了众多研究活动,在过去几十年间,各种人脸识别方法应运而生。整体特征方面,文献[1]提出Eigenface的方法,首次将主成分分析方法应用在人脸识别中;文献[2]提出了Fisherface的方法,通过去求最有区分度的子空间,达到减小人脸类内距离,增大人脸类间距离的目的;局部特征方面,较为成功的方法有LBP、Gabor等,文献[3]采用LBP方法在经gabor处理过的人脸图像上进行人脸识别,也取得了不俗效果。经过40多年的发展,现有的人脸识别技术在用户配合、光照、姿态等采集条件比较好时,可以取得令人满意的识别效果,然后在非理想环境下,大部分人脸识别技术识别率急速下降。本文提出了一种新的以深度神经网络为框架的人脸识别方法,与常规方法相比较,本方法增强了机器对于人脸图像的理解能力。对于实际的人脸识别过程,本文还提出了一种搜索半径的概念,减少了大多不必要的比对次数,缩短了识别所需时间。

1 深度神经网络

深度神经网络是一种可提取数据深层特征的方法,它解决了传统多层神经网络难以进行训练的问题。根据目标函数的不同,目前已有多种深度网络诞生,如深度受限玻尔兹曼机[4]、Autoencoder[5]、CNN[6]等。其中,Autoencoder因其训练速度较快,对原有数据的恢复较理想,常用于实际的模式识别任务中。根据实际需求的不同,也衍生出了很多种 Autoencoder,其中 Sparse Autoencoder[7]的使用最为广泛。

2 以深度神经网络为框架的人脸识别方法

迄今为止,深度神经网络已成功应用到诸如语音识别、数字识别、图像检索等多种模式识别任务中。然而,对于较为典型的人脸识别任务,相关的研究工作甚少。笔者认为原因在于:一方面传统的深度神经网络+softmax的框架需要多张图像为每个个体建立一个模型,对于人脸识别这种类别数目不确定的任务适用性较差;另一方面,人脸识别所需要的图片尺寸较大,一般情况下,30×30以上的图片才能达到满意效果,这样就加大了训练深度网络模型的难度。

2.1 网络训练方法

针对以上问题,本文提出了一套新的方法:(1)首先用大规模(万张左右)的人脸图像作为模型训练集,训练出一种针对于该尺寸的人脸图片通用三层网络,其中前两层为非线性层,尾层为线性层,将人脸映射为多维数据,对于前两层隐含层采用非线性映射方法可提高模型对于图像的拟合程度,增强网络的恢复能力。尾层采用线性层符合自然图像呈高斯分布的特性,同时为以后的分类器采用欧氏距离作为标准提供了可能,提高了系统泛化能力;(2)为了增强系统对于人脸图像的理解能力,本文进一步采用了有监督的邻近元分析方法[8],通过降低相同个体的距离,增大不同个体的距离以优化网络模型,进而提高人脸识别正确率。

邻近元分析是一种距离度量学习方法,它用一个平方欧式距离来定义新的转换空间中单一数据与其余数据的距离:

式中,xi,xj,xk分别为第i,j,k位个体人脸图像所对应的映射数据,A为映射空间,本文中表示为神经网络具体的某层。定义损失函数为f,由如下公式确定:

式中,Ci为个体i所对应的人脸集合。

通过求出损失函数f对于每层网络A的梯度,使用连续梯度下降算法迭代优化网络模型,通过该方法可提高系统对于人脸的理解能力。

2.2 人脸识别策略

在实际识别过程中,本文还提出了一种优化识别时间的方法,对于人脸映射后的多维数据,求取一个二进制表示数据:

式中,xab为第a张人脸图片的第b维分量,mb为所有人脸图像第b维分量的中间值。式3保证了对于表征图像的每一维分量0与1的均匀分布。在这里,二进制表示数据yab亦可理解为能表征图像的hash特征。

实际识别过程中,根据深度网络表示的待测图像数据求取该二进制表示数,使用二进制表示数与图像库中所有图像求取汉明距离,根据所设搜索半径R(R为常数,取小于100的值)的大小,使用汉明距离最小的前K张图像作为二次比对图像,依次求出与待识别图像的欧式距离,所得最小的欧式距离与阈值做比较,小于阈值则确定为该人脸图像(阈值由等错率ERR确定)。

搜索半径概念的提出,绕开了待识别图像与库中和该图像汉明距离较大图像作直接对比,这样就避免了与图像库中所有图像求取欧式距离,大大降低了识别所需时间。

本文训练与识别流程图如图1所示。

图1 网络模型训练与人脸识别流程

3 仿真实验

3.1 实验数据准备

CMU-PIE人脸库,建立于2000年,包括了68个人的40 000万多张照片,为研究深度神经网络在低分辨率环境下的实际效果,在本文实验中,使用了接近正面的8 840张图片作为训练集,2 714张图像作为测试集,将所有人脸都归一化到32×32大小。

实验所用网络框架为Sparse Autoencoder,隐含层构造为1024-256-128-64,其中前两层为非线性层,激活函数为sigmoid,尾层为线性层,梯度优化算法采用L-BFGS方法,识别过程中汉明距离的计算采用异或运算+lookup表的方法,时间复杂度达到O(1)。

3.2 仿真结果

实验环境为MATLAB,所用操作系统为32位windows7,计算机配置为酷睿2双核1.66 GHz,内存为2 GB。实验100次取平均值,得到实验平均正确率如下表。本实验中,2 714张图像全部测试完毕所需平均时间为5.59 s,平均测试每张人脸图片需要2.059 7 ms,符合实时人脸识别系统所需条件。实验结果的FAR与FRR曲线如图2所示,各种人脸识别方法在CMU-PIE人脸库的实验正确率如表1所示。

图2 实验结果的FAR与FRR曲线

表1 各种人脸识别方法的实验正确率(%)

图2中,FRR与FAR交点得到ERR仅为1.33%。表1中,本文方法的正确率较传统方法有明显提高,值得注意的是,本文采用的仅为最为简单的最近邻分类器,这样一来减少了计算量,二来为以后提高识别正确率留下了较大空间。

4 结束语

本文构造了一种多层深度网络,并且与有监督方法邻近元分析相结合研究了深度神经网络应用于人脸识别任务下的性能,仿真试验证明了本方法的有效性,实验所得等错率较小,且实时性好,适合应用于对识别时间要求比较高的人脸识别任务中。未来的研究方向在于使用更为复杂的分类器来提高识别率,同时在识别过程中,根据所求的图像二进制特征建立哈希表,进一步缩短查找所需时间。

[1]Turk M,Pendland A.Eigenfaces for recognition[J].Journal of cognitive neuroscience,1991,3(1):71 -86.

[2]Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfaces vs.Fisherfaces:Recognition using class specific projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711 -720.

[3]Tan X,Triggs B.Fusing Gabor and LBP feature sets for kernel-based face recognition[M].Berlin:Springer-Verlag,2007:235-249.

[4]Hindon G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5 786):504-507.

[5]Bengio Y,Lamblin P,Popovici D,etal.Greedy layer-wise training of deep networks[C].Vancouver:Advances in Neural Information Processing Systems,2007:153 -160.

[6]Hadsell R,Chopra S,LeCun Y.Dimensionality reduction by learning an invariant mapping[C].New York:IEEE Computer Society Conference on Computer Vision and Pattern Recongnition,2006:1 735 -1 742.

[7]Coates A,Ng A Y,Lee H.An analysis of single-layer networks in unsupervised feature learning[C].Brookline:Microtome Publishing.2011:215 -223.

[8]Goldberger J,Roweis S,Hinton G,etal.Neighbourhood components analysis[C].Whistler:Advances in Neural Information Processing Systems,2004:513 -520.

猜你喜欢

人脸人脸识别正确率
人脸识别 等
有特点的人脸
一起学画人脸
门诊分诊服务态度与正确率对护患关系的影响
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
三国漫——人脸解锁
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意