一种新的基于Gabor特征的零空间人脸识别算法

2016-04-12赵欢喜朱顺痣

厦门大学学报（自然科学版） 2016年1期

关键词：人脸识别人工智能

陈　思，赵欢喜，朱顺痣

(厦门理工学院计算机与信息工程学院，福建省数据挖掘与智能推荐高校重点实验室，福建厦门361024)

一种新的基于Gabor特征的零空间人脸识别算法

陈思，赵欢喜，朱顺痣*

(厦门理工学院计算机与信息工程学院，福建省数据挖掘与智能推荐高校重点实验室，福建厦门361024)

摘要:为了克服人脸识别中的小样本集( small sample size，3S)问题，本文首先利用人脸图像距离模型揭示了线性鉴别分析的物理过程，指出了零空间鉴别分析相对于主元空间鉴别分析可以提取出更有利于人脸识别的鉴别信息．在此基础上，提出了一种有效的基于Gabor特征的零空间人脸识别算法，该算法采用一种新的基于邻域保持的鉴别嵌入准则( neighbor－preserving based discriminant embedding，NDE)，并利用Gabor小波变换减轻人脸图像中光照和表情变化等因素的影响．在ORL，FERET和AR等人脸数据库上的实验结果表明本文算法具有较优的人脸识别性能．

关键词:人工智能;人脸识别;零空间方法;基于邻域保持的鉴别嵌入; Gabor小波变换

人脸识别的研究［1－5］对于图象处理、模式识别、计算机视觉和计算机图形学等领域的发展具有巨大的推动作用，同时在生物特征认证、视频监控和安全等各个领域有着广泛的应用．过去的几十年中发展出众多的人脸识别算法［1－5］，其中子空间的方法，如主成分分析( principal component analysis，PCA)［6］、鉴别成分分析( linear discriminant analysis，LDA)［7－8］等受到广泛的研究．

目前已有学者提出了若干解决3S问题的LDA方法［5－15］，例如: Zhao等［9］首先利用PCA去除总样本离散度矩阵的零空间，然后通过对SW的特征值增加一个小的扰动使得SW变成非奇异矩阵进行降维; Belhumeur等［7］利用PCA首先对高维的数据进行降维，使得SW变成非奇异矩阵，再求得投影矩阵; Parrish等［10］提出利用局部鉴别的高斯模型来求取投影矩阵．

另外一种思路是利用SW的零空间或者SB的主元空间进行降维．Chen等［11］指出LDA中类内离散度矩阵SW的零空间中包含了用于模式分类的最佳鉴别信息，通过在SW的零空间中最大化类间离散度矩阵的迹(或行列式)得到最佳的投影矩阵．此外，Yu等［12］提出了直接LDA的方法:首先去除类间离散度矩阵SB的零空间，认为SB的零空间中没有包含任何鉴别信息，再通过在SB的主元空间中最小化类内离散度矩阵的迹(或行列式)求得投影轴．Wang等［13］提出了双子空间的方法，双子空间结合PCA+LDA和零空间LDA方法，同时利用了SW的主元空间和零空间信息．

本文首先解释了LDA的物理过程，利用人脸图像距离模型揭示了线性鉴别分析的物理含义，并指出了零空间LDA相对于主元空间LDA可以提取更有利于人脸识别的鉴别信息．接着提出了一种新的准则，称为基于邻域保持的鉴别嵌入准则( neighbor－preserving based discriminant embedding，NDE)．为了减轻人脸图像中的光照变化和表情等因素对鉴别信息的提取，本文进一步结合了Gabor小波变换．实验表明本文提出的算法在不同的人脸数据库上都取得了很好的效果．

1 LDA人脸识别的物理含义

本节从最近邻法分类角度出发解释LDA的物理过程，并分别阐述了主元空间LDA( PCA+LDA)方法和零空间LDA方法提取投影子空间的过程．

在人脸识别过程中，由于噪声、光照、表情等因素的影响，可能导致人脸的类内距离大于类间距离，从而导致错误的识别，因此直接的距离比对方法的识别效果并不好．对于人脸识别而言，本质的特征［16］是身份的不同(身份差分量)，而光照、姿态、表情等变化因素(变换差分量和噪声分量)都会影响识别或者分类的结果，在识别中应该尽量减少这些因素的影响．上面的模型通常称为人脸图像距离模型［16］．

PCA+LDA可以分步地实现，即先最小化类内离散度矩阵的迹(或行列式)，然后对变换后的数据进一步最大化类间离散度矩阵的迹(或行列式)．PCA寻找噪声分量降低的子空间，记为P( ST)．而最小化类内离散度矩阵的迹(或行列式)可以在P( ST)子空间中寻找降低类内和类间变换差分量的子空间．最大化类间离散度矩阵的迹(或行列式)进一步得到增强身份差分量的子空间．而零空间LDA方法首先通过计算SW的零空间，然后在零空间中通过最大化类间离散度矩阵的迹(或行列式)得到增强身份差分量的子空间．SW的零空间中可以使得类内离散度矩阵的迹(或者行列式)为零，而PCA+LDA的方法中并不能使类内离散度矩阵的迹(或者行列式)为零．因此，零空间鉴别分析相对于主元空间鉴别分析可以提取更有利于人脸识别的鉴别信息．

2基于Gabor特征的零空间NDE人脸识别算法

针对线性鉴别分析中采用Fisher准则的缺点，本文提出了一种新的人脸识别准则，称为NDE．

2. 1类内离散度

为了保证投影后的向量之间保持原始高维空间中数据的相对位置关系，局部线性嵌入算法( locally linear embedding，LLE)［17］相应的优化准则［18－19］可以转变为

其中P是线性投影矩阵，X=［x1，x2，…，xn］是原始的数据矩阵，y是投影后的数据，A是权重矩阵，W=X( I－A)T( IA) XT是类内度量矩阵，tr(·)表示求迹运算．

2. 2类间离散度

传统的类间离散度矩阵可以表示成任意两类间均值差的协方差矩阵之和:

然而，采用传统的类间离散度矩阵可能出现的问题是距离大的类间距离可能会影响最终投影轴的计算．采用加权的SB，即对小的类间距离赋予更多的权重，从而得到的投影轴更加关注小的类间距离．

加权的SB可以定义为

其中d( ij)=‖μi－μj‖代表第i类和第j类的均值距离，w(·)是一个单调递减函数，即两类均值距离越近w (·)的权重越大．通常的取值为d－3或者d－4．

通过上面的分析，本文提出新的鉴别分析准则如下:

由于结合了邻域保持嵌入和改进的LDA方法，本文称之为NDE．

2. 3零空间NDE方法

由公式( 4)，基于零空间的NDE准则可以转化为

其中，Q是W的零特征值对应的特征向量．

基于零空间的NDE人脸识别算法的具体步骤如下:

1)去除总样本离散度矩阵ST的零空间

通过PCA对训练的人脸数据降维，降维的维数通常等于总的训练样本数－1;

2)计算W的零空间

通过对W进行奇异值分解，得到的零特征值对应的特征向量组成W的零空间，记为Q=［q1，…，qk］;

3)计算t个投影向量

通过求QQTS^BQQT前t个最大的特征值对应的特征向量，即为所求的投影向量．

2. 4 Gabor小波变换

Gabor小波变换由Daugman［20］引入，由于其优良的空间局部性和方向选择性，能够获得图像局部区域内多个方向的空间频率(尺度)和局部性结构特征，在人脸识别中得到了广泛的应用［21］．事实上，Gabor特征在人脸图像距离模型中所起的作用是降低变换差分量和噪声分量，使得NDE能够更好地提取身份差分量．本文提出的NDE准则由于更好地保留了类内的几何位置信息，同时考虑了类间的鉴别结构信息，因此可以更有效地提取有利分类结果的鉴别信息．

3实验结果与分析

本文在3个公共人脸数据库上进行了一系列的实验，包括ORL数据库［22］、FERET数据库［23］和AR数据库［24］．并且对比了各种典型的监督降维方法，包括了PCA［6］、NDP［25］、NDA［26］、LDA［8］和LDE［27］等方法．

3. 1人脸数据库介绍和实验参数设置

ORL库上共有40个人组成，每个人10幅图像．FERET人脸数据库是由美国军方发起的人脸评测数据库．本文的算法在FERET的子库上进行，该子库一共包含了200个人的1 400幅人脸图像，每个人有7幅图像，图像中包含了光照、姿态(±25°变化)和表情等各种因素的变化．AR数据库包含了120个人的26幅图像，包括了表情、光照和遮挡等．对每个人选取了14张，共1 680幅图像．

本文对ORL库中每一类人脸随机选取m张( m= 3，4)作为训练数据，剩下的图像作为测试数据．对FERET库中每一类人脸随机选取m张( m= 2，3)作为训练数据，剩下的图像作为测试数据．对AR库中每一类人脸随机选取m张( m=3，4)作为训练数据，剩下的图像作为测试数据．对于每个给定的m，分别独立地运行20次实验，每一次的训练人脸均随机选取，最终的结果是20次运行结果的平均值．

图1主元空间方法和零空间方法的比较( 20次运行)Fig．1 Comparisons between principal space based methods and null space based methods ( 20 runs)

3. 2实验结果

首先，比较了利用原始灰度特征的主元空间降维方法与零空间降维方法的识别率．图1中给出了鉴别维数不同时的各种对比算法在ORL( m=3，4)，FERET ( m=3)，AR( m=3)上人脸识别率变化情况．从图中可以看出:零空间的监督降维方法要明显优于主元空间的监督降维方法:当采用原始灰度特征时，基于零空间的NDE方法优于其他对比方法．

为了进一步地提高人脸识别率，本文进一步利用Gabor变换提取特征，得到的结果如图2所示．利用Gabor变换的零空间NDE方法相对于使用原始灰度特征的零空间NDE方法，在识别率上有显著的提高，同时优于利用Gabor变换的零空间LDA方法和没有利用Gabor变换的零空间LDA．

表1列出了13种不同对比方法的最佳识别率和其对应的鉴别向量的个数，其中最高的识别率用粗体表示．由表1可知，本文提出的Gabor+Null NDE方法在FERET( m= 2，3)和AR( m= 3，4)数据集上都取得了最高的识别率，并且对应的鉴别向量个数也是相对较少的．可见，通过Gabor变换可以非常有效地减轻光照、姿态和表情等因素对鉴别信息提取的影响，得到对人脸类内的光照和表情变化具有一定鲁棒性且更能区分类间的特征．

3. 3讨论

无论是小样本的数据库(如ORL库)或者是大样本的数据(如FERET和AR库)，零空间的NDE方法都要优于其他降维方法，这表明NDE具有很好的推广性．NDE方法利用了类内的局部结构信息和类间的全局信息，能够很好地提取对分类和识别最有利的鉴别信息．而PCA和LDA方法却保持全局的欧式结构信息( global euclidean structure)．NDA方法则提取了最近邻之间信息，但是没有考虑类内样本的局部位置信息．与NDP和LDE方法不同，本文采用的NDE方法考虑了各类之间的距离关系，更关注可能对分类造成影响的相近的人脸类别．

图2 Gabor特征变换前后的零空间LDA和NDE方法的比较( 20次运行)Fig．2 Comparisons of null LDA and null NDE methods before and after Gabor wavelet transform ( 20 runs)

表1各种方法的最佳识别率和对应的鉴别向量的个数(运行20次)Tab．1 Best recognition rates of different methods and the corresponding numbers of discriminative vectors ( 20 runs)

在实际应用中，我们应该根据数据集的特点选择合适的人脸识别方法．本文采用的NDE方法主要解决人脸图像训练样本不足的问题，并获得了令人满意的实验结果．因此，本文方法更适用于解决3S问题，即训练的样本数少于样本的维数的情况．

4结论

针对Fisher准则的缺点，本文提出了一种新的准则NDE．NDE可以很好地保持类内的局部结构信息和考虑类间的全局鉴别信息，在不同的人脸数据库上表现出优异的性能．为了减轻人脸图像中的光照变化和表情等因素对鉴别信息提取的影响，本文进一步结合了Gabor小波变换．在未来的工作中，我们将结合核( kernel)形式和张量( tensor)形式的方法来进一步提高本文方法的性能．

参考文献:

［1］杨晔，HUGO DE G，潘伟，等．基于选择性注意和部分连接神经网络的人脸识别［J］．厦门大学学报(自然科学版)，2009，48( 4) : 499－503．

［2］YAN Y，WANG H，SUTER D．Multi－subregion based correlation filter bank for robust face recognition［J］．Pattern Recognition，2014，47( 11) : 3487－3501．

［3］严严，章毓晋．基于视频的人脸识别研究进展［J］．计算机学报，2009，32( 5) : 878－886．

［4］YAN Y，ZHANG Y J．1－D correlation filter based class－dependence feature analysis for face recognition［J］．Pattern Recognition，2008，41( 12) : 3834－3841．

［5］LU H P，PLATANIOTIS K N，VENETSANOPOULOS A N．A survey of multilinear subspace learning for tensor data［J］．Pattern Recognition，2011，44( 7) : 1540－1551．

［6］TZIMIROPOULOS G，ZAFEIRIOU S，PANTIC M．Subspace learning from image gradient orientations［J］．IEEE Transactions Pattern Analysis and Machine Intelligence，2012，34 ( 12) : 2454－2466．

［7］BELHUMEUR P N，HEPANHA J P，KRIEGMAN D J．Eigenfaces vs Fisherfaces: recognition using class specific linear projection［J］．IEEE Transactions on Pattern Analysis and Machine Intelligence，1997，19( 7) : 711－720．

［8］WANG X G，TANG X O．A unified framework for face recognition［J］．IEEE Transactions on Pattern Analysis and Machine Intelligence，2004，26( 9) : 1222－1228．

［9］ZHAO W Y，CHELLAPPA R，PHILLIPS P J．Subspace linear discriminant analysis for face recognition［R］．MD: U－niversity of Maryland，1999．

［10］PARRISH N，GUPTA M．Dimensionality reduction by local discriminative Gaussians［C］∥Proceedings of the 29th International Conference on Machine Learning．Edinburgh，Scotland，UK: Omnipress，2012: 1－8．

［11］CHEN L，LIAO H，KO M，et al．A new LDA－based face recognition system which can solve the small sample size problem［J］．Pattern Recognition，2000，33( 10) : 1713－1726．

［12］YU H，YANG J．A direct LDA algorithm for highdimensional data with application to face recognition［J］．Pattern Recognition，2001，34: 2067－2070．

［13］WANG X，TANG X．Dual－space linear discriminant analysis for face recognition［C］∥Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition．Washington D C: IEEE Computer Society Press，2004: 564－569．

［14］YANG J，FRANGI A F，YANG J Y．KPCA plus LDA: a complete kernel fisher discriminant framework for feature extraction and recognition［J］．IEEE Transactions on Pattern Analysis and Machine Intelligence，2005，27( 2) : 230－244．

［15］JIANG X．Linear subspace learning－based dimensionality reduction［J］．IEEE Signal Processing Magazine，2011，28 ( 2) : 16－26．

［16］YAN Y，ZHANG Y J．Discriminant projection embedding for face and palmprint recognition［J］．Neurocomputing，2008，71( 16) : 3534－3543．

［17］ROWEIS S，SAUL L K．Nonlinear dimensionality reduction by locally linear embedding［J］．Science，2000，290 ( 5500) : 2323－2326．

［18］HE X，CAI D，YAN S，et al．Neighborhood preserving embedding［C］∥Proceedings of the 10th IEEE International Conference on Computer Vision．Washington D C: IEEE Computer Society Press，2005: 1208－1213．

［19］ZHANG Z，WANG J，ZHA H．Adaptive manifold learning ［J］．IEEE Transactions on Pattern Analysis and Machine Intelligence，2012，34( 2) : 253－265．

［20］DAUGMAN J G．Two－dimensional spectral analysis of cortical receptive field profiles［J］．Visual Research，1980，20: 847－856．

［21］程雪峰，李顺，龙飞，等．基于Log－Gabor滤波和LBP算子的光照不变人脸识别方法［J］．厦门大学学报(自然科学版)，2014，53( 3) : 359－363．

［22］SAMARIA F，HARTER A．Parameterization of a stochastic model for human face identification［C］∥Proceedings of the 2nd IEEE Workshop on Applications of Computer Vision．Washington D C: IEEE，1994: 138－142．

［23］PHILLIPS P J，MOON H，RIZVI S，et al．The FERET evaluation methodology for face recognition algorithms［J］．IEEE Transactions on Pattern Analysis and Machine Intelligence，2000，22( 10) : 1090－1104．

［24］MARTINEZ A R，BENAVENTE R．The AR face database ［R］．Barcelona: Computer Vision Center ( CVC)，1998．

［25］YOU Q，ZHEN N，DU S，et al．Neighborhood discriminant analysis for face recognition［J］．Pattern Recognition Letters，2007，40( 8) : 2283－2291．

［26］BRESSAN M，VITRIA J．Nonparametric discriminant analysis and nearest neighbor classification［J］．Pattern Recognition Letters，2003，24: 2743－2749．

［27］CHEN H T，CHANG H W，LIU T L．Local discriminant embedding and its variant［C］∥Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition．Washington D C: IEEE Computer Society Press，2005: 846－853．

A Novel Gabor Feature Based Null Space Algorithm for Face Recognition

CHEN Si，ZHAO Huanxi，ZHU Shunzhi*

( Key Lab of Data Mining and Information Recommendation of Fujian Province，School of Computer and Information Engineering，Xiamen University of Technology，Xiamen 361024，China)

Abstract:Recently，linear discriminant analysis ( LDA) has been widely used in the field of face recognition．However，in many real applications，LDA suffers from the small sample size ( 3S) problem，where training samples are limited so that LDA cannot be directly used．To overcome the 3S problem，in this paper we first reveal the mechanism of LDA to show how it extracts the most discriminative features according to an image distance model，and then identify that the null space based LDA is much more efficient than the principal space based LDA for the extraction of discriminative features．Based on this identification，we propose an effective Gabor feature based null space algorithm for face recognition，which exploits a new neighborhood－preserving based discriminant embedding ( NDE) criterion to overcome the drawbacks of the traditional Fisher criterion，and during the process of the extraction of discriminative features，the Gabor wavelet transform is incorporated to further reduce the influences of illumination and expression changes in the face images．Experimental results on several public face databases，such as ORL，FERET and AR，show that the proposed null space based NDE algorithm outperforms the state－of－theart algorithms，such as LDA，NDP，NDA，and LDE，and it can achieve the encouraging face recognition performance．

Key words:artificial intelligence; face recognition; null space method; neighbor－preserving based discriminant embedding( NDE) ; Gabor wavelet transform

*通信作者:szzhu@ xmut．edu．cn

基金项目:国家自然科学基金( 61373147，61503315) ;福建省自然科学基金( 2012J01293) ;厦门市科技计划项目( 3502Z20103037) ;厦门理工学院高层次人才项目( YKJ14020R)

收稿日期:2015－01－25录用日期: 2015－08－19

doi:10．6043/j．issn．0438－0479．2016．01．021

中图分类号:TP 391

文献标志码:A

文章编号:0438－0479( 2016) 01－0108－06

引文格式:陈思，赵欢喜，朱顺痣．一种新的基于Gabor特征的零空间人脸识别算法［J］．厦门大学学报(自然科学版)，2016，55 ( 1) : 108－113．

Citation: CHEN S，ZHAO H X，ZHU S Z．A novel gabor feature based null space algorithm for face recognition［J］．Journal of Xiamen U－niversity( Natural Science)，2016，55( 1) : 108－113．( in Chinese)