APP下载

图像特征融合在人脸识别中的应用研究

2013-08-13王正友

电视技术 2013年15期
关键词:识别率人脸特征提取

王正友

(上海出版印刷高等专科学校,上海 200093)

责任编辑:任健男

人脸识别技术起始于20世纪60年代后期,经过40多年的飞速发展,人脸识别技术在安全验证系统、医学、档案管理系统、人机交互系统、公安工作、视频会议和图像检索等领域广泛应用,已经成为计算机视觉和模式识别领域的一个研究热点[1]。

人脸识别的关键是特征提取[2],特征提取的结果被用于识别人脸,例如主成分分析(PCA)[3]。PCA的主要思想是降维,使得图像的维数等于或小于使用训练集的数量,根据图像子空间上的最佳效果来寻求特征向量,这些向量特征就是众所周知的“特征脸”。当转化成不同的子空间时,PCA所产生的位置和形状数据都会发生改变。线性判别分析(LDA)[4]是一种特征提取方法,通过它可以获得某类的数据集及其数据集中的各个类间距,LDA不改变数据集本身,而是提供一个单独的类。然而,PCA和LDA都有缺点,得到的提取结果只是一个全局结构,事实上,局部结构对描述一个物体,例如局部保持投影(LPP)[5]和正交拉普拉斯脸(OLF)[6]方法也很重要。

基于上述分析,本文提出了一种新方法来选择和融合提取出的特征,即全局与局部特征融合方法,首先将这些特征按降序排列,然后从最占主导地位到最不占主导地位的特征进行融合,既包含了全局结构,又包含了局部结构,在一定程度上提高了人脸识别率。

1 算法设计与分析

GLFS方法分为两个过程,一个是训练过程,一个是测试过程。在训练过程中,训练集被PCA,LDA和局部保持投影(LPP)方法提取。特征提取的结果被用来预计和选择[7]。然而测试过程中,测试集被投影在每个训练集的投影结果上,并在训练集选择中,根据结果的数量来进行选择。同样地,测试集的特征可以通过特征选择的再融合来实现[8]。

1.1 基于主成分分析的特征提取

卡洛[9]是一种把高维数据投射到低维的线性技术,称为主成分分析(PCA)。如果图像维数用n(图像矩阵的行数乘以列数)表示,所使用训练集数用m表示,当m≪n这种情况时,那么它可表示为

所有的训练集的平均值可以写成

基于面部图像平均值矩阵协方差,可表示为

方程(3)的特征值和特征向量表示为

式(4)的结果有m维,其中m≪n,得到最小降维的数目是(n-m)个。

1.2 基于线性判别分析的特征提取

线性判别分析(LDA)是PCA过程的改进,LDA被用来最大化类间差异率和最小化类内比,从而得到最大的类间比和最小的类内比,特征提取更好。LDA比率的差异可表示为

LDA的特征值和特征向量可表示为

1.3 基于局部保持投影的特征提取

PCA和LDA旨在保持全局结构。然而,在实际应用中,局部结构更加重要。局部保持投影(LPP)对于局部结构学习来说是一种新的方法,局部结构特征比全局结构特征更加重要。LPP[10]旨在保持数据的内在几何和局部结构。LPP的目标函数可以表示为

式中:W是相似矩阵,可表示为

式中:aTXDXTa=1。可通过使用下面的公式配制最小化目标函数的特征值和特征向量

1.4 特征选择及融合

特征提取结果的融合通常在外表全局结构上进行,事实上,局部结构对描述一个对象非常重要。本文提出了一个基于面部的特征选择与融合全局和局部结构的方法,具有全局结构的外表特征提取是由PCA和LDA来完成的,然而局部结构的提取是由LPP来完成的。对于PCA,LDA和LPP,特征提取的结果分别可用下面的等式表示

如图1所示,如果为每个特征提取方法提取特征的数目是m,而特征选择的的数目是S,并且S≤m,那么PCA+LDA+LPP特征融合的数目可以用3S表示。特征融合的结果可写成下面的矩阵

图1 特征融合过程

为了简化计算,式(16)可被写作如下的行向量

式(17)是PCA,LDA作为全局结构和LPP作为局部结构的融合特征。

1.5 识别

要确定分类结果,基于特征融合的相似度测量是必要的,它可以写成

识别百分率结果可以用真正的识别结果数除以测试集数目计算出来,可写成

整个算法过程如图2所示。

图2 算法过程

2 实验结果及其分析

2.1 ORL 人脸库

ORL人脸库共有40个人的400张图片,每人10张,其中有些图像拍摄于不同时期,人的脸部表情和脸部细节有着不同程度的变化,比如笑或者不笑、眼睛或睁或闭、戴或不戴眼镜,人脸姿态也有相当程度的变化,深度旋转和平面旋转可达20°,人脸尺度也有多达10%的变化,图3所示为ORL人脸库中某人的10张人脸图像。

图3 ORL人脸库中某人的10张人脸图像

为了比较实验结果,执行3套方案:第1套方案,使用的训练集的数量由每个人的5组姿势构成,其余5组姿势构成测试集;第2套方案,训练集的数目由每个人的6组姿势构成,其余4组姿势构成测试集;第3套方案,训练集的数目由每个人的7组姿势构成,其余3组姿势构成测试集,PCA能量选取95%。每种方案的最高识别率如表1所示。

表1 各个方案在ORL上最优识别率比较

从表1中可以看到,随着训练样本数的增加,识别率呈上升的趋势。

2.2 Yale人脸库

Yale人脸库包含了15个人的165张人脸,每人11张,包括了不同光照条件(灯光往左照射、往右照射、往中间照射),不同的面部表情(正常的、开心的、沮丧的、睡着的、惊讶的以及眨眼的),不同场景的(戴眼镜的和不戴眼镜的),如图4所示为Yale人脸库中一个人的11幅具有不同特征的人脸图像。

图4 Yale人脸库中某人的11张人脸图像

与ORL上的实验相同,为了比较实验结果,同样执行3套方案:第1套方案,使用的训练集的数量由每个人的6组姿势构成,其余5组姿势构成测试集;第2套方案,训练集的数目由每个人的7组姿势构成,其余4组姿势构成测试集;第3套方案,训练集的数目由每个人的8组姿势构成,其余3组姿势构成测试集,PCA能量选取95%。每种方案的最高识别率如表2所示。

表2 各个方案在Yale上最优识别率比较

从表2中同样可以看出,随着训练样本数的增加,识别率呈上升的趋势。

2.3 比较与分析

将本文方法与PCA[3],LDA[4],LPP[5],OLF[6],GCFF[7],MKLF[8]方法相同情况下在 ORL 及 Yale 上的最优识别率进行了比较,其中,GCFF,MKLF是最近学者们提出的两种比较新颖的特征融合方法。比较结果如表3、表4所示。

表3 各方法在ORL上的最优识别率比较

表4 各方法在Yale上的最优识别率比较

通过表3、表4可以看出,本文方法的在ORL及Yale上的识别率明显比其他方法高,因为本文方法考虑了全局结构,又考虑了局部结构,由此再次验证了不管是全局结构,还是局部结构,在特征提取过程中都是很重要的。结合表1、表2还可以看出,识别率百分比在高维有稳定的趋势,而在低维有上升的趋势。由于大量的主导特征没有作为相似性的测量,一些错误会发生在使用少量的特征。可以证明,当用来衡量相似性的特征增加时,识别率百分比也增加了。

3 总结

本文对基于图像的特征提取问题进行了研究,采用全局与局部特征融合的方法,将PCA和LDA的提取结果融合到LPP中,在ORL及其FERET两大人脸数据库上进行了实验,证明了本文所提方法的优越性。特征融合方法的引用,提高了单样本的识别率,但在训练阶段需要一次运行多种不同的方法,必然会带来额外的计算开销,所以,在提高识别率的同时,提高识别效率,并且找到一个更好的融合方案,将是进一步研究的重点。

[1]KIM T,KITTLER J.Locally linear discriminant analysis for multi modally distributed classes for face recognition with a single model image[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(3):318-327.

[2]WANG X,TANG X.Random sampling for subspace face recognition[J].International Journal of Computer Vision,2006,70(1):91-104.

[3]YAN S,LIU J,TANG X,et al.A parameter-free framework for general supervised subspace learning[J].IEEE Transactions on Information Forensics and Security,2007,2(1):69-76.

[4]LI B,HUANG D S,WANG C,et al.Feature extraction using constrained maximum variance mapping[J].Pattern Recognition,2008,41(11):3287-3294.

[5]XIE Z,LIU G,FANG Z.Face recognition based on combination of human perception and local binary pattern[J].Lecture Notes in Computer Science,2012,72(2):365-373.

[6]WANG R,SHAN S,CHEN X,et al.Manifold-manifold distance and its application to face recognition with image sets[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,21(10):4466-4479.

[7]OU Fan,HAN Zhaocui,LIU Chong,et al.Face verification with feature fusion of Gabor based and curvelet based representations[J].Multimedia Tools and Applications,2012,57(3):549-563.

[8]YEH Y,LIN T,CHUNG Y,et al.A novel multiple kernel learning framework for heterogeneous feature fusion and variable selection[J].IEEE Transactions on Multimedia,2012,14(3):563-574.

[9]张爱华,尉宇.基于混沌粒子群的决策树SVM的调制模式识别[J].电视技术,2012,36(23):126-129.

[10]刘翠响,肖伶俐.基于连续均值量化变换的人脸检测算法[J].电视技术,2013,37(1):154-156.

猜你喜欢

识别率人脸特征提取
有特点的人脸
一起学画人脸
基于类图像处理与向量化的大数据脚本攻击智能检测
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
基于Daubechies(dbN)的飞行器音频特征提取
三国漫——人脸解锁
提升高速公路MTC二次抓拍车牌识别率方案研究
Bagging RCSP脑电特征提取算法
高速公路机电日常维护中车牌识别率分析系统的应用