基于DLBP、PCA和SVM算法的人脸识别
2016-10-22张燕于威威李文媛
张燕,于威威,李文媛
(上海海事大学信息工程学院,上海201306)
基于DLBP、PCA和SVM算法的人脸识别
张燕,于威威,李文媛
(上海海事大学信息工程学院,上海201306)
为提高人脸图像的识别率,提出一种结合DLBP、PCA和SVM算法的人脸识别方法。首先对每幅人脸图像进行分块处理,对每一分块图像进行局部二值模式统计,选取其中出现频率较高的模式,将所有图像分块的LBP直方图衔接起来作为图像最终的纹理特征,然后应用主成分分析法(PCA)对所提取的纹理特征进行降维处理,最后使用支持向量机分类器来对图像进行分类识别。基于该方法构建实用、有效的人脸特征提取、选择和识别过程,并在ORL人脸数据库进行实验,结果表明,相较于之前的LBP+SVM、PCA+SVM、LBP+PCA+SVM等人脸识别算法,该方法能有效提高人脸图像的识别率。
人脸识别;DLBP;PCA;SVM
0 引言
人脸识别[1]技术是计算机视觉和模式识别领域的一个重要研究内容,生物识别技术中的人脸特征识别技术是一种基于人脸特征的身份识别技术。寻找有效的图像特征提取算法是提高人脸图像识别率的关键问题之一。特征提取的方法可以分为基于全局的和基于局部的特征提取,基于全局特征提取的方法有:主成分分析法(PCA)[2]和独立分量分析法(ICA)[3]等。基于局部特征提取的方法有局部二值模式(LBP)[4]和Gabor小波[5]等。基于全局特征的方法虽然能从更全面的角度对人脸进行描述、能较好地保留图像的纹理特征,然而易受到姿态、光照等影响。与基于全局的方法相比较,基于局部纹理特征对表情、遮挡和光照等变化具有更强的鲁棒性,而且能解决图像维数过高的问题,并且基于局部的特征比较容易被识别,并且级联多个局部特征的组合有助于提高人脸图像的识别率,但是基于局部特征的最大问题是识别率是完全依靠所提取的局部特征,而这些特征对表情、光照较敏感,导致识别率较低,稳定性不高,研究表明在人脸图像的识别中,人脸的局部特征和全局特征都起着同样重要的作用。所以,更多的人选择将全局和局部的人脸识别方法相结合起来。
本文提出了一种结合DLBP、PCA和SVM算法的人脸识别。该方法首先利用LBP提取人脸图像的纹理特征,将一幅人脸图像分成若干块,选取每个分块中出现频率较高的累计达80%的模式,然后使用PCA对提取到的纹理特征进行降维处理和特征选择操作,这样可以提高运算的效率并且能全面的提取图像的纹理信息,最后使用支持向量机(SVM)对所选取的特征进行分类和识别。与原始的LBP+SVM、PCA+SVM、LBP+ PCA+SVM方法相比较,DLBP+PCA+SVM能提取到更加全面的局部和全局的特征,对人脸图像具有更强的判别和表示能力和鲁棒性,能提高人脸图像的识别率。
1 基于DLBP、PCA、SVM算法的人脸特征提取过程
因为人脸特征维数很高,若直接采用SVM特征选择方法,计算的复杂度会很大,影响效率。为了达到有效性和实用性,首先通过DLBP、PCA进行人脸特征提取和特征选择,然后再采用SVM作进一步的特征分类。
图1 人脸识别过程
2 人脸特征提取算法
2.1局部二值模式
局部二值模式是一种灰度纹理测量方法,由T.O-jala等[6]为了准确度量图像的局部对比度而提出的。其基本思想是:在一个n×n的邻域内,用中心像素点的灰度值作为阈值,与它的邻域像素点的灰度值相比较得到图像的局部纹理特征。LBP算子的计算公式如下:
式(1)中,gi(i=0,1,…,p-1)表示邻域像素点的灰度值,gc表示中心像素点的灰度值,P表示邻域中像素点的个数,邻域半径为R。
图2中心像素点的灰度值是6,其邻域8个点灰度值分别为6、5、2、1、7、8、9、7等。LBP模式=10001111,LBP=1+16+32+64+128=241,C=(6+7+8+9+7)/5-(5+2+ 1)/3=4.7
图2 基本LBP算子
为解决原始LBP存在大尺寸纹理特征无法提取的局限性,Ojala等人对LBP做了修改,形成系统的理论,在一个灰度图像中,定义了一个半径为R(R>0)的圆环形邻域,P(P>0)个邻域的像素点均匀分布在圆周上,如下图3所示。设邻域的局部纹理特征为T,那么T可以用邻域中的P+1个像素的函数来描述:
图3 几种不同P,R值对应的圆环形邻域
随着半径的增大,各像素点之间的相关性会不断减小,所以,通过在较小的邻域内,就可以获取图像大部分的纹理信息。在不丢失纹理信息的基础上,若将邻域像素的灰度值分别减去中心像素的灰度值,那么局部纹理特征就可以表示为:
若各个差值与gc相互独立,那么上式在分解后,可表示成:
因为t(gc)代表图像的亮度,并且和图像的局部纹理特征无关,则得到下式:
那么图像纹理特征的描述就可以直接表示成差值的函数:
Ojala等人定义了旋转、统一不变和旋转不变统一三种不同类型的局部二值模式。统一化局部二值模式的公式可以表示成:
式中,mod是求余运算。该模式有P(P-1)+3个不同的输出。即将原始的256个输出(0~255)映射到P(P-1)+3个输出。
旋转不变局部二值模式的公式如下:
其中,ROR(x,i)是旋转函数,表示x向右循环移动i位,最终取最小值以得到LBP值。
如下图描述的是LBP旋转不变模式的计算过程。其中,最上面表示得到的原始LBP值,通过循环旋转,得到中间8个LBP值,将其中的最小值作为最终的旋转不变模式值。
图4 LBP旋转不变模式
旋转不变统一局部二值模式的公式描述如下:
2.2显性局部二值模式(DLBP)
Liao在2009年提出了基于局部二值模式的改进算法——显性局部二值模式(DLBP),DLBP的原理是选择二值模式中出现频率较高的模式来描述图像的纹理信息。由于LBP方法中的统一模式忽略了图像中那些交叉点、曲率较大和角点处的模式,影响了最终分类的结果,所以尽量要在模式不稀疏的前提下多保留二值模式。因此DLBP在统计图像的所有LBP模式的基础上,筛选出出现频率较高的模式,并把累计频率达到80%的高频率模式组成最终图像的特征向量。
DLBP算法对于图像的旋转性以及图像噪声有很好的适应性,但是丢失了图像的全局纹理信息,所以本文使用了PCA算法对DLBP所提取的特征进行了补充。
2.3主成分分析(PCA)
主成分分析[7-8](PCA)是一种多维数据的描述方法,能够使多维数据根据实际研究需要更好地描述出来的一种变换方法,本质就是在尽可能地保持原始数据的前提下,通过线性变换的方法将样本数据从高维空间变换投影到低维空间中。PCA很早就被应用到了人脸识别领域。
在人脸识别过程中,使用PCA进行特征降维,首先使用LBP方法对提取到的人脸图像进行向量化操作,提取纹理特征作为一组随机向量,通过PCA降维处理,那么任意给定的人脸的图像可以近似看作这组特征的线性组合,而组合的系数可以用来表示人脸特征向量。
PCA算法:在d维空间中存在n个样本x→1,x→2,...,x→n,可以将其看作一个n维随机向量,可将其表示成矩阵的形式X=[x1,x2,...,xn],对X的所有列取均值,则可得到:
令X=[m,m,…,m]。则可以用式(12)表示样本集X对应的协方差矩阵St:
设St的秩为k;λ1,λ2,…,λk是矩阵St的特征值,且λ1≥λ2≥…≥λk;ωi,i=1,2,…,k为对应的特征向量。则λi与ωi满足:
令w=[ω1,ω2,…,ωk],在PCA中,将特征向量ωi称为这组样本的主成分,W为主成分矩阵。
将n维随机变量x经下式变换:
可得到一个新的n维的变量y,y=[y1,y2,…,yn]T。这个变换就是将变量x向W所对应的一组基进行投影,可获得一组投影系数y。y就称作为x,是在这组数据下经过PCA变换后的结果。
当获得投影系数y后,则可以按式(15)重构原始数据:
3 基于SVM的分类识别
3.1知识向量机(SVM)基本理论知识
1960年以来,Vapnik等学者研究并建立了统计学习理论,并提出了结构风险最小化原理[9]。支持向量机(SVM),能很成功地处理模式识别(分类问题、判别分析)和回归问题(时间序列分析)等诸多方面的问题,并可推广到预测和综合评价等学科和领域。
SVM的原理就是去寻找一个满足分类要求的最优分类超平面,使该超平面在保证分类精度的基础上,可以最大化超平面两侧的空白区域。
为了解决这个约束最优化问题,引入Lagrange函数:
式中,ai>0为Lagrange乘数。约束最优化问题的解由Lagrange函数中的鞍点来决定,同时最优化问题的解在鞍点处满足对w和b的偏导等于0,此时可将QP问题转化为相对应的对偶问题:
计算出的最优权值向量w*和最优偏置b*的公式如下:
若存在线性不可分,支持向量机的主要思想是将输入向量映射到一个更高维的特征空间向量中,并在所得到的特征空间中构造最优分类超平面。
将x从输入空间Rn到特征空间H的变换ø,得:
用特征向量Φ(x)代替输入向量x,然后可以得到最优分类函数如下式(23):
3.2支持向量机与多分类
对于二分类问题,给定样本集(xi,yi),i=1,2,…,l,x∈Rn,y∈{±1}以及核函K(xi,xj)=ø(xi)·ø(xj),其中ø是非线性映射函数。SVM训练出的学习机器是:
其中w是权重,b是偏置
标准SVM只能处理二分类问题,当遇到多分类的情况时,思路如下:
(1)一对多(1-a-r)方法:该算法的思想是当有K类问题就构造出K个二分类器,那么第i个SVM就用第i类中的训练样本作正训练样本,然后将其余的样本作为负训练样本。最后输出的是二分类器输出中为最大的那一类。该方法的优点是:在识别人脸图像时只需训练K个二类支持向量机,所以得到的分类函数的个数会较少。
(2)一对一(1-a-1)方法:该算法的基本思想是在K类训练样本中构造出全部可能的二分类器,每类训练样本都只在K类中的2类上进行训练,一共构造了个K(K-1)/2分类器,该方法称作1-a-1(1-against-1)。在组合所得到的二类分类器的过程中,会采用投票法,而得票最多的类就是新点所归属的类。1-a-1方法的优点是:其训练速度较1-a-r方法快。缺点有:若单个二类分类器存在不规则化,那么整个K类分类器就会趋向于推广误差无界、过学习、分类器的数目K(K-1)/ 2会随着类数K的增加而增加,本文采用的是多分类。
4 实验结果及分析
实验选择的数据库是ORL人脸图像库,在该数据库上对算法进行测试和比较。该图像库包括40个人的共400幅图像,图像尺寸大小是112×92,每人有10幅图像,ORL人脸图像库是在不同视角、不同时间和不同脸部细节(长头发/短头发、微笑/生气)的条件下拍摄的,图像如图5所示。
图5 ORL人脸图像数据库原始图像实例
4.1与其他算法的比较
该实验是在训练样本和测试样本数目相等的情况下进行的,LBP的邻域大小是3×3,PCA维数是80。如图表1所示是各种不同的特征提取或特征选择方法和分类器相结合后得到的识别率,结果表明LBP+PCA+ SVM算法由于LBP+SVM、LBP+KNN、PCA+SVM、PCA+ KNN,并且DLBP+PCA+SVM算法优于LBP+PCA+ SVM。
表1 各算法识别率比较
4.2训练样本数量分析
根据本文所提出的关于人脸识别的方法,训练样本分别选取每人的前5幅(共计200幅图像),前6幅(共计240幅图像),前7幅(共计280幅图像)。剩余的图像作为测试样本。实验对比不同样本数量对两种人脸识别方法识别率的影响。实验结果表明在样本数为4,5,6,7时,本文所提出的DLBP+PCA+SVM方法比LBP+PCA+SVM方法的识别率都要高。识别率随着样本数量的增多呈上升趋势。具体实验结果如图6所示。
图6 DLBP+PCA+SVM与LBP+PCA+SVM在不同训练样本情况下是识别率
5 结语
本文提出一种结合DLBP、PCA和SVM算法的人脸识别方法。该方法首先利用LBP算法对人脸图像进行纹理特征提取,统计每个分块中各个模式出现的频率,选择频率较高的累计达80%的模式,然后使用PCA对提取到的纹理特征进行降维处理和特征选择操作,这样可以提高运算的效率并且能全面地提取图像的纹理信息,最后使用SVM对特征进行分类和识别。在实验过程中,综合考虑了训练样本数量对识别率的影响,并和现有的算法LBP+SVM、PCA+KNN等算法进行比较。实验结果表明,DLBP+PCA+SVM算法在人脸识别过程中是一种有效的算法,在今后的研究中,还需进一步提升算法的识别速度。
[1]张翠平,苏光大.人脸识别技术综述[J].中国图象图形学报:,2000,5(11):885-894.
[2]Turk M,,Pentland A,.Eigenfaces for Recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[3]Bartlett M S,Movellan J R,Sejnowski T J.Face Recognition by Independent Component Analysis[J].IEEE Transactions on Neural Networks,2010,13(6):1450-1464.
[4]Ojala T,Pietikainen M,Harwood D.Performance Evaluation of Texture Measures with Classification Based on Kullback Discrimina-tion of Distributions[C].Pattern Recognition,1994.Vol.1-Conference A:Computer Vision&Image Processing.,Proceedings of the 12th IAPR International Conference on.1994:582-585 vol.1.
[5]Daugman J G.Uncertainty Relation for Resolution in Space,Spatial Frequency,and Orientation Optimized by Two-Dimensional Visual Cortical Filters[J].Journal of the Optical Society of America A Optics&Image Science,1985,2(7):1160-9.
[6]Ojala T,Harwood I.A Comparative Study of Texture Measures with Classification Based on Feature Distributions[J].Pattern Recognition,1996,29(1):51-59.
[7]Javed A.Face Recognition Based on Principal Component Analysis[J].International Journal of Image Graphics&Signal Processing,2013,5(2).
[8]Haitao Z,Pong Chi Y,Kwok J T.A Novel Incremental Principal Component Analysis and Its Application for Face Recognition[J]. IEEE Transactions on Systems Man&Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man&Cybernetics Society,2006,36(4):873-86.
[9]Lee K,Chung Y,Park C H,et al.System for Registering and Authenticating Human Face Using Support Vector Machines and Method Thereof:US,US 7092555 B2[P].2006.
[10]Guyon I,Weston J,Barnhill S,et al.Gene Selection for Cancer Classification using Support Vector Machines[J].Machine Learning,2002,46(1-3):389-422.
Face Recognition Based on DLBP,PCA and SVM Algorithms
ZHANG Yan,YU Wei-wei,LI Wen-yuan
(College of Information Engineering,Shanghai Maritime University,Shanghai 201306)
In order to improve the recognition rate of face image,proposes a combination of DLBP,PCA and SVM face recognition algorithm.Firstly,each face image is divided into blocks,each block of the image of the local two value model selection statistics,which has higher frequency mode,LBP will block all image histogram link up as the image texture features,then uses principal component analysis(PCA)to reduce the dimension of the texture feature extraction,finally uses support vector machine classifier to classify and identify the image. This method is constructed based on the practical,effective facial feature extraction,selection and identification process,and carries out the experiment and in the ORL face database.The results show that compared to the previous LBP+SVM,PCA+SVM,LBP+PCA+SVM face recognition algorithm,this method can effectively improve the recognition rate of face image.
Face Recognition;LBP;PCA;SVM
1007-1423(2016)25-0022-06DOI:10.3969/j.issn.1007-1423.2016.25.006
张燕(1991-),女,浙江金华人,硕士研究生,研究方向为图像处理、模式识别
2016-05-04
2016-09-01
于威威(1978-),女,博士,副教授,研究方向为模式识别、计算机图像处理、数据挖掘等