APP下载

基于特征融合的人脸识别新算法

2017-02-22吴锡生魏月纳

计算机技术与发展 2017年1期
关键词:维数识别率分类器

吴锡生,魏月纳

(江南大学 物联网工程学院,江苏 无锡 214122)

基于特征融合的人脸识别新算法

吴锡生,魏月纳

(江南大学 物联网工程学院,江苏 无锡 214122)

针对基于传统Gabor小波变换的人脸特征提取存在维数高的不足,提出了一种基于改进的Gabor特征融合和SVM的人脸识别算法,并用二维傅里叶变换进行加速求解,提高了特征提取的速率。提取了人脸图像的Gabor多方向和多尺度特征,然后对同一方向上不同尺度的特征进行融合,再采用fastPCA算法对融合后的特征进行降维,最后用改进的SVM分类器即混合核函数分类器进行分类识别,并利用两种处理模式对分类器进行融合。在FERET和ORL人脸库上进行了实验,结果表明该算法能有效地表征人脸,具有较高的识别率。

人脸识别;Gabor特征融合;改进SVM;分类器融合

0 引 言

作为人工智能与模式识别的研究热点之一,人脸识别占有十分重要的地位。与其他生物特征相比,人脸是一种最自然的特征,因此人脸识别在身份认证、公共安全以及监控方面得到了广泛应用。由于人脸图像易受表情、光照、年龄、噪声、头发或者眼镜遮挡等因素的影响,因此提取区分性好且鲁棒性高的面部特征,构建高性能分类器,提高识别率,一直是人脸识别领域的重点和挑战[1-2]。为此国内外研究人员进行了大量的研究工作,提出了许多有效的特征提取方法。

由于Gabor滤波器可以捕捉人脸在不同方向和不同尺度的局部特征信息,对光照变化和人脸姿态不敏感,因此广泛应用于人脸识别[3]系统。徐杰等[4]提出结合Gabor和PCA算法,先对人脸图像进行Gabor小波变换,得到Gabor小波特征,再用PCA进行降维,有效地提高了识别率。针对Gabor人脸特征的高维特性,王宪等[5]提出了分块思想,结合分块的PCA和Gabor滤波器,选择最邻近分类器,有效提高了人脸识别率。周家锐等[6]将Gabor与Memetic算法相结合,先优化Gabor滤波器组,然后提取更有区分度的人脸特征,从而提高人脸识别率。邓洪波等[7]在特征提取时选用局部Gabor滤波器组,不仅减少了计算量还提高了特征提取的速度。

目前Gabor特征提取一般有两种方法:

(1)提取Gabor特征,然后采用一些降维算法降低特征维数;

(2)选取部分尺度和方向上的Gabor特征,然后再降低特征维数。

目前常见的分类器有K近邻、神经网络等算法[8-9]。K近邻算法虽然简单易实现,但其分类性能不好;而神经网络学习存在过拟合、收敛速度慢等缺陷。

基于上述分析,文中提出了一种新的Gabor特征融合、同时对SVM进行改进的人脸识别算法,在不丢失Gabor特征的基础上,对相同方向不同尺度的特征进行融合,初步降低了特征维数,再采用fastPCA进行二次降维,然后设计SVM分类器。

1 改进的人脸识别算法流程

改进的特征融合和SVM的人脸识别流程可以简述为:对人脸图像进行Gabor小波变换,并对得到的Gabor特征进行融合,消除其冗余信息,初步降低特征维数,然后用fastPCA算法再次对特征矩阵进行二次降维,最后构建支持向量机分类器,输出人脸识别结果。

2 人脸特征提取

2.1 Gabor变换

二维Gabor小波的核函数响应不管是在频域还是空域,都有很好的分辨能力,能表现出良好的方向选择性和空间局部特性[10],同时对光照变化、姿态也不敏感。二维的Gabor小波变换表达式[11]为:

(1)

对于一张人脸图像I(x,y),将其与式(1)进行卷积,得到:

Mu,v(z)=I(x,y)⊗ψu,v(x,y)= ∬I(x,y)·ψu,v(x,y)dxdy

(2)

在此利用快速FFT算法对式(2)进行计算,若用ξ、ξ-1表示傅里叶变换及其反变换,则根据卷积定理有:

ξ{Mu,v(x,y)}=ξ{I(x,y)*ψu,v(x,y)}=ξ{I(x,y)}*ξ{ψu,v(x,y)}

(3)

Mu,v(x,y)=ξ-1{ξ{I(x,y)}*ξ{ψu,v(x,y)}}

(4)

由此便得到对应尺度和方向的人脸特征表示,其结果见图1,则整张人脸可以表示为:{Mu,v(z)|u∈(0,1,…,7),v∈(0,1,…,4)}。

图1 Gabor特征

2.2 特征融合

从图1中可看出,Gabor变换后,一张人脸图像有40张Gabor特征图,对于相同方向不同尺度的Gabor特征图有些相似,从而存在数据冗余,而且特征维数很高。文献[13]提出一种二进制编码融合规则,对相同尺度下不同方向的Gabor特征进行融合;文献[11]则提出了和、最小值、最大值等融合规则,分别对相同方向不同尺度、相同尺度不同方向的特征进行融合,结果表明对相同方向不同尺度的融合要比对相同尺度不同方向的融合能更有效地表征人脸特征。因此文中在文献[13]的基础上,对同一个方向上不同尺度的Gabor特征进行融合,以提高人脸识别效率。

若Gabor特征实部用Re(Mu,v(z))表示,虚部用lm(Mu,v(z))表示,则其融合规则如式(5)和式(6)所示:

(5)

(6)

按此规则把在不同尺度但同一个方向的Gabor特征编码成二进制,然后再对其进行融合成为十进制编码,其形式如下:

(7)

(8)

通过式(7)和式(8),对每一个方向的Gabor尺度特征进行融合,即把40张Gabor特征图降到了8个方向上,其融合结果如图2所示。

图2 融合后的结果

最后人脸特征向量选用融合后的Gabor幅值向量表示:{Mu(z)|u∈(0,1,…,7)}。

这样一幅图像经过Gabor特征提取并融合后,得到了8组特征矢量,针对这8组特征矢量有两种处理方式:

(1)可以将其简单级联成一个长特征矢量X,然后对X进行学习和识别分类;

(2)分别对单组特征矢量进行学习和分类,然后再对8组分类结果进行融合。

由于一般图像的维数比较高,直接将特征级联会导致维数过大而难于处理,因此文中采用fastPCA对特征矢量X再次进行降维,以减少运算量。

3 改进的支持向量机算法

作为一种机器学习算法,支持向量机以统计学习理论为基础,它通过核函数的引入,很好地解决了非线性分类问题。但是核函数的选择是SVM应用领域遇到的一个重大难题,至今为止都没有具体的方法和理论指导,通常是靠经验选取核函数[14]。

支持向量机(SVM)对小样本、高维等问题具有较好的分类性能,算法原理如下所述。

设有训练集:(x1,y1),…,(xL,yL),xi∈Rn,yi∈{-1,+1},用SVM算法求解约束极值问题,即:

(9)

其中,K(xi,xj)为核函数,它满足Mercer条件,常用的核函数有:

(2)径向基函数(RBFkernel):K(x,y)=exp{-g‖x-y‖2};

(3)多项式核函数(Polykernel):K(x,xi)=[(x·xi)+1]d;

(4)多层感知机(Sigmoidkernel):K(x,xi)=tanh(γ·(x,xi)+θ),其中c、v、g均为常数。

训练后分类函数即为:

(10)

其中,αi、b0为约束极值问题的最优解。

在SVM中,众多核函数各有千秋,而核函数的选取主要借助于经验。经研究发现,径向基核函数是典型的全局核函数,而多项式核函数则是典型的局部核函数,二者在一定的定义区间内具有很好的性能[15]。而采用Sigmoid核函数时,支持向量机实现的是一种多层感知器神经网络,在训练的过程中隐含层节点数目以及节点对输入节点的权值都是自动确定,支持向量机的理论基础决定了它最终求得的不是局部最小值而是全局最优值,从而保证了它不会出现过学习现象,具有很好的泛化能力。在式(10)中选用不同的核函数即构造不同的分类器,参考文献[15]将二个核函数组合使用的方法,对Sigmoid函数和多项式核函数进行组合,即:

Kmix=μKpoly+(1-μ)Ksigmoid

(11)

将式(11)代入式(10)即得到新的分类器,记为K-SVM,表示为:

(12)

4 实验结果与分析

为验证文中特征融合算法的可靠性和基于组合混合核函数的SVM分类的有效性,采用FERET和ORL人脸库,在IntelCoreI5处理器、4GB内存、Win7旗舰版及MatlabR2010a下编程实现,并与文献[13-15]进行对比。

4.1 ORL人脸库的实验分析

ORL数据库共有40人,每人10张图片共400张图片,图片大小为92×112。为了方便计算,在此将图片尺寸归一化为32×32,部分人的图片有光照、表情、姿态的变化,每个人的图片选用前5张用来训练,剩余的用来测试。先对每张图片进行特征提取,再进行融合,然后对提取后的8组特征矢量按照以下两种方式进行处理。

(1)将8组特征矢量简单级联成一个长特征矢量X,然后对X进行学习和识别分类。文中经过多次实验可知,在特征维数为20时识别率趋于平稳,而随着特征维数的增大,训练和识别的速度将严重下降,因此综合考虑时间和精准度,降维后的维数统一选用20(其中,参数μ=0.95时分类性能最优)。在特征维数为20时,文中算法和相关文献的比较结果如表1所示。其中与文献[15]的比较只用了其中的混合核函数分类器,而特征提取用的是文中算法。从实验结果可以看出,文中算法融合后的Gabor特征比传统的Gabor特征和文献[13]融合后的特征能更好地区分人脸,有效提高了识别率。

表1 四种算法在ORL库上识别结果的比较

(2)对各单组特征矢量进行学习和分类,得到8组局部分类器,然后再根据投票决策对其局部分类器进行融合。先根据单个特征识别率的高低排序,选择最高的三个特征融合为新的第一组,同时组合最低的三个为第二组,再将这两组和剩余的两个特征即四组分类器整合为一个分类器。其单个特征的识别率以及融合局部分类器后的识别率如图3所示。

图3 识别率(1)

在特征矢量维数为20时,方式(1)的识别率为95.6%,而方式(2)的识别率为96%,因此文中选用后者,即对单个特征进行训练和学习得到单个分类器,再对8组局部分类器进行融合,以进一步提高识别率。

4.2 FERET人脸库的实验分析

FERET包括了一个通用人脸库以及通用测试标准,同一人包括不同表情、光照、姿态和年龄的照片,从中选取600张图像即60人每人10张,并将其裁剪为128×128。为了便于计算,尺寸统一归一化为32×32,每个人的图片选用前5张用来训练,剩余的用来测试。

(1)首先提取图像特征,并进行融合得到8组特征矢量,将其级联成一个长特征矢量X,然后对X进行学习和分类识别。在特征维数为20时四种算法在FERET数据库上的识别率如表2所示(参数μ=0.95时分类性能最优)。

表2 四种算法在FERET库上识别结果的比较

由表2可以看出,文中算法在FERET数据库上的识别率同样优于其他算法。

(2)对单个特征矢量进行学习分类,单个特征的识别率如图4(a)所示,同样根据识别率进行排序,即组合1、4、7为新的第一组分类器,再组合2、3、5为第二组,另外6、8分别为第三组、第四组,再将新的四组分类器整合为一个分类器,其识别率如图4(b)所示。相比第一种处理方式识别率进一步得到了提高。

图4 识别率(2)

4.3 结果分析

由表1和表2可以看出,文中提出的融合同一方向不同尺度的特征比文献[13]提出的融合同一尺度不同方向的特征更能表征人脸的特性,识别率更高。但由于文中是对融合后的8个特征矢量进行学习和分类,而文献[13]是对融合后的5个特征矢量进行学习,因此在速度方面不如文献[13]。而且通过组合Sigmoid和多项式核函数,取长补短,不仅保证了离测试点较远点的函数值衰减慢,而且使测试点附近有较大的函数响应值,从而更充分地综合了两个核函数的优势,使得混合核函数的泛化能力得到了明显提高,且Sigmoid和多项式核函数的组合要优于文献[15]提出的径向基和多项式核函数的组合。

实验结果表明,文中算法对于不同的数据库都略优于其余文献,有良好的识别性能,并且对于不同姿态、表情、光照都有一定的鲁棒性,而且还具有较低的计算量,能较好地满足人脸图像识别的实时性要求。

5 结束语

提出的人脸识别算法首先对人脸提取不同尺度、不同方向的Gabor特征,然后对相同方向不同尺度的特征进行融合,并采用组合核函数的SVM进行识别分类,结果表明该算法有很好的识别性能,并且在实际化工厂人员的身份验证中取得到了良好的识别效果。针对更加复杂条件下(比如摄像机拍摄角度不同)的训练样本不足的人脸识别将是研究者下一步的研究重点。

[1] Adana Y,Moses Y,Ullman S.Face recognition:the problem of compensating for changes in illumination direction[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,19(7):721-732.

[2] Andres A M,Padovani S,Tepper M,et al.Face recognition on partially occluded images using compressed sensing[J].Pattern Recognition Letters,2014,36(15):235-242.

[3] 张 莹,王耀南.基于Gabor滤波器包络的人脸识别算法[J].中国图象图形学报,2008,13(12):2314-2320.

[4] 徐 杰,施鹏飞.基于Gabor小波特征的多姿态人脸图像识别[J].计算机工程与应用,2003,39(21):17-18.

[5] 王 宪,陆友桃,宋书林,等.基于Gabor小波变换与分块PCA的人脸识别[J].计算机工程与应用,2012,48(3):176-178.

[6] 周家锐,纪 震,沈琳琳,等.基于Gabor小波与Memetic算法的人脸识别方法[J].电子学报,2012,40(4):642-646.

[7] 邓洪波,金连文.一种基于局部Gabor滤波器组及PCA+LDA的人脸表情识别方法[J].中国图象图形学报,2007,12(2):322-329.

[8] George A N S,Belhumeur P N,Kriegman D J.From few to many:illumination cone models for face recognition under variable lighting and pose[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,23(6):643-660.

[9] 唐京海,张有为.基于FLD特征提取的SVM人脸表情识别方法[J].计算机工程与应用,2006,42(11):10-12.

[10] Chai Zhenhua,Sun Zhenan,Mendez-Vazquez H,et al.Gabor ordinal measures for face recognition[J].IEEE Transactions on Information Forensics and Security,2014,9(1):14-26.

[11] 王 琳,李勇平,王成波,等.基于二维Gabor小波矩阵表征人脸的识别算法[J].计算机工程,2008,34(2):8-10.

[12] Su Y,Shan S,Chen X,et al.Hierarchical ensemble of global and local classifiers for face recognition[J].IEEE Transactions on Image Processing,2009,18(8):1885-1896.

[13] 薛 涛,刘潇潇,张海兵.基于Gabor特征融合和LSSVM的人脸识别算法[J].计算机应用与软件,2014,31(7):191-194.

[14] 李云峰,欧宗瑛.基于Gabor小波变换和支持向量机的人脸识别[J].计算机工程,2006,32(19):181-182.

[15] 谌 璐,贺兴时.改进的支持向量机算法在人脸识别上的应用[J].纺织高校基础科学学报,2015,28(1):108-115.

A New Face Recognition Algorithm Based on Feature Fusion

WU Xi-sheng,WEI Yue-na

(School of Internet of Things Engineering,Jiangnan University,Wuxi 214122,China)

Considering the high dimensional deficiencies of face feature extraction based on traditional Gabor wavelet transform,a face recognition algorithm based on improved Gabor feature fusion and SVM is proposed,and it accelerates the solving process with the two-dimensional Fourier transform and improves the rate of feature extraction.The Gabor multi-directional and multi-scale features of face image are extracted,then fusing of the features in the same direction at different scales,after that,the dimension of fused feature by fastPCA algorithm is reduced.Finally the face images are recognized with the improved SVM classifier based on mixed kernel function,and the classifier is fused by using two kinds of processing pattern.The experimental result is conducted on face database like FERET and ORL,which shows that the algorithm can effectively characterize face and improve recognition rate.

face recognition;Gabor feature fusion;improved SVM;classifier fusion

2016-02-14

2016-06-16

时间:2016-11-22

国家自然科学基金资助项目(61373055);江苏省产学研联合创新资金项目(BY2013015-35)

吴锡生(1959-),男,教授,CCF会员,研究方向为模式识别;魏月纳(1987-),女,硕士,研究方向为模式识别。

http://www.cnki.net/kcms/detail/61.1450.TP.20161122.1227.022.html

TP301.6

A

1673-629X(2017)01-0065-05

10.3969/j.issn.1673-629X.2017.01.015

猜你喜欢

维数识别率分类器
修正的中间测度和维数
一类平面数字限制集的维数
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
含非线性阻尼的二维g-Navier-Stokes方程全局吸引子的维数估计
基于特征选择的SVM选择性集成学习方法
基于差异性测度的遥感自适应分类器选择
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别