一种基于混合核函数SVM的人脸识别方法

2016-11-04晏志超

四川轻化工大学学报(自然科学版) 2016年3期

关键词：人脸识别人脸类别

晏志超，姚　亮，韩　超

(安徽工程大学电气工程学院，安徽　芜湖　241000)

一种基于混合核函数SVM的人脸识别方法

晏志超，姚亮，韩超

(安徽工程大学电气工程学院，安徽芜湖241000)

SVM是人脸识别中最常使用的一种机器学习领域算法，它通过距离概念得到对数据分布的结构化描述，降低了对数据规模的要求，适合处理人脸图像这种小样本训练集的分类问题。其中SVM的核函数的选择对分类精度影响很大，全局核函数的预测函数对输出进行正确预测的能力较高，而局部核函数具有较强的学习能力，兼顾两者特点，使用结合RBF核和Sigmoid核的混合核来设计SVM分类器进行识别。针对ORL库进行PCA特征提取，然后使用基于混合核的SVM分类器进行识别分类。实验结果表明，在识别率上，基于该混合核函数的SVM分类器比基于普通核函数SVM分类器要更占优势。

混合核函数；支持向量机；PCA；人脸识别

引　言

人脸识别将人脸图像作为矩阵数据，对数据进行降维以及分类处理。相比较传统的人身验证方式，人脸识别由于其方便采集、非接触性、安全性等优势，是一种更容易被人们接受的身份验证方式，应用十分广泛[1-2]。由于人脸图像比较复杂，数据量庞大，且外界干扰因素对数据会产生较大影响[3-4]，因此这是一项意义重大而又极具挑战的课题。人脸识别由人脸检测、人脸分类识别两大环节构成[5]。检测环节的工作是指从采集到的整个图像中识别出人脸的区域，检测环节常用的算法有Adaboost，SVM等[6-7]；分类识别环节由图像的特征提取和对图像的具体类的判定两个过程组成，其目的是确定出图像所属的具体类别，本文主要讨论该环节。分类识别环节中，特征提取环节采用主成份分析(PCA)[8-9]，人脸鉴别环节采用支持向量机(SVM)[10-11]。主成份分析又叫主分量分析，是一种统计分析方法，它的原理简单，特征容易获取更易于实现，是当前比较流行的特征提取方案[12]。SVM基于结构风险最小化原则，在优化训练误差和最小化置信范围值之间寻求折中，在小样本的情况下可以得出较好的分类结果，通常情况下采集到的人脸样本数量都会非常有限，因此人脸识别中常用SVM作为分类器，其中SVM分类器的核函数对分类的性能起着至关重要的作用。核函数分为全局核函数和局部核函数，前者的预测函数可以对未来输出进行更好的预测，而学习性能方面则是后者较好[13]。为了结合两者的优势，本文提出了使用结合全局核和局部核的混合核函数[14-16]作为整个系统的核函数，最终实验得出，基于混合后的核函数的SVM分类器在识别率上要高于传统基于单一核函数的SVM分类器。

1　PCA特征提取

在人脸识别中，人脸图像被用矩阵来表示。由于人脸图像非常复杂，矩阵的维数也因此很高，对高维的数据直接进行计算，运算速度会非常慢，不能保证人脸识别时的实时性，并且高维的人脸图像数据包含很多噪声，对分类的结果而言是一个不利的因素，因此针对获取的人脸图像首先要采取特征提取操作。

假定进行实验的人脸库中的每一张图像的分辨率为i×j，选取库中的训练样本数为m，将每一张人脸图像用一个行向量来表示，然后将这些图像数据存储到一个二维数组A[m][i×j]中，则数组的每一行表示一个单独人脸图像的所有像素信息，而数组的每一列则代表在同一位置处不同图像类别之间的像素信息。得到A矩阵后，通过求其协方差矩阵得到任意两个像素之间的关系，其中该协方差矩阵的大小为n×n，针对得到的协方差矩阵求其特征值以及特征向量，总共有n个特征值及其对应的特征向量，然后进行主成份提取，即按照特征值由大至小排列，根据所需精度的要求来确定特征向量的数量，例如需要降到p维，则选取前p个特征值对应的特征向量，通常p<

图1映射矩阵

2　SVM人脸分类

2.1人脸分类器的确定

假设存在n组不同的人脸，即n个类别，表示为S={S1,S2,...,Sn}。首先需要针对每两个类别两两组合为一个二分类问题设计一个分类器，也就是需要对Si(i=1,2,...,n)训练得到n个SVM分类器，每一个SVM分类器SVMi可以解决Si和非Si的二分类问题，所以，针对n个类别的图像数据，需要训练设计出的二分类SVM分类器的数量为n(n-1)/2。其中对于类别S1的SVM分类器SVM1，将第一类的训练集数据的Flag值置为1，而将其他非该类中的训练集数据的Flag值置为0，即可训练得到分类器SVM1，同理，对于类别Si的SVM分类器SVMi，只需要把第i类中的训练集数据的Flag值置为1，非第i类的数据集的Flag值置为0。

针对每一个二分类SVM分类器，对于输入数据x，计算f(x) = wTx + b的值确定类别，其中w为权值向量，b为阈值，f(x)等于0时的x就是超平面上的点，f(x)大于0和f(x)小于0分别代表两个类别，定义分类的结果标签y为1或-1，即超平面一侧数据点对应的f(x)全是1，另一侧数据点的f(x)值全是-1。最终选择使得超平面两侧的数据之间间隔最大的解。而针对人脸图像分类问题，样本数据是非线性可分的，此时处理的方法是选择一个核函数将人脸图像样本数据映射至高维空间，使得样本数据在该空间里线性可分，求得SVM分类器为：

(1)

其中，K(xi,x)表示核函数，αi表示Lagrange乘子，αi的取值范围为[0,∞)。为了控制可能分类错误的点，需要加入惩罚系数C的约束，该系数表示对样本的分类错误的重视程度，如果C的值取很小，分类错误的点会较多，反之，C的值取很大，则会产生过拟合。加入C的约束后，αi的取值范围为[0,C)。

得到这些二分类器后，采用投票法进行最终类别的确认，每个分类器为对测试人脸样本给出分类的结果，得票最多的类别，则判定为最终分类的结果，图2为多个二分类器进行投票确定分类结果的流程图。

图2SVM分类器投票

2.2混合核函数

核函数对于分类结果的影响重大，实际上，SVM的许多特性都是由它的核函数的类型所决定的，因此选取好的核函数对于识别分类的精度非常重要。对于核函数的选择，也是需要满足一定要求的，即Mercer条件。核函数的形式以及核参数的不同，空间之间的映射关系也会不同，因此在核函数选择上的差别也会带来不一样的识别结果。

常用的核函数有：

(1) 径向基核函数(radial basis function)

(2) 线性核函数(linear function)

K(x1,x2)=

(3) 多项式核函数(polynomial function)

K(x1,x2)=(+d)4

(4) sigmoid核函数(sigmoid function)

K(x1,x2)=1/(1+exp(-u))

全局核函数允许距离较远的数据点对核函数产生影响，它的预测函数对输出结果准确预测的性能较强，即外推能力较强；而局部核函数相反，它只允许距离相近的数据点影响核函数，拥有较好的学习能力，但是预测函数性能不佳，随着参数σ的增大而减弱，比较善于处理局部特征。核函数需满足Mercer条件，满足该条件可以免除变化，而直接利用低维度的参数带入核函数来等价的计算高维度向量的内积。考虑到二者各自的优势，将二者利用一个系数通过线性组合起来从而达到兼具两者优势的核函数作为整个系统的核函数。本文通过结合RBF核以及Sigmoid核来确定整体的核函数，混合后的核函数为：

K(x1,x2)=(1-λ)(1/(1+exp(-u))+

(2)

其中，系数λ为RBF核核函数所占权值，通过对系数λ值的调整来改变RBF核以及Sigmoid核在整个系统核函数中所占的作用的大小。

3　仿真实验

3.1实验环境

本文算法采用的仿真软件为的matlab7.0，实验库采用ORL人脸库。该图片库是当前最流行的人脸库之一，它由40个类别，每个类别共10幅图，总计400张图片组成，包含各种人脸姿态、角度、光照、表情、眼睛是否睁开，是否佩戴眼镜等差异。ORL人脸库所有图像都是在相同背景下拍摄，图像本身已经经过归一化和校准等操作，因此无需再次进行处理。实验过程中，每个人为一个类别，分别给40个人编号，并且每个人的10幅图像也进行编号。本文实验的训练样本采用每个类别的前5张图，测试样本采用每个类别的后5副图，实验流程图如图3所示。

图3实验流程图

3.2实验结果与分析

由于ORL图片库已经对图片进行了一定的裁剪、旋转以及灰度化等预处理的操作，因此无需再次对图片采取重复预处理的操作。实验中，首先是对训练样本图片进行特征的提取操作，完成之后将这些图片数据存入到一个矩阵中，每幅图像为一行。图4分别为使用PCA降至150维、100维和50维后重构后效果，可以看出150维明显具有较好的重构效果。图5为降到20维的主分量图。

图4不同维数下PCA重构图

图5主分量

训练过程中，每个个体取前5副图像，40个类别，一共200副图像进行训练，总共需要构造出40×39/2个两两分类的分类器，将待测样本输入各个分类器中进行计算，按照投票机制判定输入样本类别。实验中惩罚系数C的取值为100。

图6为混合系数λ取不同值时识别率的变化，对混合分类器的λ的值进行调整，得到不同的混合分类器后进行实验。通过实验数据可以看出，当λ在0.8以下时识别率逐步升高，而当λ的值在0.8之上时候会有所下降，因此λ=0.8时混合核函数的性能最优。

图6混合系数对识别率影响

表1展示了基于原始线性核函数、原始RBF核函数、原始多项式核函数、原始Sigmoid核函数、混合RBF和线性核函数、混合RBF和Sigmoid核函数的支持向量机分类器各自的最优参数，以及在各自最优参数情况下的识别率，可以看出单核函数在人脸识别应用中，RBF核函数识别效果相对较优，混合核函数比单一的核函数更占优势，而混合了局部核函数RBF和全局核函数Sigmoid后的核函数效果可以达到最优。

表1　几种核函数最优参数情况下的识别率对比

4　结束语

本文使用matlab在ORL库上来验证识别效果，首先使用PCA算法对图片采取特征提取的操作，然后提出一种混合RBF核与Sigmoid核的混合核函数。实验结论表明：相比较基于传统单一核的SVM分类器，基于混合核的SVM在最终的识别效果上占优势。

[1] RUJIRAKUL K,SO-IN C,ARNONKIJPANICH B.PEM-PCA:a parallel expectation-maximization PCA face recognition architecture[J].Scientific World Journal,2014(5):174-175.

[2] 杨军,刘研丽.基于图像的单样本人脸识别研究进展[J].西华大学学报:自然科学版,2014,33(4):1-5.

[3] ADINI Y,MOSES Y,ULLMAN S.Face recognition:the problem of compensating for changes in illumination direction[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):721-732.

[4] SHARMA R,PATTERH M S.A new hybrid approach using PCA for pose invariant face recognition[J].Wireless Personal Communications,2015,85(3):1561-1571.

[5] SHIEH M Y,CHIOU J S,HU Y C.Applications of PCA and SVM-PSO based Real-Time face recognition system[J].Mathematical Problems in Engineering,2014(1):1-12.

[6] XU Shibiao,MA Guanghui,MENG Weiliang,et al.Statistical learning based facial animation[J].Frontiers of Information Technology & Electronic Engineering,2013,14(7):542-550.

[7] JIANG Yunliang,SHEN Yefeng,LIU Yong,et al.Multiclass Adaboost ELM and its application in LBP based face recognition[J].Mathematical Problems in Engineering,2015(1):1-9.

[8] AGARWAL M,JAIN N,KUMAR M,et al.Face recognition using eigen faces and Artificial Neural Network[J].International Journal of Computer Theory and Engineering,2010,6(4):624-629.

[9] SHARMA R,PATTERH M S.A new pose invariant face recognition system using PCA and ANFIS[J].Optik International Journal for Light and Electron Optics,2015,126(23):3483-3487.

[10] ZHOU Changjun,WANG Lan,ZHANG Qiang.Face recognition based on PCA and logistic regression analysis[J].Optik International Journal for Light and Electron Optics,2014,125(20):5916-5919.

[11] KIM S K,PARK Y J,TOH K A,et al.SVM-based feature extraction for face recognition[J].Pattern Recognition,2010,43(8):2871-2881.

[12] MOGHADDAM B,YANG M H.Learning gender with support faces[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(5):707-711.[13] 邬啸,魏延,吴暇.基于混合核函数的支持向量机[J].重庆理工大学学报:自然科学版,2011,24(10):66-70.[14] 杨海燕,周永权.一种支持向量机的混合核函数[J].计算机应用,2009,29(z2):173-175.

[15] ZHU Shuxian,ZHANG Renjie.Research for face recognition base on mixed kernel function[C]//International Conference on Audio,Language and Image Processing,2008(ICALIP2008),Shanghai,July 7-9,2008:1395-1399.[16] ZHANG B L,LEUNG C.Face recognition by combining kernel associative memory and Gabor transforms[C]//7th International Conference on Automatic Face and Gesture Recognition(FGR06),Southampton,April 2-6,2006:107-112.

A Face Recognition Method Based on Combined-kernel Function SVM

YANZhichao,YAOLiang,HANChao

(College of Eletrical Engineering, Anhui Polytechnic University, Wuhu 241000,China)

Support vector machine (SVM) is one of the most commonly used algorithm in machine learning when it comes to face recognition, it gets structured description of data distribution by the conception of distance and reducing the requirements of data volume, so it’s very suitable for the face recognition of small sample of the training set. The selection of kernel function of SVM has a great influence on the classification accuracy, global kernel function has the strong ability of generalization but weak in learning ,local kernel function is the opposite, taking into account of both advantages, SVM classifier is designed by using the mixture of RBF core and Sigmoid core for identification. using PCA algorithm to extract feature ORL face database firstly, and then using combined-kernel function of SVM classifer to do classification. The result proved that combined-kernel function of SVM has higher recognition rate than traditional single kernel function.

combined-kernel function; support vector meachine; PCA; face recognition

2016-03-06

安徽省自然科学基金项目(1508085MF121);安徽工程大学安徽检测技术与节能装置省级实验室开放研究基金项目(1506C085002);2016年高校优秀中青年骨干人才国内外访学研修重点项目(gxfxZD2016100);国家级大学生创新训练项目(2014103630342016)；2016年度安徽高校自然科学研究项目(KJ2016 A056)

晏志超(1991-),男,江苏高邮人,硕士生,主要从事图像处理与模式识别方面的研究,(E-mail)259598863@qq.com;

韩超(1974-),安徽宿州人，副教授,博士,主要从事图像处理与模式识别方面的研究,(E-mail)hanchaozh@126.com

1673-1549(2016)03-0023-05

10.11863/j.suse.2016.03.06

TP391.4