APP下载

基于KPCA和LDA融合改进的人脸识别算法研究

2016-01-20张震,张学忠,李龙

郑州大学学报(工学版) 2015年5期
关键词:白化预处理

基于KPCA和LDA融合改进的人脸识别算法研究

张震,张学忠,李龙

(郑州大学 电气工程学院,河南 郑州 450001)

摘要:针对人脸识别算法运行速度与识别率的矛盾,提出了一种将KPCA和LDA相结合的算法.首先对人脸图像进行白化、低通滤波预处理,去除干扰、噪声的同时平衡图像的能量谱;然后利用KPCA和LDA的改进方法,有效降低样本空间维数的同时又解决了“小样本”和边缘数据的分类问题;最后利用最近邻分类器进行分类识别.通过大量的实验证明此方法是可行的.

关键词:白化;低通滤波;预处理;KPCA;LDA

收稿日期:2015-04-21;

修订日期:2015-07-10

基金项目:河南省教育厅重点科技攻关计划项目(13A510684)

作者简介:张震(1966—),男,河南郑州人,郑州大学教授,博士,主要从事信号处理,图像处理与模式识别研究,E-mail:zhangzhen66@126.com.

文章编号:1671-6833(2015)05-0116-05

中图分类号:TQ0352.7;TQ0352.9

文献标志码:A

doi:10.3969/j.issn.1671-6833.2015.05.025

Abstract:In view of the contradiction between running speed and recognition rate of face recognition algorithm, a new algorithm has been proposed that combines KPCA and LDA .Firstly, the face images is conducted pretreatment of whitening and low pass filtering to remove the interference and noise, and at the same time it also can balance the energy spectrum of the image. Then, combining with the improved of KPCA and LDA method, we effectively reduce the sample space dimensionality and solve the “small sample” and edge data classification problems. Finally, the nearest neighbor classifier is used for classification and recognition. The experimental results verify that the method is feasible.

0引言

人脸识别一直是生物识别领域的研究热点,基于统计和基于几何的方法是比较常用的两种人脸识别方法[1].现在最受欢迎的是基于子空间的方法,它具有较高的计算效率和表征能力.最基本的线性子空间方法有主成分分析法(PCA)、线性鉴别分析法(LDA);非线性子空间方法主要有拉普拉斯特征映射法、核主成分分析法(KPCA)等.其中PCA和LDA方法在人脸识别中容易受姿态、光照、表情等因素的影响,又加上PCA方法不能解决人脸样本的非线性问题和LDA方法使用时容易产生“小样本”和边缘数据的分类问题;而KPCA虽然能解决PCA不能解决的非线性问题,但同时它会提取到过多的不相关特征,从而影响到人脸识别的速度和识别率,因此笔者提出了KPCA和LDA融合改进的方法.首先对人脸图像进行预处理,然后利用KPCA最佳样本均值估计向量代替原始样本向量,降低样本维数,进而提高了算法运算速率;最后对降维后的样本使用改进的LDA方法.

1白化和低通滤波的预处理

获得的每一幅人脸图像,不能保证它是正规的,它或多或少受外界环境影响,进而影响人脸的识别.人脸识别的预处理可以减少这些外界环境影响,提高识别率.笔者拟采用白化和低通滤波预处理.

人脸图像就像一个平静的水面上投去一颗石子,周围产生不平衡的能量谱,根据这一系列能量谱进行提取信息.根据这个原理,Liao Ling-zhi等提出用一个白化滤波器分离低频和高频信息,优化人脸能量谱,然后用一个低通滤波来滤除用白化预处理分离开的高频部分的噪声[2].

白化处理的具体过程就是选取一个白化矩阵W,将原始图像X经过一个矩阵变换Y=WX,利用此式求取其特征值.W的具体表达式如下

(1)

式中:αw为白化参数.

用指数低通滤波器滤除白化过程分离开的高频噪声,设计如下

(2)

2双树复小波和Gabor小波分解

双树复小波变换(Dual-Tree Complex Wavelet Transform,DT-CWT)[3]和Gabor小波[4]是人脸识别中常用的特征提取方法.DT-CWT可以解决很多小波变换不能解决的问题,它具有很多优点,如多方向选择性、良好的平移性、计算复杂度低等,又因为DT-CWT由可分离小波变换演变而来,计算复杂度比Gabor小波低得多,这使得它在人脸识别中迅速流行开来.但DT-CWT的方向选择也是有局限的,它仅能提取特定的几个方向,就连比较重要的水平和竖直这2个方向都不能提取,Gabor小波可根据应用进行参数设定,进而提取任何方向的信息,因此选择二者结合的方法.

3KPCA和LDA融合改进算法

3.1核主成分分析法(KPCA)

从选取的人脸库中任意选取一个样本集,选取其中的n个作为训练样本集,其余为测试样本集,将每个样本按从上到下,再从左到右的顺序排列成一个N维列向量,从而训练样本集的矩阵为X=[x1,x2,…,xn].φ:x→φ(x)∈F是对其实施的非线性映射,称φ为核映射,F为核空间,已知在特征空间中作子空间降维变换有[5-6]

Y=WTφ(x).

(3)

对φ(x)进行求解,对求得的特征值进行排列,然后选取d个最大的特征值λi及其对应的特征向量ui,根据公式(3)即可求出降维后的投影矩阵W=(γ1,γ2,…,γd).

3.2KPCA的改进算法

传统的KPCA算法虽然将人脸的非线性信息包括在了核矩阵中,但这样将原来就很高的样本维数,变得更高,因此,传统的KPCA算法有计算难度大、时间长等问题.为了能够解决上述问题,提出了改进的KPCA算法.它的具体操作就是用最佳均值向量代替原始样本向量,这样以来投影到核空间的样本维数也跟着降低了.具体描述如下[7-8].

从选取的人脸库中任意选取一个样本集,从样本集中选取m个人,每个人c张图片,总共n个样本作为训练样本集,将每个样本按从上到下,再从左到右的顺序排列成一个N维列向量,从而训练样本集的矩阵为X=[x1,x2,...,xn].

(1)假设第i类的样本向量为

(4)

(5)

(6)

(7)

选择合适的均值向量系数对样本均值向量进行估计,使映射到核空间的维数降低,这相当于进行了一次降维,减小了计算量,设均值估计系数矩阵为u(c×c).

用公式(7)乘以均值向量系数求得最佳均值向量,则

(8)

(9)

为了求得最佳均值估计系数,笔者首先构造一个αi函数,其中ui为函数αi的自变量.

3.3线性鉴别分析法(LDA)

传统的LDA方法定义类内离散度矩阵SW和类间离散度矩阵SB如下[9-10]:

(10)

(11)

(12)

式中:W满足SBW=λSWW.

3.4改进的LDA算法

众所周知,传统LDA有两个突出缺点:一是处理高维图像时容易产生“小样本问题”,二是由此引发的边缘数据分类的问题.为了解决这两个问题,笔者对传统算法做如下两点改进.

(a)对SB作如下变化

为了更好地区分样本类内、类间的关系,使难以区分的样本区分开,相同的样本紧密联系在一起,笔者在求取类间散度矩阵时,进行了一定的加权值处理,使得类间信息区分更加明显,同时类内信息更加紧凑.

(14)

dij=(μi-μj)T(μi-μj),

(15)

(16)

由准则可知最具有辨别力的特征就是SB的非零空间和SW的零空间的交集空间.

(1)提取SW的零空间U

UTSWU=0,(UTU=I).

(17)

(18)

(19)

3.5KPCA和LDA的融合改进方法

4实验及结果分析

以上算法用ORL人脸库在MATLAB 2010a上进行仿真实现.首先对人脸图像进行预处理,这个过程就是用一个白化滤波器分离低频和高频信息,给人脸图像进行优化能量谱,然后用一个低通滤波来滤除用白化处理分离开的高频部分的噪声.预处理之后,对人脸图像运用DT-CWT与0°和90°Gabor小波进行特征提取共同构成人脸图

像的特征向量,预处理前后的图像如图1.

图1 ORL人脸库部分原图像和预处理后的图像

4.1样本个数对各算法识别率和耗时的影响

本次实验采用的ORL人脸库,共40个人,每人10幅图像,从每类样本中任意选取x=2,3,4,5,6张图片作为训练样本,其余的作为测试样本,特征维数为40,具体实验结果如表1所示.

根据表1可知,这几种算法随着训练样本数的增加,识别率都随之提高,同时运算时间也显著增加.随着训练样本数的增加,PCA、LDA和改进LDA(GLDA)的训练时间明显高于改进KPCA(GKPCA)和改进KPCA+LDA(GKL);GKPCA和GKL在处理小样本时,与KPCA相比并无很大优势,但是随着样本数量逐渐增加,训练时间明显减少,识别率也有所提高;相同样本数的情况下GKPCA+LDA仅比KPCA多耗一点时间,但识别率也得到提高,这是值得的.

表1 不同算法的人脸识别速度和识别率

4.2样本维数对各算法识别率的影响

本实验选取ORL人脸库的前5幅人脸图像作为训练集,其它图像作为测试集,在特征维数分别为20~60时通过以下6种方法进行对比实验,实验结果如表2.

通过实验可以看出,各个算法随着特征维数的变化,识别率也随之改变,特征维数在40左右时,识别率达到最佳.实验说明了特征维数过小或过大都影响识别率,过小不能包含图像的全部信息,过大影响识别速度和包含过多的冗余信息.

4.3特征向量数对各算法识别率的影响

本实验选取ORL人脸库的前5幅人脸图像作为训练集,其它图像作为测试集,特征维数为40,通过以下6种方法进行对比实验,实验结果如表3.

根据表3可知,随着特征向量数的增加,各个算法的总体趋势是一致的,识别率都在提高.当特征向量数趋于90左右时,识别率趋于稳定.这说明特征向量数为90时基本上达到最佳,随着特征向量数的增加,测试的时间也会越来越长,并且变化很大。几种算法的对比比较,充分体现了笔者提出的人脸识别算法的优势.

5结论

对人脸图像进行白化和低通滤波预处理后,运用DT-CWT与Gabor小波进行8个方向的特征提取;然后利用改进KPCA的最佳样本均值估计向量代替原始的样本向量和对LDA的类间散度矩阵和类内散度矩阵进行改进,降低样本维数

的同时还保留了最具有辨别力的信息,进而提高了算法的识别率.

表2 不同算法的识别率随维数的变化情况

表3 样本向量数对各算法识别率的影响

参考文献:

[1]CHELLAPPA R,WILSON C L,Sirohey human S machine recognition of faces:a survey[J].Proceedings of IEEE,1995,83(5) :705-741.

[2]LIAO Ling-zhi,LUO Si-wei,TIAN Mei. Whitened faces recognition with PCA and ICA [J] . IEEE Signal Processing Letters,2007,14(12):1008-1011.

[3]SELESNICK IW, BARANIUK R G, KINGSBURY N C. The dual-tree complex wavelet and 2-D Gabor transform [J] . IEEE Signal Processing Magazine,2000, 22(6) :123-151.

[4]LIU C, WECHSLER H. Independent component analysis of Gabor features for face recognition [J] . IEEE Transactions on Neural Net-works,2003, 14(4) :919-928.

[5]SEBASTIAN M, GUNNAR R, JASON W, et al. Fisher discriminant analysis with kernels [A]. Proceeding of the IEEE Workshop on Networks for Signal Processing[C]. Pis-cataway, 1999:41-48.

[6]邓貌,陈旭,陈天翔,等.采用核聚类分析的KPCA改进算法[J].智能系统学报,2010,5(3) :221 -226.

[7]韩争胜,李映,张艳宁.基于LDA算法的人脸识别算法的研究[J].微电子学与计算机,2005,22(7):131-138.

[8]王永茂,徐正光,吴金霞. 基于类别多核局部判别嵌入的人脸识别[J] . 郑州大学学报:工学版,2012,33(3):125-128.

[9]SHERMINA J. Illumination invariant face recognition using discrete cosine transform and principal component analysis[C]// Proceedings IEEE Conference on Electrical and Computer Technology. Tamil Nadu: Institute of Electrical and Electronics Engineers Computer Society,2011:826-830.

[10]谢永林.LDA算法及其在人脸识别中的应用[J].计算机工程与应用,2010,46(19):189-192.

Study of Face Recognition Algorithm Based on Improved KPCA and LDA

ZHANG Zhen1, ZHANG Xue-zhong2, LI Long3

(School of Electrical Engineering, Zhengzhou University, Zhengzhou 450001, China)

Key words: whitening; low pass filter; preprocessing; KPCA; LDA

猜你喜欢

白化预处理
运用红外相机技术首次记录白化小麂
白化黄喉拟水龟人工培育研究①
基于Surfer的瞬变电磁法扇形超前探测白化文件的精确快速生成方法
最严重白化
基于预处理MUSIC算法的分布式阵列DOA估计
浅谈PLC在预处理生产线自动化改造中的应用
白化茶种质资源分类研究
络合萃取法预处理H酸废水
PMU数据预处理及压缩算法
基于自适应预处理的改进CPF-GMRES算法