APP下载

基于Gabor的特征提取算法在人脸识别中的应用

2012-01-18欧阳文

电子设计工程 2012年24期
关键词:散度小波人脸

欧阳文,王 燕

(兰州理工大学 计算机与通信学院,甘肃 兰州 730050)

人脸识别由于其在公共安全、视频监控、身份鉴别、智能人机交互等方面的广阔应用前景以及对模式识别理论的发展具有重要的学术意义而备受关注,是模式识别的热门研究领域之一。在过去的几十年里,人脸识别技术取得了较大的发展,涌现出许多人脸识别方法,子空间方法成为当前人脸识别的主流方法之一,子空间方法中最为主要和流行的方法是主成分分析(Principal Component Analysis,PCA)[1-2]和线性判别分析(Linear Discriminant Analysis,LDA)[3]。

特征提取是人脸识别技术中一个基本而又十分重要的环节,在整个人脸识别过程中,特征提取扮演着尤为重要的角色,如何提取出稳定、有效的特征,并用最少的特征来表示尽可能多的人脸信息是人脸识别成败的关键。

Gabor展开是一种同时用时间和频率表示一个时间函数的方法,而求解Gabor展开系数的公式被称为Gabor变换。传统的Gabor变换的缺点是窗口尺寸一经确定就无法更改,因此不具有变焦特性,无法对信号进行多分辨率分析。为解决这一问题人们将Gabor理论同小波理论相结合,提出了Gabor小波[4]。Gabor小波具有小波变换的多分辨率特性,同时具有Gabor函数本身所具有的局域性和方向性。目前Gabor变换和Gabor展开已被公认是信号与图像表示的最好的方法之一。Gabor变换中要解决的最基本问题是:在给定综合窗下如何求解分析窗及Gabor变换系数。

Turk[1-2]于1991年提出了著名的特征脸方法(Eigenface),将主成分分析(PCA)应用于人脸识别,通过提取人脸图像的主成分进行识别。Eigenface是基于重建准则的,即重建误差最小,它无法揭示数据的局部结构。当人脸的光照、表情产生比较大的变化时,其识别率一般不是十分理想。Fisherface[5]属于有监督识别方法,利用线性判别分析(LDA)寻找使类间距和类内距比值最大化的投影方向,获得了较好的识别效果。然而,当样本数目小于样本维数时,Fisherface会出现小样本问题。所以一般先采用PCA方法进行降维,然后再用LDA提取特征进行识别,这样既解决了小样本问题,又可以得到更具判别性的特征。

因此,文中充分利用Gabor小波变换具有良好的提取和区分能力的空间特性,首先进行人脸特征的提取,然后在此基础上利用PCA进行初次降维,最后利用LDA所具有的判别性优势来得到最终的人脸特征。

1 Gabor特征提取

Gabor小波变换是利用小波核函数能够模拟大脑皮层反射区的特性,使良好的空间特性对各类特种具有良好的提取和区分能力,在许多领域尤其是图像分析及识别领域的应用非常广泛。

二维Gabor小波的函数表示为:

其中δ为高斯窗口的尺度因子,用来调节该滤波器的尺度与带宽;方向与频率由φu与ωv控制。只要设置好δ、φu和ωv,就可以利用 Gabor滤波器组对图像 I(x,y)进行进一步处理,这个过程也是一个卷积的过程:

该式通过对人脸图像的Gabor小波分解,从而得到所需要的特征。

图1表示了在频域半平面上,6个相隔30度的方向上不同频率的Gabor小波滤波器:

图1 不同方向及频率的Gabor小波族Fig.1 Gabor wavelet family of different directions and frequencies

2 线性判别分析

LDA(Linear Discriminant Analysis)算法其最主要的功能就是提取出高维特征空间中最具分辨能力的低维特征向量,使得属于同类的样本尽量靠近,而不同类的样本尽量分散,使得类间散度与类内散度的比值最大化。

设人脸图像训练样本集为X,首先将训练集中二维图像转换为一维向量,转换后记为D×1维,将属于一类的人脸图像进行相应的图像归类记为Xi,样本总数为n,总共分为l类,其中每类样本数为 ni,i=1,2,3,…,l。

专利权利要求中的错误初探:错误的形式、改正的途径........................................................................孟 睿 徐棣枫 11.66

定义类间散度矩阵为:

类内散度矩阵为:

wi(i=1,2…d)为特征方程 SbWi=λSwWi最大的 d 个特征值 λi(λ1≥λ2≥…≥λd)相对应的特征向量。 则 Wopt=[w1,w2,…,wd]正是所求的最佳投影矩阵。通过将特征向量进行该空间的投影降维,即可得到该算法下的分类特征,即:

3 基于Gabor的PCA+LDA算法

在文中通过设定 4 个不同尺度 v(0,1,2,3)、8 个不同方向u(1,2,3,4,5,6,7)组成 32 个 Gabor特征组进行进一步的处理。通过Gabor滤波,一幅人脸图片的维数为原来图片维数的32倍,复杂性相对较高。同时考虑到复杂度,将预处理后的图像尺寸设为112×92,若用4个尺度,8个方向的Gabor滤波器组G(4,8)进行全局特征提取,则特征矢量维数高达112×92×32=329 728,这个计算量是相当大的。在此,算法首先进行全局均匀采样,间隔为8,然后将得到的5 152维特征矢量作为进一步处理的基础矢量。

整体算法描述如下:

1)Gabor小波变换进行特征提取:采用Gabor小波变换来对经过预处理的人脸图像进行处理,提取出人脸特征,然后进行全局均匀采样,得到5 152维的特征矢量。

2)PCA处理:对训练样本集进行(1)中处理,得到矩阵A,并对A进行PCA降维得到PCA的投影子空间Wpca。

3)计算类间散度矩阵和类内散度矩阵分别为:

Sb=为投影到Wpca后的样本,mi为投影到Wpca后的样本均值,m为投影到Wpca后的总样本均值。

4)依据LDA算法求解过程,以及(3)中得到的类间散度矩阵和类内散度矩阵,来求解最佳的LDA分类子空间得WLDA。

4 实验过程及分析

4.1 实验过程

文中主要在ORL人脸库和YALE人脸库上进行实验验证,并将本文提出的Gabor+PCA+LDA算法与PCA和LDA算法用于人脸识别时的识别结果进行比较。同时,为了实现横向比较,最后的分类器统一采用最近邻分类器来实现分类。

实验一:ORL人脸库实验。ORL人脸库是由英国剑桥大学建立,包括40个人,每个人10张112×92的在不同时间采集的正面人脸图像组成。其中包括不同视角、不同表情(高兴、微笑、生气、吃惊、闭眼、睁眼等)和不同面部细节(戴或不戴眼镜、有或无胡须、不同发型),人脸姿态有变化和旋转不超过20°。图2所示的是来自ORL人脸库的某一人的10张图像。

图2 ORL人脸库图像示例Fig.2 The sample images of ORL face database

对于ORL人脸库的实验验证,随机地从每个人的图片中选择 l(l=3,4,…,7)张图片作为训练样本,余下的 10-l张图片来作测试样本。具体的实验结果如表1所示。

表1 ORL人脸库上的识别结果比较Tab.1 Recognition results on ORL face database

实验二:YALE人脸库实验。YALE人脸库由15个人,每个人有11张共165张图像组成。这些图像在光照条件变化比较大,而且面部表情(正常、惊讶、伤心、开心和眨眼等)和细节 (戴或不戴眼镜、有或无胡须)也有比较明显的变化。YALE人脸库中的某一个人的11张图像如图3所示。

图3 YALE人脸库图像示例Fig.3 The sample images of YALE face database

在YALE人脸库库实验中,也是随机地从每个人的图像中选取 l(l=3,4,…,7)张图片作为训练样本 ,而 余下11-l张作测试样本。表2为具体的在YALE人脸库上的实验结果。

表2 YALE人脸库上的识别结果比较Tab.2 Recognition results on YALE face database

4.2 实验分析

从表1和表2中的实验数据中可以看出,本文提出的基于Gabor+PCA+LDA的算法在ORL人脸库和YALE人脸库上均取得了最高识别率,且识别效果均要比传统的PCA算法和LDA算法要好;当样本数取7时,PCA、LDA以及本文算法的识别率都达到最高。同时,由于YALE人脸库中的图像在光照条件变化比较大,且表情和细节变化也比较大,所以,在YALE人脸库上的识别率要整体的低于ORL人脸库中的识别率。

5 结束语

本文主要针对人脸识别中的特征提取问题,提出了一种新的基于Gabor小波变换的算法,并通过实验验证了本文算法的有效性。虽然本文算法比传统的PCA和LDA算法具有较大的优势,但离人脸识别在实际中的应用要求还比较远。在接下来的工作中,将主要通过对分类器的优化选择及改进来进一步的提高识别率[6-7]。

[1]Turk M,Pentland A.Eigenfaces forrecognition[J].Journal of Cognitive Neuroscience,1991:71-86.

[2]TURK M,PENTLAND A.Face recognition using eigenfaces[C]//Proceeding of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Washington D C:IEEE Computer Society Press,1991:586-59l.

[3]Belhumeur P,Hespanha J,Kriegman D.Eigenfaces VS.Fisherfaces:Recognition using classspecific linear projection[C]//IEEE Transactions onPattern Analysis and Machine Intelligence,1997,19(7):711-720.

[4]叶敬福,詹永照.基于Gabor小波变换的人脸表情特征提取[J].计算机工程,2005,31(15):172-174.YE Jin-fu,ZHAN Yong-zhao.The face expression feature extraction based gabor wavelet transform [J].Computer Engineering,2005,31(15):172-174.

[5]卢桂馥,林忠,金忠.基于最大差值的二维边界Fisher的人脸识别[J].计算机科学,2010,37(5):775-779.LU Gui-fu,LIN Zhong,JIN Zhong.The face recognition algorithmbased ontwodimensionalboundaryfisherofmaximum difference[J].Computer Science,2010,37(5):775-779.

[6]YANG Han-xuan,SHAO Ling,ZHENG Feng,et al.Recent advances and trends in visual tracking:A review[J].Neurocomputing,2011,74(18):3823-3831.

[7]Scherer S,Kane J,Gobl C,et al.Investigating fuzzy-input fuzzy-output support vector machines for robust voice quality classification[J].Computer Speech&Language,2012.

猜你喜欢

散度小波人脸
带势加权散度形式的Grushin型退化椭圆算子的Dirichlet特征值的上下界
有特点的人脸
构造Daubechies小波的一些注记
一起学画人脸
定常Navier-Stokes方程的三个梯度-散度稳定化Taylor-Hood有限元
基于MATLAB的小波降噪研究
具有部分BMO系数的非散度型抛物方程的Lorentz估计
三国漫——人脸解锁
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于f-散度的复杂系统涌现度量方法