APP下载

基于环形对称Gabor变换和2DPCA 的人脸识别算法

2015-04-17王汇源

计算机工程与应用 2015年16期
关键词:训练样本识别率人脸识别

王 娜,王汇源

WANG Na,WANG Huiyuan

山东大学 信息科学与工程学院,济南250100

School of Information Science and Engineering,Shandong University,Jinan 250100,China

1 引言

Gabor小波以其优良特性被广泛应用于图像处理与分析及人脸识别领域。Gabor 小波不但具有空间局部性和空间频率性等许多优点,也是对高级脊椎动物视觉皮层中的神经元的良好逼近,因此用Gabor 小波变换系数作为人脸识别的特征具有良好的生物学背景和视觉特性[1]。

文献[2-4]中采用Gabor 变换(GaborTransform,GT)特征进行人脸识别,实验结果表明GT特征提高了算法对于光照、姿态和表情等变化的鲁棒性。随后基于Gabor特征的人脸识别研究成为了该领域的研究热点。文献[5]中的GT+LBP(Local Binary Pattern)算法,采用LBP算子对GT 后的特征进行编码,然后对编码后的图像提取分块直方图进行降维和识别。文献[6]中的GT+ICA(Independent Component Analysis)算法,采用ICA 方法对GT 后的特征进行降维,并用最近邻分类器进行分类。文献[7]中采用的方法则是将Gabor 特征分块构成子模式,用最小分类器对子模式分类,最后在决策级进行融合得出分类结果。尽管这些方法都取得了不错的识别效果,但都存在如下不足之处:传统的Gabor 小波变换从5 个尺度和8 个方向提取图像局部信息,将一个像素映射为40 个变换系数,一幅图像也就映射为40 幅图像,数据极度冗余,计算量大,由于方向选取是离散的,因而不具有旋转不变性,当图像在平面内发生旋转时,识别率就会降低。为了解决GT 这两方面的问题,本文采用环形对称Gabor 变换(Circularly Symmetrical Gabor Transform,CSGT)[8]。CSGT 是GT 的一种形变,对各方向具有相同的滤波作用,只需在尺度上进行变换就能描绘出丰富的人脸特征,将一个像素映射为对应于5 个尺度的5 个变换系数。CSGT 与GT 相比,具有旋转不变性,所需要的参数和计算量少,数据冗余度低。CSGT 最初仅被应用于纹理分割中,在人脸识别中的应用还不广泛,文献[9]首次将CSGT 引入人脸识别领域,文献[10-11]对CSGT 在人脸识别中的应用作了进一步的论述。

现在主流的特征提取方法有PCA(Principal Component Analysis)[12]、LDA(Linear Discriminant Analysis)和2DPCA(Two-Dimensional Principal Component Analysis)[13]。采用PCA 和LDA 降维时要事先将二维矩阵转换成一维向量,由于该向量维数一般较高,通常高达上万维,因此使得后续的计算变得复杂。2DPCA 相当于一种直接的投影技术,直接用二维图像对应的数据矩阵构建协方差矩阵,不需要预先将二维的数据矩阵转化成高维的一维向量,相比与PCA,2DPCA 具有以下三个优点[13]:(1)协方差矩阵的计算直接简单,维数低;(2)易于求取协方差矩阵的特征向量,计算耗时比较少。(3)2DPCA 方法取得了更好的识别效果。鉴于2DPCA算法性能的优越性,2DPCA被广泛应用于人脸识别中[14-16],正因为如此,本文利用2DPCA来进行变换域特征的提取。

在本文算法中,先对每一幅人脸图像进行CSGT,并按照本文提出的两种融合方案进行多尺度特征融合,构造该图像的特征图像,最后用2DPCA 进行特征提取和分类。

2 环形对称Gabor变换

传统Gabor滤波器的定义为:

修改式中与方向有关的参数k,就可得到环形对称Gabor 滤波器的表达式,式中最后一项用来抵消函数中的直流成份,去不去掉这一项函数都是环形对称的,表达式如公式(2)(3)所示:

式中,r=(x,y) 为空间域坐标向量,,i =0,1,…;,k为频率即尺度参数,σ/k决定高斯窗口宽度的大小,σ决定窗口宽度与波长的比例关系,Δω为滤波器的倍频程带宽。

随着i的增大,频率不断减小,尺度逐渐变大。本文算法中采用表达式(3)。图1 显示了环形对称Gabor基函数在5 个尺度上的实部、虚部和幅度信息。

图1 5 个尺度上的CSGT 基函数的实部、虚部和幅度

2.1 CSGT 特性

CSGT 与GT 相比,具有以下两条重要性质[9]:

(1)降低了数据冗余量。传统的GT 采用8 个方向和5 个尺度上的变换,将1 个像素映射为40 个变换系数,而CSGT 由于去除了方向信息,变换系数只有5 个,降低了数据量。

(2)严格的旋转不变性。传统的Gabor 变换具有方向选择性而且是离散的,每个尺度下都选取8 个方向,得到的特征刻画的是这8 个方向下的滤波效果,不具有旋转不变性。CSGT 在同一尺度下的滤波方向为360°,人脸图像经过CSGT 之后,仍能保持人脸在各个方向下的特征,具有旋转不变性。

2.2 CSGT 特征表示

图2 显示了一幅来自ORL 人脸数据库的图像与5个尺度上的CSGT 滤波器卷积后所得的实部、虚部和幅度图像。

图2 一幅图像经CSGT 后所得的实部、虚部和幅度图像

从图2 可以看出,经过CSGT 后,人脸图像的局部特征包括嘴巴、眼睛、鼻子等得到了突出表现,并且对尺度和表情变化具有一定的鲁棒性。

因为经CSGT 后的幅度图像包含了实部和虚部的信息,所以本文采用幅度图像作为人脸识别的特征图像。在对5 个尺度上的特征进行融合时本文提出2 种融合方法。

(1)融合方案1

将对应于5 个尺度的五幅图像按尺度顺序上下连接为一幅图像,作为该人脸图像的特征图像,图3 显示了按方案1 融合得到的1 幅人脸图像的特征图像。

图3 按方案1 融合后得到的特征图像

(2)融合方案2

文献[17]中用到了多尺度图像叠加的思想,受此启发,本文提出了方案2,即:在进行CSGT 时,一个像素被映射为对应于5 个尺度的5 个变换系数,将5 个变换系数取平均值,作为该像素点对应的变换系数。其本质就是对CSGT 后得到的对应5 个尺度的五幅图像求平均图像。按此规则融合后得到的特征图像与原图像大小一致,数据量减为传统GT 的四十分之一。图4 显示了按方案2 融合得到的1 幅人脸图像的特征图像。

图4 按方案2 融合后得到的特征图像

3 2DPCA 方法

2004 年,yang 等人在文献[13]中提出了二维主成分分析(2DPCA)方法。与传统PCA 方法相比,2DPCA 方法有更好的性能。在传统PCA 方法中,需将二维图像转化成一维图像向量,这样不但会丢失一些图像信息,而且得到的一维图像向量维数一般较高,从而使协方差矩阵的特征向量的计算变得复杂。2DPCA 方法不需要将二维图像矩阵转化成一维图像向量,直接用二维图像构造协方差矩阵,使得协方差矩阵的计算更加直观简单,计算出协方差矩阵的特征向量的时间也比较少。

假设有M个大小为m×n的训练样本Αj(j=1,2,…,M),投影矩阵为X,X∈Rn×d,将图像矩阵Αj向X做投影,得到投影后的矩阵Yj,大小为m×d。在2DPCA 中用投影后的矩阵Yj(j=1,2,…,M)的总离散度J(X)作为准则函数来衡量投影矩阵X的优劣:

式中SX为矩阵Y的协方差矩阵,tr(SX)是矩阵SX的迹,G为图像协方差矩阵,它的计算公式为:

M表示M个m×n的训练样本,Αj(j=1,2,…,M)表示第j个训练样本的数据矩阵,为M个数据矩阵的均值。

由此可知使得J(X)最大的X中的每列向量是图像协方差矩阵G的前d个最大特征值对应的特征向量,即:

{X1,X2,…,Xd}=arg maxJ(X)

4 算法流程

下面对基于CSGT 和2DPCA 的人脸识别算法的算法流程进行描述。

步骤1将人脸库中的所有人脸进行CSGT,并按本文提出的方案1 或方案2 进行多尺度特征融合,构造特征图像。

步骤2将特征图像分为训练样本和测试样本两部分。

步骤3把训练样本集合记为,i表示第i个人,j表示第i个人的第j幅图像,N表示人的个数,K表示每个人包含K幅图像。M表示训练样本总数。计算所有训练样本的平均图像和协方差矩阵G:

对样本协方差进行特征值分解:GXi=λi Xi,选择前的d个最大特征值对应的特征向量X1,X2,…,Xd,令投影矩阵X=[X1,X2,…,Xd]。

步骤4将训练样本向投影矩阵做投影得:为训练样本的特征矩阵。

步骤5将测试样本集中的样本C向投影矩阵X做投影,得到测试样本C的特征矩阵,D=[D(1),D(2),…,D(d)]。

步骤6采用最近邻分类器进行分类。计算测试样本投影特征矩阵与所有训练样本投影特征矩阵之间的欧式距离:

5 仿真实验

为了验证本文提出的基于CSGT多尺度特征融合和2DPCA的人脸识别算法的有效性,本文用ORL人脸数据库中的人脸对该算法进行测试。使用MATLABR2010a,在Pentium®Dual-Core CPU,主频2.00 GHz,内存1.00 GHz的电脑上运行。为了易于标记,将融合方案1 和融合方案2 对应的算法分别记为 CSGT1+2DPCA、CSGT2+2DPCA。

ORL 人脸数据库包含400 幅图像,对应40 个人,每人10 幅图像,图像大小为112×92。10 幅图像各有不同,包括细节部分不同(如戴眼镜与不戴眼镜),面部表情的不同,人脸姿态的不同,发型的不同等。

首先将本文所提出的算法与PCA、2DPCA、GT+2DPCA算法在识别率上进行比较。在GT+2DPCA 方法中,每幅人脸图像经GT 后得到40 幅该人脸的幅度图像,将40幅图像都转化为一维列向量,然后组成该人脸的大小为10 304×40 的特征矩阵,最后用2DPCA 方法进行降维和分类。实验分为两组,第一组对每个人的前5 幅图像训练,对后5 幅图像进行测试。第二组实验,对每个人的后5 幅图像进行训练,对前5 幅图像进行测试。这样训练样本与测试样本数都为200,实验中特征个数都取30。

由表1 可知本文提出的两种CSGT+2DPCA 方法相比于PCA、2DPCA、GT+2DPCA 算法取得了更好的识别效果。与GT+2DPCA 相比识别率提高,说明了本文提出的两种数据冗余度小、具有旋转不变性的基于CSGT多尺度特征融合后的特征比传统GT 特征能更好的表征人脸。特别是按融合方案二融合后的特征与原图像有一致的大小,识别时与2DPCA 有相同的计算量,却取得了明显优于2DPCA 的识别率。

表1 5 种方法识别率对比结果 %

下面将本文所提出的算法与PCA、2DPCA、GT+2DPCA 算法在算法执行时间上进行比较。这里算法执行时间是指对已构造好的特征图像或原图像进行训练和识别所用时间。表2 给出对200 幅图像进行训练,剩余200 幅图像进行测试,特征数都取30 时,5 种方法的对比结果。由于计算机性能不同和处理图像的不同,允许算法执行时间有小范围的波动。

表2 算法耗时对比结果

由表2 可知本文提出的两种CSGT+2DPCA 算法与GT+2DPCA 算法相比显著地降低了训练和识别所用时间。耗时降低的原因是将GT 后对应的5 个尺度、8 个方向上的幅度图像融合后,特征矩阵大小为10 304×40,而CSGT 只采用5 个尺度上的变换,按方案1 融合后的特征图像大小为560×92,数据量为GT 的八分之一。按方案2 融合后的特征图像大小与原图像一致,为112×92,数据量为GT 的四十分之一。与2DPCA 算法相比,本文算法2 在算法耗时相同的情况下,提高了识别率。

表3给出了传统GT+2DPCA、CSGT1+2DPCA、CSGT2+2DPCA 三种方法取不同训练样本数时对应的识别率。由前面的实验结果可知PCA、2DPCA 算法识别率明显低于本文提出的算法,因此这里不再与这两种算法作对比。实验中选择的训练样本数为2 到9 个,共8 组实验,每次都对所选样本进行训练,对剩余样本进行测试。每组实验进行30 次,每次都随机选取训练样本,对结果求平均值作为本组实验的实验结果。由实验结果可知,在降低了计算复杂度、提高了识别速度的基础上本文所提出的算法仍取得了优于GT+2DPCA 算法的识别效果。当训练样本数为9 时,本文提出的两种算法识别率可以分别达到98.82%和98.88%。

表3 不同训练样本数对应的识别结果 %

表4 给出了本文算法与文献[9-11]中提出的不同算法的最高识别率对比结果,数据直接引用自各相关文献。由表4 可知,本文提出的两种算法都取得了优于其他5 种算法的识别效果,进一步证明了本文算法的有效性。

表4 不同方法最高识别率对比结果

由以上实验结果可知,本文算法有以下两个优点:

(1)提高了识别率。识别率提高是因为CSGT 能从不同尺度上提取图像的局部信息,并且在同一尺度上对各方向都有相同的滤波作用,具有旋转不变性,对人脸在平面内发生的旋转更具鲁棒性。

(2)降低了算法执行时间。训练和识别速度都有所提高,是因为CSGT 只在5 个尺度上进行变换,按方案1和方案2 融合后的特征图像的数据量分别降低为GT 的八分之一和四十分之一,大幅降低了计算量。

6 结束语

本文提出了一种基于CSGT 与2DPCA 的人脸识别新算法,先对图像进行CSGT,然后按照本文提出的两种多尺度特征融合方案在变换域构造特征图像,再用计算复杂度小的2DPCA 提取分类特征。本文提出的多尺度融合特征克服了传统GT 数据冗余度大的缺点,与GT+2DPCA 算法相比,本文算法不但取得了更好的识别效果,而且大幅降低了计算量,提高了识别速度。将该算法与传统的PCA、2DPCA 算法也做了对比,实验结果也证明了该方法的可行性。

[1] Lee T S.Image representation using 2D gabor wavelet[J].IEEE Trans on PAMI,1996,18(10):959-971.

[2] Lades M,Vorbruggen J C,Buhmann J,et al.Distortion invariant object recognition in the dynamic link architecture[J].IEEE Trans on Computers,1993,42(3):300-311.

[3] Wiskott L,Fellous J M,Kuiger N,et al.Face recognition by elastic bunch graph matching[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1997,19(7):775-779.

[4] Zhang Z,Lyons M,Schuster M,et al.Comparison between geometry-based and Gabor-wavelets-based facial expression recognition using multi-layer perceptron[C]//Third IEEE International Conference Face and Gesture Recognition,1998:454-459.

[5] 孙海鹏,毕笃彦.基于局部二元模式Gabor小波变换的人脸识别[J].计算机应用与软件,2011,28(5):247-249.

[6] 吴延海,梁文莉.基于Gabor 小波变换的ICA 人脸识别算法研究[J].微电子学与计算机,2013,30(7):141-144.

[7] 王科俊,邹国锋.基于子模式的Gabor特征融合的单样本人脸识别[J].模式识别与人工智能,2013,26(1):50-54.

[8] Zhu Zhenfeng,Tang Ming,Lu Hanqing.A new robust circular Gabor based object matching by using weighted Hausdorff distance[J].Pattern Recognition Letters,2004,25(4):515-523.

[9] 王汇源.基于线性子空间及环形对称GABOR 变换的人脸识别算法研究[D].济南:山东大学信息科学与工程学院,2007.

[10] 王进军,王汇源,吴小娟.基于环形对称Gabor变换和PCA加权的人脸识别算法[J].模式识别与人工智能,2009,22(4):635-638.

[11] 王文,王汇源,张沛.基于环形对称Gabor变换和AdaBoost算法的人脸识别[J].计算机应用与软件,2012,29(7):6-9.

[12] 王志良,陈锋军,薛为民.人脸表情识别方法综述[J].计算机应用与软件,2003,20(12):63-66.

[13] Yang J,Zhang D,Frangi A F,et al.Two-dimensional PCA:A new approach to appearance based face representation and recognition[J].IEEE Trans on Patten Analysis and Machine Intelligence,2004,26(1):131-137.

[14] 马晓燕,杨国胜,范秋凤,等.基于Gabor小波和二维主元分析的人脸识别[J].计算机工程与应用,2006,42(7):55-57.

[15] 陈伏兵,陈秀宏,张生亮,等.基于模块2DPCA 的人脸识别方法[J].中国图像图形学报,2006,11(4):580-585.

[16] 赵冬娟,梁久帧.融合2DPCA和模糊2DLDA的人脸识别[J].计算机应用,2011,31(2):420-422.

[17] 卢建云.基于Gabor 小波与CS-LBP 的人脸特征提取算法研究[D].重庆:重庆大学计算机学院,2010.

猜你喜欢

训练样本识别率人脸识别
人脸识别 等
揭开人脸识别的神秘面纱
基于类图像处理与向量化的大数据脚本攻击智能检测
人工智能
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
高速公路机电日常维护中车牌识别率分析系统的应用