自适应Gabor特征的协同表示人脸识别算法*
2018-03-26严旭东吴锡生
严旭东, 吴锡生
(江南大学 物联网工程学院,江苏 无锡 214122)
0 引 言
稀疏表示最早被提出时,应用在图像滤波、图像重构、图像压缩等。Wright J等人[1]提出了的基于稀疏表示的分类(sparse representation-based classification,SRC)方法从一个新颖的角度来解决分类问题。Yang M等人[2]提出了基于Gabor特征提取方法的SRC(Gabor-feature-based SRC,GSRC)人脸识别算法,将变换后的特征进行字典学习降低复杂度。Zhang L等人[3]讨论了SRC识别算法中致使识别准确性高的主要因素,证明了训练样本对于测试样本的协同表示分类(collaboration representation-based classification,CRC)起了关键作用[4]。
针对全局特征在人脸识别的问题中,对于表情、光照、姿态变化[5]等因素不敏感的情况,文献[6]提出了将人脸全局识别结果和分离部件识别结果融合的SRC方法。文献[7]将Gabor特征同一方向或者同一尺度的通道分为一组[8],每一组SRC的结果在决策级进行融合。使用局部特征的人脸识别算法对样本中因表情、光照、姿态等因素的变化,具有一定的抑制作用,但大部分文献并未对局部特征的鉴别性能做出分析,并且局部特征越多越影响识别算法的性能和效率。
本文提出了一种自适应Gabor特征协同表示人脸识别算法(Gabor adaptive weight CRC,GAW-CRC)。将不同的方向和尺度的Gabor特征区分,鉴于每个通道下的Gabor图像在不同的人脸数据库中分类识别的能力不同,提出了一种自适应的特征分量淘汰机制和自适应权重计算方法。同时将鉴别能力较强的特征分量的协同表示分类结果加权融合,得出最终的分类结果,提高了算法的识别率。
1 协同表示分类算法与Gabor特征提取
1.1 SRC和协同表示分类算法
假设有N类训练图像,记为A=[X1,X2,…,XN],每类训练图像的样本数为M,记为Xi=[xi,1,…,xi,j,…xi,M],i=1,2,…,N,j=1,2,…,M,可以用训练图像线性的表示测试图像,即y=Aα+ε。其中,α为稀疏表示系数,ε为一定允许范围内的噪声。L0范数的优化求解是一个NP问题,可用式(1)的L1优化[9]求解,该方法已被证明是最近似L0优化问题的解
(1)
按照式(2)计算每一类的表示误差
(2)
根据误差结果,将测试图像划分到误差最小的类,如式(3)所示
identity(x)=arg min{ri(x)}
(3)
式中identity(x)为测试样本图像的类别。
文献[3]将式(4)作为协同表示(collaborative representation,CR)的一般模型
(4)
同时将SRC视为CRC中的一个特例,并提出使用L2优化的CRC_RLS (collaboration representation based classification with regularized least square)方法,协同表示[10]分类采用L2范数取代L1,减少了计算时间。
1.2 多分量Gabor特征提取
二维Gabor小波[11]的核函数定义为
(5)
设I(z)=I(x,y)代表一幅灰度图像。将灰度图像I(z)卷积后得到该图像的Gabor小波表示,即
Gμ,v(z)=I(z)*ψμ,v(z)
(6)
在不同的尺度和不同的方向上,每一幅人脸图像共产生40个Gabor特征分量。
2 自适应Gabor特征的多分量协同表示算法
不同尺度和方向的Gabor特征鉴别能力存在差异[12],因此,在建模过程中对不同的Gabor特征需加以区分,对于鉴别能力较差的分量,予以淘汰,鉴别能力强的特征分量根据自适应的权重函数加权融合。本文将上述描述的方法称为自适应Gabor特征的多分量协同表示分类(GAW-CRC)算法。
2.1 自适应Gabor特征分量淘汰算法
通过实验发现,对于Gabor分量的特征集中那些类内区别较大,类间变化并不明显的特征分量,其分类结果并不好。因此,本文算法中,通过计算类内方差和类间方差的比值,较为明显地给出每个特征分量的鉴别能力,以淘汰鉴别能力明显较差的特征分量。具体方法如下:
1)计算每个Gabor特征分量的每一类的均值
2)计算每个Gabor特征分量每一类的方差
3)计算每个Gabor特征分量中所有样本类的类间方差均值
4)计算每个Gabor特征分量中所有样本的均值
5)计算每个Gabor特征分量中所有样本的方差
6)计算每个Gabor特征分量的样本类内方差和样本类间方差的比值
当比值比较小时,意味着该特征分量对于样本的鉴别能力较强。
本文自适应Gabor特征分量淘汰算法中,选择所有比值的中值Rc(m)或者平均值Rc(a)作为阈值分割,即Rc≥Rc(m)或者Rc≥Rc(a)即将其淘汰。将剩余的40-E个特征分量,构建特征字典用于分类识别,E为被淘汰的分量。
2.2 自适应权重计算
尽管剩余的40-E个特征分量鉴别能力较强,但并不能简单地将每个分量协同表示分类的结果直接投票表决。本文分析了剩余特征分量对于最终识别结果的贡献能力,提出了自适应的权重计算函数,将所有剩余Gabor变换特征分量各自构建新的训练样本集,共有40-E个训练集Ti,i=1,2,…,40-E,假定Xi=[xi1,xi2,…,xiN]表示第i个训练集Ti中的N个Gabor图像。对于第i个训练集中的每一幅Gabor图像xij,j=1,2,…,N,首先通过计算该向量与同一训练集中其他向量的欧氏距离找到它的k近邻[14,15]。令kij表示k近邻中与xij是同一类标签的样本数量。那么第i(i=1,2,…,40-E)个训练集的权重可通过式(7)得到
(7)
2.3 GAW-CRC具体步骤
输入:训练样本的向量矩阵A=[X1,X2,…,XN]∈RM×N和测试样本图像y。
1)分别提取训练样本A和测试样本y的Gabor特征的所有分量;
2)采用自适应Gabor特征分量淘汰算法,将类内方差和类间方差比值较大的分量淘汰;
3)采用本文的计算自适应权重的方法,计算剩余40-E个Gabor特征分量的权重值;
4)将剩余40-E个Gabor特征分量构造的字典,分别协同表示测试样本对应的分量,按照单位残差最小原则,将测试样本划分到单位残差最小的一类;
5)将每个Gabor分量的识别结果加权融合得出最终分类结果。
3 实验结果与分析
算法在AR,FERET和Extended Yale B人脸数据库上进行了大量的实验。3个人脸图像数据库中包含了不同的表情,不同光照环境,不同种族不同肤色的人脸,是公认度比较高的数据库。
将本文算法与SRC[1],GSRC[2],CRC[3]以及WMC-SRC[7]算法进行了比较。
3.1 FERET数据库识别实验
在FERET人脸库中,针对每一类人脸存在的不同角度的姿态,表情的变化和光照的变化,组成训练样本和测试样本。本文算法在小样本量情况下,针对测试样本有姿态角度变化、表情和光照变化的情况进行了实验。以每个训练集中的第一幅图像即正脸图像作为训练样本,测试样本由2幅小的姿态变化、2幅大的姿态变化、1张表情变化和1张光照变化组成,如图1。将本文提出的算法的识别率与同样的样本环境下SRC,CRC和GSRC以及WMC-SRC算法识别率对比,结果如表1所示。
图1 FERET数据库上的人脸图像
表1 FERET库上单个训练样本的识别率 %
为了使自适应的权重发挥作用,选择尽量多样本数量作为训练样本,剩余样本作为测试样本进行实验。实验结果如表2所示。
表2中可以发现:本文算法在训练样本存在小角度姿态变化时,对比SRC和CRC算法的识别率可以提升8 %~12 %。而相对于用Gabor特征作为特征分类识别的GSRC算法的识别率也可以提升6 %~8 %。对比将Gabor特征单个方向和单个尺度作为特征融合进行识别的WMC-SRC算法,本文算法的识别率也有较为明显的提高。
3.2 AR人脸数据库识别实验
AR人脸库中共包含120各不同人的26个不同表情和有遮挡的人脸。实验中,分别选择男女各50个人,作为实验对象。对每一类人脸,选择其中14张未遮挡,但包含表情变化和姿态变化的样本作为实验数据。选择每一类图像中的不同数量的图像作为训练图像,其余的人脸图像作为测试图像。取不同数量训练样本进行多次实验分析,将每次实验结果的平均值统计如表3所示。
由表3可知用于训练的图像比较少时,本文的算法对比其他算法识别率仅稍有提升。但当训练样本数目逐渐增多时,本文的算法识别率相较于其他算法识别率有较为明显的提高。说明本文算法的特征分量淘汰机制和自适应权重机制在训练样本数量充足时,对于最终的分类结果能够发挥重要作用。
图2为随机选择5,7,9幅不同数量的图像训练时,计算出40个Gabor特征分量类内方差和类间方差比值的柱状图。图中的40个条形为不同的Gabor分量的类内图像之间方差和类间方差的比值。条形较短的分量,其类内聚合度高且类间距离大,表示该分量鉴别能力强,而条形较长的分量则类内聚合度低且类间距离小,表示该分量鉴别能力弱。应用本文提出的自适应特征分量淘汰机制,仅使用条形较短的特征分量作分类识别会得到较高的识别率。
图2 AR库上选取不同像数量时特征分量的鉴别能力
图3为不同维度对应的识别率与SRC算法、CRC算法、GSRC算法以及WMC-SRC算法的识别率进行对比的。当样本选取的特征维度较低时相对于另外的4种算法,本文算法具有更加明显的优势。
图3 AR库上不同特征维度的算法识别率
3.3 Extended Yale B人脸数据库识别实验
Extended Yale B人脸数据库中每一类样本数据中含有9种不同姿态和64种不同光照条件的人脸图像。实验随机取每个人脸的8,16,24,32幅图像作为训练图像,剩余的图像作为测试图像。Gabor特征分量的淘汰机制选择中值淘汰法。实验结果如图4。
图4 Extended Yale B库上训练不同样本个数识别率比较
可以发现,本文算法在样本个数变化的情况下,自适应Gabor特征协同表示人脸识别算法得到的识别率结果高于其他算法。表明当存在表情变化以及光照条件变化情况下,GAW-CRC算法识别率相对于其他算法亦有所提高。
表4为本文的算法和其他算法运行时间的比较。由于本文算法需要计算淘汰后剩余的40-E个特征分量的识别结果,因此,其识别时间相对于单一特征的SRC算法、CRC算法和GSRC算法要长,但对较WMC-SRC算法针对全部Gabor特征分量的处理稍快。另外将自适应的Gabor特征分量淘汰机制和自适应权重算法结合SRC算法进行实验,对比算法运行时间,本文算法在运行速度上具有极大的优势。
表4 Extended Yale B库上各算法运行时间比较 s
4 结 论
基于CR的人脸识别算法,在构造特征字典时,选择Gabor变换的多个分量中最具鉴别力的分量进行特征重组,并将各个特征分量的字典协同地表示测试样本。将每个分量分别用于分类识别的特征,按照本文提出的自适应的权重计算方法,分别给每个分量赋予不同的权重,将各分量的识别结果进行加权融合得出最终的识别结果。
本文提出的自适应GAW-CRC算法与传统稀疏表示人脸识别算法相比,CR分类方法具有更强的理论依据,在同类处理方式下,极大地降低了计算的复杂度。自适应的Gabor多分量的特征提取,解决了Gabor变换特征组合使用对于分类识别准确性不足的缺点,淘汰了鉴别力较差的分量,并且将剩余鉴别力较好的分量按照贡献度的不同加权融合,实验证明本文算法在AR,FERET,Extended Yale B人脸库上均能有效地提高人脸识别的准确率。
[1] Wright J,Yang A,and Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210-227.
[2] Yang M,Zhang L.Gabor feature based sparse representation for face recognition with Gabor occlusion dictionary[C]∥European Conference on Computer Vision,ECCV 2010,2010:448-461.
[3] Zhang L,Yang M,Feng X C,et al.Collaborative representation based classification for face recognition[DB].Computer Science:Computer Vision and Pattern Recognition.arXiv:1204.2358V2[CS.CV],2012.
[4] Zhang L,Yang M,Feng X.Sparse representation or collaborative representation:Which helps face recognition[C]∥2011 IEEE International Conference on Computer Vision(ICCV),IEEE,2011:471-478.
[5] 田 娟,郑郁正.模板匹配技术在图像识别中的应用[J].传感器与微系统,2008,27(1):112-114.
[6] 胡正平,宋淑芬.基于全局和分离部件融合的双L1稀疏表示人脸图像识别算法[J].模式识别与人工智能,2012, 25(2):78-83.
[7] 杨清山,郭成安,金明录.基于Gabor多通道加权优化与稀疏表征的人脸识别方法[J].电子与信息学报,2011,33(7):1618-1624.
[8] 孙君顶,刘晓惠,陈鹏鹏.基于改进局部方向模式的人脸识别[J].传感器与微系统,2016,35(6):52-55.
[9] Yang A Y,Zhou Z,Balasubramanian A G,et al.Fast-minimization algorithms for robust face recognition[J].IEEE Transactions on Image Processing,2013,22(8):3234-3246.
[10] Wang L,Li Y,Wang C,et al.2D Gabor face representation method for face recognition with ensemble and multichannel model[J].Image and Vision Computing,2008,26(6):820-828.
[11] Yang M,Van Gool L,Zhang L.Sparse variation dictionary learning for face recognition with a single training sample per person[C]∥Proceedings of the IEEE International Conference on Computer Vision,2013:689-696.
[12] Ashrafulamin M,Yan H.An empirical study on the characteristics of gabor representations for face recognition[J].International Journal of Pattern Recognition & Artificial Intelligence,2011,23(3):401-431.
[13] Yang M,Zhang L,Zhang D,et al.Relaxed collaborative representation for pattern classification[C]∥2012 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),IEEE,2012:2224-2231.
[14] 刘中华,殷 俊,金 忠.一种自适应的Gabor图像特征抽取和权重选择的人脸识别方法[J].光子学报,2011,40(4):636-641.
[15] Shi J,Liu X,Li Y,et al.Multi-channel EEG-based sleep stage classification with joint collaborative representation and multiple kernel learning[J].Journal of Neuroscience Methods,2015,254:94-101.