基于多数投票的DBC人脸识别
2014-04-03师飞龙徐楠楠
李 岚, 师飞龙, 徐楠楠
LI Lan, SHI Feilong, XU Nannan
江南大学 物联网工程学院,江苏 无锡 214122
School of Internet of Things Engineering, Jiangnan University, Wuxi, Jiangsu 214122, China
1 引言
近年来,人脸识别的研究取得了很大进展[1-2]。人脸识别主要包括了人脸特征描述和特征匹配两个阶段,其中人脸特征描述主要分为全局特征和局部特征描述方法。由于基于局部特征的方法,如Gabor小波法[3]、子图像方法[4-5]等相对于全局特征方法具有旋转、平移、光照不变性等特点,因此具有较高的稳定性和识别率,是用于人脸识别的主流方法。
纹理分析作为一种有效的人脸局部特征描述方法,受到了广泛而深入的研究。其中最具代表性的局部纹理描述算子是LBP(Local Binary Patterns)[6]。2004年,Ahonen[7]等人将 LBP算子应用于人脸识别,在 FERET人脸库中取得了很好的效果。随后LBP算子以其出色的人脸纹理特征提取能力被广泛地用于人脸检测、人脸识别等领域,并得到了不断的改进。Vazquez[8]将人脸图像划分成三角网格,将LBP算子应用到每个三角网格内,改进了不同姿势下的人脸识别效率。Zhao[9]等人将LBP与Gabor小波相结合,提高了算法在光照下的鲁棒性。Tang[10]将Haar小波用于LBP,也得到了较高的识别率。
LBP算子只能提取像素间单一的纹理特征,当人脸表情和光照条件变化较大时,识别效果并不理想。虽然Liao[11]等人提出的多尺度LBP算子能够通过改变分块的大小获得不同的纹理特征,但是本质上并不能解决这一问题。而Zhang[12]提出的定向二值编码(DBC)方法能够提取像素间多个方向的纹理特征,很好的弥补了LBP的不足,。
本文对 DBC方法进行了分析,提出了更好的改进算法 V-HaarDBC。该算法首先引入了 Haar小波对图像去噪,然后通过投票机制避免了 DBC算法中对高维特征向量的计算。最后通过对实验数据的分析,对 V-HaarDBC算法中存在的问题做了研究,进一步提出了融合全局特征进行加权投票的WV-HaarDBC方法。
2 定向二值编码DBC
LBP算子只考虑了中心像素与周围像素的固定关系,获得的纹理特征是唯一的。而 DBC算法,提取了中心像素和邻近像素之间0°,45°,90°,135°四个方向的特征,更有效的描述各像素之间的空间关系,增强了纹理提取的效果。
图1 通过DBC方法提取的四个方向的纹理特征
设图像矩阵I内某像素点为zi,j,然后按照公式(1)求出该点沿α方向与周围像素的运算结果,其中d=1,为中心像素与周围像素的距离,α分别为0°,45°,90°,135°。
如图2所示,DBC算子从55×像素大小的矩阵中提取出了从上到下依次为0°,45°,90°,135°的纹理特征。
图2 DBC基本思想
二值化处理后,计算点zi,j的二值编码系列公式如下:
然后把 DBC编码由二进制转为十进制,计算出直方图特征进行分类即可。同LBP一样,为了更好表征局部的纹理特征,DBC也引入了和 LBP方法一样的分块思想,即先把图像分成若干个相同大小的子块,计算每个子块的 DBC直方图特征,最后将这些子块的特征直方图串联成一个向量后进行匹配。
3 结合投票分类的V-HaarDBC
3.1 Haar小波变换
人脸识别中往往会存在图像维数过高和噪声干扰的问题,我们引入小波变换的方式来解决。Haar小波在图像分解与重构中具有运算速度快,分解效果好等优点,因此我们使用Haar小波变换把人脸图像分解为高频和低频两部分。其中低频分量信息与源图像十分相似,保留了图像的大多数信息,因此可以去掉这些包含多数噪声的高频分量信息,本实验中采用一层Haar变换。
3.2 投票分类
由于DBC算法提取了四个方向的特征直方图,最终需要把这些直方图串联起来作为一个整体进行分类。在LBP算法中,高维的特征直方图给计算带来了极大的不便,而文献[12]提出的DBC算法串联了四个方向的特征直方图,构成了更加高维的特征向量,给计算带来巨大的困难。
因此本文将多数投票机制引入到 DBC算法,解决了这个难题。设定A、B、C、D分别为训练样本集在0°,45°,90°,135°方向的特征向量集,a、b、c、d 分别为未知样本在0°,45°,90°,135°方向的特征向量,则计算流程如下:
图3 多数投票法在DBC中的应用
首先,求出训练样本四个方向的特征向量集和未知样本对应的四个特征向量。然后分别判断未知样本每个特征向量的所属类别。最终通过多数投票法判断该未知样本的最终归属类别。
投票机制的引入,一方面避免了 DBC算法中直接对高维向量的计算,另一方面,多分类器的引入增强了算法的容错性,在一定程度上提高了准确率。
3.3 实验和分析
实验在ORL人脸库上进行,该数据库共有40个人,每人10幅不同图像。我们选取前5幅作为训练样本,后5幅作为测试样本。在这里,我们选取LBP,ε-LBP[13], HaarLBP[10],DBC 与本文的V-HaarDBC作为对比。其中的LBP算子采用半径为1的3*3窗口大小形式。测得不同分块形式下的实验数据如表1:
表1 在ORL人脸库上的性能比较
LBP 76.0 87.0 95.5 ε 78.5 88.5 96.5-LBP DBC 81.5 89.0 96.5 HaarLBP 80.0 95.5 97.0 V-HaarDBC 83.0 96.0 98.0
从表中数据可以看出,在不同的分块情况下,DBC的识别率均高于LBP,这是由于DBC能够提取更多的纹理特征,对于变化较大的人脸图像更加的鲁棒。试验中V-HaarDBC获得了最好的性能,相对于次优的HaarLBP,其中最小提高幅度为0.5个百分点,最大可达3个百分点。
但是这种基于投票判别的方法,存在不足之处,在第四部分,提出了相应的解决方法。
4 融合全局特征的WV-HaarDBC
观察V-HaarDBC的实验数据,发现引入投票机制的同时,也不可避免的出现了多数投票法的弊端。本实验中,我们使用DBC四个方向的特征直方图进行投票判别,即总票数为四,但是在计算最多票数的所属类别时往往会出现某些类别获得了相同的票数的情况,此时的判断结果具有不确定性。这是投票法固有的缺点。
针对V-HaarDBC的缺点,本文提出了融合全局特征进行加权投票的WV-HaarDBC方法。
Zhang[14]等人已经证实,经多层小波变化后的人脸图像的尺寸已经很小,可以直接将该矩阵用于分类识别,并具有速度快准确率高的特点。因此,我们通过二层小波法对测试图像分类,并将分类结果作为M张票加入到V-HaarDBC算法产生的四张投票之中。这样我们在分类时就获得了基于全局特征的M张票和基于局部纹理特征的四张票。
WV-HaarDBC算法流程如下:
1)对所有样本进行一层Haar小波分解,只保留低频部分。
2)对低频部分分别采用“二层Haar小波特征提取+最近邻”和“DBC特征提取+最近邻”两种方法进行分类投票。
3)通过多数投票法对从步骤2中获得M+4张票进行最终判别。
图4 WV-HaarDBC算法流程图
来自全局特征的权重票数M的取值,不仅要能大大减少分类时票数相等的情况,同时还要兼顾到全局特征和 DBC局部纹理特征,因此我们分别取M=0.1、1.1、2.1进行测试,实验环境同3.3节。
表2 WV-HaarDBC在ORL人脸库的识别效果
分析表2可知,M=0.1或2.1时,算法过于偏重其中一类特征,因此识别率提升不高甚至有所下降。当选取M=1.1时,WV-HaarDBC兼顾了二层小波的全局特征与DBC的局部纹理特征,进一步增1强了算法的稳定性,同时又减少了分类时票数相等的情况,具有最佳的识别率。因此在本实验中,M=1.1是最合适的权值。
5 结束语
本文首先提出了 V-HaarDBC方法,将 Haar小波变换和多数投票法引入DBC之中,一方面避免了对高维特征直方图的处理,另一方面多分类器的应用增强了算法的鲁棒性。然后进一步提出了融合全局特征的 WV-HaarDBC方法,实验表明,该方法具有较好的识别效果。
[1]HOLUB A,MOREELS P,PERONA P. Unsupervised clustering for Google searches of celebrity images[C]/ /Proc of IEEE Conference on Face and Gesture Recognition. [S.1.]: IEEE, 2008: 1-8.
[2]CAO Zhimin, YIN Qi, TANG Xiao-cu, et al. Face recognition with learning-based descriptor[C]/ /Proc of IEEE Conference on Computer Vision and Pattern Recognition.[S.1.]: IEEE, 2010: 2707-2714.
[3]SERRANO A,de DIEGO I M,CONDE C,et al.Recent advances in face biometrics with Gabor wavelets: A review [J]. Pattern Recognition Letters, 2010, 31(5):372-381.
[4]Nabatchian A, Raheem EA, Ahmadi M. Illumination invariant feature extraction and mutual-information-based local matching for recognition under illumination variation. Pattern Recognition, 2011,44(10-11):2576-2587.
[5]Wang JZ, Zhang BX, Wang SY, Qi M, Kong J. An adaptively weighted sub-pattern locality preserving projection for face recognition. Journal of Network and Computer Applications, 2010,33(3):323-332.
[6]Ojala T,Pietikäinen M,Mäenpää T.Multi-resolution gray-scale and rotation invariant texture classification with local binary patterns [J].IEEE Trans on Pattern Analysis and Machine Intelligence. 2002,24(7):971-986.
[7]Ahonen T, Hadid A, Pietikainen M. Face recognition with local binary patterns[C]//ECCV.8th European Conference on Computer Vision. Prague: ECCV, 2004: 469-481.
[8]VAZQUEZ H M, REYES E G, MOLLEDA Y C. A new image division for LBP method to improve face recognition under varying lighting conditions [C]// Proceedings of the 19th International Conference on Pattern Recognition. Tampa: IEEE Computer Society, 2008: 1-4.
[9]Zhao Q Y, Pan B C, Pan J J , et al. Facial expression recognition based on fusion of Gabor and LBP features[C]//ICWAPR. 6th International Conference on Wavelet Analysis and Pattern Recognition. Hong Kong: ICWAPR,2008:362-367.
[10]唐恒亮, 孙艳丰.融合多通道信息的二维人脸识别[J].北京工业大学学报.2011, 37 (12).
[11]LIAO SHENG-CA I, ZHU XIANG-XIN, LE I ZH EN,etal. Learning multi-scale block local binary patterns for face recognition [C]//ICB2007: Proceedings of IAPR /IEEE International Conference on Biometrics. Seou: l [s.n.], 2007: 828-837.
[12]Baochang zhang, Lei zhang, David zhang and Linlin shen.Directional Binary Code with Application to PolyU Near-Infrared FACE Database, ELSEVIER Pattern Recogiion Leters, vol.31, Issue14, pp.2334-2337, 2010.
[13]王月华,陈松灿.基于LBP的特征空间研究及其在自动人脸识别中的应用[D].南京:南京航空航天大学,2006.
[14]张淑玲, 邹复民.基于小波分析的人脸图像特征提取.科学技术与工程.2006, 6(12).