一种基于单演相位局部差分二值模式的人脸识别方法*
2014-09-13李昆明闫海停刘机福
李昆明,王 玲,闫海停,刘机福
(湖南大学电气与信息工程学院,湖南 长沙 410082)
一种基于单演相位局部差分二值模式的人脸识别方法*
李昆明,王 玲,闫海停,刘机福
(湖南大学电气与信息工程学院,湖南 长沙 410082)
提出一种融合单演方向和尺度间互补信息的单演相位局部差分二值模式的人脸识别方法。该方法首先提取图像的单演相位,对单演相位进行局部差分,求绝对值,并进行二值编码;接着对单演方向和相位尺度间对应的相位点进行二值编码;然后将单演方向编码、相位尺度间编码、同一尺度的单演相位差分二值编码按顺序排列形成单演相位差分模式;最后采用统计学的方法形成单演相位差分二值模式映射表,并将单演相位编码进行映射,从而达到保留主要特征模式、降低特征维度的目的。在ORL和CAS-PEAL人脸库上的实验表明,该方法具有很好的识别性能。
单演信号;相位;差分;二值编码;统计模式
1 引言
由于人脸识别技术的非侵犯性和用户友好性,其在各个领域得到了广泛应用。在过去的几十年,
人们提出了各种各样的方法。基于整体的方法,比如,主成份分析PCA(Principal Component Analysis)[1]、线性鉴别分析[2]等,这些方法在可控条件下往往会取得了不错的识别效果,但在光照、遮挡、表情变化等不可控环境中,其性能急剧下降。尽管
近几年基于稀疏表述的方法取得了不错的进步,但依然存在计算复杂度高等问题。因此,基于局部的识别方法开始得到重视,这些方法包括:基于分块的PCA[3]、局部二值模式LBP(Local Binary Pattern)[4]、韦伯局部描述算子WLD(Weber Local Descriptor)[5]等。基于局部的方法对光照、表情的变化具有较强的鲁棒性,其识别性能往往优于基于整体的识别方法。小波特征作为局部空频变换特征,能够很好地反映图像中多尺度、多方向的局部特征。文献[6]提出一种结合小波变化和稀疏表征的人脸识别方法;文献[7]提出基于Gabor滤波的局部二元方法LGBP(Local Gabor Binary Pattern),充分结合了Gabor和LBP的特点,取得十分出色的识别效果;文献[8]进一步利用局部Gabor异或的方法LGXP(Local Gabor XOR Pattern)进行人脸识别,同样取得了很好的实验效果。
尽管基于Gabor滤波的方法取得了很好的效果,但文献[7,8]中均采用5个尺度8个方向的Gabor小波,其时间和空间复杂度是十分可观的。
为此,文献[9]提出一种基于单演局部二值模式的人脸识别方法Monogenic-LBP(Monogenic Local Binary Pattern),该方法的时间和空间复杂度大概是LGBP的1/5和1/13,而且识别性能与LGBP持平甚至优于LGBP;文献[10]将单演幅值用于表情识别,取得了较好的实验效果。由于文献[9,10]没有利用单演相位信号,而单演相位反映了局部图像的结构信息,能够提供有效的判别信息;文献[11]提出将单演相位信号用于图像配准;文献[12]提出将单演幅值、相位和方向信息结合用于三维视觉测量,取得了不错的实验效果。
为有效利用单演相位信号,本文提出一种基于单演相位信号差分二值模式MPDBP(Monogenic Phase Difference Binary Patterns)的人脸识别方法。该方法不但利用局部单演相位信息,而且充分利用单演方向和尺度间的信息,在特征层融合相位差分二值模式,尺度间互补信息和方向信息形成MPDBP ,使该模式能够有效地提取图像特征。
此外,本文进一步采用统计学的方法统计出优势模式,该方法通过提取原始MPDBP模式中的优势模式形成单演相位差分统计模式MPDBSP(Monogenic Phase Difference Binary Statistical Patterns),从而达到有效降低特征维度、提高识别性能的目的。
2 Monogenic-LBP
2.1 单演信号图像表述
文献[13]中首先引进了单演信号。单演信号是一维解析信号的二维扩展,它保留了一维解析信号的重要属性。单演信号能够将图像正交分解为局部幅值、局部相位、局部方向,以旋转不变的方式提取相位特征。在数字图像处理领域,单演信号广泛应用于图像降噪、图像配准、纹理分类等。单演信号是建立在Riesz变换基础上的,Riesz变换是Hilbert变换的多维扩展。在二维空域中,Riesz核可表述为:
(1)
在频域中,Riesz核可以描述为:
(2)
对于输入图像f(x),它的Riesz变换为:
(3)
其中,*表示卷积运算。
由于多尺度单演表述能够充分描述信号特征,所以尺度可以通过定义一个带通型的Log-Gabor滤波器来产生。Log-Gabor的频率响应定义为:
(4)
其中,ω0是中心频率,σ是径向带宽也就是尺度变量。那么,带通型单演信号可以表述为:
(5)
(6)
2.2 Monogenic-LBP
本文采用文献[4]中介绍的LBP方法对单演幅值信号Av进行编码,那么Av的LBP编码Bv(Ic)为(其中下标c代表center):
(7)
其中:
(8)
(9)
3 单演相位差分二值模式(MPDBP)
(10)
为了增强相位特征的鲁棒性,进一步求取相位差分绝对值,然后再进行二值编码。
(11)
其中,threshold是经验阈值。
(12)
由于不同尺度之间存在着一定的差异,所以尺度之间应该存在某些特定的互补信息,对于多尺度分解的单演信号来说,将不同尺度之间的相位按照既定的方式进行融合将有助于完善人脸特征描述,增强特征的判别能力,从而提高识别能力。
令n=3为单演信号的尺度数目,那么不同尺度上的对应相位点,可按照下式进行编码:
其中:
(13)
(14)
为了充分利用相位、尺度、方向信息,进一步增强特征的信息提取能力,本文在特征层采用多特征融合的方法,分别融合方向信息、尺度信息和局部相位差分信息。那么,最终的多特征融合的单演信号相位差分二值编码模式(MPDBP)为:
(15)
显然,MPDBP是一个12位的二进制字符串, 相应地,MPDBP的模式数目为212=4 096。
图1分别给出了原始图像、单演幅值、方向、相位和MPDBP原始模式的直观图像。
Figure 1 Illustration of monogenic signal components and MPDBP image图1 单演信号图像处理结果示例
4 单演相位差分二值统计模式(MPDBSP)
由上述分析可知,第2节中介绍的MPDBP模式数目过大,导致特征维数过高,时间和空间消耗过大。在文献[4]中针对传统的LBP纹理特征提出一种Uniform模式,通过统计二进制码流中0/1或1/0的转换次数来定义Uniform模式,即当0/1和1/0的转化次数不超过两次时,则认为是Uniform模式。对于大部分图像纹理模式而言,二进制码流中的0/1和1/0的变换次数是有限的,图像纹理模式中绝大部分是所谓的Uniform模式,而Uniform模式数目仅仅占图像纹理模式总数目中很少的一部分,也就是说,8点采样的59个Uniform模式包含了256个原始纹理模式的主要信息。该模式映射已被证实能够有效降低原始特征的特征维度,提高特征对噪声的鲁棒性,增强LBP特征的判别能力。但是,Uniform模式是在原始图像纹理模式中定义的,对于单演幅值、相位、方向则未必如此。基于此,类似文献[15],本文采用所谓的统计模式从更广泛的意义上提取优势模式,即根据MPDBP模式中各模式出现的频率来确定优势模式,形成单演相位差分二值统计模式(MPDBSP),从而达到降低特征维数、增强特征判别能力的目的。具体算法如下:
步骤2令fj(x,y)为MPDBP编码图像,统计其直方图,得到训练集的MPDBP模式分布。
l=0,1,2,…,4 095
(16)
步骤4重复步骤3,直到达到预先设定的迭代次数M,其中M为0~4 095的任意整数。
根据上述算法,迭代M次后将剩下L-M个模式,也就是所谓的优势模式,即单演相位差分二值统计模式(MPDBSP)。显然,当M过小,会导致特征维度过高,计算量明显增加;当M过大,则会导致信息丢失严重,识别性能急剧下降。因此,如何选择一个合适的数值M是一个值得探讨的问题,为此,本文将会进一步探索迭代次数M和识别性能的关系。
5 实验结果及其分析
实验环境和实验对象:Matlab7.0,台式机:XP32位,双核2.60 GHz,2 GB内存。在ORL和CAS-PEAL人脸数据库上验证本文提出的方法。ORL人脸库包括一系列表情、姿态、遮挡变化的人脸图像。人脸库中共有40人,每人10幅图像。实验中随机采用20人构成训练集,剩余20人,每人随机选5张为注册集,剩下5张为测试集。CAS-PEAL人脸数据库是由中国科学院构建的包括光照、姿态、背景、表情、饰物变化的人脸库。训练集包含300人1 200幅图像,注册集包含1 040人1 040张正面图像。背景集由不同背景变化的553张图像组成;饰物集含戴不同帽子和眼镜的2 285张图像;表情集包括不同表情变化的1 570张图像;光照集包括不同光照条件下获取的2 243张图像;年龄集包括跨度为半年的66张不同图像;距离集包括不同距离下获取的275张图像。
实验1在ORL人脸库上,选取Monogenic-LBP、LGBP、LGXP、LBP作为对比算法。实验中,上述方法均采用5×5分块。实验结果如表1所示。
Table 1 Recognition rates on ORL database ofmethods and corresponding feature dimensions表1 ORL上各方法的识别率和特征维数
为消除图片选取的随机性,在ORL上随机选取训练集、注册集和测试集进行五次实验。从表1中可以看出,本文提出的单演相位差分模式(MPDBSP)平均识别率为0.99,高于实验中所用的其他方法。这说明相对于其他方法,MPDBSP能够提取具有更强判别能力的特征。同时可以看出,在所有的方法中,图像块对应的特征维度最小的是LBP,但是其识别效果也是最差的,MPDBSP虽然特征维度要比Monogenic-LBP和LBP要高,但其在识别效果上要比这两种方法出色。相对基于Gabor滤波的方法,MPDBSP不但在识别性能上超越LGBP,而且特征维度要小于LGBP,所以对人脸识别来说MPDBSP特征要优于LGBP特征。
实验2在CAS-PEAL人脸库上,为了说明算法的有效性,选取了若干其他算法作为比较,包括:Fisherface、Eigenface、LBP、LGBP、GFC(Gabor Fisher Classifier)和Monogenic-LBP。实验中,在表情子集,LBP、MPDBSP采用5×5分块的形式,其他子集则统一采用10×10分块的方式。实验结果如表2所示。
Table 2 Recognition rates on CAS-PEAL database表2 各方法在CAS-PEAL人脸库上的识别率
由表2可知,在所有方法中,除了在光照子集的识别性能和LGBP基本持平外,MPDBSP在表情、饰物、背景、距离、年龄子集上的识别性能均优于LGBP,更是全面超越Fisherface和Eigenface方法。比Monogenic-LBP要好,在光照子集的性能提高更为明显,这可能是相位差分二值模式对光照的鲁棒性要比幅值二值模式(LBP)强。在时间复杂度方面,基于Gabor滤波的LGBP、GFC方法需要五个尺度八个方向共40个Gabor滤波器配图;而基于单演滤波的Monogenic-LBP和MPDBSP仅需要三个Log-Gabor滤波器、六次Riesz变换。在空间复杂度方面,LGBP需要产生40个八位的特征匹配图,MBP需要产生三个八位的特征匹配图,MPDBSP需要三个12位的特征匹配图。综合考虑时间空间复杂度,MPDBSP时空复杂度要小于基于Gabor滤波的方法,而且识别性能总体上要比基于Gabor滤波的方法要好。对于同样基于单演滤波的Monogenic-LBP来说,MPDBSP时空复杂度要比Monogenic-LBP高,但识别性能要优于Monogenic-LBP,这说明相位差分特征能够有效提取图像判别特征。由上述分析可得,MPDBSP方法总体上要优于实验中所采用的其他方法。
Figure 2 Pattern distribution of MPDBP and MPDBSP图2 MPDBP和MPDBSP模式分布
图2给出了MPDBP和MPDBSP三个尺度上的模式分布图,图2a~图2c为MPDBP分布情况,可以看出原始的MPDBP分布是不均匀的,模式分布主要集中于少数的优势模式,图2d~图2f是MPDBSP分布情况,显然,统计后的模式分布要比统计前更加均衡。从统计学角度看,这些优势模式占据了原始的MPDBP绝大部分,因此我们有理由相信,这些优势模式能够提供绝大部分有效的分类信息。
从表1和表2中可以看出,理论上的分析和实验结果总体上是一致的,所以该统计方法是有效的,其得出的少数模式能够提供有效的判别信息。
Figure 3 Relation curves of pattern bins and recognition rates on CAS-PEAL database图3 在CAS-PEAL人脸库上,模式数目和识别率的关系曲线
实验中,我们对识别性能和优势模式数目的关系进行了考查,由图3可以得知,在MPDBSP中,当统计模式数目为450时,其时空复杂度和识别性能达到一个相对平衡的状态。这也更进一步说明,少数优势模式可以提供足够的判别信息,单纯增加模式数目对识别性能的提高帮助不大。可以从图3的曲线中看出,当模式数目进一步增加时,识别性能提高并不明显,甚至导致识别性能下降,这有可能是因为MPDBP原始模式中的某些模式不但没有提供有用的分类信息,甚至会提供错误的信息。然而,当模式数目过少时,虽然其特征维度小,但是却不能提供足够的判别信息,从而导致识别性能不佳。因此,识别性能和模式数目之间应该寻找一个最佳的折衷,在提取有效的判别信息的同时降低特征维度。
6 结束语
受单演幅值二值编码模式启发,本文提出一种基于单演相位差分的二值模式方法。该模式通过对单演相位进行差分二值编码来提高相位信息对局部位置变化和噪声的鲁棒性,同时将方向和尺度信息作为相位差分二值编码的互补信息进行融合,进一步提高特征的分类能力,在此基础上采用统计学的方法统计优势模式构成单演相位差分二值统计模式,从而达到降低特征维度、提高识别性能的目的。从本文的实验来看,MPDBSP能够有效提取图像的分类信息,而且对光照、表情、饰物以及年龄变化等都具有较强的鲁棒性。
[1] Turk M, Pentland A. Eigenfaces for recognition[J]. Cognitive Neurosciens, 1991, 13(1):71-86.
[2] Belhumeur P N, Hespanha J P, Kriegmand D J. Eigenfaces vs. fisherfaces:Recognition using class specific linear projection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19(7):711-720.
[3] Chen Fu-bing, Gao Xiu-mei, Zhang Sheng-liang, et al. Human face recognition method based on modular PCA[J]. Journal of Chinese Computer Systems, 2006,27(10):1943-1947.(in Chinese)
[4] Timo O, Pietikainen M. Multi-resolution gray-scale and rotation invariant texture classification with local binary patterns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(7):971-987.
[5] Chen Jie, Shan Shi-guang, He Chu, et al. WLD:A robust local image descriptor[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1705-1720.
[6] Luo Min,Zheng Ming-hui. Robust face recognition based on wavelet transform and sparse representation[J]. Computer Engineering & Science, 2012, 34(12):130-133.(in Chinese)
[7] Zhang Wen-chao,Shan Shi-guang,Gao Wen,et al.Local gabor binary pattern histogram sequence(LGBPHS):A novel non-statistical model for face representation and recognition[C]∥Proc of the 5th International Conference on Computer Vision, 2005:786-791.
[8] Zhang Bao-chang, Shan Shi-guang, Chen Xi-lin, et al. Histogram of gabor phase patterns(HGPP):A novel object representation approach for face recognition[J]. IEEE Transactions on Image Processing, 2007, 16(1):57-68.
[9] Yang Meng, Zhang Lei, Zhang Lin, et al. Monogenic binary pattern(MBP):A novel feature extraction and representation model for face recognition[C]∥Proc of the 20th IEEE International Conference on Pattern Recognition, 2010:2680-2683.
[10] Huang Xiao-hua, Zhao Guo-ying, Zhang Wei-ming, et al. Spatiotemporal local monogenic binary patterns for facial expression recognition[J]. IEEE Signal Processing Letters, 2012, 19(5):243-246.
[11] Liu Gui-xi, Zhou Ya-ping, Liu Dong-mei,et al. Infrared image registration based on monogenic phase[J]. Journal of Projectiles, Rockets, Missiles and Guidance, 2008, 28(6):269-272.(in Chinese)
[12] Li Jin-jun, Zhao Hong. Three-dimensional vision measuring technique based on multi-modal monogenic features detecting and matching[J]. ACTA OPTICA SINICA. 2011, 31(7):0712007(1)-0712007(9).(in Chinese)
[13] Gsommer F M. The monogenic signal[J]. IEEE Transactions on Signal Processing, 2001, 49(12):3136-3144.
[14] Zhang Lin, Zhang Lei, Guo Zhen-hua, et al. Monogenic-LBP:A new approach for rotation invariant texture classification[C]∥Proc of the 10th International Conference on Image Processing, 2010:2677-2680.
[15] Liao S, Zhu X, Lei Z, et al. Learning multi-scale block local binary patterns for face recognition[C]∥Proc of IAPR/IEEE International Conference on Biometrics, 2007:828-837.
[16] Shan Shi-guang.Study on some key issues in face recognition[D]. Beijing:Graduate University of Chinese Academy of Sciences, 2004.(in Chinese)
附中文参考文献:
[3] 陈伏兵, 高秀梅, 张生亮, 等. 基于分块PCA的人脸识别方法[J]. 小型微型计算机系统, 2006, 27(10):1943-1947.
[6] 罗敏,郑明辉.结合小波变换和稀疏表征的鲁棒人脸识别[J].计算机工程与科学, 2012, 34(12):130-133.
[11] 刘贵喜, 周亚平, 刘冬梅,等. 基于单演相位的红外图像配准[J]. 弹箭与制导学报,2008, 28(6):269-272.
[12] 李进军, 赵宏. 一种基于多模式单演特征检测与匹配的三维视觉测量方法[J]. 光学学报, 2011, 31(7):0712007(1)-0712007(9).
[16] 山世光. 人脸识别中若干关键问题的研究[D]. 北京:中国科学院研究生院, 2004.
LIKun-ming,born in 1988,MS candidate,his research interests include digital image processing, and pattern recognition.
王玲(1962),女,湖南长沙人,博士,教授,研究方向为数字图像处理和现代通信与网络技术。E-mail:wl_hunu@163.com
WANGLing,born in 1962,PhD,professor,her research interests include digital image processing, and modern communication and network technology.
闫海停(1988),男,河南扶沟人,硕士生,研究方向为数字图像处理和模式识别。E-mail:525480216@qq.com
YANHai-ting,born in 1988,MS candidate,his research interests include digital image processing, and pattern recognition.
刘机福(1987),男,湖南新化人,硕士生,研究方向为数字图像处理和嵌入式系统。E-mail:liujifu723@163.com
LIUJi-fu,born in 1987,MS candidate,his research interests include digital image processing, and embedded system.
Afacerecognitionmethodbasedonmonogenicphaselocaldifferencebinarypatterns
LI Kun-ming,WANG Ling,YAN Hai-ting,LIU Ji-fu
(College of Electrical and Information Engineering,Hunan University,Changsha 410082,China)
A new face recognition algorithm based on fusion local monogenic orientation,different phase scales information and the monogenic phase local difference binary pattern in the same scale is proposed. Firstly, we calculate the monogenic phase by the monogenic filters, and extract the local difference on monogenic phase, then obtain the absolute values from local difference and encode the results using binary patterns. Secondly, we encode the monogenic orientations and the same location points in every monogenic phase scale by using binary patterns, and then concatenate the monogenic orientation codes, different scales codes and the local difference codes of monogenic phase into a long binary string so as to form the monogenic phase local difference patterns.Finally,in order to remain the most information and reduce the feature dimensions, we form the mapping table with a statistical method, and map the original monogenic phase local difference patterns. Experimental results on ORL and CAS-PEAL databases show that,the proposed algorithm can achieve a better face recognition effect ampared with state-of-art methods.
monogenic signal;phase;difference;binary code;statistical patterns
1007-130X(2014)11-2210-07
2013-04-24;
:2013-09-10
TP391.4
:A
10.3969/j.issn.1007-130X.2014.11.026
李昆明(1988),男,广东化州人,硕士生,研究方向为数字图像处理和模式识别。E-mail:hudalikm@163.com
通信地址:410082 湖南省长沙市湖南大学电气与信息工程学院
Address:College of Electrical and Information Engineering,Hunan University,Changsha 410082,Hunan,P.R.China