基于变尺度DCT和PCA的人脸识别方法
2016-11-07张欣刘海宋卓展
张欣,刘海,宋卓展
(河北大学 电子与信息工程学院,河北 保定 071002)
基于变尺度DCT和PCA的人脸识别方法
张欣,刘海,宋卓展
(河北大学 电子与信息工程学院,河北 保定071002)
针对实际应用中要对不同尺度的人脸图像进行匹配和识别的需求,提出一种基于变尺度DCT(离散余弦变换)结合PCA(主成分分析法)的人脸识别方法.首先将不同尺度的人脸图像进行DCT变换,然后提取出相同的DCT系数,再将提出的DCT系数进行PCA降维,最后进行匹配识别.通过对ORL人脸库及实验采集的多尺度人脸图像进行实验,证明了所提方法对不同尺度图像的匹配识别有效,并测算了DCT变换后的修剪尺度及PCA特征维数对该方法识别准确率的影响.
人脸识别;变尺度;DCT;PCA;匹配
科技的发展与进步使人脸识别的需求越来越高,人脸识别在技术和实用层面受到了极大重视与发展.如模板匹配法[1],简单直接,但应用的模板过大就会导致计算量大.神经网络法[2-3],有很强的鲁棒性和容错性,适合并行分布处理,但神经元数目多,训练时间长,识别速度慢.基于隐马尔科夫模型的方法[4-5],充分考虑了人脸各器官的不同特征和它们的相互联系,鲁棒性好,但是隐马尔科夫是一个线性模型,不能描述非线性,当人脸库数据较大时,实时性不好.基于AdaBoost的人脸识别算法[6-8]训练的错误率上界,随着迭代次数的增加,会逐渐下降,但其计算复杂度较高.基于几何特征的人脸识别方法[9],易于理解,存储量小,对光照不敏感,难点在于如何建立模型来准确地提取人脸的几何特征.基于代数特征的人脸识别方法[10],如独立成分分析法是建立在图像的高阶统计特性基础之上的,从原始图像中提取出该图像的灰度特征,虽然灰度特征的各特征分量之间相互独立,但是独立成分分析法没有考虑灰度特征的主次关系,因此独立成分分析法很难反映从原始信号中提取出的各个分量的主次程度.以上方法对于相同尺度的人脸图像具有较好的识别效果.
在人脸识别的实际应用中,人脸图像通常是尺度不同的.本文利用离散余弦变换(discrete cosine transform,DCT)与基于代数特征方法中的主成分分析法(principal component analysis,PCA)设计了一种变尺度的人脸识别方法.该方法首先对不同尺度的人脸图像进行DCT变换,然后提取固定数量的DCT系数,再进行主成分分析,最后利用向量模值归一化的方法进行匹配识别.
1 基本理论
1.1离散余弦变换
DCT,是一种经常使用的压缩图像数据的方法,在数字图像处理技术中,它在最小均方误差这个先提条件下的压缩性能及误差最接近于最佳条件下的K-L 变换.针对于一幅尺度为A×B的数字图像,它的二维DCT公式为
(1)
a.人脸图像;b.对图a进行DCT变化.图1 DCT变换示例Fig.1 DCT transformation example
式中,u= 0 ,1 ,… ,A-1 ;v= 0 ,1,…,B-1.经过二维离散余弦变换后的图像,如图1中的a、b图所示.图1a中的低频分量集中在了图1b的左上角,其高频分量则集中在图1b的右下角.经过二维离散余弦变换的图像的左上角的低频分量包含了原始图像的主要信息,相比之下右下角的高频分量所包含的信息就显得不那么重要.保留左上角的低频信息,适当舍去高频信息,使不同尺度的人脸图像具有了相同的DCT系数,为后期匹配识别奠定了基础.
1.2主成分分析法
PCA计算出样本的特征向量并将其在特征空间的分布作为原始数据,在最小均方意义的先提条件下寻找最佳原始数据的投影,从而使原始特征空间的维数下降.
假设将人脸图像训练集用向量的形式表示为
(2)
1.3匹配
构造一个基于模板的匹配技术,原理为对于大小为M×N的图像f(x,y)和大小为A×B的子图像模式ω(x,y),f和ω的相关性可以表示如下:
(3)
其中,x=0,1,2,…,N-B;y=0,1,2,…,M-A.
计算c(x,y)的过程是将图像f(x,y)作为固定模板,子图像ω(x,y)在其中逐点移动,使ω的原点和点(x,y)重合,然后算出被ω所覆盖图像区域中所对应的各个点的像素乘积后再求和,其和就是c(x,y)在(x,y)点的响应结果.
2个向量的点积为
(4)
用于计算匹配的相关公式改进如下:
(5)
公式(5)利用向量之间夹角的余弦值从而使其响应结果只与图像f(x,y)、ω(x,y)的自身形状(或纹理)有关,与亮度无关且最大响应值为1,即越接近于1越好.
2 人脸识别的实现
2.1实验样本
实验样本包括国际通用的人脸数据库ORL (olivert ti research laboratory)中的图像和实际采集的人脸图像.ORL人脸库是由英国剑桥Olivetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,共有40个不同年龄、不同性别和不同种族的对象.每个对象10幅图像共计400幅灰度图像组成,图像尺寸是92×112,图像背景为黑色,其中人脸部分表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸尺寸也有最多10%的变化.该库是目前使用最广泛的标准数据库,它含有大量的比较结果,如图2所示.
图2 ORL人脸库部分图像Fig.2 ORL face database
实际采集的人脸数据:在光照均匀的前提下利用苹果手机4S的后置的800万摄像头,在以白色为背景进行拍摄的不同方位的人脸图像,总计300人,每人10张,共计3 000张人脸图像,并经过剪辑,使得剪辑之后的人的面部至少占整个图像的50%且图像的尺度不同,如图3所示.
2.2识别流程
1) DCT 变换.将ORL人脸库和实际采集的样本总计60人共600幅人脸灰度图像随机混合后构成样本集,把样本中的每幅人脸图像进行二维DCT 变换,选取变换后的图像中的前若干个分量并保留下来.每人随机选取5幅共计300幅人脸图像组成训练集,所有剩余的图像则组成测试集.假定选择的二维DCT矩阵的系数个数为X×Y.
图3 实际采集的部分多尺度人脸图像Fig.3 Real part of multi-scale face images
2) PCA分析.将训练集的图像做PCA变换,并将其组成特征子空间.将训练集和测试集的图像投影到所求得的特征子空间里,就会求得投影系数,用投影得到的系数替换原始人脸图像,从而达到对人脸图像的特征提取和二次降维的目的,其中对每个变换的图像提取N个主成分.
3)匹配.将每个测试样本分别输入,用式(5)进行数据匹配,计算各个匹配值,选取最大者.
2.3实验结果
在实验中,经DCT变换后,能量集中于左上角,以图像左上角的点为起始点提取大小为行乘以列为X×Y的图像,将提取出的图像进行PCA变换,选取N个主成分,即降至N维.把完成后的图像集作为匹配模板.选取测试集的图像,经以上步骤处理,作为识别样本与模板进行匹配,选取最大匹配值.实验结果表明,本文提出的方法应用在不同尺度人脸图像下,优于单独DCT和单独PCA的方法.
为了测试DCT提取系数X×Y对本方法识别准确率的影响,设定PCA提取主成分数为20,测试不同DCT提取系数下的识别准确率,结果如表1和图4所示.
从下面表1和图4中的数据可以看出:提取的PCA主成分数为定值时,随着提取的DCT提取系数逐渐增加时,识别准确率较改进之前也在增加,但过大的DCT提取系数会增加运算量.
表1 固定PCA主成分数的识别准确率
a.改进之前;b.改进之后.图4 固定PCA系数,改变DCT系数ROC曲线变化Fig.4 Fixed PCA coefficient,the change of DCT coefficient ROC curve
为了测试PCA主成分数对本方法识别准确率的影响,设定DCT提取系数为56×46,测试不同PCA主成分数下的识别准确率,结果如表2和图5所示.
表2 固定DCT提取系数的识别准确率
由表2和图5可知,当DCT提取出的数目一定时,随着PCA提取数的增加,识别准确率也较改进之前随之增加,但到达峰值时准确率上升不明显.
a.改进之前ROC曲线; b.改进之后ROC曲线.图5 固定DCT系数,改变PCA系数ROC曲线变化Fig.5 Fixed DCT coefficient,the change of PCA coefficient ROC curve
3 结论
[1]CHAIT Y,RIZON M, WOO S S,et al.Facial features for template matching based face recognition[J].American Journal of Applied Sciences.2009,6(11):1897-1901.
[2]LU J,ZHAO J W,CAO F L.Extended feed forward neural networks with random weights for face recognition[J].Neurocomputing,2014(136):96-102.DOI:dx.doi.org/10.1016/j.neucom.20141.01.022.
[3]李康顺,李凯,张文盛.一种基于改进BP神经网络的PCA人脸识别算法[J].计算机应用与软件,2014,3(11):158-161.DOI:10.3969 /j.issn.1000-386x.2014.01.041.
LI Kangshun,LI Kai,ZAHNG Wensheng.PCA face recognition algorithm based on improved BP neural network[J].Computer Applications and Software,2014,3(11):158-161.DOI:10.3969 /j.issn.1000-386x.2014.01.041.
[4]ANSUMAN M,TUSAR K M,PANKAJ,et al.Human recognition system for outdoor videos using Hidden Markov model[J].International Journal of Electronics and Communications,2013,08(011):227-236.DOI:dx.doi.org/10.1016/j.aeue.2013.08.011.
[5]李忠建,杨宜民,梅平.基于改进的隐马尔科夫模型的人脸识别方法[J].工业控制计算机,2014,27(11):29-31.
LI Zhongjian,YANG Yimin,MEI Ping.Approach of face recognition based on improved Hidden Markov model[J].Industrial control computer,2014,27(11):29-31.
[6]SRINIVASAN A.A Framework for face recognition using adaptive binning and adaboost techniques[J].International Journal of Multimedia & Its Applications,2014,3(1):76-88.DOI:10.5121/ijma.2011.3107.
[7]徐永红,申鸿魁,赵艳茹,等.四元数目小波和Adaboost在人脸识别中的应用[J].计算机工程与应用,2011,47(29):196-199.DOI:10.3778/j.issn.1002-8331.2011.29.055.
XU Yonghong,SHEN Hongkui,ZHAO Yanru,et al.Application of quaternion wavelet and Adaboost in face recognition[J].Computer Engineering and Application,2011,47(29):196-199.DOI:10.3778/j.issn.1002-8331.2011.29.055.
[8]王宏漫,欧宗瑛.人面部的代数特征与几何特征的提取及识别[D].大连:大连理工大学,2003.
WANG Hongman,OU Zongying.Human facial algebraic and geometrical feature extraction and recognition[D].Dalian:Dalian University of Technology,2003.
[9]张淑军,王高峰,石峰.基于AAM提取几何特征的人脸识别算法[J].系统仿真学报,2013,25(10):2374-2380.DOI:10.16182/j.cnki.joss.2013.10.029.
ZHANG Shujun,WANG Gaofeng,SHI Feng.Face recognition algorithm based on Geometric characteristics extracted by AAM [J].System Simulation,2013,25(10):2374-2380.DOI:10.16182/j.cnki.joss.2013.10.029.
[10]郑宇杰,杨静宇,吴小俊.基于独立成分分析和模糊支持向量机的人脸识别方法[J].系统仿真学报,2005,17(7):1768 -1770.DOI:10.16182/j.cnki.joss.2005.07.063.
ZHENG Yujie,YANG Jingyu,WU Xiaojun.Face recognition by independent component analysis and fuzzy support vector machine[J].System Simulation,2005,17(7):1768 -1770.DOI:10.16182/j.cnki.joss.2005.07.063.
(责任编辑:孟素兰)
Variable scale face recognition based on DCT and PCA
ZHANG Xin,LIU Hai,SONG Zhuozhan
(Electronic Information Engineering College,Hebei University,Baoding 071002,China)
A variable scale face images recognition method is proposed, based on the DCT binding the PCA. First, different scale face images are transformed by DCT. Then, the same DCT coefficients are extracted;and the dimension of the DCT coefficients is reduced by PCA. Finally, matching and recognition of images is done. By the ORL and collected face images, it is proved that the method of recognition variable scale images is efficient. Effective values of DCT transformed coefficients and PCA feature dimension are measured.
face recognition; variable scales; discrete cosine transform; principal component analysis; match
10.3969/j.issn.1000-1565.2016.02.016
2015-10-19
国家自然科学基金资助项目(61203160)
张欣(1966—),男,河北承德人,河北大学教授,博士,主要从事机器视觉、图像处理、模式识别和故障诊断方向研究.
E-mail:zhangxin@hbu.edu.cn
TP391
A
1000-1565(2016)02-0204-06