基于变换域特征提取和模拟退火法特征选择的人脸识别
2017-06-15孙云娟
李 伟,孙云娟
(1.河南师范大学 电子与电气工程学院,河南 新乡 453007;2.河南师范大学 新联学院,河南 新乡 453007)
基于变换域特征提取和模拟退火法特征选择的人脸识别
李 伟1,孙云娟2
(1.河南师范大学 电子与电气工程学院,河南 新乡 453007;2.河南师范大学 新联学院,河南 新乡 453007)
为了提高人脸识别系统的性能,提出DWT双边子带频域特征提取和模拟退火优化算法的特征选择。首先,运用DWT、DFT和DCT组合变换,用于人脸图像表情、姿态、平移和光照不变特征的有效特征提取。人脸图像DWT变换后,选择近似系数分量和水平系数分量[CA CH]为小波特征,经DFT变换后,利用四椭圆模板取出DFT低频高幅值系数,经DCT压缩得到人脸图像的特征系数。其次,利用模拟退火优化算法进行特征选择,在特征系数空间搜索特征子集进行人脸识别。实验仿真说明了该方法的有效性。
人脸识别;特征选择;模拟退火优化算法;频域特征提取
人脸识别作为模式识别的一个重要分支,在实际中具有广泛的应用,如:智能人机接口、可视电话系统和保安系统等。文献[1]中人脸的特征是利用PCA主值特征和LAC本地相关系数的特征;文献[2]中人脸的特征是利用PCA主值特征和DCT变换系数的特征;文献[3-4]中人脸的特征是采用Gabor窗函数提取的特征;文献[5-7]中的特征是采用小波特征;文献[6,8]中人脸识别算法是采用RBF、SVM神经网络进行识别;文献[9]中采用PSO粒子群优化算法选取特征欧氏距判别的方法。本文中提出的人脸识别算法包括两部分:变换域系数的特征提取和基于模拟退火优化算法的特征选择,最后通过欧氏距判别器进行判别。
1 理论基础
1.1 变频域算法(离散小波变换DWT、DFT和DCT)的系数特征
DWT的优点是通过改变时频窗口可以对信号进行多分辨分析,用它表示图像非常有效。一幅人脸图像通过DWT可以分解成4个子带分量:[CA]、[CH]、[CV]和[CD],其分别表示为近似分量、水平分量、垂直分量和对角分量。[CA]分量保持原有人脸图像最基本的信息,属于低频分量,其他分量为高频分量。[CA]分量和高频分量相结合才能体现出原始图像的特征。对于人脸分析,不同光照的同一人脸图像DWT变换后,[CA]分量相差一常数,高频分量相同,但DWT一个典型的缺点是图像的平移特性,即人脸图像在图像空间的移动,平移的图像和原始图像小波系数是不同的,但是其DFT系数幅值相同,仅仅引入了相移:
DFT[f(x,y)]=F(u,v),
(1)
(2)
离散傅里叶变换DFT是进行信号频率分析强有力的工具,在分析图像时具有两个最基本特性:频谱的对称性和图像平移的不变性。由于频谱系数幅值的对称性使得其系数具有一半的自由度,在选择特征系数时可以减去一半,大大减少了计算时间。为了体现DFT系数低频高幅值的特征,通常将DFT系数进行居中处理,这也恰恰体现出DFT系数的周期特性。DFT具有很强的压缩能力,选择适当的阈值,DFT系数大大减少。
离散余弦变换DCT是进行信号频率分析又一个强有力的工具,它的典型特征是具有很强的信息堆栈能力,其压缩能力优于DFT,在实际当中它和DCT通常联合使用,因此DFT-DCT性能更好。由于DFT系数动态范围大,而DCT动态范围小,DFT-DCT联合使用使得后级人脸判别电路性能提高,从而增加人脸系统的性能,因此在实际中而不用DCT-DFT,而采用DFT-DCT[10]。
1.2 四椭圆模板
为了屏蔽DFT系数,提高计算效率,采用四椭圆模板屏蔽系数。该模板由4个相互交叠的椭圆组成,假设原点为(0,0),长轴为a、短轴为b,椭圆方程(水平方向和垂直方向)为式(3)。设参数为t,参数方程为式(4),左右旋转45°的椭圆参数方程为式(5)。
(3)
(4)
(5)
1.3 模拟退火(SA)优化算法
模拟退火算法是高维空间复杂系统随机搜索的一种寻优算法,该算法的命名来源于物理化学中的退火过程,退火过程是从高温开始,慢慢冷却到低温度并且保持热平衡。该算法的基础为Metropolis算法,下降温度T为调节参数,满足迭代公式:Tk=cTk-1,c为常数,一般取范围为0.800≤c≤0.999,k=1,2,3,...。该算法与传统的迭代优化算法相比较,存在两个优点:算法不会陷入局部最小值,并且模拟退火是自适应的。模拟退火算法特别适用于求解组合优化问题。组合优化的目标是针对有很多可能解的有限离散系统,最小化它的目标函数[11,12]。其基本步骤如下:
1) 初始化温度为一个高值,并且给出其目标函数的一个初始解;
2)计算当前状态A的能量EA;
3)扰动转入另一状态B,并计算该状态的能量EB;
4)若EB 5)降低温度,重复程序。 1.4 欧氏距离分类器 (6) (7) 在分析人脸图像时,首先将该人脸图像进行DWT变换,分解出4个子带分量,且具有低频分量高幅值和高频分量低幅值的特征。近似系数[CA]分量具有原始图像的基本系数特征,眼睛、嘴巴、耳朵等位置处[CA]系数幅值比较低,而在高频分量中,幅值较高,为了分析问题方便通常取小波特征系数[CA][CH]分量。对于不同光照的同一人脸图像,DWT变换后高频特征相同,这体现出了DWT变换的优点,而近似系数却相差一常量。由于DFT变换可以克服DWT图像平移的弱点,直接将小波系数[CA][CH]进行DFT变换,得到DFT频谱特征系数。如果将原始图像直接进行DFT变换,得到的频谱系数矩阵远远大于[CA][CH]进行DFT变换得到的频谱系数矩阵,这大大增加了数据处理速度和存储空间。由于DFT系数的特点,将其进行居中处理后,体现出其低频高幅值系数的特点。且DFT系数幅值的对称性,通常抛弃一半系数进行分析处理。一般情况下可以选用椭圆型模板和三角形模板来屏蔽DFT系数,本文中选用四椭圆模板。经过模板处理后,保留了模板处的系数,删除其他系数,达到数据压缩的目的。 DCT具有很强的信息堆栈和压缩能力。将模板处理后的DFT特征系数重新祯装成一个二维系数矩阵,进行DCT压缩,压缩后解除DFT系数频域的相关特性。选择适当的阈值,进行压缩处理,生成DCT系数矩阵。人脸图像变换域系数特征提取过程如图1所示。 最后一级判别电路可由欧氏距离判别器构成。通过欧氏判别器识别不同人脸、不同人脸表情、不同人脸姿态、不同光照、不同平移的人脸图像。 图1 人脸图像变换域系数特征提取过程 图2 模拟退火优化算法选择DCT系数矩阵列向量示意图 现将所提出的方法归纳成如下步骤: Step1: 将人脸图像进行DWT变换,取出特征系数分量[CA CH]; Step2: 将[CA CH]进行DFT变换,选择四椭圆模板,取出DFT特征系数; Step3:将DFT系数转化为二维矩阵,进行DCT压缩,取出DCT特征系数; Step4:利用模拟退火优化算法选择DCT系数矩阵列向量,构成新的DCT矩阵; Step5:利用欧氏距判别电路识别人脸。 本实验仿真是在Matlab7.0环境下进行,使用Intel Corei3 2.27 GHz cpu。所取人脸数据库为Yale库、ORL库和BMP文件,其中Yale人脸图像尺寸为100×100像素,ORL人脸图像尺寸为128×128像素。Yale库15人的人脸图像,每人11种表情图像,共计165幅人脸图像。ORL库40人的人脸图像,每人10种姿态和表情图像,共计400幅人脸图像。本实验仿真对Yale库人脸正面图像进行仿真,图3给出了其中一部分人脸图像。首先将人脸图像进行DWT变换,选择bior4.4小波,提取近似系数分量[CA]和水平系数分量[CH],构成系数特征[CA CH],大小为54×108像素。将该特征分量进行DFT变换,居中处理后,系数矩阵大小为54×108,利用四椭圆模板(右半边)屏蔽取出DFT低频高幅值系数,重新再构成新的二维DFT系数矩阵,尺寸为33×33像素。将该二维系数矩阵进行DCT压缩变换,得到DCT系数矩阵。在该系数空间,利用模拟退火优化算法,选择优化的特征列向量,在搜索过程中,设初始温度为To=97°,终止温度为Te=3°,常数c=0.999。利用欧氏距离判别器识别人脸,人脸识别率最高达到95%以上,此时特征系数矩阵平均为:33.0×25.5,特征压缩比率为8.4/100。对Yale库不同表情的人脸图像进行仿真,做同样的分析,人脸识别率最高达到100%,此时特征系数矩阵平均为33.0×25.3,特征压缩比率为8.3/100,图4给出部分表情人脸图像。对ORL库不同的人脸姿态图像进行仿真,可以得出同样好的性能,图5给出了其中几幅图像人脸姿态图像。为了说明该方法的有效性,该方法与仅采用DWT、DWT+DFT时的性能比较如表1所示。 图3 Yale库人脸图像(部分) 图4 Yale库不同表情的人脸图像 图5 ORL库不同姿态的人脸图像 方法选择平均特征系数计算时间/s最高识别率DWT+SA54.0×66.510.36100%DWT+DFT+SA33.0×26.22.12100%DWT+DFT+DCT+SA33.0×25.52.11100% 本文利用DWT、DFT、DCT组合变换进行人脸图像的特征提取,并且运用模拟退火优化算法进行特征选择的创新方法进行人脸识别。DWT、DFT、DCT变换在有效特征提取过程中起着关键的作用,并且为人脸识别的高性能做出主要的贡献。DWT具有图像光照不变特征,DFT具有图像平移的不变特征,对于不同的人脸图像、不同表情的人脸图像和不同姿态的人脸图像,DFT、DCT大大压缩了小波特征系数。为了有效选择最佳系数特征,提高人脸识别性能,模拟退火法在高维系数空间搜索选择最佳性能的系数列向量。 [1] Sun T H,Tien F C.Using Bp neural network for face recognition with 2D+3D hybrid information[J].Expert Systems with Applications,2008,35(1-2):361-372. [2] Yang J,Ling X F,Zhu Y T,et al.Face detection and recognition system in color image series[J].Mathematics and computer in simulation,2008,77(5-6):531-539. [3] Thiyagarajar R,Arulselvi S,Sainarayanan G.Gabor feature based classification using statistical models for face recognition[C]//Procedia computer science,2010,2:83-93. [4] Pong K H,Lam K M.Multi-resolution feature fusion for face recognition[J].Pattern Recognition,2014,47(2):556-567. [5] Sengur A.Wavelet transform and adaptive neuro-fuzzy inference for color texture classification[J].Expert Systems with Applications,2008,34(3):2120-2128. [6] Gumus E,Kilic N,Sertbas A,et al.Ucan.Evaluation of face recognition techniques using PCA、wavelets and SVM[J].Expert system with applications,2010,37(9):6404-6408. [7] Rangaswamy Y,Raja K B,Venugopal K R.Face Recognition Using Fusion of DTCWT and FFT features[C]//Procedia Computer Science,2015,54:809-817. [8] Balasubramanian M,Palanivel S,Ramalingam V.Real time face and mouth recognition using radial basis function neural networks[J].Expert Systems with Applications,2009,33(3):6879-6888. [9] Ajit Krisshna N L,Kadetotad D V,Manikantan K,et al.Face recognition using transform domain feature extraction and PSO-based feature selection[J].Applied soft computing,2014,22:141-161. [10] Gonzalez R C,Woods R E.Digital Image Processing[M].2版.北京:电子工业出版社,2007:35-40. [11] Kumar S.Neural Networks[M].北京:清华大学出版社,2006:68-70. [12] Haykin S.Neural Networks and Learning Machines[M].3版.北京:机械工业出版社,2011:22-30. [13] Theodoridis S,Koutroumbas K.Pattern Recognition[M].4版.北京:机械工业出版社,2009:34-36. Face Recognition Based on Transform Domain in Feature Extraction and Simulated Annealing Algorithm in Feature Selection LI Wei, SUN Yunjuan (Henan Normal University, Xinxiang 453007, China) Two core techniques are proposed in the paper to improve the performance of face recognition system: DWT dual_sub band frequency domain for feature extraction and simulated annealing optimization for feature selection. First, it is combined DWT、DFT and DCT methods to extract facial expressions,translation and illumination invariant features.The wavelet features [CA CH] are selected using approximation and horizontal coefficients of the DWT of a face images.Low frequency high amplitude components are achieved with quadruple ellipse mask after DFT. DCT feature coefficients are obtained with DCT compression in the end. Then,The Simulated Annealing Algorithm is used for features selection and the feature subset is searched for the recognition in the space.The experiment simulation shows the validity of the method. face recognition; feature selection; simulated annealing algorithm; frequency domain feature extraction 2016-12-09 李伟(1967-),男,河南新乡人,硕士,讲师,主要从事数字图像处理、模式识别和水印技术等方面的研究. 10.3969/i.issn.1674-5403.2017.02.019 TP317.4 A 1674-5403(2017)02-0070-052 提出的方法
3 实验仿真和性能分析
4 结 语