SPCA参数对单样本人脸识别效果影响分析

2011-08-18王科俊邹国锋张洁

智能系统学报 2011年6期

关键词：识别率人脸人脸识别

王科俊，邹国锋，张洁

(哈尔滨工程大学自动化学院，黑龙江哈尔滨 150001)

SPCA参数对单样本人脸识别效果影响分析

王科俊，邹国锋，张洁

(哈尔滨工程大学自动化学院，黑龙江哈尔滨 150001)

奇异值扰动的主分量分析(SPCA)是一种有效的单样本人脸识别方法，但SPCA算法的识别效果受参数选择的影响比较大，针对SPCA算法中衍生图像生成参数n和结合参数α的不同取值对识别效果的影响进行了分析，利用ORL人脸库和CAS－PEAL人脸库做了大量的实验和比较分析，实验结果表明给出的SPCA参数选取方法和取值范围是合理的，并有效地提高了SPCA算法的实际应用效果和单样本人脸识别的性能.

人脸识别;奇异值分解;结合投影主分量分析;奇异值扰动主分量分析;衍生图像;结合图像

单样本人脸识别问题［1］给人脸识别技术带来巨大挑战，近年来已成为人脸识别研究中的一个重要方向，并得到广泛关注.单样本人脸识别可以有效降低训练样本的收集成本和存储成本，加快人脸识别系统的处理速度，所以在犯罪取证、身份证验证、银行和海关监控等一些特殊的场合得到应用;但是由于训练样本的有限性，单样本人脸识别的识别率往往不高，所以如何有效提高单样本条件下的识别率已成为人们研究的重点.

近年来，研究人员分别从不同的角度对单样本人脸识别问题进行了研究，王科俊等［2］将目前文献中出现的主要针对单训练样本人脸识别的方法概括为以下几类:基于几何特征的方法、样本扩张法、特征子空间扩展法、通用学习框架法、图像增强法、神经网络法和三维识别方法等.其中，图像增强法是使那些对于识别比较重要的特征更加突显出来，同时对那些次要无用的、甚至对识别造成干扰的信息进行抑制的一种方法，该方法侧重于图像的预处理.基于奇异值扰动的主分量分析［3］(singular value decomposition perturbation principal component analysis，SPCA)就是利用原图像奇异值分解(singular value decomposition，SVD)的重构图像来增强原图像的一种方法，通过增强能够使样本提供的信息得到充分利用，可以有效提高识别率，特别是在单样本人脸库中人脸类别比较多的情况下效果更显著.SPCA人脸识别方法易受人脸图像大小影响，随着人脸图像的不断变小，SPCA方法和其他人脸识别方法的区别变得并不那么明显，同时，SPCA方法也受到衍生图像重构参数和结合参数的严重影响，但是这2个参数的取值目前还没有可依据的理论方法.

针对SPCA人脸识别方法易受到奇异值分解参数和结合图像生成参数影响的问题，本文就这2个参数的取值方法进行了深入分析，同时为了充分讨论这2个参数的影响，在ORL人脸库和CAS－PEAL人脸库上进行了大量实验，验证了不同取值方式对于识别效果产生的不同影响，得出了SPCA人脸识别方法中参数取值的原则和规律，为SPCA在人脸识别中的进一步应用提供了参考依据.

1 奇异值扰动的主分量分析法(SPCA)

主分量分析法(principal component analysis，PCA)［4］由 Kirby 和 Sirovich［5］首先引入人脸识别，并取得巨大成功，成为一个判别人脸识别方法性能好坏的公认基准.针对单训练样本人脸识别问题，Wu和Zhou［6］在PCA的基础上提出了结合投影的主分量分析(projection combined principal component analysis，(PC)2A)，这种方法能够在一个更小的特征空间中获得优于传统PCA算法的识别性能，但是Chen等［7］又进一步探讨了n阶(PC)2A，他们认为采用高阶投影组合能够进一步降低特征维数，而识别性能略有提高，并提出了E(PC)2A(enhanced(PC)2A)算法，随后Zhang等［3］又注意到人脸图像矩阵的奇异值除了对噪声不敏感外，还具有保持输入向量的某些代数和几何不变性的重要性质，从而提出了奇异值扰动的主分量分析(singular value decomposition perturbation principal component analysis，SPCA)

1.1 结合投影的主分量分析法

(PC)2A是专门针对单样本人脸识别提出的，侧重图像预处理的一种扩展的PCA方法，该方法把原人脸图像与其一阶投影相结合，以增强人脸图像中对识别有利的信息，抑制人脸图像中对识别无用的信息，从而提高单训练样本情况下的人脸识别效果.

假设P(x，y)是一幅经过归一化的大小为N1×N2的图像的灰度矩阵，x∈［1，N1］，y∈［1，N2］，P(x，y)∈［0，1］.P(x，y)的水平和垂直投影分别定义如式(1)和式(2):

式(1)、(2)的2个投影在一定程度上反映了人脸图像重要局部区域的分布特点.

P(x，y)的投影图像定义为

最后，定义P(x，y)的结合投影图像Pa(x，y).

式中:0＜α＜1.0为结合参数，Pa(x，y)的取值有可能超出［0，1］，可对其进行归一化使其取值在［0，1］内，归一化策略如下:

最后，得到原图像的结合投影图像P'α(x，y)，然后对其运用PCA进行降维和特征提取.根据文献［6］，在使用较少的特征脸(10%～15%)情况下，即在一个更小的特征空间中，(PC)2A可以获得比传统特征脸方法更高的识别精度.

1.2 奇异值扰动的主分量分析法

遵循(PC)2A的思路，SPCA为研究单样本人脸识别问题提供了一条新的思路，它是一种图像增强的方法.它首先需要得到图像的奇异值扰动衍生图像，再把原图像和衍生图像按一定的法则结合形成结合图像，最后对结合图像运用PCA以识别图像.SPCA的目的就是要从单幅人脸图像中“挤出”更多的信息，这些“挤出”的信息包含某些对识别很重要的人脸特征.

假设I(x，y)是一幅归一化的大小为N1×N2的图像灰度矩阵，其中 I(x，y)∈［0，1］，根据奇异值分解定理，I可表示为

然后，通过扰动原图像I的奇异值来获得I的奇异值衍生图像P，P定义为

式中:n是一个实数，取值范围为1＜n＜2.

得到衍生图像P后，再把P与原图像I线性结合，产生一幅新的结合图像J(x，y)，结合方式如式(5):

式中:α是结合参数，取值范围为0＜α＜1.0.

通过式(4)求取衍生图像的过程实质是图像重构的过程，当n=1时，衍生图像P等于原始图像I;当n＞1时，满足λi＞1的奇异值对应的特征向量将被放大，同时λi＜1的奇异值所对应的特征向量被缩小，因此衍生图像P在强调较大奇异值作用的同时，对较小的奇异值进行了限制，实现了对人脸图像中有用信息的放大增强，对无用信息的削弱衰减.所以，将P结合到I得到结合图像J的这一过程，在保持原始图像主要信息的前提下，将会对轻微的表情、光照和遮挡等变化具有较好的适应性.

结合图像 J(x，y)的取值有可能超出［0，1］，尽管这对最终的识别结果不会有影响，但显示图像时会产生变形.为此，对J(x，y)的取值也采用式(3)进行归一化.然后，对归一化后的结合图像J(x，y)而不是原图像I(x，y)采用主分量分析法提取特征和识别，这就是奇异值扰动的主分量分析法，也即SPCA.

1.3 SPCA参数选取分析

通过1.2节的分析，可以看出参数n和α对SPCA过程及识别效果有严重的影响.文献［3］在介绍SPCA算法的过程中，将参数α的值设定为0.25，但并没有给出取值的原则和方法，只是在参数α=0.25的情况下简要讨论了参数n对识别效果的影响，得出了n取 3/2时SPCA效果较好的结论.另外，何家忠等［8］在讨论一种新的图像增强方法时，也对参数的取值进行了分析，但也只是在固定α=0.3的情况下分析了参数n的变化带来的影响，并得出n取9/8时算法的识别性能较好，然后在固定n=9/8时分析了参数α对算法性能的影响，得出了参数α的取值范围为0.15＜α＜0.4.显然，固定一个参数而分析另一个参数对SPCA过程及识别效果的影响是不全面的，应当在参数n和α同时变化的情况下进行有效的分析.

文献［3］指出在衍生图像的重构过程中参数n是一个大于1的实数，n取大于1的实数可以有效地将有用信息进行增强，无用信息进行衰减，但并不是n越大越好，当n取较大值时衍生图像的内部信息结构被扰乱，图像变得平滑模糊，不再适合用来表征人脸图像，会导致识别率下降.所以在一些文献中把参数n的变化范围限制在1～2，其中文献［3］通过定义n=1+1/(11 －m)(m=1，2，…，10)将n的取值设定在1～2，但是这种取值方式使得n的取值在m取1～5的数时过于密集，而当m在7～10变化时n的取值又过于稀疏.当m取1～5的数时，n的取值分别为 1.1、1.111 1、1.125、1.143、1.166 7，显然，参数n这样的取值变化较小，对于奇异值衍生图像的生成不会产生明显的影响变化，从而对于最终结合图像增强效果的影响也并不明显，不利于分析n的变化给识别率所带来的影响;而当m取值为7时，n的取值为1.25，当m的取值为8时，n对应的为1.333，当m变化到9的时候n的取值为1.5，所以中间的取值1.4对于识别效果有怎么样的影响无法进行有效的分析.

本文对文献［3］中n值的取值方式进行了改进，采取均匀取值的方式，定义n取值为1.1，1.2，…，1.9，2.0，这样可以更全面和均衡准确地分析出取值分布对于识别率的影响.另外，对参数n的取值范围，分别在ORL人脸库和CAS_PEAL人脸库上进行了大量的实验，实验表明文献［3］将参数n的上限值确定在2.0是并不合理的，在实际的人脸识别系统中应当根据具体采用的人脸数据库中，人脸图像模式的复杂程度设定参数n的上限值，而将参数n固定在某一个值的做法是不恰当的.

而对于结合参数α会对识别率产生怎么样的影响，文献［3］中没有给出明确的取值原则，本文则通过大量的实验对比得出了结合参数α合理的取值范围.在获得参数n和α较小的取值范围后，再在这个小范围内进行更为精确细致的实验，最终得到参数n和α的最优取值.

2 SPCA算法的实现步骤

SPCA算法的实质是奇异值分解结合主分量分析，因此可连接图像的奇异值分解及主分量分析2个步骤来实现，具体实现步骤如下:

1)对于人脸库中的一幅人脸图像，可用实矩阵A∈RM×N来表示，先把A的像素值范围归一到［0，1］，计算 ATA∈RN×N.

3)根据式(4)计算A的奇异值扰动衍生图像P，根据式(5)和(3)计算结合图像J.

7)训练图像和测试图像按P=UTY往投影空间U投影，得到投影向量，再利用欧式距离来确定测试图像的类别.

3 实验结果分析

本文分别在ORL人脸库和CAS－PEAL人脸库上进行了大量的实验，其中ORL人脸库是一个变化模式相对单一且由西方人人脸构成的人脸库，而CAS－PEAL人脸库是变化模式相对较为复杂且由东方人人脸组成的人脸库.通过在这样的2个人脸库上的实验可以更充分地验证参数n和α取不同值时对SPCA识别效果的影响.

3.1 ORL人脸库介绍

实验所用人脸图像为英国剑桥大学AT＆T实验室创建的ORL人脸数据库［10］.ORL人脸库包括40个人，每人10幅，共400幅人脸图像，图像为256级灰度，尺寸大小为92×112(宽×高)像素.照片拍摄于不同的时间，采用统一的黑色均匀背景，在一定范围内存在光照变化，面部表情变化(睁眼或者闭眼、微笑或者严肃)以及脸部细节变化(如是否戴眼镜).所有的照片都是正面直立的，允许一定角度的头部倾斜和旋转，一般旋转角度不超过20°.这有利于验证SPCA参数是否可以抑制无用干扰信息，对于分析参数变化对识别效果的影响是有利的.

实验中选取40个人，每人一幅具有正常表情的标准人脸图像作为训练样本库，剩余的360幅图像用于测试.图1给出了其中一个人的图像.

图1 ORL人脸库中一个人的图像Fig.1 One person’s images in ORL face database

3.2 ORL人脸库上的实验结果分析

针对参数n和α取不同值，采用文献［3］中的取值方式和本文提出的均匀取值方式进行了实验，图2和图3分别给出了2种取值情况下图像的奇异值扰动衍生图像、结合图像随n变化的情况.

图2 文献［3］中m取不同值时的衍生图像和结合图像Fig.2 The derived images and combined images in［3］with different m

图3 本文中n取不同值时的衍生图像和结合图像Fig.3 The derived images and combined images in this paper with different n

通过上面的实验图像可以明显地看出，当采用文献［3］中的取值方式时，在α=0.25的情况下，m从1～6的变化过程中，衍生图像几乎没有变化;同样得到的结合图像也没有太大变化;而当m从8变化到10时，衍生图像则发生较大的模糊变化，这对于充分分析n取不同值对衍生图像的重构带来的影响是不利的.所以，为了能够均衡、充分地分析n和α的变化给识别率带来的影响，分别针对文献［3］的取值方法和本文的取值方法进行了大量的实验.实验结果如图4、5与表1、2所示.

图4 本文采用n均匀取值方式下的识别率Fig.4 Recognition rate n values in the uniform mode

图5 文献［3］中n取值方式下的识别率Fig.5 Recognition rate n values in［3］

表1 参数n 2种取值方式下的平均识别率对比Table 1 The average recognition rate n in two values modes

表2 参数n 2种取值方式时参数α变化对平均识别率的影响Table 2 The influence of parameter α change under different n values

通过图4和图5以及表1、2中的实验数据，2种取值方式随着n的不断增大，平均识别率都呈现下降的趋势，但是相对于文献［3］提出的取值方法，采用均匀取值的方式时，识别率呈现均匀下降的趋势，能更全面地观察出n的变化给识别率带来的影响.通过表1数据可以看出，当1＜n≤1.6时平均识别率在80%以上，识别效果较好.

在分析n取值变化给识别率带来影响的同时，也详细地针对α的变化给识别率带来的影响进行了大量的实验，通过表中的数据，随着α的增大平均识别率整体呈现下降的趋势，在n值均匀变化的情况下，随着α的增大平均识别率的变化范围较宽，结合上述2个表中的数据，0.1＜α＜0.5时，SPCA的识别性能较好.

上面的实验数据只是说明了识别率受参数变化影响时的总体变化趋势，并得出了参数n和α的一个大致的取值范围.在得出此范围之后，本文又进行了实验，结果如图6所示.从而得出n和α的最佳取值.

图6 n和α小范围变化时的识别率Fig.6 Recognition rate n and α change in a small area

结合表1、表2、图6的实验数据可以看出，当n取值为1.15或1.2时平均识别率分别为87.34%和86.63%，而单项识别率也是比较高的.而对于α的取值为0.25时，平均识别率为85.39%是比较高的，而且单项的识别率也是最高的.综合以上的分析，最终得到参数n和α取值分别为1.15和0.25.

3.3 CAS－PEAL人脸库上的实验结果分析

由3.2节的测试数据可以看出，由于ORL人脸库中的人脸模式变化单一，所以识别效果还令人满意.现在再采用人脸模式变化较多的CAS－PEAL人脸库进行实验，测试参数取值对于识别效果的影响.CAS－PEAL人脸库包含了1 040名中国人共99 450幅头肩部图像，所有图像在专门的采集环境中采集，涵盖了姿态、表情、饰物和光照4种主要变化条件，部分人脸图像具有背景、距离和时间跨度的变化.本文实验中采用每人的7幅图像，这7幅图像分别是每人在表情、正常、背景、距离、饰物、姿态和光照变化下的人脸图像.图7是选择出来的一个人在7种变化下的人脸图像.

图7 CAS－PEAL人脸库中选择出来的一个人的人脸图像Fig.7 One person’s images in CAS-PEAL face database

图8 本文采用的n均匀取值方式下的识别率Fig.8 Recognition rate n values in the uniform mode

图9 文献［3］中n取值方式下的识别率Fig.9 Recognition rate n values in［3］

图10 n 2种取值方式下的平均识别率Fig.10 The average recognition rate n in two values modes

图11 参数α变化对平均识别率的影响Fig.11 The influence of parameter α change

通过图8～11的实验数据看出，识别率有明显的下降，这也恰恰说明了在复杂情况下提高单样本人脸识别率是困难的.采用文献［3］的取值方式，参数n被限定在1～2，但是显然SPCA算法的识别率没有达到最优值，识别率明显处于上升阶段，无法得出参数n对识别效果有影响的正确结论.所以本文在此基础上，进行了进一步的实验，把参数n的取值范围扩大到了1～3，实验数据表明参数n在取值为2.1和2.2时平均识别率和单项识别率是最高的，当n变化到2.8以后识别率基本维持在一个固定的值，不再发生变化.

而参数α对识别效果的影响并不是特别明显，采用文献［3］的取值方式时，在参数α变化的情况下平均识别率基本都维持在53%左右，而采用本文的方法时，平均识别率维持在54%左右，并没有大幅度的增减现象出现.但是通过单项识别率可以看出，参数α取值在0.5～1.0的识别率相对较高.

通过以上的分析和格数据得出这样的结论，在CAS－PEAL人脸库上进行实验测试SPCA参数的影响，参数α的取值范围为0.5＜α＜1.0，参数n的最佳取值为2.1，已经超出文献［3］所规定的2.0的上限值.

本文通过在ORL人脸库和CAS－PEAL人脸库上的大量实验，验证了SPCA算法衍生图像生成参数n和结合图像计算中结合参数α对识别效果有严重的影响.针对不同情况下的人脸库，参数n和参数α应当有不同的取值规律，并不是一成不变的.对于人脸模式变化较为单一且由西方人人脸构成的人脸库，一般参数n和参数α取值是比较小的，而对人脸模式变化较为复杂且为东方人的人脸库，参数n和参数α取值相对较大.这主要是由于在人脸模式单一的情况下，如果参数n取值较大衍生图像的内部信息结构被扰乱，图像变得平滑模糊，不再适合用来表征人脸图像，会导致识别率下降.但是在人脸模式较为复杂的情况时，人脸图像信息已经很复杂，经过衍生图像变换后，最终得到的人脸结合图像变得模糊从而忽略了一些细节信息，但这样更能表达出复杂状态下各种人脸的概况信息，所以识别率反而提高.

4 结束语

奇异值扰动的主分量分析(SPCA)首先对人脸图像进行特殊的预处理，以增强人脸图像中对识别有用的信息，并抑制那些对识别不利的信息，然后再使用主分量分析法进行特征提取和识别，为单训练样本人脸识别开辟了一条新的思路.本文重点讨论并测试了SPCA中衍生图像生成参数n和结合图像计算中结合参数α对识别结果的影响，得出了SPCA取得较好识别效果时参数的取值原则，从而进一步说明SPCA方法的有效性.

［1］TAN Xiaoyang，CHEN Songcan，ZHOU Zhihua，ZHANG Fuyan.Face recognition from a single image per person:a survey［J］.Pattern Recognition，2006，39:1725－1745.

［2］王科俊，段胜利，冯伟兴.单训练样本人脸识别技术综述［J］.模式识别与人工智能，2008，21(5):77－83，635－642.

WANG Kejun，DUAN Shengli，FENG Weixing.A survey of face recognition using single training sample［J］.Pattern Recognition and Artificial Intelligence，2008，21(5):77－83，635－642.

［3］ZHANG Daoqiang，CHEN Songcan，ZHOU Zhihua.A new face recognition method based on SVD perturbation for single example image per person［J］.Applied Mathematics and Computation，2005，163(2):895－907.

［4］TURK M，PENTLAND A.Eigenfaces for recognition［J］.Journal of Cognitive Neuroscience，1991，3(1):71－86.

［5］KIROBY M，SIROVICH L.Application of the Karhunen－Loeve procedure for the characterization of human faces［J］.IEEE Transactions on Pattern Analysis and Machine Intelligence，1990，12(1):103－108.

［6］WU Jianxin，ZHOU Zhihua.Face recognition with one training image per person［J］.Pattern Recognition Letters，2002，23(14):1711－1719.

［7］CHEN Songcan，ZHANG Daoxiang，ZHOU Zhihua.Enhanced(PC)2A for face recognition with one training image per person［J］.Pattern Recognition Letters，2004，25(10):1173－1181.

［8］何家忠，杜明辉.单样本人脸识别中一种新的图像增强方法［J］.微计算机信息，2006，22(3):266－268.

HE Jiazhong，DU Minghui.A new image enhancement method for face recognition with single training sample［J］.Microcomputer Information，2006，22(3):266－268.

［9］徐士良.C常用算法程序集［M］.2版.清华大学出版社，1996:74－77.

［10］剑桥大学 AT＆T实验室.ORL人脸库建［EB/OL］.［2010－05－12］.http://www.cl.cam.ac.uk/Research/DTG/attarchive/facedatabase.html.

王科俊，男，1962年生，教授，博士生导师，博士，哈尔滨工程大学自动化学院副院长，哈尔滨工程大学模式识别与智能系统学科带头人.现任中国人工智能学会理事、中国人工智能学会科普工作委员会副主任、黑龙江省人工智能学会理事长、黑龙江省神经科学学会副理事长、黑龙江省神经科学学会人工智能与医学工程专业委员会主任、黑龙江省自动化学会理事.曾获得部级科技进步二等奖2项，三等奖3项，省高校科学技术一等奖1项、二等奖1项，中国船舶工业总公司优秀青年科技工作者称号，2002年黑龙江省十大杰出青年提名奖，哈尔滨工程大学首届十大杰出青年称号.主要研究方向为生物特征识别与智能监控、神经网络、计算生物信息学等.完成科研项目20余项，在研项目10余项.发表学术论文150余篇，出版学术专著3部，国防教材1部，主审教材2部.

邹国锋，男，1984年生，博士研究生，主要研究方向为生物特征识别与智能监控.

张洁，女，1987年生，硕士研究生，主要研究方向为生物特征识别与智能监控.

Analysis of the influence of SPCA parameters on the recognition of a single sample face

WANG Kejun，ZOU Guofeng，ZHANG Jie
(College of Automation，Harbin Engineering University，Harbin 150001，China)

Singular value decomposition perturbation principal component analysis(SPCA)is an effective singlesample face recognition method;however，the identification results of the SPCA algorithm are seriously affected by parameter selection.In this paper，the effect on the identification，which was caused by the derived image parameter and the combined image generation parameter in the SPCA algorithm，was analyzed.Many experiments and comparative analyses were performed on the basis of the ORL face database and the CAS－PEAL face database.The experimental results show that the SPCA parameter selection method and the parameter range given in this paper are reasonable.In addition，reasonable parameters are effective in improving practical application of SPCA algorithms and the recognition performance of a single－sample face.

face recognition;singular value decomposition;(PC)2A;SPCA;derived image;combined image

TP391.4

1673－4785(2011)06－0531－08

10.3969/j.issn.1673－4785.2011.06.009

2010－09－14.

国家“863”计划资助项目(2008AA01Z148);黑龙江省杰出青年科学基金资助项目(JC200703);哈尔滨市科技创新人才研究专项基金资助项目(2007RFXXG009).

邹国锋.E－mail:zgf841122@163.com.