改进的分块2DPCA人脸识别方法

2011-08-11吴天德戴在平

通信技术 2011年10期

吴天德，戴在平

（华侨大学信息科学与工程学院，福建厦门 361021）

0 引言

主成分分析法（PCA，Principal Component Analysis）[1]作为当前应用最为普遍的人脸识别方法之一，首先对人脸进行向量化操作得到一组随机矢量，再通过PCA得到一组特征图像，对于任意给定的人脸图像都可以被近似为这组特征图像的组合。2004年杨健等提出了二维PCA方法[2]提高了提取人脸特征的稳定性并减少了PCA方法的运算量。

表情、眼镜等内因以及照明、摄像机视点等外因是影响人脸识别率的主要方面。为此，很多研究针对这方面[3-4]，通过图像处理技术提高识别率。

2005 年陈伏兵等对二维主成分分析（2DPCA）方法进行了改进，提出了模块2DPCA方法(Modular 2DPCA)[5]。与杨健提出的2DPCA算法相比，该算法中，原图像首先被模块化，得到的子图像直接转化成为训练样本进行总体协方差矩阵的重构。

2010 年韩晓翠等[6]基于样本中间值改进了2DPCA的算法，将类内中间值引入到总体协方差矩阵中，取得了良好的效果。

基于上述几种算法提出了将样本中间值应用到模块2DPCA的总体协方差矩阵中，得到一种最优投影矩阵的新构造法。通过在ORL人脸数据库中的测试，证明了改进后的方法与原始2DPCA方法和普通的Modular 2DPCA方法相比有了较好的改善。

1 模块2D-PCA算法

为了求取最优的投影向量组，先把m×n的A原始图像矩阵分成p×q的人脸子图像矩阵，即：

其中，每个矩阵Akl都是m1×n1（pm1=m，qn1=n）的阵列。得到的所有Akl被视为新的训练样本集。

假定人脸图像有c类分别为ω1,ω2,…,ωc，每一类由ni个图像组成，训练样本集合由组成。训练样本Ai的p×q模块图像矩阵如下：

式中N=Mpq,把待测图像矩阵A投影到向量为Q后得到如下特征矩阵：

分类器采用的是余弦距离分类器，对待测图像进行分类。方法如下：

2 优化的模块2DPCA算法

2.1 关于样本中间值介绍

首先对给定的数列进行排序，通过上述方法求出中间值，例如[7]：

数列 1——｛3.3，3.0，10，3.1，1，3.2，3.4｝，排序后的结果是｛1，3.0，3.1，3.2，3.3，3.4，10｝，其中间值是3.2，平均值为3.857。

数列 2——｛3.3，3.0，10，3.1，1，3.2，3.4，3.5｝，排序后的结果是｛1，3.0，3.1，3.2，3.3，3.4，3.5，10｝，其中间值是(3.2+3.3)/2=3.25，平均值为3.8125。用同样的方法可以定义中间向量。

对于n维列向量组Z1,Z2,…,Zq为：

则中间向量定义为：其中θj是Z的第j行的中间值。

2.2 融入类内中间值的Modular 2DPCA算法步骤

首先类似于传统算法，把m×n的人脸矩阵A分成p×q子矩阵：的阵列。得到的所有Akl被视为新的训练样本集。

区别于普通的Modular 2DPCA，本方法在求总体协方差矩阵时，使用子块的类内中间值代替训练样本均值。有效的提高了识别效果。

算法步骤如下：

①假定人脸图像有c类分别为ω1,ω2,…,ωc，每类由n(i)

矩阵A中的每个子矩阵Akl均为个图像组成。训练样本集由来组成，每个训练图像都是m×n矩阵。训练样本Aij的p×q模块图像矩阵如下：其中

②融入类内中间值的总体协方差矩阵：

③最优投影向量组。对GT进行降序排列后，取其1～r个特征值映射的r个鉴别矢量X1,X2,…,Xr，令：

进行投影后得到：

Bij为Aij的特征矩阵。

⑤测试样本的特征提取。把测试样本图像矩阵变换，即：

Bx为I在进行投影得到的结果。

⑥分类：

3 实验结果与分析

3.1 ORL人脸库

为验证本算法, 文中采用了由英国Cambridge大学的AT&T实验室采集的ORL人脸库[8]，它由400张分辨率为 112× 92的灰度图像组成，依据采集过程，将数据库分为了40组，每组都包含同一人不同的10张正脸图像，多达10%的变化。

3.2 实验1

实验过程中，把人脸库平均的分成2部分。在40组图像中对同一人从10幅任选出5副图像用作训练样本，余下的图片进行识别率统计测试。实验结果如图1所示。

图2 实验1的结果

图2中给出的原始2DPCA方法与融入中间值4×4模块2DPCA方法(Median-M2DPCA)的比对证明了，Median-M2 DPCA 继承了模块2DPCA的特性，比传统2DPCA更具鲁棒性。

3.3 实验2

实验中，在40组图像中，每组任选n(n=2,3,4,5)幅人脸图像用作训练样本，剩下的图片用来对几种方法的性能进行统计，共进行3组试验。每组实验都重复10 次之后取平均值作为其最终的识别率。比对结果如表1 所示。

表1 3种不同方法比较表（%）

从表1中数据可以看出，融入样本中间值的模块2DPCA方法在小样本情况下的识别率明显比传统的模块2DPCA算法和基于样本中间值2DPCA方法的识别率高，说明对于人脸采集过程中由于光照等因素形成的会形成一些边缘样本，而用训练样本的中间值作为样本的分布中心比用样本的平均值更便于分类。

4 结语

将类内中间值引入到模块2DPCA的总体协方差矩阵的构建之中来。融合后的算法继承了模块2DPCA的强鲁棒性，同时在一定程度上克服了边缘样本的干扰，有效的提高了识别率和识别性能。

[1]KIRBY M, SIROVICH L. Application of the KL Procedure for the Characterization of Human Faces[J]. IEEE Trans Pattern Analysis and Machine Intelligence, 1990, 12 (01): 103-108.

[2]YANG J, ZHANG D, FRANGI A F. Two-dimensional PCA: a New Approach to Appearance-based face Representation and Recognition[J].IEEE transactions on pattern analysis and machine intelligence, 2004, 26(01): 131-137.

[3]许高凤,丁士圻,郭丽华,等. 基于小波的人脸去光照识别算法研究[J]. 系统仿真学报, 2009, 21(14): 4362-4366.

[4]张忠波,马驷良,马捷,等.小波和神经网络在人脸光照校正中的应用[J]. 吉林大学学报:理学版, 2005, 43 (02): 162-166.

[5]陈伏兵,陈秀宏,张生亮,等. 基于模块 2DPCA 的人脸识别方法[J].中国图象图形学报, 2006, 11 (04): 580-585.

[6]韩晓翠. 一种改进的2DPCA人脸识别方法[J]. Computer Engineering and Applications, 2010, 46 (25):185-187.

[7]YANG J, ZHANG D. Median LDA: a Robust Feature Extraction Method for Face Recognition[C]: 2006 IEEE International Conference on Systems, Man, and Cybernetics, October 8-11, 2006, Taipei,Taiwan: 4208-4213.

[8]张岩, 武玉强. 改进的模块 2DPCA 人脸识别算法[J].计算机工程,2011,37(07): 228-230.