基于Snake模型和协作表示分类的鲁棒人脸识别方法

2016-11-26唐守军吴洪武

湘潭大学自然科学学报 2016年2期

关键词：识别率人脸识别人脸

唐守军，吴洪武

(1.广东开放大学基础教学部，广东广州 510091;2.华南理工大学数学学院，广东广州 510641)

基于Snake模型和协作表示分类的鲁棒人脸识别方法

唐守军1*，吴洪武2

(1.广东开放大学基础教学部，广东广州 510091;2.华南理工大学数学学院，广东广州 510641)

人脸图像的姿态和偏转角度变化严重影响人脸识别的性能，为此提出一种基于Snake模型姿态矫正和协作表示分类(CRC)的鲁棒人脸识别方法．首先，利用Snake模型提取人脸图像边缘和特征点，对偏转人脸图像进行矫正．然后，提取Gabor特征，构建特征向量．最后，采用CRC算法，对图像特征进行协作表示，根据样本图像与测试图像的残差来判断图像类别．实验结果表明，提出的方法对偏转角度、姿态、光照变化具有很强的鲁棒性．

人脸识别；姿态偏转；Snake模型；协作表示分类；Gabor特征

人脸是一种广泛接受的有效生物特征指标，人脸识别(FR)已成为计算机视觉应用中的研究热点[1]．尽管许多人脸识别算法能在约束条件下取得较好的识别效果，但在实际应用中，人脸图像的不同偏转角度、光照条件、面部表情、遮挡等变化环境对识别性能具有显著的影响[2]．

目前，学者已经提出了一些处理上述变化的人脸识别方法．例如，文献[3]提出一种基于尺度不变特征融合(FSIF)的识别方法，利用尺度不变特征转换算法提取特征，能够一定程度解决姿态变化的影响．文献[4]利用主动表观模型(AAM)边界化脸面，并匹配来自图库的正面人脸图，在提取Gabor特征之前对偏转人脸进行矫正，一定程度上提高了对偏转人脸的识别性能．文献[5]提出一种基于局部二值模式(LBP)和稀疏表示分类(SRC)算法的人脸识别方案，其对姿态变化人脸具有较高的识别率，但是其在构建稀疏字典矩阵时不能获得稳定的最稀疏解．

本文提出一种基于Snake模型姿态矫正和协作表示分类(CRC)的鲁棒人脸识别方案．利用Snake模型对偏转人脸图像进行矫正，然后提取Gabor特征，并采用CRC算法来分类特征．在FETET和AR数据库上的实验结果表明，本文方案能够很好地识别偏转人脸，整体识别率达到了97%，同时对于姿态和光照变化的人脸也具有很强的鲁棒性．

1 基于Snake模型进行人脸姿态矫正

Snake模型又称主动轮廓模型(ACM)[6]，是一种目标轮廓描述方法，目前其已应用于图像边缘提取、图像分割与分类，目标跟踪等领域．考虑人脸偏转姿势的变化，采用Snake模型对人脸姿势变化进行建模．Snake模型中采用点分布模型(PDM)，利用点集坐标向量来定义目标的形状：

(1)

新人脸目标的形状S可以表示为平均形状S0，该平均形状根据基向量的线性组合而变形，该基向量在示例集中代表目标变化的主要模型，且受仿射变换而变形[7]．图像中人脸的形状S可以表示为：

S=T(s,R,T;S0+Ψip)，

(2)

(3)

利用训练形状集的主成分分析(PCA)建立基础Ψ．PCA提供了特征向量的一组正交模式及其特征值．该特征值代表训练形状的模型变换中相应特征向量的重要性．然后，选择具有较大特征值的特征向量来创建基础Ψ．因此，可利用较少的参数来获得可生成大变形的模型．

为了使可变形模型与图像符合，本文采用了一种Snake模型中的特定类型：约束局部模型(CLM)．CLM通过计算局部特征的斑块，在图像中搜寻标记，每个标记的位置与PDM的一个点相关．可利用训练图像集来创建与每个标记相关联的局部特征的模型．然后，本文归一化相关系数，将测试图像中计算的特征与训练图像的特征进行比较．然后，利用均值平移算法，来减小训练和测试特征之间的差别，进而优化PDM中点的位置．最终结果为一个拟合了面部特征的形状，如图1所示．

在提取人脸Gabor特征之前，需要调整人脸到平均脸型形状，并将图像归一化到300×400像素．图2描述了一个人脸平均形状，该形状在脸部的定位如下：平均形状的顶点为鼻子中轴的基础位置，其定位在1/3图像高度处的水平中心上．中轴是连接鼻尖和鼻底且分离鼻孔的线．眼睛位于同一水平线上，且它们中心间距设置为68像素．眼睛之间的间距控制着对齐平均形状的比例．

在矫正对齐阶段，首先，旋转图像使眼睛在同一水平线上；然后，缩放图像使形状的宽度等于对齐平均形状的宽度；再后，转化图像，使由每只眼睛和鼻子中轴顶点形成的三角形的中心在平均形状和脸部形状之间．这种对齐可采用图库和测试人脸在相同位置进行比较，从而提高了矫正对齐的性能．如果人脸姿态有较大的旋转，且人脸一边被遮挡，则利用在鼻子上方的顶点，而不用被遮挡的眼睛．图2描述了一个归一化图像示例．

2 提取Gabor特征

在人脸矫正之后，本文在具有5种空间尺度0≤v≤4和8种方向0≤μ≤7下计算人脸Gabor特征．在人脸图像网格中，利用固定像素位置(67,125)和(135,125)的眼睛将图像进行矫正．具有5个空间尺度的Gabor过滤器定义为[8]：

(4)

(5)

其中*为卷积运算符，I为人脸图像．最后，将Gabor特征向量归一化为：

(6)

3 基于CRC进行人脸识别

协作表示分类(CRC)[9]是稀疏表示分类(SRC)的一种改进算法，其在估计表示系数时，重点考虑表示的协作性，放松对稀疏性的要求．协作表示法利用范数作为约束条件求得的稀疏矢量同样可以很好地表示测试样本[10]．

本文从k个人脸类中收集带有标签的训练样本，设定Ai=[vi,1,vi,2,…,vi,ni]表示从图库中第i类的训练图像的一个m×ni大小的矩阵，vi,j表示第i个人的第j幅图像．由于初始时并不知道测试样本的身份，因此需要定义一个矩阵A，表示所有类的训练样本的融合：

Am×n=[A1,A2,…,Ak]=[v1,1,v1,2,…,v1,n]…[vk,1,…,vk,nk].

(7)

测试样本y仅能由正确人脸类别中的样本进行完全表示，倘若A存在大量的人脸类别，则需要将其引导为稀疏表示的系数x，x表示对应某个类的系数，即求解以下最优化问题：

(8)

实际上，利用l1范数可以获得最稀疏的解，但随着A的行或列的增加，计算量会呈指数增加，如何快速求解式(8)成为当前稀疏表示分类算法的一个难点．由于稀疏表示分类过多的强调“稀疏性”，忽略了“协作性”．而在一般人脸识别中，人脸之间具有一定的相似性，因此可以使用类间样本表示的“协作性”来解决稀疏表示的问题[11]．因此，本文利用CRC法来求解下面的最优化问题：

(9)

其中λ表示正则化参数，正则项能够保证递推最小二乘法(RLS)所得解的稳定性，同时可将“稀疏度”引入到解x中．利用正则化RLS求解式(9)获得的解可表示为：

(10)

设定P=(ATA+λI)-1AT，显然P与测试样本y无关，因此可预先将P作为一个投影矩阵计算出来．当生成一个序列样本y后，就可以利用Py对y进行投影，这样可以使CRC获得非常快的运算速度．

本文基于CRC的人脸识别方案步骤如下：

(1) 分别提取训练图像vi,j和测试图像的Gabor特征：Gi,j，Gy∈Rd×1(d为Gabor特征长度)，并根据Gi,j构建训练样本特征集A，将Gy表示成特征向量y．

4 实验及分析

在FETET和AR数据库上，将本文方案与现有相关方案进行比较，分别为：尺度不变特征融合法(FSIF)、主动表观模型+Gabor特征(AAM+Gabor)和局部二值模式+稀疏表示分类(LBP+SRC)．实验采用MATLAB7.0在PC机上实现．

4.1FERET数据库实验

FERET数据库中包含不同偏转角度的人脸图像．为了测试本文方案对于不同偏转角度姿势人脸的识别性能，从FERET数据库选取8套人脸，姿势角分别为60°、40°、25°、15°和0°，每种姿势角图像集合都包含200张不同的人脸图像．将其中100张作为训练集，另外100张作为测试集．图3所示为FERET数据库中几张不同偏转角度人脸姿势的例子．

在这些偏转人脸集上进行实验，实验结果为5次实验的平均值，结果如表1所示．可以看出，随着人脸偏转角的减少，各种方案的识别率也越高．其中，对于偏转15°～0°角度的图像，本文方案的识别率都达到了100%，对于偏转40°以内的图像都达到了97%以上．另外，由于AAM+Gabor方案采用了人脸矫正技术，所以其偏转人脸的识别率要高于LBP+SRC．对于偏转60°的图像，本文方案识别率比最差的FSIF方案提高了约20%，比最优的AAM+Gabor方案提高了约5%．这是因为本文利用Snake模型对偏转人脸进行了矫正，同时融合了协作表示分类法，有效提高了对偏转人脸的鲁棒性．

表1 各种方案对FERET数据库中偏转人脸的识别率

4.2 AR数据库实验

AR人脸数据库中的图像具有不同的脸部表情和光照变化．本文从AR数据库选择50个对象，每个对象20幅图像进行实验．图4为AR数据库中的人脸图像示例．

将每个对象的10幅图像作为训练集，剩下的作为测试集．各种方案的综合识别结果如表2所示．可以看出，与上一个实验不同，LBP+SRC方法采用SRC来稀疏表示特征，在表情和光照变化图像上的性能要高于AAM+Gabor方案．另外，本文方法对所有脸部表情和光照变化都能达到很高的识别率，整体识别率达到了95%以上，这也证明了本文采用的CRC在人脸识别上要优于SRC．

表2 各种方案对AR数据库中表情和

5 结束语

本文提出一种基于Snake模型姿态矫正和CRC算法的人脸识别方法，在提取人脸Gabor特征之前，利用Snake模型对偏转人脸图像进行矫正．利用CRC算法对图像特征进行协作表示并分类图像．与现有具备人脸矫正的方案进行比较，结果表明，提出的方法能够更好地应对偏转人脸．此外，提出的方法中，采用CRC比SRC更适合多姿态变化的人脸识别．

[1] 孔令美, 汤庸. 基于小波变换和小波神经网络的3D遮挡人脸识别方法[J]. 湘潭大学自然科学学报, 2015, 37(4): 82-86.

[2] 黄永明, 章国宝, 董飞, 等. 基于 Gabor, Fisher 脸多特征提取及集成 SVM 的人脸表情识别[J]. 计算机应用研究, 2011, 28(4): 1 536-1 539.

[3] 李根, 李文辉. 基于尺度不变特征变换的平面旋转人脸检测[J]. 吉林大学学报(工学版)，2013, 43(1): 186-191.

[4] DING L, DING X, FANG C. Continuous pose normalization for pose-robust face recognition[J]. Signal Processing Letters IEEE, 2012, 19(5): 721-724.

[5] MOEINI A, MOEINI H, FAEZ K. Unrestricted pose-invariant face recognition by sparse dictionary matrix[J]. Image & Vision Computing, 2015, 36(7): 9-22.

[6] 兰红, 张璐. 分水岭优化的Snake模型肝脏图像分割[J]. 中国图象图形学报, 2012, 17(7): 873-879.

[7] ZHU G, GUO S X. Image-fusion-based multi-resolution active contour model[J]. Optik-International Journal for Light and Electron Optics, 2014, 125(17):4 955-4 957.

[8] PEREZ C A, CAMENT L A, CASTILLO L E. Methodological improvement on local Gabor face recognition based on feature selection and enhanced Borda count[J]. Pattern Recognition, 2011, 44(4): 951-963.

[9] 林国军, 解梅. 一种鲁棒协作表示的人脸识别算法[J]. 计算机应用研究, 2014, 31(8):2 520-2 522.

[10] ZHANG H, WANG F, CHEN Y, et al. Combination of linear regression classification and collaborative representation classification[J]. Neural Computing & Applications, 2014, 25(3): 833-838.

[11] HUANG W, WANG X, JIN Z, et al. Penalized collaborative representation based classification for face recognition[J]. Applied Intelligence, 2015, 4(4): 722-731.

责任编辑：龙顺潮

A Robust Face Recognition Method Based on Snake Model and Collaborative Representation Classification

TANGShou-jun1*,WUHong-wu2

(1.Department of Basic Teaching, The Open University of Guangdong, Guangzhou 510091; 2.School of Mathematics, South China University of Technology, Guangzhou 510641 China)

The performance of face recognition is seriously affected by facial image pose and deflection angle changes. For this issue, a robust face recognition scheme based on Snake model and collaborative representation classification (CRC) is proposed. First, the Snake model is used to extract the edge and feature points of the face image, and to correct the deflection of the face image correction. Then, this scheme extracts the Gabor feature to construct the feature vector. Finally, the CRC algorithm is used to coordinate represent the image features, and the classification of the image is determined according to the residual error of the sample image and the test image. The experimental results show that the proposed scheme has strong robustness to deflection angle, pose and illumination changes.

face recognition; pose deflection; Snake model; collaborative representation classification; Gabor feature

2016-01-27

广东省高校自然科学研究课题(KF1420)

唐守军(1980-)，男，山东淄博人，讲师.E-mail:sjtang@gdrtvu.edu.cn

TP391

1000-5900(2016)02-0104-05