基于稀疏表示的人脸识别系统设计与实现

2016-10-22廖延娜马超

电子设计工程 2016年17期

关键词：训练样本字典识别率

廖延娜，马超

（1.西安邮电大学理学院，陕西西安710121；2.西安邮电大学电子工程学院，陕西西安710121）

基于稀疏表示的人脸识别系统设计与实现

廖延娜1，马超2

（1.西安邮电大学理学院，陕西西安710121；2.西安邮电大学电子工程学院，陕西西安710121）

针对人脸识别在实际应用中存在光照异常、姿态变化、遮挡、样本缺乏等情况，研究了结合主成分分析的稀疏表示人脸识别分类算法，设计并实现了人脸识别系统。系统依据训练字典对实时采集的人脸图像进行识别，并支持训练字典的实时更新。测试结果表明，在训练样本充分的情况下，系统对正面无表情人脸识别率在99%以上，满足正常人脸识别的使用需求；在训练样本不充分的情况下，识别率仍可以达到70%以上，可用于安防预警。

计算机图像处理；人脸识别；稀疏表示；主成分分析

人脸识别技术（Face Recognition，FR）［1］涵盖了生物技术和计算机技术，涉及到计算机图像处理、机器学习、模式识别、人体生理学和认知科学等多个技术领域［2］。人脸识别算法已经经历了长时间的研究，在图像背景简单、样本充分的情形下，大部分算法都能够对其进行高精度的识别。

在实际应用中，由于环境因素的异同，能否应对复杂情形下的人脸图像，成为目前检验各类算法的难题。基于弹性图匹配法的人脸识别算法［3］以同类人脸图像相似的拓扑结构为依据进行识别分类。但其处理过程中计算量较大，识别效率较缓慢［4］。基于3D模型的人脸识别算法［5］可以从单张人脸图像还原模型参数，并进行匹配识别。但对图像质量要求较高，应用范围较狭窄。基于遗传算法［6］的人脸识别算法可以高效地选取最优判别系数，但其对不同环境下的人脸特征提取差异较大［7］。因此，采用基于稀疏表示的分类算法（Sparse Representation based Classifier，SRC）［8-9］构建人脸识别系统。

1　结合主成分分析的稀疏表示分类算法

1.1算法原理

SRC的基本思想为：假设识别系统有足够多的样本，其中每一类的训练样本可以通过其自身的线性组合来表示同类的测试样本。将所有的训练样本组合在一起形成一个冗余字典，由于测试样本只可以被同属一类的训练样本表示，即只有与测试样本同类的训练样本系数有值，其它类训练样本的表示系数为零，因此系数向量是稀疏的。根据压缩感知理论［10］，采用稀疏重构算法对欠定方程进行求解，得到测试样本的稀疏表示系数，从而进行归类判别。

根据上述描述，可以将稀疏表示表达为y=Ax，其中，y是目标信号样本，A为训练样本空间，x为系数向量。x中只有少数值为非0元素，即是稀疏的，所以求解x可以转化为求x的l0范数，即：

‖x‖0表示x的l0范数，即x中非零元素的个数。求解l0范数是一个NP-hard问题，它的解极不稳定。在x是足够稀疏的条件下，可以将方程（1）转化为求解x的l1范数问题，即：

一般情况下，图像中有噪声存在，故需要考虑误差项，即y=Ax+e。则方程（2）转化为：

式（3）是一个凸优化问题，由于噪声等因素影响，x的非零元素会散布于多类间，使用系数重构误差的方法进行判断分类：

其中di是i与第类相关的系数。利用式（4）得到的最小误差，可以确定样本所属类别。

在求解y=Ax的过程中，需要对图像矩阵A进行降维处理，采用主成分分析法实现降维。主成分分析（Principal Component Analysis，PCA）［11-12］是将一个高维向量通过一个特征向量矩阵U，投影到一个低维的向量空间，虽然产生了数据的损失，但保留了决定性的主要信息。在人脸识别算法中，假设有N个训练样本，每个样本中所有的像素灰度值列为一个向量ai，从而构成训练样本集｛a1，a2，…，aN｝，其协方差矩阵为：

协方差矩阵C的特征向量ui及对应特征值λi组成人脸空间的正交基底。图像的主要信息聚集在特征值较大的特征向量中，将特征值按降序排列，取前d个特征值对应的特征向量为主成分，构成变换矩阵U=（u1，u2，…，ud），即人脸识别系统的字典，在此基础上求解稀疏向量。

1.2算法仿真

为测试稀疏表示算法的性能，在YaleB［13］，ORL［14］和AR［15］3个人脸数据库上进行了仿真实验，并记录测试数据，如表1所示。

其中YaleB包含数据有10类64张人脸图像；ORL数据集包含数据有40类10张人脸图像；AR数据包含数据有120类14张人脸图像，因其人脸种类较多，数据库较大，所以也是公认度较高的一种数据库。

测试时，在每一类人脸图像中进行随机标记作为训练样本，通过设置不同标记率观察识别算法的性能。

表1　算法在3种数据库上的识别率（%）

由表中数据可知，随着训练样本的增加，对人脸的识别率也在不断提升。同时，在标记率达到50%后，对各类人脸的识别率都达到90%以上，显示了其很好的鲁棒性。

2　人脸识别系统设计

设计的系统包括人脸数据库采集训练部分和识别检测部分，如图1所示。

图1　人脸识别系统结构

人脸数据库采集训练部分结合UI界面，通过摄像头拍照采集人脸图像，或从外界资源文件直接导入人脸图像，建立人脸数据库。训练部分支持人脸数据库的实时扩展和字典数据包更新，入库的人脸图像首先进行归一化作用的处理，包括彩色图像的灰度化，降噪处理。然后对图像库进行样本训练，生成人脸识别分类字典数据包。识别检测部分从监测摄像头返回的视频流中定位截取人脸图像，并进行预处理，然后根据已生成的人脸识别分类字典进行实时识别。两部分的软件流程如图2所示。

图2　系统软件流程

3　系统测试

3.1人脸类别对测试结果的影响

对所设计的系统，采集了多类人脸图像数据作为实验样本。

采集样本时，正常情况下会选择清晰度较高、面部基本对齐的正脸或小角度侧脸（小于30度）作为优质训练样本的原子，如图3（a）所示。在样本来源不可控的情况下，也有可能存在训练样本效果不理想，光线弱、成像模糊、侧脸过多等现象，如图3（b）所示。

图3　训练样本图片示例

考虑到实际情况的复杂性，选择A、B两类人脸图像作为测试样本的原子。A类为多种表情、小部分遮挡（即遮挡面积小于50%）的人脸，如图4（a）所示；B类为大角度侧面、大面积遮挡、光线昏暗等情况，如图4（b）所示。

图4　测试样本图片示例

文中将所采集到的多类人脸图像数据分为以下4种情况进行测试：

Test 1：优质训练样本+A类测试样本；

Test 2：优质训练样本+B类测试样本；

Test 3：恶劣训练样本+A类测试样本；

Test 4：恶劣训练样本+B类测试样本。

当每一类取不同的训练样本数进行训练得到字典时，识别测试统计结果如表2所示。

表2　在各类情况下的识别率（%）

由上表数据可知，Test 1中，即使在单训练样本条件下，对A类测试样本的识别率也高达90%以上；当训练样本数取到10时，识别率可达到99.64%，完全可以满足正常情况下的人脸识别要求。

Test 2中，当训练样本数增多时，对B类测试样本的识别率得到显著的提高，表明优质的训练样本生成的分类字典，对恶劣测试样本良好的包容性。

Test 3和Test 4中，恶劣训练样本使特征提取不明显，导致对A类和B类测试样本识别率均较低，不过此时增加训练样本的数量，也可以较大程度的提高识别率，当训练样本数为10时，识别率可达70%以上，这一结果表明，在训练样本质量较差的特殊需求中，如安防预警等，该系统有一定使用价值。

3.2训练样本数目对测试结果的影响

为得到最佳训练样本数目，在采集建立人脸数据库基础上，进行了不同个数的训练样本对识别率影响的测试，测试结果如图5所示。

图5中，折线1表示不同数目的优质训练生成的字典对各类测试样本的识别率；折线2表示不同数目的恶劣训练生成的字典对各类测试样本的识别率。由图可见，随着训练样本数目的增加，两种情况的识别率都得到了显著提高。当优质训练样本数目达到10以后，识别率达99%以上；对于劣质训练样本，当训练样本数小于8时，由于样本质量情况不稳定，增幅差异较大，达到9张之后，识别率平稳增长。

图5　不同训练样本数对识别率的影响

4　结束语

研究并采用基于稀疏表示的识别算法设计并实现了人脸识别系统，系统可在动态视频流中实时截取图像进行识别。通过实际采集样本测试，在训练样本充分时，系统对测试人脸样本的小角度侧面、多表情、小部分遮挡等情况下的识别率在99%以上，可满足正常情况下的人脸识别需求，如门禁考勤、身份识别等应用场合。同时，系统对于恶劣的训练样本和测试样本有较好的包容性，在安防预警等特殊应用场合有一定的使用价值。后续可引入多人脸定位算法，将应用扩大到等更多场合。

［1］张会森，王映辉.人脸识别技术［J］.计算机工程与设计，2006，27（11）:1923-1928.

［2］韩增锟.基于人脸识别技术的考生身份验证系统的设计与实现［J］.计算机与数字工程，2012（1）:148-150.

［3］俞燕，李正明.基于特征的弹性图匹配人脸识别算法改进［J］.计算机工程，2011（5）:216-218.

［4］孙大瑞，吴乐南.基于特征的弹性图匹配人脸识别算法［J］.应用科学学报，2002，20（4）:377-381.

［5］肖云.基于3D人脸识别研究的探索［J］.电脑知识与技术，2011，7（9）:2136-2137.

［6］阴亚芳，张婧琪，廖延娜.小生境遗传算法在多车牌定位中的应用［J］.西安邮电大学学报，2015，20（1）:40-43.

［7］倪红霞，朱启伟.基于遗传算法的人脸识别系统设计［J］.杭州电子科技大学学报，2010，30（4）:45-49.

［8］阴亚芳，李倩，廖延娜.基于低秩矩阵分解和协作表示的人脸图像分类［J］.西安邮电大学学报，2015（1）:70-74.

［9］Wright J，Yang Allen，Ganesh A，et al.Robust face recognition via sparse representation［J］.IEEE Transations on Parttern Analysis and Machine Intelligence，2009，31（2）: 210-227.

［10］王小刚，田小平，吴成茂.基于压缩感知的图像快速重构去噪算法［J］.西安邮电学院学报，2012（4）:11-14，20.

［11］余付平，冯有前，范成礼，等.基于主成分分析的字典学习［J］.控制与决策，2013（7）:1109-1112.

［12］陈佩.主成分分析法研究及其在特征提取中的应用［D］.西安：陕西师范大学，2014.

［13］LEE K C，HO J，Kriegman D.Acquiring linear subspaces for face recognition under variable lighting［J］.IEEE Trans.Pattern Analysis and Machine Intelligence，2005，27（5）: 684-698.

［14］陈丹，王国胤，龚勋，等.一种适用于人脸检测的自适应光照补偿方法［J］.计算机工程与应用，2012，48（22）: 175-178.

［15］Martinez A.Benavente R.The AR face database［R］.CVC Tech.Report，1998.

The design and implementation of face recognition system based on sparse representation

LIAO Yan-na1，MA Chao2
（1.School of Science，Xi'an University of Posts and Telecommunications，Xi'an 710121，China；2.School of Electronic Engineering，Xi'an University of Posts and Telecommunications，Xi'an 710121，China）

In order to solve the situations of abnormal light，attitude change，obscured，samples lack in actual application of human face recognition system，the recognition algorithm based on sparse representation combined with principal component analysis is studied.A human face recognition system is designed to realize real time face image recognition in real time according to training dictionary，and the training dictionary can be updated real time.According to the test results，when the training samples are adequate end the face images are expressionless，frontal，the rate of system identification over 99%，meetting the demand of normal use of face recognition.when the training samples are not adequate，the rate over 70%，can be used in the security warning.

computer image processing；sparse representation；face recognition；principal component analysis

TN911.73

1674－6236（2016）17-0153-03

2016-01-14稿件编号：201601106

陕西省教育厅专项科研计划项目（12JK0559）；陕西省自然科学基础研究计划项目（2014JM2-6117）

廖延娜（1974—），女，安徽怀远人，硕士，副教授。研究方向：电路与系统及信号与信息处理研究。