非受控场景下的二维人脸识别研究
2017-11-30闫月影北京城市学院
闫月影 北京城市学院
非受控场景下的二维人脸识别研究
闫月影 北京城市学院
近年来,人脸识别是生物特征识别、计算机视觉等领域研究的热点课题之一。人脸识别按照测试数据类型可以分为受控场景人脸识别和非受控场景人脸识别。在受控的场景下,人脸识别技术已经达到了令人满意的效果。然而在实际的应用过程中,由于光照变化、姿态变化、遮挡和表情变化等一系列非可控因素的影响,可能导致非受控场景下的人脸图像类内变化远大于类间变化,使得人脸识别的性能急剧下降,无法满足实际应用的需求。因此,本文将针对非受控场景中的人脸识别问题展开深入研究与分析,针对其中的关键问题和难点,提出相应的解决办法。本课题针对非受控人脸识别问题中的各类干扰因素以及“数据缺失”现象,对人脸识别算法进行了研究和设计。针对非受控人脸识别中各类干扰因素的影响,本文设计出一种改进的卷积神经网络(CNN)进行人脸识别工作。该CNN模型具有多个隐藏层,通过逐层提取特征的方式,能够很好地消除非受控状态下人脸识别问题中各种复杂干扰的影响。
人脸识别 非受控 卷积神经网络
1 引言
随着电子商务(Electronic Commerce)在世界范围内的迅速发展,在Internet等开放式网络中进行电子交易等商务活动逐渐步入公众的视野。然而,网络上存在着一些敏感的个人信息,这些个人信息通过授权后才能允许访问,因此作为网络安全的一个关键问题,身份鉴别引起越来越多的关注。传统的身份验证方式包括用户口令、用户账号、身份证和智能卡等,但是,随着信息技术的不断发展,这些传统的身份认证方式变得不再安全。例如一些网络黑客会通过网络窃取用户个人信息,给网络用户带来巨大的损失,解决这一问题迫在眉睫。生物特征识别技术是指计算机利用人体生物特征进行身份识别或个体验证的一种技术。与传统身份验证方式相比,生物特征识别技术具有其独特的属性(生物特征通常具有唯一性),因此能够在一定程度上解决这一问题。
人脸识别技术由于其直接、友好等特性,易于为用户所接受,逐渐在众多生物识别技术(视网膜识别、声音识别、指纹识别等)中脱颖而出。人脸识别技术是通过计算机分析人脸图像,利用特殊方法提取人脸中有效的识别信息,进行身份验证的一门技术。
人脸识别按照测试数据类型可分为受控场景人脸识别和非受控场景人脸识别。非受控场景下的人脸识别是指使用在个体不被告知或不被打扰的情况下获得的图像进行身份识别。与注册图像相比,测试图像会存在人脸局部遮挡、姿态变化、光照变化、表情变化、化妆甚至成像质量下降等一个或多个情况,这给人脸识别带来了巨大挑战。因此,本文通过分析非受控状态下人脸识别过程中可能遇到的各种问题,给出相应的解决策略。
2 非受控状态下的人脸识别
2.1 人脸识别系统
人脸识别属于图像识别的一种,其大致工作过程如下:首先输入需要进行身份识别的人脸图像,经过预处理和特征提取等步骤逐渐减少数据量,并得到特征向量。然后将提取到的特征向量与样本特征库中的特征进行比较,输出识别结果。输入的图像可以使二维平面图像或含有丰富人脸信息的三维点云数据。一个人脸识别系统通常有两种模式,人脸认证模式和人脸识别模式。人脸认证模式下进行的是一对一的处理,将输入人脸图像提取出的特征与已经获得分类信息的图像进行特征匹配,通过对比输入图像的特征与样本库中的特征判断是否具有相同身份。人脸识别模式下进行一对多处理,将输入图像的特征与有标签数据集中的所有对象分别进行匹配,找出与之匹配程度最高的一个对象,从而识别出输入图像的身份。图2-1显示了人脸识别的过程。
图2-1 人脸识别过程
2.2 非受控状态下的人脸识别问题分析
在实际应用过程中,人脸识别系统的性能往往会受到各类综合因素的影响,例如光照变化、姿态变化、面部表情、年龄跨度、面部遮挡等。人脸识别可以分为两大类:合作情况(受控状态)与非合作情况(非受控状态)。
合作的情况主要有以下这些应用:安全检查系统、计算机登录和电子护照等。在这种情况下,用户愿意主动配合,并以要求的方式(如中性表情、眼睛睁开的正面姿势)来表现他们的人脸以获得访问权限或通过检查。在非合作的情况下,例如视频监控中,用户可能并不知道到他们正在被监控。同时通常在用户主动配合的情况下,如计算机登录等,距离一般少于1米,这样的人脸识别问题相对来说是比较简单的。而非合作情况下的应用一般距离都较远,如视频监控识别等,非常富有挑战性。
虽然非受控状态下的人脸识别比受控状态下的识别难度大,但显然非受控状态下的人脸识别应用范围更加广泛。
近年来,虽然人脸识别技术由于其友好性和非打扰等优势,逐渐被广泛应用在各个领域。同时,在应用过程中它的很多缺陷与问题也逐渐突显出来,成为其进一步发展的阻碍,主要表现在以下几个方面:
①光照变化。在实际应用中,受到外界的光照干扰等因素影响,会导致拍摄到的人脸图像部分区域出现过亮或过暗现象,严重者可能导致人脸特征完全消失,给预处理等过程带来极大的不便。由于在非受控状态下,光照条件保持稳定是完全不可能实现的,目前众多人脸识别方法都对光照条件有一定的要求,因此光照是人脸识别技术需要克服的最大技术难题之一。
②姿态变化。这里的姿态变化是指人脸相对于摄像机的视角发生变化,这也是一个会对人脸识别系统的性能产生极大影响的因素。当同一身份的人脸头部发生姿态变化时(旋转或倾斜),人脸特征会随之发生较大变化。同时,在实际应用中,大部分情况下被识别者的动作是非受控的,这就会导致人脸发生大姿态变化,有可能只能采集到小部分人脸,给人脸识别带来极大的困难。因此,提高识别系统对人脸姿态的鲁棒性也是人脸识别中的挑战之一。
③表情变化。人脸由于人类发达的面部肌肉可以做出各种丰富的表情。人脸表情的变化会引起人脸几何形状及面部特征的变化,同时引起采集的二维人脸图像发生变化,对人脸识别系统的性能产生干扰。因此,即便是身份相同的人,在表情变化的影响下,人脸特征会发生极大变化,使人脸识别算法难以提取有效识别特征,影响人脸识别算法的性能。
④有无遮挡。人脸面部可能存在眼镜、胡须、帽子、围巾等遮挡物。尤其是当这些遮挡物的面积过大或遮挡住了人脸的关键部位时,会对人脸识别系统产生影响,导致系统难以获得足够的人脸特征而发生漏判或错判,导致识别率的下降。
⑤非人脸和类肤色干扰。在非受控状态下的人脸图像采集中,背景中有时会存在和肤色类似的像素,同时人脸附近也可能存在有非人脸肤色部分,导致人脸图像的肤色区域难以分离出来,导致人脸识别系统无法检测出准确的人脸位置和区域而发生错误,致使识别率下降。
⑥其他因素。除了以上几种常见因素之外,非受控状态下的人脸识别还存在大量干扰因素:年龄跨度导致人脸特征发生变化;人脸采集设备(如噪声、曝光不足、模糊等)会对拍摄到的人脸图像产生不同的影响。因此要解决如此多复杂因素的影响,就必须设计出鲁棒性更强,人脸识别准确率更高的人脸识别方法。
2.3 深度卷积网络
2.3.1 卷积神经网络结构
卷积神经网络是一种结构特殊的神经网络,包含输入层、输出层和隐藏层等各层,每一层由若干二维平面构成,而每个二维平面由众多独立的神经元组成。通常第一层为输入层,而与它直接连接的是特征提取层C,而与C层连接的则是特征映射层S。网络中最重要的部分就是中间的隐藏层,包括卷积层和下采样层。其中卷积层是由抗形变的C元聚合而成,而下采样层则由S元构成(承担特征提取工作)。输入层的所有局部感受野都与C层中的每一个神经元相连接,用来提取输入层的局部特征。首先将样本图像输入卷积层进行卷积(卷积层中包含滤波器),这个滤波器可以添加偏置并且可以训练,卷积后在C1层产生n个特征映射图。接下来对这些特征映射图进行分组求和加权以及偏置。接着通过Sigmoid等激活函数得到S2层的n个特征映射图。最后循环执行以上过程(循环次数人为设定),最后一个下采样层与输出层全连接,得到最终输出结果。
2.3.2 卷积神经网络在非受控人脸识别上的优势
卷积神经网络采用局部感知野、权值共享以及多个滤波器等方法综合在一起,因此具有网络结构简单、训练参数较少和适应性强等特点。卷积神经网络的特殊结构避免了传统算法中复杂的特征提取和特征重建过程,在训练过程中能够并行进行特征提取和模式分类。
卷积神经网络可以分层提取特征,然后再进行人脸验证工作,这种结构显然能够解决解决非受控状态下的人脸识别问题。因为无论对于具有相似干扰(遮挡部位)的图像还是具有不同干扰的图像,通过卷积神经网络的分层特征提取都可以解决。
正是卷积神经网络的这种特殊结构,它才可以完全解决非受控问题中诸如姿态变化、光照变化、表情变化、遮挡、旋转和尺度变换等综合干扰因素的影响以及大姿态、大范围遮挡下的“数据缺失”问题。
3 结论
卷积神经网络是人工神经网络与深度学习思想结合的产物,具有层次结构化、局部感知区域、特征提取和分类过程结合的全局训练等特点。研究表明,CNN网络通过多层非线性映射,能够很好地解决姿态变化、光照变化、表情变化、遮挡、旋转和尺度变换等综合干扰影响对人脸识别工作的影响。
[1]Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J].Science,2006, 313(5786): 504-507.
[2]Belhumeur P N. Ongoing Challenges in Face Recognition. Frontiers of Engineering: Reports on Leading-Edge Engineering from the 2005 Symposium[R], New York USA, 2005: 5-14.
闫月影,女,北京市,汉,本科,北京城市学院,助教,研究方向:计算机科学与技术。