人脸识别技术的概述及发展历程
2020-09-10朱承斐
朱承斐
本文主要介绍人脸识别技术发展的几大时期与主要方法,以及应用的几大新型领域,最后对其安全性提出一点考量。
人脸识别;人脸识别方法
1引言
人脸识别是指通过对人脸视觉特征信息进行分析以此完成人脸鉴别的一种计算机技术。同时也是一种生物识别技术。通过结合计算机数字图像处理技术与生物统计学的相关原理,构建包括人脸采集、人脸定位、人脸识别预处理、人脸查找、人脸匹配等一系列技术在内的人脸识别系统。
近年来人工智能、机器学习、深度学习等相关领域大放异彩,人脸识别作为一种能够通过计算机来鉴别人脸和身份的一种工具已经渗透我们生活的方方面面,如智能门锁,智能手机人脸解锁,小区门禁,智能考勤,高铁刷脸检票等。各领域对于人脸识别技术的广泛应用也在不断使这项技术日益完善并趋于成熟。与此同时这项技术也在向更多的领域推进。如:
(1)基于人臉识别的快速公交云支付系统
用户通过在手机端下载APP完成人脸身份认证,录入人脸识别的人脸库中,绑定自己的ID。直接刷脸乘车,解决需随时携带公交卡或者现金所带来的不便。
(2)税收征管“天眼”
税收部门在前台受理端通过有关设备完成人脸采集工作, 在后台分析端组建人脸管理系统完成人脸大数据分析工作, 实现以人为核心的新型税源管理模式。做到税源监控到个人,风险管理对象到个人。
(3)人脸识别电视
通过电视机上所携带的摄像头完成人脸识别并进行后台大数据分析,准确识别用户人物的相关属性, 对用户性别和年龄进行分析,获取用户的浏览内容及使用习惯,通过用户的喜好来推送节目内容,做到一用户一推送,满足用户之间的差异化、个性化,提高用户的体验感及舒适感。
2人脸识别算法的三大模块:
在2014年DeepFace提出的人脸识别模型中将人脸识别的过程大致分为四个阶段。包括人脸检测、人脸对齐、人脸表征、人脸分类。
2.1人脸检测:
人脸检测是通过明确输入的图像或视频流中人脸所在的位置、大小和姿态以解决人脸在哪的问题。在不受图像尺寸,人物姿势及面部表情等因素的影响的情况下,从图像中提取人脸并做相关的人脸对齐工作,为后续的特征分析与人脸识别做准备工作。
2.2人脸对齐:
人脸的可活动性及摄像头的固定性使得同一张人脸在图像中会有不同的角度以及表情,不会每一张都是标准的证件照,因此会对识别精度造成误差。人脸对齐的工作就是将图像中检测到的人脸通过旋转缩放等变换达到证件照效果的过程。其过程是通过对眼睛、鼻尖、嘴角、脸的轮廓点等人脸特征关键点进行仿射变换来达到理想效果。
2.3人脸特征表征:
人脸特征表征是通过将带识别的人脸图像载入神经网络,得到具有特定维数的特征向量来完成对人脸的识别工作。该特征向量由人脸区域特征的差异性和区分度来生成,如鼻子和嘴巴所表示的特征的不一致性。以此来增大不同人脸特征的特征向量之间的差异性。得出的差异度最小的特征向量即为所识别的人脸。在DeepFace算法中采用了5个卷积层、1个最大池化层、1个全连接层来进行人脸的表征,如下图所示:
3人脸识别的发展历程及主要方法:
3.1起源阶段:
20世纪50年代美国心理学家J.S.Bruner发表“The perception of people”从感知和心理学的角度开始了对人脸识别的探索。20世纪60年代Bledsoe 发表了关于工程学的“Facial Recognition Project Report”,选取人脸特征信息点之间的间距,比率等数据信息作为判别依据建立了第一个半自动的人脸识别系统。
3.2早期算法阶段
3.2.1基于模板匹配的人脸识别方法:
模板匹配的原理是先建立一个人脸模板库,提取输入人脸的特征信息进而构成特征向量,再与人脸模板库中的人脸特征向量进行向量之间的距离计算,可通过最小距离法进行判别。距离最小的则将识别的人脸归类为模板库中的人脸。此方法利用了所选取的人脸特征区域的全局信息,因此带来了特征向量之间计算的时耗。
模板匹配分为静态模板匹配和弹性模板匹配两大类。静态模板匹配是将待识别人脸与模板库中的模板人脸灰度图像或局部灰度图像进行自相关性计算,但极大的受人脸表情和姿态影响,识别准确度较低。弹性模板匹配则是将人脸看作是带标号的拓扑图,将拓扑图与模板库中的模板图进行特征向量匹配,找出匹配度最高的模板人脸,则将待识别的图像人脸归入该类模板人脸。特征向量由人脸特征节点构成。
3.2.2基于几何特征的人脸识别方法:
最早的几何特征人脸识别是通过提取人脸的侧脸轮廓特征点形成轮廓曲线,确定轮廓基准点对轮廓曲线进行比对来完成人脸的识别。但图像人脸一般为正脸故应用较少。主流的基于几何特征的人脸识别方法的主要思想是通过分析人脸五官的形状和分布结构所具有的规律性。对其进行几何描述,计算五官之间的距离、角度、比值等作为特征信息来完成对人脸的识别。基于几何特征的人脸识别方法具有较好的光照不敏感性,但对于人脸表情和姿态变化的鲁棒性则较差。
Poggio和B runelli于1993年对基于几何特征的人脸识别方法和基于模板匹配的人脸识别方法进行了比较并得出各自的优缺性同时发表论文“features versus templates”。
3.2.3基于子空间的人脸识别方法
基于子空间的人脸识别算法把人脸图像描述为一个高维的向量,将该高维向量通过投影的方式投影到低维空间中,投影后的低维向量在子空间中更加紧凑,也更为方便描述同时也降低了计算度,能够达到比较良好的区分度。
经典的子空间识别算法有主成分分析和线性判别分析。主成分分析的核心是保留投影后的关键信息,在尽可能多的保留关键信息的前提下降低数据的冗余度,为后续的识别提供便利。线性判别分析的核心是使得不同类间的差异尽可能大,同类之间的差异尽可能小。从而使得同类人脸投影后聚集緊凑,不同类人脸分散。主成分分析和线性判别分析目前都有较为成熟的基于特征举证和特征向量的算法。其他基于子空间的方法还包括ICA(独立元分析)、NMF(非负矩阵因子)、以及基于核的非线性子空间分析方法有KPCA(核主元分析)和KFDA(核判决分析)等。
3.2.4基于隐马尔可夫模型(HMM)的人脸识别方法
基于隐马尔科夫模型的人脸识别方法首先完成对人脸图像的观察向量提取,再通过HMM训练得到相关的人脸HMM数据库。将待识别的人脸输入HMM训练网络得到相应的HMM参数,与数据库中的参数进行相似度比对,输出匹配概率最高项。目前能较好地进行人脸观察向量提取方法有:(1)直接用图像像素灰度值做观察向量,(2)使用二维离散余弦变换的变换系数做观察向量。
马尔可夫模型是对马尔科夫过程的模型化,由五个状态描述,可表示为: λ = ( N,M,π,A,B) 。通过设置马尔科夫链A的N个状态以及每个状态相应的观察数目M,通过一个随机过程得到一个观察值序列B。通过得到的观察值序列来感知相关的特征。基于隐马尔可夫的人脸识别算法对于人脸五官特征及特征之间的相互联系有充分考量,对于人脸的表情及姿态等的变化具有好的鲁棒性。
3.2.5人工特征+分类器的方法
目前常用的较为成熟分类器有朴素贝叶斯、支持向量机、逻辑回归、人工神经网络、决策树等。所以此阶段的重点是在于人工特征的设计工作,以便于能够将不同的人识别出来。
将描述图像的HOG特征,Gabor特征,LBP特征,SIFT特征应用于人脸识别领域是一大创举。其中的典型代表是LBP特征即局部二值模式,特征简单有效。LBP特征计算能够解决光照敏感问题,姿态和表情问题。
3.2.6深度学习的方法
自2012年ILSVRC-2012,卷积神经网络在图像分类领域显示出了巨大的威力,其使用效果明显优于人工设计的特征+分类器的方案,使得深度学习方法大放异彩。卷积神经网络通过学习海量的人脸图片提取人脸的特征向量,替代人工设计的特征。卷积神经网络模型的发展前期侧重于网络结构和数据集的设计,后期主要着重于对于损失函数的优化,提高网络的精确率。自此奠定了深度学习在人脸识别领域举足轻重的地位。
2014年Facebook提出DeepFace,成为深度卷积神经网络在人脸识别领域的奠基之作。该方法在LFW数据集上获得97.35%的准确率。
随后,Google提出FaceNet方法,使用三元损失函数完成对损失函数的改进,该方法在LFW数据集上获得了99.63%的准确率。
香港中文大学唐晓鸥团队提出DeepID方法,同时不断进行改进,又提出了DeepID2,DeepID3。均是卷积神经网络在人脸识别领域的经典方法。
4人脸识别的安全性考量
人脸识别作为一种人体身份认证的工具,其高效快捷,低成本的性能使其在安全領域(公共安全、信息安全、金融等)得到了广泛应用,如门锁,手机的访问控制,刑事侦查的视频监控等。但又由于人脸的易复制性,出现了许多针对人脸认证的攻击手段,如人脸照片攻击,人脸视频回放攻击,及三维人脸攻击等。
为了有效的预防并阻断这些攻击手段,我们有必要在人脸识别时加入人脸活体检测技术。人脸活体检测是为了检测人脸图像是否为活体,进而判断是否为人为攻击。人脸活体检测分为两大类,一类是基于描述子的分析方法,纹理、运动、形状、频率、颜色等均可以作为描述子来对活体与非活体图像进行区分。一类是分类器的方法,通过对大量的活体图像和非活体图像进行训练,得到一个活体的判别模型。
参考文献
[1]R Brunelli,T Poggio.Face recognition:features versus templates [J].IEEE Trans.PAMI,1993,15(10):1042-1052.
[2]Matthew Turk,Alex Pentland. Eigenfaces for recognition. 1991, Journal of Cognitive Neuroscience.
[3] Eigenfaces vs. Fisherfaces: recognition using class specific linear projection. Peter N Belhumeur J P Hespanha David Kriegman. 1997 IEEE Transactions on Pattern Analysis and Machine Intelligence.
[4] Dong Chen, Xudong Cao, Liwei Wang, Fang Wen, Jian Sun. Bayesian face revisited: a joint formulation. 2012, european conference on computer vision.
[5]Timo Ahonen, Abdenour Hadid, Matti Pietikainen. Face Description with Local Binary Patterns: Application to Face Recognition. 2006,IEEE Transactions on Pattern Analysis and Machine Intelligence.
[6]王岩青.“人脸识别”打造税收征管“天眼”[J].中国税务,2018(12):74.
[7]熊志勇,沈理.基于本征特征的弹性模板匹配法[J].计算机研究与发展,1999(07):109-114.
[8]赵丹. 基于几何特征的人脸识别方法研究[D].河北工业大学,2015.
[9]谢振东,蔡梓超,顾裕波,邹大毕.基于人脸识别的快速公交云支付系统的构建[J].电子技术与软件工程,2019(22):144-145.
[10]龚锐,丁胜,章超华,苏浩.基于深度学习的轻量级和多姿态人脸识别方法[J/OL].计算机应用:1-7[2020-02-10].http://kns.cnki.net/kcms/detail/51.1307.TP.20191025.1649.018.html.
[11]杨巨成,代翔子,韩书杰,毛磊,王嫄.人脸识别活体检测综述[J/OL].天津科技大学学报:1-10[2020-02-10].http://kns.cnki.net/kcms/detail/12.1355.N.20191219.1130.006.html.
[12]余龙华,王宏,钟洪声.基于隐马尔科夫模型的人脸识别[J].计算机技术与发展,2012,22(02):25-28.
[13]瓦佳.康佳发布智能“人脸识别”电视[J].电器,2019(01):58.
[14]邹金花.人脸识别技术的研究与应用[J].电脑知识与技术,2019,15(28):199-200.
[15]祝秀萍,吴学毅,刘文峰.人脸识别综述与展望[J].计算机与信息技术,2008(04):53-56.
[16]田启川,王满丽.深度学习算法研究进展[J].计算机工程与应用,2019,55(22):25-33.
[17]刘青山,卢汉清,马颂德.综述人脸识别中的子空间方法[J].自动化学报,2003(06):900-911.
[18]蒋阿娟,张文娟.人脸识别综述[J].电脑知识与技术,2019,15(02):173-174+190.