人脸识别技术概述与展望
2018-12-17谢奕樊山东师范大学附属中学幸福柳
谢奕樊 山东师范大学附属中学(幸福柳)
引言
19世纪80年代末,在《Nature》上Galton第一次系统介绍了人脸识别,是已知的最早的关于人脸识别的文章。然而,人脸识别技术经过100多年的发展,在20世纪80年代后进入才初级应用阶段。随后,特别是近十几年,人脸识别技术进入蓬勃发展期,目前在身份识别、门禁、侦查等方面有着广泛而重要的应用。
1 人脸识别的发展趋势
图1 Web of science人脸识别每年发表文章
在Web of science上,对人脸识别进行文献检索,检索结果如图1所示,可以看到计算机领域人脸识别每年发表的文章数目逐年递增,有越来越多的人进行相关研究,是研究的热门领域。
图2 据根据IBG发布的全球生物识别市场规模推算资料(IBG前瞻产业研究院整理)
人脸识别的市场:根据公开文献资料,2009-2016年全球人脸识别行业市场规模发展趋势(单位:百万美元) 如图2所示,可以看到人脸识别市场份额由2009年390亿增长到2016年2653亿,增长为原来6倍之多,市场份额越来愈大,具有很大的应用前景。
2 人脸识别的方式
图3是人脸的识别的过程,包含图像获取,预处理,特征提取,分类识别等四步。
图3 人脸识别的过程
3 人脸识别的技术方案
3.1 基于全局特征的人脸识别
此类方法,将一张脸像表达为一个像素矩阵,这个矩阵通常被转换成像素矢量。尽管这些方法很容易实现,但是它们对变化(姿势、灯光、面部表情和方向)很敏感,影响识别的准确率。将该类技术可以进一步划分为线性和非线性的技术。
3.1.1 线性技术
这些方法将输入的一个大空间图像数据线性投影到一个区域相对较小的空间(子空间)。然而,该方法对脸部/非脸部形态进行分类时,并不是很有效。
特征脸算法:这是一种非常流行的面部识别方法,是基于PCA的技术(主成分分析)。给定一组样本图像,本质上是找到这些面孔的主要组成部分,确定协方差矩阵的特征向量,然后将其描述为特征向量的线性组合。
2D PCA:为了避免将图像转换为向量时丢失信息,二维PCA接受的是输入图像而不是矢量。
独立元分析法(ICA):这是一种主要用于信号处理的方法。
多维标度法(MDS):该方法在投影中并不保存数据的方差,而是保存所有数据之间的距离,进而通过特征值分解寻找一个最小化的线性变换。
非负矩阵分解法(NMF):非负矩阵分解是一种不使用类概念表示面的方法。NMF在基向量组合权重中不允许包含负元素。
线性判别分析法(LDA):LDA,也叫做“Fisher线性判别”,是最广泛使用的人脸识别方法之一。包括两步:PCA减小原始空间和得到最终投影空间的向量。
独立高强Gabor小波法:从正面图像的Gabor小波变换中提取出高强度特征向量以提高人脸识别精度。Gabor小波被认为是最好的人脸识别方法之一。
3.1.2 非线性技术
当输入数据结构是线性时,线性方法可以得到数据稀疏的真实表达。然而,当数据是非线性的,需使用核函数的来构建一个大的空间,在这个空间中,将问题变成线性的。在此背景下,提出了几种非线性方法:
核主成分分析(KPCA):KPCA是使用核函数对经典的线性技术PCA进行非线性重构。由于KPCA技术是基于“内核”的,内核矩阵的大小与样本数量的平方成正比,因此训练样本困难。
支持向量机(SVM):该方法在不需要更多知识的情况下,具有高泛化性能识别的学习技术,可以更好地减少图像的大小。然而,尽管该方法经常在某些特定的测试中提高识别率,但是却无法像线性方法一样保持足够的可靠性。
4 基于局部的人脸识别方法
4.1 基于兴趣点的人脸识别方法
该方法首先提取特定的几何特征,比如头部的宽度,眼睛之间的距离等等。然后,这些数据将成为“分类器”识别个体的入口。
弹性图匹配法(EBGM):这是DLA方法的扩展,其图像节点位于脸部的一些选定点上。
几何特征向量法:该技术使用训练集来检测眼睛的位置,首先计算待测图像和训练集之间的相关系数,然后搜索得到最大值。
人脸统计模型法:该方法使用许多特定检测器去检测人脸各部分特征,如眼睛,鼻子,嘴巴等。
4.2 基于局部外观的人脸识别方法
该类技术,在局部区域定义好后,对于人脸识别系统的性能是至关重要的就是找到代表该区域信息的最佳方式。常用的方法有:Gabor系数法,哈儿小波法,傅里叶变换法,尺度不变特征变换法(SIFT),局部二值模式法(LBP),局部相位量化法(LPQ),韦伯定律描述符(WLD)等。
与全局方法相比,局部方法具有一定的优势。一是可以提供基于局部区域的附加信息,二是对于每种类型的局部特征,可以选择最合适的分类器。
4.3 基于统计模型的混合方法
该方法同时使用全局和局部统计以结合二者的优势。
隐马尔可夫模型(HMM):在人脸识别中,该方法对于重要的面部区域(头发、前额、眉毛、眼睛、鼻子、嘴和下巴),会从上到下排列成自然的顺序。
基于伪隐马尔可夫模型的Gabor变换(GWT-PHMM):该方法可以结合Gabor小波变换(GWT)的多分辨率能力和伪隐藏马尔科夫模型的局部交互二者的优势。
在HMM使用PCA和离散余弦变换(DCT)的识别系统:不使用DCT,直接使用PCA降低维度。
HMM-LBP:这是一种被称为HMM-LBP的混合方法,允许通过使用LBP工具对人脸图像进行来进行特征提取。
此外,还有GARG(高斯分布黎曼流形判别分析),HMMSVM-SVD,SIFT-2D-PCA,小波变换和定向LBP等方法可以实现人脸识别。
5 结论
尽管在人脸识别领域取得了很高的成功率,但仍然存在两个主要的未解决的问题,即照明和姿势的变化。为了克服这两个问题,提供更精确的面部形状信息,出现了更多新技术,例如3D人脸识别,深层神经网络(DNNs),红外(IR)成像等都取得了重大成功。在未来,人脸识别的难点,诸如数据采集免干扰、远距离识别、3D细节构建、环境设别光照、多姿态人脸识别、表情变化、人的老化、饰物或者遮挡、肤色变化等也必然被进一步克服。