APP下载

人脸识别技术分类比较

2021-04-04黄兴晗杜小甫刘沂杰

电子测试 2021年17期
关键词:人脸人脸识别卷积

黄兴晗,杜小甫,刘沂杰

(厦门大学嘉庚学院信息科学与技术学院,福建漳州,363105)

0 引言

人脸识别技术是指利用计算机技术对人脸图像进行分析,进而实现身份识别与验证的身份检测技术。现今人脸识别技术有两种主要的研究方向:以人工设计的特征检测为主的非深度学习方法,以及近年来发展成熟的基于深度学习卷积神经网络的人脸识别方法。

1 传统非深度学习方法

1.1 基于几何特征的方法

基于几何特征的方法是传统方法,在该方法中认为人脸由各部分器官组成,而各部分器官又有许多相应的特征点,因此能够通过所有特征点的几何特征的集合来进行判断与分析。

Yang等人指出人脸是一个复杂的图案,在场景中自动发现人脸是一个困难但重要的问题。然后提出了一种复杂背景下人脸定位的新方法。该方法采用基于知识的分层方法,由三个层次组成:较高的两层是基于不同分辨率的马赛克图像;最低一层上提出了一种改进的边缘检测方法。最后该方法能够在复杂的黑白图像中定位大范围的未知人脸。后来卢春雨等人改进了这种方法,基于区域特征思想提出一种新的人脸识别快速方法,比Yang的方法快很多,适用性也更强。

章品正等人,针对复杂背景中人脸检测的受影响问题,提出了一种新方法。该方法首先通过预处理,将光照变化带来的影响降低。然后通过多种划分分辨率,对人脸图案设置不同检测规则,经过多种不同分辨率的检测对比,以提高检测准确度。然后对检测结果进行进一步验算,使用最小同值分割吸收核区,这种方法具有非常优秀的抗干扰能力。最终对复杂背景中,具有较高噪声的人脸输入进行识别,结果证明具有较好的准确率和抗干扰效果。

1.2 基于特征脸的方法

所谓基于特征脸的方法,首先给出了特征脸的定义。特征脸指的是利用一组规范化的人脸图像来构造数学模型,将人脸图像公有的像素空间特征进行总结,得到的一组标准数据。然后再识别未知图像时,将未知图像的像素信息投射到前面的模型中,得到相似度的数值。数值高于某个阈值时,认为输入的是人脸图像,否则认为输入的不是。根据最后的比较过程中所使用的的方法不同,可以将前人工作划分为几种不同算法。特征脸是一种典型的主成分分析方法。

Shatnawi等人为了解决嵌入式系统中对人脸识别的实时性要求,提出了对人脸识别的准确度和所需计算量进行衡量,找到最优的平衡。具体研究了3中不同的距离测量方法。即:欧几里德距离,街区城市距离,和国际象棋距离。试验结果表明,可以找出最优的特征脸的数目,可以提供在可接受的执行时间内的最高识别率。此外,特征脸的最佳数目很大程度上取决于所选择的距离度量。Rosnelly等人针对笔记本电脑摄像头的人脸识别算法进行了研究,该方法是基于特征脸技术的。通过摄像头获取320 x 240和100 x 100两种分辨率的人脸图像,进行特征比对,进行身份识别。然后通过表情捕捉,左右倾斜等动作要求,来进行生物信息识别,判断输入的是活体生物信息而不是静态图像。Hu等人提出了一种全新的人脸识别方法,将人脸图像的增强双树复小波变换(ADT-CWT)表示与正则化邻域投影判别分析(RNPDA)方法相结合。ADT-CWT首先通过空间频率、空间局域性和方向选择性来获取人脸特征,以应对光照和面部表情的变化。然后采用RNPDA进一步降低了ADT-CWT特征的求导维数,通过简单的回归框架直接得到一组最优特征向量,从而克服了NPDA样本量小的问题。在FERET数据库、扩展YALEB数据库和CMU PIE数据库上进行了大量实验,比较了该方法与一些流行的降维方法的识别性能。实验结果验证了该方法的有效性。

1.3 基于统计理论的方法

此外,基于统计理论的方法也是早期研究中常见的一种人脸识别方法。

Moghaddam等人提出了一种无监督的视觉学习技术,它基于高维空间的密度估计,利用特征空间分解。为训练数据建模,导出了两种类型的密度估计:多变量高斯模型(用于单峰分布)和混合高斯模型(用于多峰分布)。然后利用这些概率密度建立一个最大似然估计框架,用于视觉搜索和目标检测,用于自动目标识别和编码。这种学习技术可以应用于人脸和非刚性物体(如手)的概率视觉建模、检测、识别和编码,效果良好。

2 基于卷积神经网络的深度学习方法

卷积神经网络(Convolutional Neural Networkm,CNN),是一种深度神经网络,能够直接使用图像的像素值作为输入,将神经网络中的图像空间,分为多块进行复杂计算,通过各种参数的计算、共享等数据挖掘方式,将局部性的特征进行完全的自主学习。最后得到一个完整的图像识别模型,后续就可使用此模型对其他图像进行识别,并且能够给出相应的相似率进行参考。在人脸识别领域,基于深度学习的识别算法比较多。

2.1 特征融合与匹配

通过多个不同的卷积核,将一张图片上多个不同的特征分别进行提取,最后再将多个特征相结合,形成更高层级的特征。层级越高,特征越易描述,越具体。将传统方法与深度学习方法相结合。

马骏的研究指出由于单一的神经网络通道进行人脸表情识别会造成特征信息丢失,设计了一种特征融合的算法。首先将直方图均衡化处理后的面部表情图片通过卷积神经网络提取全局特征,将原图通过局部二值模式处理后,送入另一个卷积神经网络模型中,进行图片局部特征的提取,然后把前两步骤中得到的全局特征和局部特征进行加权平均,最后通过softmax进行分类。这种方法在FER+数据集上测试得到了较好的识别结果,验证了模型的有效性。He等人针对异构人脸识别进行了深入研究,提出一种名为Wasserstein CNN的卷积神经网络,对红外图像和普通可见光视频图像相结合,对异构人脸图像进行识别,取得很好的效果。在三个具有挑战性的NIR-VIS人脸识别数据库上的广泛实验表明,Wasserstein CNN与目前其他最先进的方法相比,也具有显著的优势。

2.2 深度分离

在传统的卷积神经网络中加入一些深度可分离卷积。通过逐通道卷积与逐点卷积等方法,降低参数量与运算成本。能够提取不同深度的特征信息,提高网络结构的鲁棒性与准确性(一般用于轻量级网络)。周丽指出在现实生活中,面部表情识别常被使用在社交、公共安全、人机交互和计算机视觉中。在实验中常使用众包表情数据集Fer2013来训练网络,但该数据集噪声较多,模型准确率达到65%后很难再提升。于是,文章改为使用重新整理后的表情数据集Fer+。Fer+数据集不仅标注出了无效人脸数据,并且重新整理了表情标签,为每个表情类别都标记了分类概率,利于实现人脸的复合表情识别。该论文使用简化Xception模型,在原模型基础上修改了网络模型宽度,并且只使用了4个具有残差连接的深度可分离卷积层,最终在Fer+数据集上得到了80%左右的测试准确率。

Parkhi等人针对超大规模训练数据集在卷积神经网络中的应用问题进行研究,使用了一个超过260万张图片的超大规模数据及,通过自动化方法循环自动组装,实现了深度网络训练的遍历和人脸识别的复杂度的控制,在数据准确性和算法时间之间取得了良好的平衡。最后在标准LFW和YTF人脸数据集上验证,实验效果良好。

3 总结

本文总结了当前人脸识别技术的分类,重点对基于特征检测的传统方法进,和对基于卷曲神经网络的深度学习方法进行了分类对比。对较为先进的方法进行阐述,对各种方法中的优缺点进行分析,帮助我们后期进行深入的人脸识别研究。

猜你喜欢

人脸人脸识别卷积
人脸识别 等
基于3D-Winograd的快速卷积算法设计及FPGA实现
有特点的人脸
一起学画人脸
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
从滤波器理解卷积
三国漫——人脸解锁
基于傅里叶域卷积表示的目标跟踪算法
长得象人脸的十种动物