基于DeepID的人脸检测与识别算法研究
2018-09-13王晶晶刘蓉侯雨静
王晶晶 刘蓉 侯雨静
摘要:本文将详细介绍DeepID网络人脸检测与识别算法研究,包括DeepID方法的网络结构、计算过程、数据集等内容,在此基础上介绍了联合贝叶斯模型。并通过对比实验,给出了DeepID网络训练效果图以及加入联合贝叶斯模型后的精度对比,直观反映出DeepID模型的训练结果。同时介绍了DeepID2+网络。着重介绍了关于交叉墒和验证信号等部分的内容。
关键词:DeepID网络;联合贝叶斯模型;DeepID2+网络;人脸检测与识别
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2018)17-0220-02
随着人脸检测与识别研究的不断深入,我们对于检测与识别准确性的要求不断攀升,基于深度学习的人脸检测与识别算法就是在这样的大背景下产生的。作为人工智能范畴的重要组成部分,机器学习通过研究计算机模拟或实现人类的学习行为,不断获取新的知识和技能,改善自身特性。而深度学习作为机器学习中的一种重要方法,通过卷积神经进行训练得到的数据模型更加完善周全。
DeepID网络是当前较为流行的一种网络,它的原理与基础卷积神经网络[1-2]的原理基本类似,通过改进和完善卷积神经网络的内容,完成DeepID网络的实现。DeepID网络相比于卷积神经网络,最大的特点是在经过多层的网络结构对数据进行处理和训练后,可以获得的十分丰富的验证信息,准确率大大提高。
而DeepID2+網络则是在基于DeepID网络的基础上,对人脸检测与识别的精度和维度等相关量都进行了一定程度的改善,使得训练模型结构更为完善,训练结果效果更佳出色。
1 DeepID网络
1.1 网络结构
DeepID网络的网络结构示意图如图1所示,该卷积网络与最基本的卷积神经网络较为相似。在DeepID网络结构中,卷积网络的主要作用是分类经过训练后的人脸。DeepID网络包含4个卷积层与3个池化层,样本的特征用网络中的最后一层来表示。
DeepID网络结构对图片的处理过程可以理解为:当源图片输入网络,图片局部的低级特征由下层网络进行提取并通过卷积进行逐层计算,逐渐减少网络提取出的特征数量,与此同时,网络结构的全局性逐渐增强。通过这个处理过程,DeepID网络最终将输出一个维度为160的高级向量,该向量信息密度很高,并包含着丰富的验证信息,可以直接用来进行身份辨认[3]。
1.2 计算过程
上文已经介绍过,DeepID的网络结构包括4个卷积层和3个池化层。通过其网络结构图可以看出,在前3个卷积层的后面,各自有一个池化层。在第四个卷积层的后面,则直接与全连接层相连,并通过这一层形成一个用于分类的输出层和特征。
DeepID的算法流程如图2所示。将输入图片按照尺度、通道、范围等类别进行划分,每个向量的训练过程都是相对独立的,最后通过连接所有的向量以获得最终向量。
1.3 联合贝叶斯模型
联合贝叶斯模型在人脸识别领域的应用同样十分广泛[4-5],联合贝叶斯模型的思想主要是基于贝叶斯人脸识别,其主要原理为将一副人脸分为两部分构成,一部分是人与人之间的差异,另一部分是个体本身的差异。人与人之间的差异,即为每个人之间的区别所在;而个体本身的差异,则表示同一个人在不同环境、光照、视角下凸显出的差异。将这种差异映射到数字图像处理上即可表示为:
1.4 数据集
DeepID使用的训练集为Celeb Faces[6]。Celeb Faces数据集是由香港中文大学汤晓鸥教授实验室于2016年7月29日公布的大型人脸识别数据集。在这个数据集的使用过程中,训练集中的80%的数据被用来训练DeepID网络中的神经网络部分,而后面的贝叶斯模型则由剩余的20%完成。Celeb Faces是一个大型的数据集,Celeb Faces数据集中,一共包含5436位著名人士的共87628张图片。
Celeb Faces包含有不同人种、不同表情、不同角度、不同背景、不同发型、不同装饰物的各类人脸图片,背景也由单色背景至复杂背景不同程度上均有涉及。因此,由Celeb Faces数据集训练出来的人脸模型准确度较高,识别能力较好,足以完成日常人脸检测与识别的需要。
1.5 实验结果
在得到多维特征向量后,通过PCA降维,并将降维后的特征向量与贝叶斯模型结合,整个网络的性能得到了有效的提高,这也侧面说明了DeepID最后一层所学习到的特征都是相互关联的,并且能够用于表示所有身份。如图3为实验结果。
2 DeepID2+网络
2.1 交叉墒和验证信号
DeepID2+网络与DeepID网络最大的不同点在于,在新的网络结构中加入了两个“验证信号”,并受到两个“验证信号”的监管。其中一个的“验证信号”为人脸识别信号,即样本的身份特征,另一个是“验证信号”为人脸验证信号,这个信号存在的意义在于减小来自相同人脸的不同图像之间的差异。两个信号的存在,在降低相同个体、不同样本之间差异的同时,大大提升了不同个体之间特征的多样性。
式中,f为Deep ID2+为特征向量,由全连接层生成;t为训练样本的标签;[θid]为网络输出层的全部参数;[pi]为目标概率分布,作为一个一维向量,[pi]只有一个值为1,其他值均为0;[pi]为可预测到的分布。
2.2 网络结构
DeepID2+的网络结构与DeepID的网络结构大体相同,只是做出一定程度的改进。主要在全连接层处添加了第一降采样层和第二降采样层,得以照顾更多不同的局部特征。并使全连接层的维度增加至512维,使形成的特征包含更多的信息,得以进一步提升维度。
3 全文小结
本文详细介绍基于DeepID网络人脸检测与识别算法,系统的分析了包括其网络结构、计算过程、数据集等部分在内的全部内容,并介绍了联合贝叶斯模型。同时在介绍DeepID网络的基础上,介绍了DeepID2+网络。着重介绍了关于交叉墑和验证信号等部分的内容,并对比DeepID网络与DeepID2+网络结构之间的不同之处。
参考文献:
[1] Cecotti H, Graser A. Convolutional Neural Networks for P300 Detection with Application to Brain-Computer Interfaces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(3): 433-445.
[2] Chen Y N, Han C C, Wang C T, et al. The Application of a Convolution Neural Network on Face and License Plate Detection[J]. USA: IEEE, 2006: 552-555.
[3] D. Chen, X. Cao, F. Wen, J. Sun. Blessing of dimensionality: High Dimensional Feature and Its Efficient Compression for Face Verification[J]. In Proc. CVPR, 2013.
[4] D. Chen, X. Cao, L. Wang, F. Wen, and J. Sun. Bayesian face revisited: A joint formulation[J]. In Proc. ECCV, 2012.
[5] Moghaddam B, Jebara T, Pentland A. Bayesian face recognition. Pattern Recognition[J]. 2000(33) : 1771–1782.
[6] S. Yang, P. Luo, C. C. Loy, X. Tang. From Facial Parts Responses to Face Detection: A Deep Learning Approach[J]. In IEEE International Conference on Computer Vision (ICCV), 2015.
[7] Y. Sun, X. Wang, X. Tang. DeepID learning face representation by joint identification- verification[J]. In Proc. 2014.