基于深度学习的三维人脸识别方法研究
2019-05-30吴梦蝶
摘 要:本文通过深度卷积网络(Deep Convolutional Neural Networks,DCNN)实现人脸的三维特征和二维特征的提取。对建立的两个DCNN进行训练以及识别测试。将两个DCNN提取的二维人脸图像及人脸深度图的高层抽象特征作为一神经网络(Artificial Neural Network,ANN)的输入,输出结果作为提取的最终特征。实验结果表明,与其他识别方法相比,本文设计的方法在识别正确率上得到了可观的提高。
关键词:三维人脸识别;深层卷积网络;特征提取
DOI:10.16640/j.cnki.37-1222/t.2019.11.133
1 基于DCNN的三维人脸识别
1.1 DCNN结构
文章搭建的DCNN分别如图1和图2所示,包含层卷积层、最大池采样层,除输入与输出外,中间各层均可称为隐藏层。文章将卷积后的激活函数设置为ReLU(Rectified Linear Units)非线性矫正函数,公式为f(x)=max(0, x),相较于使用Sigmoid函数,DCNN训练后的识别结果有效的提高[1]。
1.2 n路Soft-max 回归层 及训练算法改进
文章使用soft-max回归层预测多种类别的概率,如图1所示。类别数表示为n,预测标签值即为每种类别的概率,预测标签值,则:
代表类别i的概率,,则:
对于第n种类别的概率:
可以推导出:
其中soft-max回归层的参数集为。
通过最大似然估计法以获得整个网络的代价函数,即:
是通过训练不断进行改进的参数,K为n种类别的样本总和,是第组输入向量,;为预测标签值。通过训练使代价函数不断减小或达到最大训练次数。模型代价函数的公式为:
对公式(5)求偏导,得:
的维度为类别数n,其自由度为n-1,则向量中存在冗余度为1的。的存在使在调整的过程中容易过大。这时,在损失函数的收敛计算中增加权重衰减项(>0),以防止值过大。
理论证明,是一个凸函数,因此使 的迭代运算目标可使用梯度下降算法,在此算法中,得到的结果误差进行反向传播,从而调整,(其中为学习速率):
(8)
在模型的训练过程中,通过将前一次得到的梯度值与一常数相乘添加到当前梯度的计算过程中的方法来带动梯度下降的过程。这种改进的优势在于利用经验数据加速计算过程,避免训练过程陷入局部最优。
文章将两个网络的输出结果作为三维数据和二位数据的高层特征,将其作为一神经网络(ANN)的输入进行分类。
2 实验结果及分析
2.1 学习速率及各层向量可视化实验
文章中的数据源图像包含了人的脸部、头发、肩部等,通过Haar 特征结合Adaboost的方法,去掉多余部分,只提取图像中人的脸部,提高模型输入的质量[2,3]。将提取的二维人脸图片归一化为大小,并将彩色图转为灰度图。
将数据模型的空间信息表示为z轴上的大小,将其映射为二维图像,则z值的大小通过灰度值来表示,通过这种方法得到的二维图像成为深度图。利用类间最大方差法(Otsu)[4]对深度图进行操作,消除多余部分,保留人的脸部。将人脸深度图归一化到 6853。
学习速率可认为是参数更新的幅度。文章通过对学习速率赋值的方法得到不同学习速率的识别曲线,首次令。在训练过程中,将进行过脸部提取的数据分成三部分。第一部分用于训练,第二部分数据用于验证训练过程中的识别率,整个训练过程结束后用第三部分测试整个模型识别率。最终,将学习速率设置为0.06。
模型中隐藏层的输出如图3所示。
2.2 对比实验及分析
将本文三维人脸识别方法与几种常用人脸识别方法进行比较实验,采用n=64,即64个人,每人选取不同的姿态和光照的图像10张,得到样本总数k为640,结果如表1所示。通过对比发现,本文识别算法较其他几种方法识别率有了明显的提高。
3 结论
文章分别建立了两个用于二维人脸图像特征提取和人脸深度特征提取的DCNN模型。相较于传统人脸识别方法,本文算法增加了深度信息,以增强算法对人脸姿态和外部环境的鲁棒性。经过对卷积网络进行多方面的改进,加速算法收敛,得到数据的高层抽象表示,实现分类任务。通过实验验证了算法所提取的特征具有代表性及可分性。并進行了本文算法与几种常用算法的比较实验,验证了本文方法在人脸识别正确率上得到了可观的优化。
参考文献:
[1]Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[C].International Conference on Neural Information Processing Systems. Curran Associates Inc.2012:1097-1105.
[2]Erdem C E,Ulukaya S,Karaali A,et al.Combining Haar Feature and skin color based classifiers for face detection[C].IEEE International Conference on Acoustics, Speech and Signal Processing. IEEE,2011:1497-1500.
[3]Huang C C,Tsai C Y,Yang H C.An Extended Set of Haar-like Features for Bird Detection Based on AdaBoost [C].Signal Processing, Image Processing and Pattern Recognition - International Conference, Sip 2011,Held As.DBLP,2011:160-169.
[4]Yan L V,Gong Q.Application of weighting 3D-Otsu method in image segmentation [J].Application Research of Computers, 2011,28(04):1576-1579.
作者简介:吴梦蝶(1990-),女,河北沧州人,硕士,助教,教师,研究方向:深度学习、图像识别。