基于Deep ID人脸检测身份技术现状和展望
2018-09-21陈月吴恋周华丽熊琴代芳穗田芳
陈月 吴恋 周华丽 熊琴 代芳穗 田芳
摘 要:针对替考现象屡禁不止的现状,提出了基于Deep ID人脸检测身份技术来辨别考生的真实性。脸部是每个人最具代表性的特征,每个人的脸部纹路都具有唯一性,且更易提取,所以人脸识别将是考场验证的首选。随着深度学习的提出,人脸识别的使用频率不断提高,其准确率也不断提升。人脸识别运用于多个领域,并取得了重大突破,根据最新的研究,建议使用、人脸识别算法Deep ID技术验证考生身份。文中阐述了人脸识别用于检测考生身份一致性的可行性,可有效防止考生替考作弊等情况出现。
关键词:深度学习;身份验证;卷积神经网络;Deep ID
中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2018)07-00-03
0 引 言
通过数据分析可知,替考现象屡禁不止,由于人眼识别的准确率较低,不论大型还是小型考试都存在不公平现象。如今,深度学习技术已渗入各领域,Deep ID更掀起了一股學习新潮,因此将Deep ID人脸识别技术运用到考生认证中,提高考生的考前认证效率与准确率,避免替考,实现考试的公平公正。
1 人脸识别的研究发展
中国研究人脸识别技术时,侧重人脸识别及多种模式的人机交互技术[1],其中Deep ID算法所应用的人脸识别技术已被应用到诸多领域。现阶段,人脸识别已逐渐延伸到多种实际生活场景中。人脸检测技术已由图片的简单处理发展到图像的实时处理,已从传统技术转变为深度学习技术[2]。
2 常用人脸识别技术简介
2.1 TENCENT-BESTIMAGE
早先,相册产品中出现了优图人脸检测器[3]。之后,优图人脸检测器相继应用于诸多APP移动产品中。2014年,优图为保证高准确率,挑选出十万张没有人脸的照片作为负样本进行训练,夺得FDDB桂冠。
优图不断优化技术,在Viola与Jones提出瀑布式检测框架后[4],利用不一样的特征提取方式,增加了系统的表达能力;采用光照分离技术,进行多次技术改进与算法迭代后[5],技术发生了革命性变化,利用AUC技术提高设备分类能力,使用Vector Boosting等技术将不同特征的人脸归属到一个框架。
2.2 FaceNet
FaceNet人脸检测算法[6]将CNN和Triplet Mining相结合,在LFW数据集上测试,其准确度高达99.63%,在YouTube人脸数据集上进行测试[7],其准确度也达到95.12%,相比之前的准确度提高了近30%。通过卷积神经网络技术将人脸图像映射到特定的特征向量中,可由此计算出不同的人脸特征距离。
判断两张人脸照片是否属于同一个体可通过计算照片的人脸特征[8],距离阈值等方法。谷歌通过CNN技术把图像映射到特定的欧几里得空间内[9]。图片相似度与空间距离成正相关,该映射确定下来后,人脸识别任务将变得简单。
2.3 Face++
Face++是旷视科技公司研发的人脸识别云服务平台[10]。近年,他们推出一款游戏,曾位居APP Store国内区排行榜前五,可由于游戏开发经验不足及基础知识掌握不够,他们随即将精力转移到人脸识别检测的基层技术完善方面。
Face++应用的人脸识别技术中有两个特殊例子。其中一个例子是世纪佳缘网站,客户可根据自己对另一半的要求,输入另一半长相的特征点,搜索相似外貌的异性用户,这个搜索在数据库中进行,当下该数据库是世纪佳缘网站的内部数据库,日后可成为各大社交网络上的人脸数据库。第二个例子是与360搜索引擎合作,在360搜索的图片搜索中利用识别检测技术对图片进行检索。
如今Face++已发展到能够稳定应对不同人脸姿态并对其处理的地步,且其技术已更新为深度学习算法,此外,Face++还通过自己独特的算法可将每张人脸压缩到仅有几个字节的长度。
3 基于深度学习的人脸识别技术
3.1 深度学习技术
3.1.1 卷积神经网络(CNN)
近些年,人脸识别领域一直密切关注CNN的相关技术。特别是CNNs在FRUE上取得的令人印象深刻的成果。20世纪60年代,Hubel与Wiesel在研究猫脑皮层时发现了独特的神经网络结构,并由此进行相关研究。CNN是一种前馈神经网络,是图像处理领域的一种应用,其中人工神经元可以对应周围的单元,进行大型图像处理。CNN含有两层,第一层为提取层,神经元输入时跟上一层接受域相连;第二层为映射层,每个特征映射为一个平面,全部神经元权值相等。卷积神经网络的每个卷积层都有一个分计算层,用来计算局部平均二次提取值,减少分辨率。卷积神经网络主要用于识别扭曲不变的二维图像,其特点局部权值共享在图像处理方面具有优越性,利用梯度下降+链式求导法则对节点进行求导,能从不同种类的值组成的集合中学习得到需要的函数。
图像中的对象并不完全一致,但在训练CNN之前脸部图像效果较好。它在Deep Face中声明,一个池层在本地转换健壮性和保存纹理细节之间需要很好的平衡。Deep Face的另一个贡献是3D人脸对齐。传统方法中,人脸图像在输入之前可以使用二维相似变换来对齐。然而,该2D对齐无法处理平面旋转。为克服这一局限性,DeepFace提出了一种利用仿射摄像机模型的三维对准方法。
3.1.2 Deep ID
孙祎是香港中文大学的博士,是Deep ID人脸算法的发明者。Deep ID算法充分利用卷积神经网络,能够表征1 000多种分类的特征,且分类精度较好,不会因数据集过小而产生拟合,在人脸识别数据集LFW上测试的准确度高达97.45%。
Deep ID技术中卷积神经网络起到了学习特征的作用,输入图片后,Deep ID将得到一个160维的向量,之后在该160维向量上使用现有的贝叶斯学习组合进行分类,得出结论。卷积神经网络计算的特征值区分度大且紧凑,因此得到的效果将会更好。其数据集对于Deep ID或任何卷积神经网络都较为重要,数据集将会使卷积神经网络得到充分训练,Deep ID将增加新的数据[11]与更多图片。其次是裁剪图片,多角度裁剪,然后使用PCA降维计算好的向量组合。
Deep ID與Deep Face存在截然不同的地方,Deep Face在训练神经网络之前会使用对齐方法。我们认为一旦经过人脸对齐,人脸的面部特征就会固定在部分像素中,就可利用卷积神经网络对其进行特征学习。针对同样的问题,Deep ID并未采用对齐方法,而是将一个人脸划分成很多部分,每个部分都会训练一个模型,然后将模型聚合。
Deep ID2在Deep ID上改进了CNN的结构,采用图像识别方面的最新网络结构,且层数加深。Deep ID2与Deep ID的不同之处在于新的网络结构以47×55的图片为输入,并添加了验证信号,网络结构也得到了修改,提取到的特征维度也得到了增加。利用前向-后向贪心算法选择小的图像块[12]。Deep ID2+在Deep ID2的基础上修改了网络架构,接着对卷积神经网络进行分析和研究,将向量从160维提升到512维,结合CeLeFaces+与WDRef数据集组成训练集,第一层和第二层max-pooling层都分别连接到Deep ID层。
Deep ID3在LFW上的测试准确率为99.53%,相比Deep ID2+性能大幅提升,更加精确。
3.2 验证身份技术
3.2.1 人脸检测
技术部门可通过摄像头采集不同的人脸图像,当客户处于拍摄范围内时,摄像头将通过界面控制按键实时拍摄客户的人脸,可实时、准确地找出人脸的特征位置点。
3.2.2 人脸特征提取
人脸特征提取过程中,摄像头首先感应到人脸的5个特征点,即两个眼睛、鼻子边界点和嘴巴的边界点,基于两眼和嘴巴对齐。将人脸划分为60个部分,其中包括10个子区域、3个尺度和颜色通道等。
3.2.3 人脸验证
选中向量后利用PCA降维,对于输出后的向量可以使用联合贝叶斯模型进行分类。利用得出的数值来衡量身份证和真人是否为同一个人[13]。在训练集上可以得到一个相似值,当相似度值大于固定值时,为同一个人;当相似度小于固定值时,非同一个人。在进行确认分析中即可得出结论。
4 验证身份真实性的人脸识别系统市场意义
作弊是一种欺骗行为,为了自己的利益而忽视了对他人的公平使考试的功能没有得到正常发挥,因此研究防作弊的科技手段十分必要。
如今,各个行业都离不开科技的支撑,教育界亦然。近几年较热门的技术就是人脸识别研究,并且随着人脸识别技术的不断突破,学者们的研究热情高涨。
人脸识别已不是一个新词,但是它的研究却从未停下,在当今科技发展的时代,我们也与时俱进使用最新的算法——Deep ID,尽可能达到验证的准确率和高效率。证件的照片与真人比对,显示两者相似度,机器识别代替人眼,有效杜绝替考。
5 结 语
实验结果证明,将身份证人脸识别系统运用在考生验证上效果明显,准确率高,还可对意在作弊的考生起到震慑作用。与传统验证方法相比,该方法可明显降低核对时间,减轻监考老师任务,更加有利地降低考生作弊的频率。
参考文献
[1] SUN Y,LIANG D,WANG X,et al. Deepid3:Face recognition with very deep neural networks[Z]. Computer Science,2015.
[2] ZHU Z,LUO P,WANG X,et al.Recover canonical-view faces in the wild with deep neural networks[Z].Eprint Arxiv,2014.
[3] SCHROFF F,KALENICHENKO D,PHILBINJ. Face Net:a unified embedding for face recognition and clustering[Z].Computer Vision & Pattern Recognition,2015:815-823.
[4] TRAN A T,HASSNERT,MASI I,et al.Regressing robust and discriminative 3D norph able models with a very deep neural network[C].IEEE Conference on Computer Vision & Pattern Recognition,2017:1493-1502.
[5] CHOI H C,KIM S Y,OH S H,et al.Pose invariant face recognition with 3D morph able model and neural network[J]. IEEE International Joint Conference on Neural Networks,2008,48(1):4131-4136.
[6] HE K,SUN J.Convolutional neural networks at constrained time Cost[C].IEEE Conference on Computer Vision & Pattern Recognition,2015.
[7] TAIGMAN Y,YANG M,RANZATO M A,et al. Deep face:Closingthe gap to human-level performance in face verification[C]//Comput-er Vision and Pattern Recognition,IEEE Conferenceon. IEEE,2014:1701-1708.
[8] MOHADDAM B,PENTLAND A. Probabilistic visual learning for object recognition[J].IEEE Trans.,Pattern Analysisand Machine Intelligence,1997,19(7):696-710.
[9] HUANG T S,YANG G Z.Human face detection in a complex background[J].Pattern Recognition,1994,27(1):53-63.
[10] SAMAL A,IYENGAR P A.Automatic recognition and analysis of human faces and facial expressions:A Survey[J].Elsevier Science,1992,25(1):65-77.
[11] GOLDSTION R J,HARMON L D,LESK A B. Man-machine interaction in human face identification[J]. Bell Syst Tech Journal,2014,51(2):399-427.
[12] PARKER F.Computer Generated Animation of Faces[C].In Proceedings ACM ANN Conference. New York,1972,1:451-457.
[13] ALLEN A L.Personal descriptions[M].Lodon:Butterworth,1950.
[14] GUO S H,YONG X Y. When face recognition meets with deep learning:an evaluation of convolutional neural networks for face recognition[Z].