APP下载

基于卷积神经网络的人脸考勤系统

2024-07-24夏冉李雨欣李鹏飞

电脑知识与技术 2024年17期

摘要:随着计算机视觉技术的发展,人脸识别技术已被广泛应用于多个领域,包括安全认证和个人身份验证。相较于传统的考勤方法,如签到表或指纹识别,基于识别的考勤方法提供了一种更高效、可靠且便捷的解决方案。为了提高考勤管理的效率和准确性,设计了一个基于卷积神经网络的人脸考勤系统。系统由人脸注册和人脸识别两大模块组成,能在各种光照和姿势下准确识别员工面部特征。考虑到计算需求,选用了dlib库中的HOG检测器和基于ResNet的人脸识别模型,优化了考勤流程并保证了实时性。测试结果表明,该系统在单人及多人考勤场景下有效工作,实现了高识别准确率。

关键词: 人脸考勤; 人脸识别; 卷积神经网络

中图分类号:TP391.4 文献标识码:A

文章编号:1009-3044(2024)17-0039-04 开放科学(资源服务)标识码(OSID) :

0 引言

随着计算机视觉技术的迅猛发展,人脸识别技术已经从理论研究走向了实际应用,并广泛应用于安全认证、公共安全、个人身份验证等领域。在日常考勤管理中,传统的考勤方法如签到表、刷卡或指纹识别等手段逐渐显示出其局限性,如易于伪造、代签、考勤效率低下以及隐私问题等。因此,开发一种高效、可靠且便捷的考勤系统显得尤为重要。卷积神经网络(CNN) 作为一种深度学习架构,其设计来自生物的视觉感知机制,能够自动并有效地从图像数据中提取复杂的特征表示,在物体检测、图像识别等视觉任务中展现出的卓越性能。

近年来,CNN已成为人脸检测和人脸识别的核心技术。本文旨在设计一个基于卷积神经网络的人脸考勤系统,该系统可以自动识别并记录员工的考勤状态,能够在各种光照和姿势条件下准确识别员工的面部特征,同时确保了处理速度和系统的实时性,从而提高考勤管理的效率和准确性。

1 人脸检测算法概述

人脸检测是人脸识别系统中的首要步骤,作为计算机视觉领域的一个重要研究方向,经历了从早期的特征驱动方法到近现代的深度学习技术的演变,这个过程不仅推动了人脸检测技术的发展,也为其他计算机视觉任务提供了重要的技术基础。

Haar特征是人脸检测领域的一种早期方法,它基于简单的矩形特征进行人脸检测。2001年Viola 和Jones提出了一种使用Haar特征和AdaBoost算法结合的人脸检测框架[1],该框架通过构建一个强分类器的级联,实现了快速有效的人脸检测,这种方法的成功开创了基于特征的人脸检测技术,但其对光照和姿态变化较为敏感。2005年Dalal和Triggs首次将HOG特征用于行人检测[2],之后这种方法也被应用于人脸检测领域,它通过计算和统计图像局部区域的梯度方向直方图来表征图像的形状和纹理信息,相较于Haar特征,能更好地处理光照变化的问题,但在复杂背景下的性能仍有限。随着深度学习技术的兴起,CNN[3]开始在人脸检测领域展现出强大的能力,它能够自动学习和提取高层次的特征,极大地提高了人脸检测的准确性和鲁棒性,自2012年以来,随着硬件计算能力的提升和大规模标注数据集的可用,CNN成为人脸检测的主流方法之一。SSD[4]检测算法,通过单次的前向传播实现对图像中多个对象的检测和分类,并在人脸检测中的应用展现了高效和准确性的平衡。MTCNN[5]结合了人脸检测与人脸对齐(通过关键点检测)的多任务框架,进一步提升了人脸检测的性能,展现了优异的检测效果。

2 人脸识别算法概述

人脸识别技术是计算机视觉领域的一项关键技术,它涉及从图像或视频中识别或验证个体身份的过程。随着技术的发展,人脸识别经历了从传统算法到深度学习算法的重大转变。

早期,人脸识别主要依靠几何特征,如眼睛、鼻子和嘴巴之间的距离和角度,这种基于几何特征的人脸识别方法直观且容易理解,但对于姿态、表情和光照变化非常敏感,准确性和鲁棒性有限。随着计算能力的提升和算法的发展,基于模板[6]的方法逐渐兴起,这类方法通过比较输入人脸图像与存储的模板之间的相似度来进行识别,典型的算法包括Eigenfaces(基于主成分分析PCA) 和Fisherfaces(基于线性判别分析LDA) ,这些算法通过提取面部的全局特征来进行匹配,相比基于几何特征的方法有所改进,但仍受到外部条件变化的影响。为了提高识别的鲁棒性,研究者提出了一些基于局部特征匹配的算法[7],如局部二值模式(LBP) ,这类方法关注于人脸的局部区域,通过比较细节特征来进行识别,对于光照和表情变化具有较好的适应性,但对特征选取和参数设置较为敏感,需要大量的调优。

深度学习的兴起彻底改变了人脸识别技术的发展方向,CNN[8]的引入标志着人脸识别技术进入了一个新的时代。CNN能够自动学习和提取高层次的抽象特征,通过多层次的结构自动学习数据的层次性特征,从而能够捕捉从简单到复杂的人脸特征,这些特征比传统手工设计的特征更具判别性和鲁棒性。通过在大规模数据集上进行训练,CNN模型能够学习到人脸的一般性特征,这些特征对于未见过的人脸图像也具有很好的泛化能力,能够处理多种复杂情况,包括不同的光照条件、表情变化、遮挡情况,以及姿态差异。与传统方法相比,基于CNN的人脸识别技术能够实现端到端学习,直接从原始像素到识别结果,无须手工设计特征或复杂的预处理步骤。这简化了模型的训练和部署流程,同时提高了识别的效率和准确性,例如,AlexNet、VGG、ResNet[9]等深度网络结构在人脸识别任务中得到了广泛的应用。基于卷积神经网络的人脸识别技术已成为当前人脸识别领域的主流方法,这些优势使得CNN方法不仅适用于学术研究,也极大地推动了人脸识别技术在安全、监控、互动媒体等领域的应用发展。

3 总体设计及主要模块介绍

系统设计流程,如图1所示,由人脸注册和人脸识别两大模块组成。首先,将待考勤人员的人脸特征存入到人脸特征库中。然后,对考勤人员的人脸特征进行实时提取,并与人脸特征库特征进行比对。最后,将考勤结果计入考勤记录表中(考勤成功,将登记时间记入表中,否则,考勤失败)。

3.1 人脸注册模块

人脸注册模块负责采集用户的面部图像,提取面部特征,并将这些数据存储到系统的特征库中以供将来识别使用,具体实现步骤如下:

1) 输入带考勤人员的基本信息:姓名、ID号和采集人脸图像数量。这一步是为了将采集到的面部信息与用户的身份信息关联起来。

2) 初始化摄像头,开始视频捕捉人脸图像。如图2所示,在 WIDER FACE数据集上基于CNN模型的人脸检测方法对于人脸的复杂变化(如姿态、表情、遮挡)具有更好的适应性。但是,虽然基于卷积神经网络(CNN) 的人脸检测算法相较于传统的人脸检测技术在准确性上有显著提升,但其较大的计算量需求导致了检测速度的减缓。如图3所示,在人脸背景相对较为简单,人脸数目较少情况下,基于传统和基于CNN 模型的方法检测效果相当,但是传统方法简单高效。鉴于人脸考勤系统所涉及的人脸检测任务相对简单,因此在选择人脸检测方法时,本文使用dlib 库中的HOG检测器检测视频帧中的人脸。

3) 对于每个检测到的人脸,使用dlib库的68点关键点检测器来找到人脸的关键点。

4) 使用dlib库中的基于ResNet的人脸识别模型,从每个检测到的人脸中提取面部特征描述符。

5) 将采集的特征描述符被转换成列表形式,与人脸的标签ID和姓名一起,写入一个人脸特征库CSV 文件中。

3.2 人脸识别模块

人脸识别模块是人脸考勤系统的核心组成部分,主要负责通过对比识别出特定个体的面部特征,具体实现步骤如下:

1) 从视频流中,检测待考勤人员脸部和面部关键点信息,其步骤同人脸注册模块的1~3步。

2) 如图4所示为基于Fisher的传统识别方法和基于ResNet模型的深度学习方法,对相同人脸Yale数据集的识别结果,基于ResNet模型对56张测试集中的图像,识别正确率100%,而基于Fisher 的方法仅为79.63%。由于基于卷积神经网络的人脸识别模型,较传统识别模型识别率较高,所以本文选用dlib库中的基于ResNet模型作为人脸识别模型。用选用识别模型,从每个检测到的人脸中提取面部特征描述符。

3) 将提取的人脸特征与特征库中的特征进行比对,计算欧几里得距离,以找出最相似的人脸特征。

4) 若最小距离小于设定阈值,则认为匹配成功,识别出人脸,显示识别结果,并根据特定条件(如一定时间内未重复识别)记录到考勤信息CSV文件中。若大于阈值,则考勤失败。

4 系统测试

4.1 人脸注册功能测试

考勤前需对待考勤人员进行人脸特征录入。首先,需设置采集人脸特征的图像张数,考勤人员的姓名和ID号码。如图5所示为设置采集人脸特征图像张数为3时的采集结果。

4.2 人脸考勤功能测试

在人脸考勤模块中,需要设置阈值大小(系统设置阈值为0.3) ,可以进行单人和多人同时考勤。如图6a) 所示为单人考勤结果,最右侧为考勤人员姓名及考勤成功时间;图6b) 所示为多人同时考勤结果,最右侧为考勤人员姓名及考勤成功时间。

5 结束语

本文设计并实现了一个基于卷积神经网络的人脸考勤系统,该系统不仅优化了传统考勤方法的局限性,如提高了考勤效率和准确性,而且还能够在复杂环境下准确识别员工的面部特征。通过采用dlib库中的HOG检测器和基于ResNet的人脸识别模型,展现了对于人脸的复杂变化(如姿态、表情、遮挡)的良好适应性,同时保证了处理速度和系统的实时性。尽管本系统在实验和测试中表现出色,但我们也认识到还有进一步改进的空间。未来的研究可以探索更高效的人脸检测和识别算法,以进一步提高系统的识别速度和准确率。

参考文献:

[1] VIOLA P,JONES M.Rapid object detection using a boosted cas⁃cade of simple features[C]//Proceedings of the 2001 IEEE Com⁃puter Society Conference on Computer Vision and Pattern Rec⁃ognition.CVPR.Kauai,HI,USA.IEEE,2001:I.

[2] DALAL N,TRIGGS B.Histograms of oriented gradients for hu⁃man detection[C]//2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR′05).San Di⁃ego,CA,USA.IEEE,2005:886-893.

[3] ZAMIR M,ALI N,NASEEM A,et al.Face detection & recogni⁃tion from images & videos based on CNN & raspberry pi[J].Computation,2022,10(9):148.

[4] 苏海涛,张守棋.注意力机制优化SSD的戴口罩人脸快速检测研究[J].电脑知识与技术,2023,19(19):30-34,38.

[5] 杨玉洁,陈天星,石林坤,等.偏转角度情况下MTCNN人脸检测算法改进[J]. 计算机与数字工程,2023,51(9):2074-2078,2206.

[6] 谢毓湘,王卫威,栾悉道,等.基于肤色与模板匹配的人脸识别[J].计算机工程与科学,2008,30(6):54-56,59.

[7] 黄璞,沈阳阳,杜旭然,等.基于局部约束特征线表示的人脸识别[J].计算机科学,2022,49(S1):429-433,536.

[8] 左栋,杨明远.基于ResNet50网络特征融合的人脸识别技术研究[J].电脑与信息技术,2023,31(1):22-24.

[9] KANAKA DURGA B, RAJESH V. A ResNet deep learning based facial recognition design for future multimedia applica⁃tions[J]. Computers and Electrical Engineering, 2022(104):108384.

【通联编辑:闻翔军】

基金项目:智慧助老——助力老人融入智慧社会(202310478031) (2023 年河南省本科高校大学生创新创业训练计划项目)