APP下载

基于Jetson Nano的人脸口罩识别系统设计

2024-05-12叶光泽童宣科侯保冀

电子产品世界 2024年1期
关键词:人脸识别深度学习

叶光泽 童宣科 侯保冀

摘要:人脸和口罩识别在许多现代应用中有广泛需求,包括安全检查、身份认证以及工业安全等方面。探 讨了基于 Jetson Nano 的人脸口罩识别系统,旨在实现对个体是否佩戴口罩的准确判断。该系统使用先进的 人脸识别算法来定位图像中的人脸区域,然后应用深度学习模型对人脸区域进行口罩检测。所有的数据处 理和模型推理均在 Jetson Nano 上实现,从而使系统具有较高的运行效率和可移植性。在多个不同环境和视 角下进行测试,结果显示该系统在各种复杂条件下都展示出较高的识别准确率,并能处理高达 30 帧 /s 的实 时图像。不仅证明了 Jetson Nano 在图像识别和实时数据处理方面的高性能,还为开发多种人脸识别应用提 供了有力的技术支持。

关键词:人脸识别;口罩识别;Jetson Nano;深度学习

中图分类号:TP394.41;TP183文献标识码:A

0 引言

近年来,人脸识别技术取得了显著进展,已广 泛应用于各种场合,包括安全监控、身份验证、人 流量统计以及工业自动化等。其中,检测是否佩戴 口罩成为一个特殊但重要的任务,特别是在需要遵 守特定安全规定或健康标准的场合。然而,即便是 最先进的人脸识别算法,也常常会受到环境变量 (如光照、角度和遮挡物)的影响,导致算法準确 性下降。为了解决这些问题,需要一种低成本、高 效率的解决方案,因此本文提出基于 Jetson Nano的人脸口罩识别系统。Jetson Nano 是一款专为边缘 计算设计的微型计算平台,具有出色的图像处理和 机器学习能力,且功耗和成本都较低。

1 硬件设计

1.1 硬件组件

本设计的硬件架构主要由 3 个 部 分 组 成: Jetson Nano 微型计算平台、显示屏和摄像头。

1.1.1 Jetson Nano

Jetson Nano 是 NVIDIA 公司推出的一款微型计算平台,专为边缘计算设计。其搭载了 ARM A57 处理器和 128 核统一计算设备架构(compute unified device architecture,CUDA)兼容的图形 处理器,具有出色的图像处理和机器学习能力。 Jetson Nano 还具有低功耗和高性能的特点,适用于 人脸和口罩识别等实时图像分析任务。

1.1.2 显示屏

为了实时显示识别结果,本设计使用了一台 7 英寸的显示屏。该显示屏与 Jetson Nano 通过高清 多 媒 体 接 口(high definition multimedia interface, HDMI)连接,能够以高分辨率和流畅度来展示摄 像头捕获的图像和算法识别的结果。

1.1.3 摄像头

本设计使用了一款高清网络摄像头,具有 1 920×1 080 的分辨率和 30 帧 /s 的帧率,以捕捉 高质量的图像。该摄像头通过 USB 接口与 Jetson Nano 连接,能够实时传输视频流。

1.2 工作流程

在硬件组合完毕后,系统的工作流程如下:首 先,摄像头捕捉实时视频流,并通过 USB 接口发 送到 Jetson Nano。其次,Jetson Nano 进行图像预 处理并运行人脸口罩识别算法。最后,识别结果会 即时在连接的显示屏上显示出来。

该硬件组合不仅确保了系统的高效运行,还具 有很好的可扩展性和可移植性,为未来的研究和应 用提供了强有力的硬件支持。

2 软件设计

在完成环境搭建后,软件设计部分将遵循程序 流程(图 1)进行编码和实现。

2.1 环境搭建

环境搭建作为实验的初步阶段,具有基础且关 键的意义。本设计需要搭建深度学习的环境,即 PyTorch(开源的 Python 机器学习库)框架,需要 考虑好各种库之间的匹配问题,以及 PyTorch 和 torchvision(PyTorch 的一个图形图像库)的安装, 这两个库是深度学习模型开发的重要组成部分。完 成环境搭建后,对 PyTorch 进行基础验证是确认环 境稳定性的关键。只有在完成这些必要的流程之后 才能进行代码编写。

2.2 预处理

预处理是为了准备图像数据以供模型使用。首 先进行图像缩放,将输入图像的大小调整为模型所 期望的尺寸。其次,进行图像归一化,将每个像素 的 RGB(红、绿、蓝)值由 0 ~ 255 缩放到 0 ~ 1, 从而加速模型的收敛速度并提高准确性。此外,还 需进行维度扩展,为图像数据增加一个批处理维 度,使其能够输入到神经网络模型中。

2.3 人脸检测

人脸检测采用了基于深度学习的方法。使用 了 预 训 练 的 卷 积 神 经 网 络(convolutional neural networks,CNN)从输入图像中提取有用的特 征 [1-2],CNN 模型如图 2 所示。该模型使用 PyTorch 框架进行加载,如图 3 所示。人脸的定位是通过预设的边界框来实现的。首先,生成一组锚点框 [2], 并覆盖在图像的不同位置上。每个特征图的尺寸代 表不同尺度上的空间布局,锚点大小和比例定义了 每个锚点框的尺寸和形状。模型会预测边界框中哪 些最有可能包含人脸,以及如何微调边界框以更准 确地定位人脸。

测结果以获取实际的边界框,该函数采用模型 输出和锚点边界框作为输入。首先,计算锚点的中 心位置和尺寸。其次,利用原始输出(通常是由 神经网络生成,表示边界框相对于锚点的偏移和 大小变化)来调整锚点。函数通过应用一组比例 因子,计算预测的边界框的中心位置、宽度和高 度。最后,利用函数将这些信息合并,形成最终 的预测边界框,从而更准确地指示图像中的目标 位置。

2.4 口罩识别

在准确检测人脸后,需要利用模型识别这张脸 是否戴了口罩。模型基于其学习到的特征来判断边 界框内的人脸是否戴有口罩,并给出相应的类别标 签和置信度。这是通过查看模型的输出来实现的。 该输出是一个概率分布,显示了模型对每个类别 (戴口罩和未戴口罩)的置信度。

对于每个检测到的人脸,通过置信度阈值和非 极大值抑制(non-maximum suppression,NMS)来 过滤和精炼结果 [3]。如果一个预测的置信度高于置 信度阈值,则认为这个预测是可信的,否则将其 舍弃。交并比(intersection over union,IoU)[4] 表 示两个边界框的重叠度,IoU 值是两个边界框相交 区域面积与两个边界框联合区域面积的比值。在 NMS 过程中,如果两个边界框的 IoU 值高于 IoU 阈值,这通常表示两个边界框都在检测同一个对 象。在这种情况下,只保留置信度更高的那个边界 框,同时舍弃另一个。因此,通过设置合适的 IoU 阈值和置信度阈值,可以保证系统更准确地识别出 是否戴了口罩。

最后,根据识别结果,边界框和类别标签将被 绘制在原始图像上,并且给出可信度。识别情况如 图 4 所示。戴口罩为 Mask,未戴口罩为 NoMask。

3 系统测试

3.1 数据集

在进行系统测试之前,选择合适的数据集是至 关重要的。由于本文设计的是一个面向人脸和口 罩检测的系统,因此选择了包含戴口罩和未戴口罩 的大规模人脸数据集。数据集来自 WIDER Face 和 MAFA 数据集 [3]。AIZOO 团队以统一标准对这两 个数据集中图片的人脸位置进行二次标注,共标注 了 7 971 张人脸标注图片。该数据集包含了多种场 景、光照条件以及人脸方向来测试模型在各种情况 下的泛化能力。

3.2 测试环境和视角

测试环境的多样性也非常重要。为了确保模型能够在不同的实际应用场景中表现良好,系统不仅 在室内进行了测试,还模拟了室外、公共交通、商 场等多种环境。除了环境外,还从不同的视角和距 离进行了测试,包括正面、侧面、斜视等,以及 从不同距离对目标进行捕捉,从而测试模型的稳 健性。

3.3 结果与讨论

经过一系列综合测试,模型在大多数测试环境 和视角下都表现出色,对有口罩和无口罩的分类准 确率很高。然而,该模型也存在局限性和需要改进 的地方。在极端光照条件下,如逆光或暗光,模型 的检测效果不佳。在未来的版本中可能需要加入光 照不变性或者使用更复杂的模型来改善性能。当人 脸部分被遮挡或者佩戴了非标准口罩(如颈巾、面 纱等)时,模型的检測准确度也有所降低。这意味 着模型可能需要更多数据集来训练,特别是包含各 种遮挡和口罩类型的数据集。虽然 NMS 算法有效 地减少了多余的检测框,但在高密度人群中,模型 检测结果仍然可能产生一些错误。针对该问题,可 采用更高级的后处理技术,例如,Soft-NMS 算法 [5] 可以作为一个潜在的解决方案。这些测试结果不仅 验证了模型的有效性,也指出了模型改进和优化的 方向。

4 结语

本文设计了基于 Jetson Nano 的人脸口罩识别 系统。通过采用先进的 CNN 架构和实用的图像处 理技术,不仅实现了高准确度的人脸识别,还成功 地对是否佩戴口罩进行了判断。本系统经过了多环 境和多角度的严格测试,结果显示其在大多数应用 场景下都具有出色的性能和可靠性。然而,本系统 还有改进空间,包括在特定光照和遮挡条件下的检 测准确度,以及后处理算法的优化。未来将进行更 多的数据收集和模型训练,以进一步提高系统的准 确性和适应性。

参考文献

[1] 仝晓春,周玲 .基于卷积神经网络的人脸识别研究 [J]. 电脑知识与技术,2023,19(23):26-27,38.

[2] 曹家乐,李亚利,孙汉卿,等 . 基于深度学习的视觉 目标检测技术综述 [J]. 中国图象图形学报,2022, 27(6):1697-1722.

[3] 蒋益鸣,范希喆,张美嘉,等 . 基于卷积神经网络口罩识 别方法研究 [J]. 中国新技术新产品,2022(17):17-19.

[4] 张羽 . 目标检测中的交并比损失函数研究 [D]. 合肥: 安徽大学,2021.

[5] 樊新川,陈春梅 . 基于 YOLO 框架的轻量化高精度目标 检测算法 [J]. 液晶与显示,2023,38(7):945-954.

猜你喜欢

人脸识别深度学习
人脸识别 等
揭开人脸识别的神秘面纱
基于(2D)2PCA-LBP 的人脸识别方法的研究
人脸识别在高校安全防范中的应用
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现