基于人流密度检测算法的实训室人员监控管理系统设计
2024-06-07孙一平付瑾
孙一平 付瑾
摘要:针对高校实训室人员信息难以智能化管理的问题,本文设计了一种基于人流密度检测算法的人员监控管理系统,通过人脸检测识别算法,实现了实训室人员的无感识别和数理统计。以贵州民航产教融合开放实训基地部署的人员监控管理系统为对象进行测试验证,结果表明,该系统能够可视化展示实训室内的人员信息,对测试集数据具有100%的准确率。本研究为实训室的智能化管理提供了有效支持。
关键词:智能化管理;人流密度检测算法;可视化
中图分类号:G647 文献标识码:B
随着高校不断深化教育改革和发展,实训课堂教学环节作为教育教学的重要组成部分,越来越受到重视。然而,目前高校在实训教学环节中存在着资源系统配置不合理、实训场地管理智能化水平低、实训室利用率缺乏数理统计和评估等问题,严重影响了教学的质量和效果[1]。针对这些问题,亟需对实训室人员进行有效地监控和管理。实训室人员智能化监控管理是实训监控管理中的一个重要方面,它涉及到对实训室内人员出入、在场、活动等情况的记录、分析和评估。传统的人员监控管理方式主要依靠人工登记、考勤、巡查等方式进行,这些方式存在着主观性强、效率低、准确性差等缺点,不能满足现代化信息化教学管理的要求,因此,需要研究一种基于数字化、信息化和智能化的方法对实训室人员监控管理进行改进和创新。
目前的人员监控管理系统主要采用主成分分析、线性判别分析、和支持向量机等方法,这些方法易陷入局部最优,存在识别效率低的问题,而人工神经网络也存在数据样本小或网络简单,导致模型训练困难等问题,不能满足准确监控的需要[2]。为此,本文研究一种基于人流密度检测算法的实训室人员监控管理系统,以解决高校实训室人员监控管理识别准确率不高的问题。
1 系统总体方案
基于人流密度检测算法的系统总体方案设计如图1所示。人流密度检测算法是基于计算机视觉对图像进行分析和理解,实现对目标、场景、特征等信息的提取和识别的一种图像识别技术,它通过对人脸图像进行检测和识别,实现对人员身份和属性的判断和确认,这在人员管理、考勤系统、智能门禁等方面有着重要的应用价值。
整个系统是基于摄像头自动采集进入教学场所的人员的人脸图像,传入人员监控管理系统,开展人脸识别。系统若检测到课堂学生或教师,则进行正常数据统计和分析;若监测有非法入侵者,则会把入侵者的照片保存到数据库,并发出警报声,同时,系统还会通过GPRS给系统管理员发出入侵警告短信[3]。
2 系统组成设计
本文设计的人员监控管理系统由四个部分组成,如图2所示。第一部分是前端部分,它使用高清视频摄像机来捕捉人员的信息。第二部分是传输部分,它使用网络交换机、网桥等设备来把前端的图像信号传送到监控中心。第三部分是中心控制部分,是基于Dell PowerEdge R740服务器设计的,负责对图像信号进行管理、存储、解码、分发等操作。第四部分是显示部分,它负责把信息以高清、流畅、实时的形式展示出来。此外,还有辅助部分,它为其他硬件设备提供稳定的电源和安全的防护。本系统选择 Windows作为操作系统来统一管理和控制存储器、摄像头和网络等外部设备。
需要指出的是,前段部分的人脸图像采集设备是一种用于获取人脸图像的硬件设备,它主要由摄像头、图像传感器、GPRS模块等组成。摄像头负责捕捉人脸图像,并将其转换为数字信号。图像传感器具有CMOS功能,支持Windows内核的万能驱动,具有低功耗、高集成度、低成本等优点。GPRS负责将图像传感器处理后的人脸图像数据通过网络发送到人脸识别系统的服务器端,实现远程传输和存储,它适用于Dell PowerEdge R740芯片的模块,直接插到相应接口就可以使用,无需额外的配置和安装,它提高了设备的兼容性和便捷性。
3 人流密度检测算法
3.1 系统编译环境
为了实现基于人流密度检测算法的人员监控管理系统,首先搭建了系统交叉编译环境,将图像处理的程序编译成适合管理平台运行的可执行文件。本文采用的交叉编译环境如图3所示,模型训练基于RTX A4000显卡,采用TensorFlow 2.0开源系统软件,这有利于提高系统设计的灵活性及降低开发成本。
3.2 算法实现
人流密度检测算法的核心是识别图像中的每个人员,基于深度学习的人员检测方法自动从图像中提取有助于完成任务的语义特征,提高检测的准确性和鲁棒性。本研究基于YOLOv5的深度学习算法[4],它由四个部分组成:输入端、Backbone、Neck、Prediction,如图4所示。模型的基本组件包含由Conv+Bn+Leaky_relu三者组成的CBL、由Conv+Res unint模块Concate组成的CSP、以及采用1×1,3×3,5×5,7×7的卷积核进行多尺度融合的SPP。
输入端是对图像进行调整大小、归一化预处理,转换為适合模型处理的格式。Backbone是主干网络,用于特征提取,它是一种经典的卷积神经网络Resnet,通过Res unit来解决梯度弥散和过拟合的问题,在图像分类问题上具备较强的特征提取能力。Neck利用残差连接和通道分离的方式,更好地融合Backbone给出的特征,提高了特征提取的效率和效果,从而提高网络的性能。需要指出的是,Backbone网络使用了Focus结构,将图像的宽高信息集中到通道信息,减少了计算量和内存消耗,同时,还使用了Mosaic数据增强,将四张图片进行拼接,丰富了检测物体的背景,提高了模型的泛化能力。
3.3 系统特色与创新
与经典的卷积神经网络和深度信念网络人脸特征提取方法相比[5],YOLOv5首先使用了Focus结构,输入图像的四个相邻像素被合并为一个,能够将更高层次的特征运用到多个层次的表示中,以更高效地提取图像特征的判别信息。其次,利用YOLOv5的CSP结构,将特征图分为两部分,一部分直接传递到下一层,另一部分经过卷积操作后再与前一部分相加,从而增强特征的表达能力。最后,由于YOLOv5使用了SPP结构,实现了多尺度的特征融合,提高了对不同大小目标的检测性能。因此,基于YOLOv5的深度学习特征提取方法的优势之一是灵活性和分辨率,它非常适合实训室人员监控管理系统且更为有效。
4 系统实现与测试
4.1 系统执行流程
系统程序执行分为训练过程和测试过程,如图5所示。首先对摄像头采集的训练样本图片作数据增强处理,充分训练后获得准确的测试模型。然后,读取测试样本,测试模型自动预测准确率。如果存在异常数据则报警,系统利用GPRS给系统管理员发短信通知。
4.2 测试结果分析
以贵州民航产教融合开放实训基地部署的人员监控管理系统实验平台为测试对象,如图6所示。测试集人脸数据是由贵州开放大学航空学院应急救援技术专业的4个不同班级,每个班级50人,为了综合测试GPRS报警功能,在测试的二班、三班和四班分别加入非本班学生2名、3名和4名,因此,测试集由209幅人脸图像组成。
系统对4个班分别进行测试,测试分析结果见下表,可以看出,该系统的准确率为100%。
5 结论
本研究设计了一种人流密度检测算法的实训室人员监控管理系统,给出了系统的设计目标、硬件组成以及软件流程。测试结果表明,系统具备人员信息识别准确率高达100%。该系统配备了GPRS模块,一旦发现非法入侵者,能够立即通过短信告知系统管理员,实现实训室的智能化无人管理。
参考文献:
[1]李家薪,秦思,陈彬.新形势下职业院校实验实训室建设与管理问题的思考[J].科技风,2023(03):17-19.
[2]郑鹏,柯晔伟.基于人工智能和云平台管理的高校智能实训室建设[J].科技风,2020(32):3-4.
[3]刘新朋,郎利影.基于ARM的人脸识别门禁系统设计[J].工矿自动化,2013,39(09):12-15.
[4]宋传旗.YOLOv5算法的人脸识别检测方法研究[J].计算机时代,2023(07):15-19.
[5]莊薪霖.人脸识别方法综述[J].科技创新与应用,2022,12(02):130-132.
项目来源:本文为贵州开放大学(贵州职业技术学院)、贵州远程教育基地、贵州远程教育学会课题成果,课题名称:基于图像识别的人员监控管理系统设计及应用研究(项目编号:2023ZD12)
作者简介:孙一平,博士,贵州开放大学(贵州职业技术学院)副教授,研究方向:深度学习。