APP下载

基于深度学习的到课率统计系统设计与实现

2024-03-12赵衍鲁力立

现代教育技术 2024年2期
关键词:模式识别机器学习

赵衍 鲁力立

摘要:到课率作为宏观教学管理数据,对高校教学管理具有重要作用。虽然近年来出现了一些课率统计的数字化方法,解决了传统到课率统计费时、费力、滞后等问题,但由于成本高、使用不方便、准确率不高等原因,导致其无法推广。随着技术的发展,深度学习在多目标检测中的准确率越来越高,有助于解决此类问题。为此,文章利用深度学习技术,设计了一种基于教室摄像头RTSP视频流的到课学生头部识别的模型1MB-Plus,并将其应用于某高校的一百余间教室的到课率统计中,取得了97.3%的准确率。研究表明,该模型有助于解决到课率统计存在的问题。文章通过研究,旨在以最小的成本为高校教务管理部门提供较为准确的宏观到课率数据,辅助学校的教学管理工作。

关键词:到课率统计;机器学习;模式识别;拥挤人群计数;头部检测

【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2024)02—0108—10 【DOI】10.3969/j.issn.1009-8097.2024.02.012

在高校教学管理中,到课率是一个能综合反映教学管理水平、学风和教学质量的重要指标,根据到课率数据,院系和学校教务管理部门可以整体把握教学情况,以进行更好的教学管理。传统的到课率统计方法主要包括课堂点名和课后统计,然而这两种方法的效率都非常低下,虽然近年来业内先后出现了通过红外、蓝牙、无线射频标签、二维码、WiFi、指纹识别、人脸识别等多种到课率统计的方法,但都存在各种各样的问题,导致其无法得到大规模推广。因此,在大学教学管理中,迫切需要一种能够基于现有条件,便捷、高效、低成本、准确地统计到课率的方法。当前,深度学习在多目标检测中的准确率越来越高,而随着我国各高校标准化考场和智慧教室建设进程的加快,很多大学教室中都安装了能够覆盖整个教室场景的摄像头,如果能够利用这些摄像头,结合深度学习技术构建到课人数统计模型,或许有助于提升到课率的统计效率和精确度。为此,本研究尝试基于深度学习框架试构建到课人数统计模型,并用标注过的教室照片对模型进行深度学习,将训练好的模型部署在生产环境中,通过对接课表、教師基本信息等数据,生成不同维度的到课率统计数据。

一 研究现状

到课人数统计模型主要是利用教室中的摄像头所采集到的视频帧进行人头部检测,从而识别教室中的人数。而教室内的人头部检测是一个典型的拥挤场景下的人群计数(Crowd Counting)问题。拥挤场景下的人群计数是计算机视觉研究领域的一个经典问题,主要实现手段有基于热力图的人群密度检测(DenseCrowd Counting)和基于头部检测(Head Counting)的人数统计两种,其中基于头部检测的人数统计方法具有更好的参考价值和应用场景[1]。早期的人群计数研究主要基于检测的方法和回归的方法来实现,而从2015年开始,卷积神经网络(CNN)被引入人群计数研究。鉴于CNN在机器学习领域的良好表现[2],现有的人头部检测方面的研究大部分基于CNN开展,如陈久红等[3]对基于区域的全卷积神经网络(R-FCN)目标检测算法进行改进,提高了R-FCN算法对小目标的识别能力,使其在自制的数据集上达到89.4%的准确率;张晓强等[4]利用教室现有的视频监控系统获取教室实时图像,结合教室内人员分布特点及教室建筑风格,通过检测学生头部特征,并使用AdaBoost级联分类器对提取的视频帧HOG样本特征进行训练,构建头部检测模型用于检测人数,取得了80%的准确率。

然而,很多人群计数算法虽然在实验条件下具有很好的表现,但到了生产环境下,由于受到光照、遮盖、相似物体等噪声干扰,识别准确性会大大降低。因此,生产环境中的人头检测模型除保证较高的检全率和检准率外,还需要有较强的鲁棒性。在教室环境下,由于存在学生之间相互遮挡、低头、转头、佩戴帽子、有相似物体、弱光线及光线分布不均、噪声干扰等问题,导致目标检测的准确性难以得到保证。针对这种情况,Yudin等[5]利用标注的1000张教室照片,训练了FCN、Faster R-CNN和Mask R-CNN三种卷积神经网络,结果表明:Mask R-CNN的速度虽不及FCN的十分之一,但准确率却很高;Faster R-CNN的精度虽不如Mask R-CNN,但比FCN更稳定。Monti等[6]提出了一种基于摄像头和Raspberry Pi平台的人数统计方法,得益于边缘计算的迁移学习框架,该系统在教室人数统计中的最大平均绝对误差小于1.23。Yi等[7]标注了3070张课堂照片,并通过改进YOLO V4算法构建了教室人数统计系统,结果表明其准确率在测试集上获得明显提升。刘媛等[8]构建了真实教室场景的图像数据集,并基于RetinaFace人脸检测网络设计RetinaStudent人头检测网络模型,提升了学生脸部被遮挡情况下的模型性能,在自制数据集上达到99.1%的识别率。何强等[9]通过改进YOLO V3模型,增强了模型对模糊或者较小目标的检测能力。Niu等[10]则提出一种基于YOLO V5的增强型骨骼识别系统,用于检测课堂行为。这些方法对提高人头检测模型的检全率、检准率和鲁棒性都起到了一定的作用。

为了提高准确率,还有研究者尝试采用两种或两种以上的方法分别对教室内的人头数进行统计,通过比较和综合,以获得更准确的结果。例如,Fu等[11]将多任务卷积神经网络(MTCNN)人脸检测和中心人脸识别两种深度学习算法进行结合,开发了一套大学课堂自动考勤系统,该系统在实验环境下能达到98.87%的准确率;单华标等[12]综合使用蓝牙传输和人脸识别技术设计了一套点名系统,可有效防止出勤作弊问题;胡青松等[13]开发了一种融合WiFi数据与人脸识别的课堂点名方法,利用教室WiFi接入数据和人脸识别数据进行交叉比对,实现精准点名。

总的来看,现有教室场景下的人群计数研究虽然在一定程度上提高了人头部识别的准确率,但都缺乏生产环境下大规模部署的实验数据。而当前已投入实际使用的模型精度都不超过90%,在学校课堂到课人数统计应用场景下,这样的准确率明显满足不了学校管理的实际需求。因此,本研究旨在构建一套在生产环境下能快速、准确统计到课率的系统,以满足学校教学管理需求。

二 基于深度学习的到课人数统计系统设计

近年来,很多高校建设了大量的智慧教室、标准化考场和直录播教室,这些教室都安装了标清或高清摄像头;还有些学校从安全角度考虑,在教室内安装了安防摄像头。利用这些摄像头的视频帧,结合深度学习技术进行到课人数统计,既可以最大限度地利用现有资源,又能给学校教学管理部门提供亟须的到课率统计数据。为此,本研究在通过可行性验证的基础上设计了一套完整的基于深度学习的到课率统计系统,具体设计思想如下:

1 可行性分析

首先,教室中的摄像头从像素上分为标清和高清两类,其中标清摄像头的像素在30万左右,高清摄像头的像素在100万左右。标清摄像头虽然无法用于教室环境下的人脸识别,但对于“头部识别”却没有太大的影响。其次,这些摄像头都支持标准的实时流传输协议(RTSP),可以较为方便地获得不同厂商的摄像头视频流。最后,近年来基于多层神经的深度学习技术日趋成熟,特别是在模式识别领域表现优异,业界也开发出Caffe、PyTorch等成熟的深度学习框架。因此,从技术角度来看,本研究方法是可行的。

2 系统实现流程

到课人数统计是典型的模式识别问题,主要思想是通过识别人的头部特征,来判断在课堂环境下,哪些是“人”,哪些不是。因此,本研究基于深度学习框架设计的到课率统计系统的实现流程是:①采集教室上课照片,对人的头部进行标注;②基于PyTorch深度学习框架,搭建到课人数统计模型;③利用标注好的照片,对到课人数统计模型进行训练(监督学习),经过多轮调整、优化、迭代,得到成熟的到课人数统计模型;④在服务器上部署模型;⑤通过对教室摄像头RTSP视频流进行抽帧,将视频帧输入模型,计算每帧中的到课人数;⑥通过与课表数据对接,在上课时间准点、上课开始后若干分钟、课程结束前若干分钟分别抽帧并统计人头数,生成到课率、迟到率、早退率等数据;⑦通过对接课表、院系、教师等数据,生成不同维度的到课率统计报告,供院系管理者和学校教学管理部门参考。具体的实现流程如图1所示。

3 机器学习框架的选择

目前已有多种成熟的深度学习框架,其中由Facebook人工智能研究院基于Torch开发的PyTorch开源深度学习框架广受科研人员的青睐。PyTorch底层由C++实现,简洁、高效、快速、功能强大,并且可以部署于CPU服务器,在科研和工程领域都很适用。因此,本研究选择基于PyTorch机器学习框架搭建课堂学生头部识别模型。

4 模型训练

刚搭建好的到课人数统计模型未经过深度学习训练,准确率不高,因此还需要标注一定数量的课堂照片用于模型训练、调优和迭代。为了提高模型识别的准确度,在系统运行后,还需要将识别错误的照片进行重新标注,再对模型进行新一轮的训练,如此反复迭代多次,不断调整和优化模型参数,最终得到令人满意的结果。

5 模型的部署

与所有深度学习模型部署过程类似,在公开数据集上预训练好的头部检测模型需要在教室场景下进行定制化微调,这就需要采集教室场景下的数据对模型进行定制化训练。该系统的场景是课堂教学环境,移动干扰较少,场景固定,定制化训练后的到课人数统计模型会有比较高的性能。同时,各个摄像头采集到的课堂场景比较类似,因此定制化训练后的模型在课堂场景下会有比较好的泛化能力,可以较为容易地推广到其他教室。

三 系统的实现与实践

研究团队基于上述的设计思想,在上海市A大学的数据中心部署了一台业务处理服务器和一台到课人数统计服务器。其中,业务处理服务器通过同步教务系统数据,按照事先设定的业务逻辑,发送采集指令给到课人数统计服务器,采集指令包括采集时间和摄像头的IP地址。到课人数统计服务器按照指定的时间和IP地址从摄像头上采集视频帧并计算人数,将结果以Json格式发回给业务处理服务器。业务处理服务器再结合教务系统、人事系统和学工系统数据,从各个维度统计到课率。

1 到课人数统计模型的构建

在课堂人数统计的应用场景下,需要识别的目标实例较多,实例密度较大,且各实例在图像上的占比较小,对算力的要求也较高,但考虑到系统的可推广性,到课人数统计模块又不能占用太大的算力资源。这些场景特点和约束条件要求算法模型的参数量不宜过大,但推理速度又必须足够快。针对这样密集的人头部检测任务,研究团队在轻量级的小目标检测模型网络结构1MB-RFB的基础上,设计了一个1MB的轻量级到课人数统计模型,并对模型结构进行了改进,使其在保持现有推理性能的前提下進一步提升识别性能。

1MB小目标检测项目是业界影响力较高的开源项目,其模型结构1MB-RFB(如图2所示)主要针对边端低算力设备进行设计,在检测任务上以较低算力获取较好的识别性能。原始的1MB-RFB采用单步多框目标检测(Single Shot MultiBox Detector,SSD)的基础结构,改进了初始特征学习部分和中间层不同尺度特征学习部分的网络(改进后的结构分别对应如图2左侧和中间部分),初始特征学习部分采用DepthwiseConv在端侧提升模型的运行速度,中间层采用Inception结构加强多尺度特征的融合。同时,网络根据检测任务减少了各个特征图的特征维度,进一步提升了模型的推理性能。

在实验过程中,研究团队发现,1MB-RFB初始特征学习部分特征图的尺度下降速度过快会影响模型底层特征的表达,进而影响模型的推理性能,需要找到一种在快速降低特征尺度的同时又能保持底层特征表达能力的结构。为此,研究团队尝试不同的网络结构及其参数的排列组合,结合人头检测任务平衡特征检测性能和推理速度,最终选取Depthwise+CReLU的组合。

在网络中间层不同尺度特征学习部分,原始的1MB模型采用Inception结构,此结构会计算多种维度特征并在最后进行融合,因而会消耗较多的算力。同时,多层特征的存储和访问也会带来更多的I/O操作,降低网络的推理速度。如果能找到一个统一的Block结构来进行中间层部分的特征学习,将会明显改善模型性能,加快模型的推理速度。为此,研究团队先后尝试了ShuffleBlock、CGBlock、MBBlock等多种结构,并根据参数量和计算量定义这些模块的维度参数。通过比较,最终选取MBBlock作为中间部分特征学习的基础模块。综合上述两部分的改进,本研究团队构建了如图3所示的轻量模型结构,将其命名为1MB-Plus。

2 模型对比结果

为了测试1MB-Plus到课人数统计模型的性能,本研究团队使用了开放数据集WIDER FACE进行验证。该数据集包含393703张标注人脸,这些人脸在尺度、姿势、标准、表达、装扮和光照方面都有不同的体现,是业界较为常用的人脸检测数据集。

研究团队使用数据集提供的切分方式进行模型训练测试,为了更贴近真实使用场景,在测试时对图像进行统一的尺度操作——将测试图像进行等比例缩放,分别保持图像不超过320×240和640×480。本研究将1MB-Plus与1MB的另外两个版本1MB-slim、1MB-RFB进行了对照,得到Wider-face检测性能测试的对照结果如表1所示。可以看出,1MB-Plus模型各方面的性能均优于1MB模型所提供的slim模型和RFB模型。

在推理速度方面,研究团队使用联想Thinkpad T450笔记本电脑、边端设备RK3399以及云上设备P40分别进行推理速度测试,得到的数据如表2所示。可以看出,1MB-Plus模型比1MB-RFB模型推理速度更快。

3 训练数据采集与标注

整个模型采用“预标注-人工修正-模型训练-系统部署”的方式进行多次迭代,以不断提高性能。为了获得真实场景照片以对模型进行持续训练,研究团队将系统部署在上海市A大学的数据中心。该校有120间教室安装了摄像头,系统对部分教室随机采集500张左右的上课照片,每张照片均为30~60万像素,共获得5000张课堂照片。

对采集到的照片进行人工分析,可以发现由于每间教室摄像头安装的位置、角度和高度都不尽不同,学生上课时坐座位也有相当的随意性,因此教室照片中的学生头部会出现多种情况,影响识别效果。图4展示的就是其中一节课的课堂场景。

在图4中,位置1的学生头部被手遮挡;位置2的学生低下头,看不见面部;位置3的学生也低下头,只能看见黑色头发,且被前面的同学遮挡了一部分头部;位置4的学生戴了白色的帽子,且面部被帽檐遮挡。

为了在降低标注成本的同时提高标注效率,研究团队先使用基于开源数据集训练好的1MB-Plus模型对采集的图片进行预标注,然后利用Labelme工具对预标注的结果进行人工校正。通过对预标注结果进行抽样检查,发现预标注错误主要有三种类型:漏标、错标、重复标注。图5为预标注结果示例,图中位置1~7为漏标,位置8和9为误标,位置10为重复标注。

在预标注结果中随机抽取500张照片进行人工统计,发现预标注准确率在70%~80%之间,并不理想;采用人工手段修正错误标注,并进行新一轮机器学习后,再随机抽样500张照片进行人工统计,发现预标注准确率已接近90%,有明显提升;采用人工手段对错误的标注继续进行修正,再重新进行第三轮机器学习,随机抽取500张照片进行人工统计,发现预标注准确率为97.3%,说明模型已经收敛,准确度能满足学校教学管理部门对到课率统计数据的要求。

4 系统架构

整个系统除自身的数据处理和业务逻辑外,还涉及与多个外部系统进行通信和信息交换。系统的复杂性和对处理能力的要求决定了该系统架构是一个分布式的异步系统,不同的任务和功能需要分别运行在不同的计算节点上。同时,考虑到系统的迭代升级,系统的架构设计需要满足可扩展性要求。按照功能划分,系统整体架构包括四个模块,分别为视频帧采集模块、到课人数统计模块、业务系统对接及数据交换模块、数据存储模块。

(1)各模块功能

①视频帧采集模块。本系统采用摄像头生产厂商提供的SDK与视频监控服务器通讯来获得视频帧。视频帧获取是一个异步的过程,需要编写和配置正确的回调函数。而每获取一个视频帧,系统需要与监控服务器进行三次异步通讯。该模块的主要难点在于管理120余个视频源的异步通讯,并正确处理通讯过程中可能出现的各种异常,如超时、抖动等。

②到课人数统计模块。该模块是纯计算模块,对算力要求比较高,同时在功能上独立性比较强,因此在进行架构设计时,需要将其作为独立的模块运行在一个单独的计算节点上。为了增强系统的可扩展性,整个模块被打包成一个Docker镜像,并通过容器的方式进行部署。同时,模块会对外提供一个RESTful服务接口,視频帧采集模块将采集到的视频图片通过HTTP请求发送给该服务接口,检测模块完成头部检测后,将结果以HTTP Response形式返回。

③业务系统对接及数据交换模块。该模块需要对接两个外部业务系统和一个数据存储模块。其中,对接的外部业务系统包括教务处的课表系统和到课率统计系统的上层应用。课表信息存储在Oracle数据库中,业务系统对接模块需要定时从该数据库中读取课表信息,并且根据当日的课表信息,自动创建视频抓拍任务。到课人数统计模块会在每日凌晨2点触发一个定时任务,该定时任务从课表系统拉取当日的课表信息进行解析,然后生成一系列的定时抓拍任务。每个抓拍任务对应一个定时器,当定时器到期的时候,系统自动触发抓拍任务,调用视频帧采集模块向抓拍任务指定的摄像头发送抓拍指令,并将抓拍的图片发送给到课人数统计模块进行处理,返回的结果则发送给上层应用进行统计和展示,同时发送给数据存贮模块进行持久化。为了充分解耦前端业务系统(业务处理服务器)和后端计算系统(到课人数统计服务器)之间的关联,人数统计模块中生成的到课人数结果通过RESTful接口向外部发布。上层的应用处理模块和数据存储模块均打开一个监听接口,接收到课人数统计系统发来的数据。

④数据存储模块。本模块存储课程唯一记录号、抓拍到的图片和图片中的到课人数统计结果。数据存储模块不仅存数据,还需要满足简单、轻量级的查询任务。考虑到需要存储的数据较为简单,查询要求不高,本系统采用了基于文件的MySQL存储方案,以简化系统复杂度。为了留有扩展余地,数据存储模块作为独立的服务可部署在不同的节点上,其对外的数据通信通过RESTful接口实现。因此,如果将来由于业务发展需要升级数据存储模块,可在不影响系统中其他模块正常运行的前提下单独进行。

(2)数据生成与使用

到课人数统计模块通过同步课表数据,从每节课的上课时间点开始,在课程开始后的前5分钟、中间5分钟和最后5分钟,每分钟从摄像头视频流采集一帧图像用于计算到课人数,然后将人数、课程号、课堂照片等数据以Json格式编码作为HTTP的Body发送给前端业务模块。

对于每一节课,前端业务模块会收到多个推送过来的到课人数统计结果。受抓拍条件、人员流动及算法自身的影响,对于同一节课,后端每次推送过来的到课人数是存在差异的,因此前端应用通过计算平均值从多次到课人数统计结果中得到一个更为可靠的最终结果。具体算法是:课程开始后的前5分钟计算到课人数平均值,作为按时到课人数,用于计算准时出勤率和迟到率;课程中间5分钟计算到课人数平均值,作为课堂到课人数,用于统计到课率;课程最后5分钟计算到课人数平均值,用于计算早退率。

将到课人数数据与课程信息表、选课信息表、学生基本信息表等数据表进行关联计算,在院长和系主任端显示各学院和各专业的到课率情况,并可按教师、班级、教学周、学期等不同维度进行查询;在教务处及分管教学校领导端可按专业、学院、年级、教学周、学期等不同维度进行查询,为学校各级教学管理者提供参考数据。图6所示为到课率数据在用户端的展示。

本系统的前端基于HTML5设计,具有自适应性,可以方便地在PC端和移动端使用。基于学校的统一组织架构图和统一身份认证,可以为不同角色的用户提供相应的授权,以保障数据安全。为稳妥推进系统应用,教务管理部门选择两个学院进行试点,每个月给学院分管教学副院长发送本月到课率统计报告,报告内容不仅包括本学院到课率情况,也提供横向对比数据(全校平均到课率、各学院平均到课率等),分管教学副院长也可以自行登录平台查询具体到课率情况和现场照片。每月发送的到课率统计数据提高了试点学院对到课率的重视,也给学院教学管理工作提供了数据支持,经2023年3月~7月一个学期的试用,两个学院的平均到课率均有8%以上的提升,说明本系统对于学校的教学管理和督导具有一定的作用。

四 结论与展望

本研究设计的基于深度学习的到课率统计系统在生产环境下获得了97.3%的准确率,且具有较好的鲁棒性,已经可以满足学校宏观教学管理对到课率统计的要求,充分说明本系统设计的科学性和有效性。同时,本系统最大程度地利用了高校现有的IT硬件资源,且基于开源框架和开源系统进行开发与部署,具有良好的经济性和可复制性。但是,由于深度学习原理和机制的限制,当有新教室接入本系统的时候,需要拍摄一定量的课堂照片进行新一轮的机器学习才能保证识别的准确率;而且摄像头的安装位置、角度对本系统的识别准确率都有一定的影响。在后续的系统迭代和升级中,可以考虑对深度学习模型做进一步优化,以提升性能。优化的方向主要有两条:一是获取更多的线上数据,并通过人工标注后反哺给模型,以提升模型性能。这种方法可以最大程度地挖掘现有模型的潜力,将其性能充分发挥出来。二是采用新的深度学习模型,通过检测整个人体(考虑到教室场景,主要是坐姿下的人体检测)来达到识别到课人数的目的。这种方法可以突破现有模型的性能瓶颈,有望带来更好的识别效果,但需要更大的投入,且结果有一定的不确定性。

参考文献

[1]Sam D B, Surya S, Babu R V. Switching convolutional neural network for crowd counting[A]. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)[C]. Honolulu: IEEE Computer Society, 2017:4031-4039.

[2]Damale R C, Pathak B V. Face recognition based attendance system using machine learning algorithms[A]. 2018 Second International Conference on Intelligent Computing and Control Systems (ICICCS)[C]. Madurai: IEEE, 2018:414-419.

[3]陳久红,张海玉.基于深度学习的教室人数统计系统设计[J].软件导刊,2019,(10):27-29、35.

[4]张晓强,王迅,杨航,等.基于智能视觉物联网的教室人数跟踪系统[J].图像与信号处理,2019,(2):8.

[5]Yudin D, Ivanov A, Shchendrygin M. Detection of a human head on a low-quality image and its software implementation[J]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2019,42:237-241.

[6]Monti L, Tse R, Tang S K, et al. Edge-based transfer learning for classroom occupancy detection in a smart campus context[J]. Sensors, 2022,(10):3692.

[7]Yi K, Yan S, Liu L, et al. CCSS: An effective object detection system for classroom crowd statistics[A]. 2022 IEEE 46th Annual Computers, Software, and Applications Conference(COMPSAC)[C]. Los Alamitos: IEEE, 2022:111-116.

[8]劉媛,陈小丽,屠增辉,等.基于改进RetinaFace算法的教室人数统计方法[J].计算机与数字工程,2022,(9):1887-1890、1916.

[9]何强,李静,陈琳琳.基于改进YOLO V3算法的室内人数统计模型[J]. Hans Journal of Data Mining, 2023,(1):10-22.

[10]Niu W, Sun X, Yi K. Improved YOLOv5 for skeleton-based classroom behavior recognition[A]. Third International Conference on Intelligent Computing and Human-Computer Interaction(ICHCI 2022)[C]. Guangzhou: SPIE, 2023:107-112.

[11]Fu R, Wang D, Li D, et al. University classroom attendance based on deep learning[A]. 2017 10th International Conference on Intelligent Computation Technology and Automation(ICICTA)[C]. Changsha: IEEE, 2017:128-131.

[12]单华标,龙华伟.高校点名方法和系统[P].中国专利:CN113256834A,2021-8-13.

[13]胡青松,张淳一,陈艳.一种融合WiFi数据与人脸识别的课堂点名方法[P].中国专利: CN112734966A,2021-04-30.

Design and Implementation of a Class Attendance Statistics System Based on Deep Learning

Abstract: As a macro teaching management data, class attendance rate plays an important role in the teaching management of colleges and universities. Although some digital methods of class attendance rate statistics methods have emerged in recent years to solve the problems of time, effort and lag in traditional class attendance statistics, they cannot be popularized due to high cost, inconvenient use and low accuracy. With the development of technology, the accuracy of deep learning in multi-target detection is increasingly higher, helping to solve such problems. Therefore, this paper used deep learning technology to design a 1MB-Plus model based on classroom camera RTSP video stream to recognize arriving students heads, and applied it to the class attendance statistics in more than 100 classrooms of a university, and obtained the accuracy of 97.3%. The experiment also showed that the model was helpful to solve the problems of class attendance statistics. Through research, this paper was aimed to provide more accurate macroscopic attendance data for the educational administration departments of colleges and universities at the lowest cost, so as to assist the school teaching management.

KeyWords: class attendance statistics; machine learning; pattern recognition; crowd counting; head detection

猜你喜欢

模式识别机器学习
紫地榆HPLC指纹图谱建立及模式识别
浅谈模式识别在图像识别中的应用
第四届亚洲模式识别会议
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
机器学习理论在高中自主学习中的应用
可拓模式识别算法中经典域的确定方法
第3届亚洲模式识别会议