基于人脸识别技术的旅游城市景点自动安检系统
2022-11-23冯炜娟田世政
冯炜娟,田世政
(1.安康学院 马克思主义学院,安康 725000;2.西南大学 经济管理学院,重庆 400715)
由于交通的频繁,客流的巨大,使得交通安全、人员信息的核查变得十分困难,因此,目前大多数的交通安全检查都是依靠手工进行的。这不仅会增加人力成本,而且会造成资源的巨大浪费。如何快速、准确、安全地进行安全检测,是快速、准确、安全的关键。在这个背景下,自动安检系统应运而生,大量的技术已经在各个运输行业得到了广泛地应用,为人们提供了空前的便利。为此,有较多学者研究了自动安检系统,其中,文献[1]设计了旅客风险安检系统。构建游客风险评价体系,利用旅客信息模拟安检流程设计硬件模块,基于PSO-BP 神经网络算法构建风险识别模型,实现安检;文献[2]利用人脸识别技术和RFID 识别技术设计机场旅客安检系统,实现无需口令与无需主动配合的“智能无感”安检。
但是上述方法由于环境等因素的限制,应用于旅游景点中的检测效果较差。人脸识别技术主要是通过摄像机获取信息,然后对图像中的人脸进行检测、追踪,从而对所检测到的人脸进行相应地处理。基于人脸识别技术的这个优点,本文将其应用到旅游城市景点游客身份自动检测中,设计一个基于人脸识别技术的旅游景点自动安检系统。
1 基于人脸识别技术的旅游城市景点自动安检系统
1.1 旅游城市景点自动安检系统硬件设计
1.1.1 旅游城市景点自动安检系统硬件框架
所研究的旅游城市景点自动安检系统硬件框架如图1所示。基于图1可知,此次研究的旅游景点自动安检系统主要由TMs320DM6446DaVinci 处理器、身份核验模块、视频解码模块、数据库等重点模块组成,通过身份核验模块、数据库模块、图像处理器模块对图像处理与识别,再发送到核心处理器中进行后端控制。
1.1.2 主处理器设计
TMs320DM6446DaVinci 处理器是一个双核心结构[3],它包含一个297 MHz 的ARM926EJ.S 核心,ARM 子系统[4],视频处理子系统(VPSS),VICP(VICP),以及其他丰富的外部设备接口。其功能如图2所示。
图2 TMs320DM6446 处理器功能框图Fig.2 TMs320DM6446 processor functional block diagram
TMs320C64x+DSP 芯片,片内存储控制器,DSP外接设备,TMs320C64x+DSP 系统。DSP 芯片C64x+DSP 为核心,其32 KBLlP 程序RAM/Cache(直接映射)、80 KBLlDRAM/Cache(局部映射),C64x+DSP 能够在一次指令循环中执行8 条32 bits 指令,每一次运算可以实现2 个16×16 bits 或4 个8×8 bits 的运算[5]。同时,包含64 个常用32 位寄存器,用于储存资料,为自动安检系统提供数据支持。具有以下特性:
1)ARM 子系统利用CPL5(controller controller,CPL5),用于对指令[6]、数据缓存、紧耦合存储器(TCM)、存储器管理单元(MMU)和其他系统功能进行控制。
2)ARM 子系统中的内存管理单元为操作系统提供了虚拟存储器的功能,为ARM 上的Windows CE、Linux 等操作提供了必要的支持。
3)ARM 系统包含了大量的外部设备,它由DDR2端口控制器、PWM、音频串口、EMIF、通用串行总线等组成。
1.1.3 视频解码模块
TVP5158 是一款高品质的视频解码芯片[7],它由美国德州仪器公司开发,使用128 针TQFP 封装。本芯片可实现4 种不同类型的模拟视频信号,并具有各自的解码信道,每一信道均含有1 个10 bits、27 MSPS 的高速模数变换器。支持PAL 和NTSL 两种格式的视频解码,具有自动降噪、自动对比度调整等特点。支持8 bits 的ITU.R.R.656 和YCbCr4:2:2的16 bits 的视频格式。
TVP5158 芯片支持的多路传输技术,可以将多个视频信号以线交叉的方式进行混合,从而使DM6446 在仅支持单路输入的情况下,实现了两个摄像机的采集。TVP5158 芯片具有多种工作方式,能够在12C 总线上访问对应的寄存器,从而达到以上工作方式。由于该嵌入式门禁系统采用双路输入方式,因此采用了双路输入和单路输出方式,并将其传输至TMs320DM6446。由于TVP5158 的输入/输出接口的电压是3.3 V,DM6446 是1.8 V,所以必须把TVP5158 管脚的输出信号用电压变换器SN74AVCBl64245GR 变换成1.8 V 的逻辑电压。
1.1.4 身份核验模块
身份核验模块负责身份核验阅读和控制闸机。主要由小型一体阅读机和安检机两组设备组成。
CVT820B 双屏人证一体阅读核验终端,集成了人脸识别技术、证件扫描技术、打印机技术和计算机技术,充分利用条码技术、无线通讯技术,由显示屏、身份证读卡器、摄像头组成。可以通过读取居民身份证芯片中的身份信息、现场采集指纹图像和人脸照片,来获取验证结果。阅读核验处理器为高速QDSP6 v5,内核配置为Qualcomm 的Cortex-A7 四核处理器,工作频率为691 MHz768 KBL2,存储为8/16 GB,支持全网4G 数据传输;显示屏为7 寸全视角,分辨率为1024×600 横屏显示。身份证读卡器具有ISO/EC15693 协议、ISO18000-3 协议、UART/RS232 通信协议,最大读写距离为8 m。
SYT-5030 安检机:负责监测通过人员有无携带非法物品,同时内置居民身份证阅读器和高分辨率摄像头,符合公安部GA450—2013 标准,可读取居民身份证芯片内的文字和人脸信息并现场采集人脸图像。利用微留残探技术对多种金属材质进行分析,空间分辨力达到中1.0 mm;利用电磁身份识别感应高速扫描通过人员信息,防止误报警、漏报,抗干扰能力较强。实际使用时在人员通过核查后,安检机利用摄像头会自动采集所有通过人员信息。
1.1.5 网络模块
网络模块主要负责服务器与检测模块间的通信。网络模块采用ARMCortexM3 系列的LM3S6965为控制芯片,网络模块移植了LWP 协议栈与服务器进行TCP/P 通信。网络模块的功能是完成服务器和验票系统之间的通讯,本项目的网络模块以ARMCortexM3 系列LM3S6965 为核心,其性能优越,对突发事件的反应速度快[8]。
ARMCortexM3 系列处理器中有一款LM3S6965,它是一款为工业应用而开发的专用微处理器。其特征是:256 K 的单周期FLASH;64 K 的单循环RAM;最多可以达到42 个GPIO 端口;最高50 MHz 的操作频率;3 个串口通讯接口;一个完整的10 Mbps Ethernet 控制器,它与ARM 体系结构兼容;一种睡眠组件,该睡眠组件具有叫醒单元;38 个具有8 个优先级的中断;整合了嵌套矢量中断控制器(NVIC),使得处理中断更加简单。
1.1.6 数据库模块
数据库主要包括公安部人像数据库、通关信息数据库等。数据库模块底层逻辑采用UDB 分布式架构,以SQL99 标准作为存储运行原则,设计引擎。全面支持结构化和非结构化数据的处理。通过ETL 的数据字典程序,提取人像特征,对数据进行整合处理,在服务器端生成人像数据库。
1.1.7 图像处理器模块
图像处理器模块采用ATMEL AVR 型号的8位微处理器,内含ATMEga128L 芯片,逻辑架构为RISE,可同时发送152 条指令,具有独立的预分频器和比较器功能。分为8 位PWN、8 个单端通道、7个差分通道和2 个具有可编程增益的差分通道。两个可编程的串行USART,用于上电复位和掉电检测。
利用高清摄像机连续采集人脸图像,根据数据库和身份核验模块提供的信息,对于无证人员,自动判定和截取多张正面人脸图像。筛选最清晰图像通过网络模块传输至后台服务器,利用人脸识别技术进行身份信息比对。选取相似度最高的比对结果确认人员身份,并将采集的数据以及核查日志直接存入后台数据库。
1.2 旅游城市景点自动安检系统软件设计
1.2.1 旅游城市景点安检系统流程
图像处理器模块的人脸识别技术应用于自动安检系统同样要完成3 步,先由旅游城市景点自动安检系统硬件部分获得相关图像,对图像预处理,最后进行人脸比对并输出结果,实现自动安检。人脸识别技术应用于自动售检系统流程如图3所示。
图3 人脸识别技术的旅游景点安检系统流程Fig.3 Flow chact of tourist attraction security check system of face recognition technology
首先是对图像进行预处理,然后利用人脸识别模块对灰度图像进一步地处理,可以使目标区域的轮廓得到进一步的突出。如果一个像素点的灰度低于此阈值,则此点的灰度被设定为0,反之为255,变换公式表示为
式中:T 代表设定的阈值。
经过上述处理后能够将图像目标内容分为目标区域和背景区域,方便于后续目标提取。经过上述图像预处理后,对图像增强。此次研究中采用灰度直方图处理方法,将其表示为
式中:N 代表图像中像素总数;nk代表第k 级灰度的像素个数;rk代表第k 个图像块的灰度级。
经过上述过程对图像预处理,为后续景点自动检测提供基础。
1.2.2 人脸识别
经上述处理后,进行人脸识别,识别过程中主要采用主成分分析技术中的K-L 变换方法,该方法主要是一种用于任何概率分布的最优正交变换方法。该方法主要寻找一组最优正交基向量,从而使该组正交基向量表示原图像并且保证误差最小,如果其中两个矩阵的特征值相同,则两个矩阵为相似矩阵,公式如下:
由于在人脸图像矩阵中包含了较多的样本向量,为此预先对图像样本向量统计,公式为
式中:m 代表样本向量的数量;Xi代表第i 样本向量的均值。
在此基础上,进行人脸识别,特征匹配识别方法较多,为加快识别速度,采用比较特征度量值体检,将公式表示为
式中:y1,y2分别为图像投影以及待测人脸图像的投影;C 代表协方差矩阵。
通过上述过程计算出图像在模板方向上的投影距离,并将距离和自适应阈值对比,小于阈值就代表匹配成功,大于阈值代表匹配失败,不断重复上述过程,实现人脸匹配。
最后,由于自动安检系统采集的特征值是非常多的,特征值也是不断反复学习的,为此,将迭代学习算法应用到其中,其学习算法的框架如图4所示。通过迭代学习算法的应用能够在识别图像过程中,不断迭代特征值,实时更新数据库,以提高特征值分析的准确率,以此完成旅游城市景点自动检测。
图4 迭代学习算法Fig.4 Iterative learning algorithm
2 仿真实验
2.1 实验平台的设置
为验证基于人脸识别技术的旅游城市景点自动安检系统的有效性,进行实验对比,并将文献[1]方法、文献[2]方法与本文系统对比。实验平台的主要参数如表1所示。
表1 图像获取设备参数设置Tab.1 Image acquisition device parameter settings
实验中,共选取男女各5 个人,每人10 张共100 张图像,待识别的图像包括直接由高清摄像头获取的影像,也包括提供商本人的个人证件照片(标准照片)或旅行照片,证件照的角度、光线、表情都不太一样。所以这些图像的分辨率不同,1~20 张图片分辨率为160×120,21~40 张的图片分辨率为320×240,41~60 张图片的分辨率为640×480,61 张到80 张图片的分辨率为1920×1080,81~100 张图片的分辨率为3840×2160,将数据库中的图片按照分辨率分为4 组,共进行5 次实验,分析在不同分辨率图像下3 个系统的应用效果。通过模数转换器将人脸视频图像转换为数字信号,将处理得到的图像存储在RAM 模块中,将人脸识别算法写入数据库模块。将摄像头获取的图片存储到数据库中作为训练数据集,由于数据库中每个人都有10 副不同表情的图片,因此在图片存储到数据库时需要对每个图片都添加身份编码。
然后在迭代学习算法建立多层迭代神经网络,层数设定为6 层。建立3 个堆叠的RBM 组成自动编码器,采用数据库中经过自动编码的人脸图像进行依次迭代训练,获得一组优化的权值。采用此权值优化算法可以自动学习图像的特征,将识别为同一人脸特征的图片与身份信息匹配,识别为一组,识别结果如图5所示。从检测正确率和平均检测耗时两个指标来分析系统的人脸识别性能。
图5 人脸识别结果Fig.5 Face recognition results
2.2 检测正确率对比
分别采用3 个系统识别上述提到的不同分辨率的图像,得到的结果如图6所示。
图6 检测正确率对比Fig.6 Detects the accuracy comparison
根据图6可知,基于人脸识别技术的旅游景点自动安检系统在不同分辨率的检测上,检测正确性均高于80%,受到图像分辨率的影响较小。而另两个系统在检测中,整体正确率较低,受到图像分辨率的影响较大,较本文系统应用效果差。
2.3 平均检测耗时对比
对比3 个系统在检测中的平均耗时,如图7所示。从图7的结果能够看出,本文系统整体检测时间较少,较为稳定,较另两种系统检测效果好。
图7 平均检测耗时对比Fig.7 Average detection of time-consuming comparison
综上所述,本文旅游城市景点自动安检系统具有较高的检测正确率与效率,说明该系统能够提高旅游城市景点检测的工作效率。本文系统获得较好效果的原因可能是该系统重点设计了系统的软件部分,在软件部分采用了人脸识别技术,并提出了图像的预处理过程,从而提高了检测效率。
3 结语
本文设计了基于人脸识别技术的旅游城市景点自动安检系统,实验结果表明,本文系统具有较好的识别效果,能够为旅游城市景点自动安全检测提供帮助,满足系统的设计需求。此次研究的系统主要是针对一个图像识别,在后续研究中,可以研究识别多个图像的方法,以进一步提高旅游景点自动安全检测的效率。