基于卷积神经网络的行人目标检测系统设计
2020-08-03王林,刘盼
王 林,刘 盼
(西安理工大学 自动化与信息工程学院,西安 710048)
0 引言
卷积神经网络是以卷积计算为基础的前馈型神经调节网络,包含多个深度支撑结构,是深度学习理论中的代表应用算法。与其它调节型网络相比,卷积神经网络具备完善的表征学习能力,可按照输入信息所属阶层,对数据节点实施分类或平移转换,故也被称为“具有平移不变能力的人工神经网络”[1-2]。该项物理概念最早由西方国家研究人员在20世纪80年代中期提出,当时的卷积神经网络具备较长时间的物理反应延迟,而在21世纪初期,随着深度学习理论的不断完善,卷积神经网络也得到了快速的发展,并且被广泛应用于自然语言处理、计算机目标检测等多个领域。
目标检测是基于目标几何特征统计的图像分割方法。通常情况下,可将一个待测目标人工分裂成多个部分,在复杂应用场景中,多个目标组织具备完全统一的实时协调能力,可辅助计算机系统获取直观的识别处理结果。PCA、SVM算法是常见的行人目标检测系统处置方案,可通过特征降维的方式,消除待检样本的残影序列,从而实现对行人目标的实时稳定跟踪。但上述系统的目标数据堆积程度相对较高,很难获取足量的行人目标检测信息,易因运动姿态的不确定性而造成实时检测精度的下降。为解决此问题,引入卷积神经网络,在CNN计算框架、训练文件架构等多项应用设备结构的支持下,设计一种新型的行人目标检测系统,并通过比照实验的方式,突出说明两类系统间的实用差异性。
1 卷积神经架构及检测体系结构
行人目标检测系统的卷积神经架构由目标传感器、神经型分类器、并行检测结构等多个应用元件组成,具体搭建方法如下。
1.1 CNN计算框架
行人目标检测系统卷积神经网络以CNN计算框架作为核心搭建结构,在“主机+FPGA”体系的基础上,控制目标检测特征的输入与输出流程,再联合信息存储带宽与卷积网络内部的核权值,实现行人目标图像的实时匹配。当CNN并行计算单元开始接收目标数据存储器中的传输信息后,整个计算框架才正式进入检测运行模式,在此过程中目标传感器、卷积分类器等应用型设备始终保持独立的并行连接状态,且与内网络存储结构相连的数据传输信道,也会随之出现兼容性占用趋势,一方面实现了神经网络体系内的信息检测环境构建,另一方面也可将与行人目标相关的图像数据,直接反馈至系统检测主机中。作为卷积神经网络的初级处理结构,CNN计算框架可协调行人目标信息间的传播应用关系,再占据一定的系统带宽条件,传输必要的目标权值参量,从而完成行人目标信息的输出与平衡,建立数据存储器与系统检测主机间的应用连接[3]。
图1 CNN计算框架图
1.2 目标传感器
目标传感器是行人目标检测系统中的重要数据处理元件,以3D Magnetic Seneor设备作为主要搭建结构,芯片外缘负载多个传感接线柱组织,可深入CNN计算框架中调取卷积神经网络内的目标应用信息,并按照既定数学模型,将各数据指标汇总至检测系统关联数据库中[4]。从执行功能的角度来看,目标传感器基本等同于一个信息处理设备,可借助传输导线建立与卷积神经网络及检测分类器的物理连接,在待检目标行人运动姿态出现明显变动的情况下,3D Magnetic Seneor设备内暂存的数据信息总量也会随之快速变化。一般来说,行人运动幅度越大,姿态的变动区间范围就越宽,与之匹配的目标传感数据总量也就越多;行人运动幅度越小,姿态的变动区间范围就越窄,与之匹配的目标传感数据总量也就越少[5]。若传感器接线柱的占用频率过高,则易导致信息数据堆积量的快速增加,而在目标传感器的调度下,CNN计算框架的承载容量也随之提升,不仅增大了系统在单位时间内对于行人目标信息的检测总量,也避免了运动姿态不确定性对实时检测结果造成的抑制影响。
1.3 神经型卷积分类器
在检测系统中,神经型卷积分类器只处理行人目标图像中的阴影淡化问题,可在原始数据信息的基础上,按照线性投射原理,固定阴影区间的实际笼罩范围,再联合Markov分类处置元件,判定该类型信息所属的存储形态,从而建立与并行检测结构间的理论应用连接。因神经型卷积分类器不具备独立的形态结构,故原始行人目标图像中一定会存在比较多的信息干扰节点,如图2所示[6]。
图2 原始行人目标图像
Markov处置元件的一次分类作用主要针对行人目标图像中的明显性干扰信息噪点(如树影、灯影等)。当目标传感器中的数据信息呈现快速汇集状态时,卷积分类器才开始对行人目标图像的集中性处理,但此次操作的执行能力有限,只能淡化大范围的阴影节点,不能去除行人目标体周围的干扰信息噪点,如图3所示[7]。
图3 一次分类后的行人目标图像
Markov处置元件的二次分类作用主要针对行人目标体周围的干扰信息噪点(如人体阴影)。在此情况下,目标传感器中的数据信息快速分散,卷积分类器转移与行人目标相关的神经性节点组织,达到直观获取系统检测指令的目的,如图4所示。
图4 二次分类后的行人目标图像
1.4 并行检测结构
并行检测结构存在于系统数据输入端与输出端之间,可将卷积神经网络内的行人目标信息,转化为完整的检测处理图像,是神经型卷积分类器的下级执行元件,同时满足CNN计算框架与目标传感器的调度与调节需求。整个并行检测结构由卷积子层、目标抽样层两部分组成[8]。通常情况下,卷积子层直接与系统神经网络主机相连,可在多个节点组织的作用下,对神经型卷积分类器输入的行人目标信息实时统筹处理,并借助神经网络中的卷积递归函数,实现对目标数据的抽样处置。目标抽样层包含大量的检测函数模型,可在接收卷积子层结构中行人目标信息的同时,建立必要的图像检测规则,并将这些信息与Markov处置元件中的噪点数据匹配,从而生成独立的行人目标检测图像,以供其它系统设备的直接应用与调取。
图5 系统并行检测结构
2 基于卷积神经网络的行人目标检测系统软件设计
2.1 待检测目标样本训练
在卷积神经架构及检测体系结构的支持下,按照训练文件连接、训练环境搭建、参数文件配置的处理流程,实现对待检测行人目标样本的训练处理。
2.1.1 训练文件架构
训练文件架构建设是实现行人目标检测的重要处理流程,包含存放目录生成、子文件夹读取、候选框合并等多个处置阶段(如表1所示)。在实际检测过程中,训练文件架构可以充当行人目标数据的传输背景,一方面可与卷积神经网络中的并行检测结构建立应用型连接,另一方面可在目标传感器的促进下,选择文件样本中的必要信息参量[9]。存放目录也叫训练文件架构的基层数据处置单元,常被定义为“caffe-fast-rcnn”译码形式,其中“caffe”编码代表神经网络内部的卷积型连接节点;“fast”编码代表平行检测情况下的行人目标数据转码速率,若转码速率过快,则可在“fast”源码的基础上后缀“+”或“++”,以描述系统内文件架构行为的具体施行状态;“rcnn” 编码代表行人目标数据结构在卷积神经网络中所处的实时位置,为保证系统应用检测指令的获取直观性,编码体在训练文件架构中始终保持波动性传输状态,且极值信息点的标注范围不得超过[20,210](限制单位为109T)的物理区间。
表1 训练文件架构建设处置原理
2.1.2 训练环境
根据表13显示:拉丁舞练习组女生在上肢快速反应测试中使用时间平均减少了8.17s,拉丁舞练习组男生平均减少了11.03s,P<0.05,两组之间具有显著性差异,表明拉丁舞对男生上肢协调性的影响大于女生;触杆反应测试和十字绕杆跑测试中,拉丁舞练习组女生使用时间分别平均减少了2.88s和2.67s,拉丁舞练习组男生分别平均减少了3.62s和1.72s,两组之间差异不显著,表明拉丁舞对男、女大学生灵敏素质影响差异不大。
行人目标文件的训练环境搭建包含硬件配置、软件配置两个环节。其中,硬件配置是指检测主机存储容量及存储形式的选择,纵观整个神经网络的卷积连接形式,系统检测主机内的GPU结构,至少具备16 G的数据承载空间,而与文件架构所匹配的硬盘空间则至少应保持为2 006 G。软件配置则主要针对行人目标文件的存放目录结构,在算法层面,整个训练框架始终保持为开源状态,随着“fast”编码后缀“+”符号数量的增加,系统检测编码的实时位置也会逐渐向着神经网络主机端靠近,直至行人目标数据的转码速率与文件样本生成速率完全相等[10]。针对“alt-opt”型行人目标数据信息,检测系统软件配置则采取数据集解压的处理形式,将卷积神经网络内的节点占用率降低至低标准应用状态后,实施测试脚本的规划与利用,直至卷积分类器可直接输出与行人目标数据相关的系统检测结果。
2.1.3 参数文件配置
完成配置后的行人目标参数文件主要存储在“caffe-fast-rcnn”目录下,可按照信息样本节点内的数据函数重要度,确定检测系统中训练文件架构的实际连接形式,从而实现对卷积神经网络内样本节点的合理化占用[11]。用于生成行人目标检测指令的配置函数由多种基类形式共同组成,简单来说,可在加载训练文件样本信息的同时,处理系统检测节点间的数据互联关系,从而实现对行人目标数据的加载预处理。表2描述了几种常见的行人目标参数文件配置函数。
表2 常见行人目标参数文件的配置函数
2.2 行人目标样本重构及目标检测
按照待检测目标样本的实际训练需求,配置系统检测接口的实际访问参数,再联合模块复用加速结构,完成卷积神经网络内的行人目标样本重构,实现新型行人目标检测系统的顺利应用。
2.2.1 检测节点架构
图6 系统检测节点的架构连接形式
2.2.2 访问接口配置
访问接口配置是在检测节点架构的基础上,对行人目标信息数据包的进一步处理,可联合神经卷积分类器等多个硬件应用结构,处理系统内的检测执行指令,从而控制行人目标样本图像的实际输出方向[13]。在访问接口组织的促进下,待检测行人目标信息数据包首先执行封装处理,再根据各类“def”函数的排列形式,生成多个解码型数据结构,借助已重构的训练文件样本,生成系统检测所需的地址及指令信息参量,经过多次缓冲稳定,生成最终的行人目标样本图像,借助完善的访问接口组织,传输至其它系统元件结构之中。
图7 访问接口配置原理
2.2.3 模块复用加速设计
模块复用加速器是指存在于卷积神经网络节点内的信息初始结构,可在固定行人目标图像中像素点梯度值的同时,以核心像素点作为系统检测指令的实时切入位置,再分别计算各个方向上的图像梯度分布常量数值。通常情况下,一个模块复用加速器只对应一个像素点梯度数值,且与之匹配的梯度方向和梯度角度也始终保持在固定参数区间内[14]。设t0代表系统检测模块间最小的复用加速时长,t1代表系统检测模块间最大的复用加速时长,联合复频卷积参量f,可将行人目标检测系统中的模块复用加速应用公式定义为:
(1)
其中:δ0代表神经网络内的最小卷积应用权限,δ1代表神经网络内的最大卷积应用权限,χ代表与行人目标数据匹配的必要检测系数,Δy代表单位复用加速时长t行人目标数据的检测处理总量。至此,实现各项软硬件执行结构的搭建,在卷积神经网络结构的支持下,完成新型行人目标检测系统的设计。
3 实验分析
为验证基于卷积神经网络行人目标检测系统的实际应用价值,设计对比实验。在既定背景环境中,设置多个监测摄像头用于获取连续的行人目标图像,如图8所示,将摄像头内的数据参量转换成信息流形式,传输至检测分析主机中,根据各项参量指标的具体变化情况,研究单位时间内行人目标检测量及目标数据堆积量的具体变化趋势,其中实验组分析主机搭载新型行人目标检测系统,对照组主机1搭载PCA算法,对照组主机2搭载SVM算法。
图8 实验检测图像
以10 min作为单位检测时长,分别记录在5个单位时长内,实验组、对照组行人目标检测量的实际变化情况,实验详情如表3所示。
表3 行人目标检测量对比表
由表3可知,实验组行人目标检测量在第5组别内的记录数值最大,平均数量级达到9.45×109T,第1组别内的记录数值最小,平均数量级仅为8.00×109T,整个实验过程中的平均数量级达到8.85×109T,处于最大、最小平均数值结果之间;对照组1行人目标检测量在4组别内的记录数值最大,平均数量级达到4.35×109T,在第2组别内的记录数值最小,平均数量级仅为4.20×109T,整个实验过程中的平均数量级达到4.26×109T,与实验组平均数值水平相比,下降了4.59×109T;对照组2行人目标检测量在第4组别内的记录数值最大,平均数量级达到4.55×109T,在第1组别内的记录数值最小,平均数量级仅为4.30×109T,整个实验过程中的平均数量级达到4.41×109T,与实验组平均数值水平相比,下降了4.44×109T。综上可知,应用基于卷积神经网络行人目标检测系统,具备在单位时间内,增强目标数据信息检测量的能力。
分别以10 s、20 s、30 s作为周期性检测时长,逐次加大检测主机内的目标数据输入流量,取9次实验的目标数据堆积量具体数据结果作为分析样本,研究行人目标数据堆积速率的具体变化趋势,实验详情如表4~6所示。
表4 实验组目标数据堆积量
表5 对照组1目标数据堆积量
表6 对照组2目标数据堆积量
对比表4~6可知,实验组目标数据堆积量在周期性检测时长等于10 s的情况下,具有最大的平均值结果,在周期性检测时长等于20 s的情况下,具有最小的平均值结果,同时去除最大值与最小值,取周期性检测时长等于30 s最为分析对象,经计算可知,实验组目标数据堆积量的平均值仅为1.20×109T/s;对照组1目标数据堆积量在周期性检测时长等于10 s的情况下,具有最大的平均值结果,在周期性检测时长等于30 s的情况下,具有最小的平均值结果,同时去除最大值与最小值,取周期性检测时长等于20 s最为分析对象,经计算可知,对照组1目标数据堆积量的平均值达到3.03×109T/s,与实验组平均值相比,上升了1.83×109T/s;对照组2标数据堆积量在周期性检测时长等于10 s的情况下,具有最大的平均值结果,在周期性检测时长等于30 s的情况下,具有最小的平均值结果,取周期性检测时长等于20 s最为分析对象,经计算可知,对照组2目标数据堆积量的平均值达到2.82×109T/s,与实验组平均值相比,上升了1.62×109T/s。综上可知,应用基于卷积神经网络行人目标检测系统,可实现降低单位时间内目标数据堆积速率的初衷。
4 结束语
在卷积神经网络的支持下,新型行人目标检测系统改进传统CNN计算框架,联合目标传感器、并行检测结构等多个硬件执行设备,在建设训练文件架构的同时,设置必要的模块复用加速器结构。从实用性角度来看,新型检测系统可解决PCA、SVM算法中目标检测量低、数据堆积速率快的问题,具备较强的实用适应性。