基于扩张卷积神经网络的密集区域人数统计系统
2019-04-26钱超李顶根
文/钱超 李顶根
1 引言
当前,密集场所的公共安全问题越来越突出。为了保障公共安全,对公共场所尤其是人口密集区域的人数统计显得尤为重要。同时随着图像采集与图像处理技术的发展,基于视频图像的人数统计方法得以广泛的应用。目前基于视频的人数统计主要有基于检测的人数统计,但是由于人群密集区域,身体头部之间的遮挡非常严重,采用典型的头肩模型和人体模型直接对人流中单个个体进行检测统计导致人数统计精度较低。另外,基于特征的人数统计,但假设前景区域和人流总数近似于线性关系,在密集区域由于遮挡和透视问题也使得其精度较低。
随着深度学习在图像处理和图像识别上的发展应用,使得深度学习算法逐渐引入到人流密度统计上,基于此发展出一些基于深度学习的人流密度统计方法。其中卷积神经网络中其神经元间的非全连接和权值共享的特性,使其网络模型的复杂度明显减低,同时减少了权值的数量,在人数统计处理中优势明显。Zhang[4]等人提出用多任务卷积神经网络估计人群密度概率图以提高精度。Zhang[5]等人提出了用多列卷积神经网络提取不同尺寸的行人特征,增加人群密度估计准确率。但是该结构存在着模型结构复杂,训练难度大,训练时间长,难以实际应用的问题。因此基于此本文提出了基于扩张卷积神经网络的人数统计算法。通过卷积神经网络提取特征,并通过扩张卷积神经网络在保证数据量的基础上,提高模型深度,估计人群人流密度进行人数统计。
2 模型
2.1 模型结构
表1:模型误差表
图1:基于扩张神经网络的人数统计算法整体结构图
针对人群密集区域的场景特点,本文采用基于神经网络的人数统计方法。该网络前端采用卷积神经网络,后端采用扩张卷积神经网络,以增大感受野,获取更多特征。
在前端网络中选取常用的VGG16神经网络,在传统的VGG16神经网络中去除了用于分类的全连接层,只采用了VGG16中的卷积层和池化层。卷积核的大小为3X3,这使得输出的数据仅仅为输入数据的1/16,一方面减小了数据处理量,另一方面保证了算法的精度。
在后端网络中采用了扩张卷积,其作用在输出分辨率不变的情况下进一步挖掘数据特征。其中扩张卷积系数取2。该算法的整体结构图如图1所示。
2.2 模型调试
为了生成用于训练该人数统计模型的真实人群密度概率图,这里采用高斯核密度算法。在训练图像中每个人的头部中心位置坐标,然后通过高斯核模糊行人标点生成人群密度概率图。
其中,x是人群密度概率图H的像素位置,a是行人标记集中一个标记点,δ是高斯核N的方差。
图像中的总人数为人群密度概率图中所有点像素和。即
为了评估模型计算值与真实目标值之间的偏差,这里采用欧式距离方程来计算。模型的损失函数由两个部分所组成。其中包括人群密度概率图损失函数和人群人数损失函数。
其中N为训练数据中的图像数。Xi为输入图像,Fh为估计的人群密度概率图,Fc为估计的人群数量。
2.3 模型评估
为了对卷积神经网络模型人数统计的精度进行定量评估,引入了评价指标平均绝对误差(MAE)和均方误差(MSE)。
N为测试图像总数,Estn和GTn分别为第i张图像所对应的真实值和估计值。平均绝对误差反映了模型结果的准确性,而均方误差反映了模型结果的鲁棒性。
3 模型验证
为了对模型的精度进行验证,这里采用ShanghaitechB数据集。该数据集中共700张图像,其中400张图像作为训练数据,余下300张图像作为测试集。将本文的基于卷积神经网络的人流统计算法与其他几种算法的估算误差相比较,结果如表1所示,该模型具有较高的精度,可实际应用。
图2:密集区域人群人数统计系统效果图
4 基于卷积神经网络的人流监测应用
基于该扩张卷积网络的人群人数统计算法,设计了一款用于实时监测密集区域人数的统计系统。并在武汉市某大型广场进行实时监测和显示,系统输出的图像如图2所示。从图中可以看出,该系统能够较好的反映出人群密度,并统计出人群人数。对公共密集区域的人群起到很好的安全监控作用。
5 结论
本文提出了一种基于扩张卷积网络的人群人数统计算法。该算法由卷积神经网络和扩张卷积神经网络两个部分构成。该算法适用于密集区域人群拥挤场景,能够在扩大感受野的同时保证数据的计算强度。且通过在典型数据集上的分析,验证了其有效性,同时具有较好的精度和鲁棒性。