基于视频图像的车站设施服务能力适应性识别

2022-03-19王锦玉王齐荣

四川建筑 2022年1期

王锦玉王齐荣

【摘要】目前我国铁路客运车站通过静态的方法设计车站内各种设施的规模和布局来实现车站总体服务能力的最大化，车站运营管理部门缺少能够动态评估车站设施服务能力与客流不确定需求之间匹配程度的手段。文章基于深度学习理论，提出了一种车站设施服务能力与客流不确定需求适应性评估的视频图像检测方法，通过视频图像检测出车站重要设施范围内乘客排队的人数，结合制定的适应性分级标准对车站设施服务能力与客流需求进行适应性评估。实验结果表明，所提出的方法检测速度快，能够满足实际应用中实时性的要求，而且对人群目标检测的平均准确率为81.25 %。其检测结果可以辅助管理者评估车站设施在动态客流需求下的运营情况。

【关键词】车站; 深度学习; 人群目标检测; 适应性评估

近年来，我国铁路旅客出行人数与日俱增，特别是客流高峰期，车站面临重要设施服务能力与客流需求严重不匹配的情况，运营管理部门也缺少能够准确把握客流需求的技术手段。利用城市轨道交通自动售检票系统[1]和手机信令数据[2]进行客流监测是近些年主要的研究方向，但是检票闸机只能检测进出站乘客的出行信息和数量，时效性不高，手机信令数据无法采集车站内局部区域拥堵点的数据[3]。随着智能视频监控系统和计算机视觉技术的发展，基于视频图像的行人检测技术广泛应用于公共场所，也为公共交通领域的客流检测提供了借鉴。

国外的图像研究较早，已经形成了大量成熟的技术，ObjectVideo、Visio Wave、Citi Log等软件都能够实现对视频的智能分析和图像识别。Object Video软件能够对视频中行人的人数进行识别，准确率已经能达到80 %～90 %[4]。目前广泛应用的方法有背景差分法、光流场法、帧间差分法[5-8]等。近些年，国内学者研究人群目标检测技术实现对城市轨道交通客流的实时检测，采用深度卷积神经网络（Convolution Neural Network ，CNN）大幅度的提高了客流检测的准确率，具有较高的研究价值和广阔的应用前景[9-11]。这些相关研究表明，深度学习在轨道交通客流检测的性能和准确度方面表现都较为出色，而YOLO v3 又是目前速度和精度都很高的一个网络模型，在CPU计算下可以获得45 帧/s图片处理的效率，完全可以应用于视频图像的检测任务[12]。因此本文提出了一种基于YOLOv3算法检测车站设施服务能力与客流需求适应性评估的方法，该方法能够辅助管理者评估车站设施在动态客流需求下的运营情况。

1 适应性评估检测流程

本文提出的客流需求与设施服务能力适应性评估的视频检测算法流程如图1所示。该算法的完整流程分为三个模块：预处理模块、核心检测模块以及输出模块。

1.1 预处理模块

对输入的视频图像进行预处理工作，可以使检测网络更好地完成学习任务。

1.1.1 视频图像处理。

本文中视频图像检测的输入数据为车站的监控视频，抽取视频中的图片，通过抽取的部分视频画面完成检测任务。

1.1.2 检测区域选择。

根据运营管理的需求，利用视频监控来掌握乘客的数量和空间分布，本文将车站范围内的重点设施：进出站口、安检处、自动扶梯、检票口作为重点监控区域，事先圈定视频画面中的检测区域，可以提高检测的效率[13]。

1.2 核心检测模块

1.2.1 YOLO v3模型框架

YOLO v3网络结构包括Darknet-53和YOLO层，Darknet-53的作用是特征提取，YOLO的作用是多尺度预测。Darknet-53直接舍弃池化操作，大大降低了池化带来的梯度负面效果，用卷积层中的步长来实现降采样，作为YOLO v3的特征提取网络具有鲁棒性更好的优点。YOLOv3的检测网络引入多尺度预测的概念，即将检测层数量由原来的1层增加到3层，3层对应 13×13，26×26及52×52三个不同尺度的特征图，作者用K-means聚类出锚框的尺寸，并将锚框个数由5个提高到9个，按锚框尺寸大小分到三个检测层级，YOLOv3多尺度检测的方法很好的融合了上下文特征信息，可以应用于不同尺度目标的模型预测。YOLO v3牺牲了网络速度但是提升了准确度并且提高了网络结构的深度。YOLO在GPU中速度達到了45fps，也就是说每秒能够检测45张图片，检测速度比Fast-R-CNN快了300倍，完全能够达到实时检测的目的，而且在实时检测中，也比其他实时检测算法的精度都要高[14]。YOLO v3的网络框架如图2所示。

1.3 输出模块

本文所研究的视频检测模型的重要输出内容之一就是车站重要设施范围内乘客的实时数量，但是仅仅获取到实时的乘客数量对运营指导意义不大。所以在得到乘客数量的基础上，本文希望通过设置合理的人数阈值对车站设施的服务能力适应性做出评估。决定车站设施服务能力与客流需求适应性的三个主要因素：车站设施服务能力，应急资源配置以及客流组织策略。在现实场景下，将得到的客流需求与车站设施服务能力适应性评估与运营组织工作结合起来，意义重大。本文的输出模块将适应性划分为三个等级，依次是良好，差，极差。适应性评估的分级以乘客在车站设施范围内排队的数量与其通行能力之间的匹配程度为标准。具体的分级方法本文将在第二部分重点介绍。

2 适应性评估分级

车站设施服务能力不足的主要表现为客流的拥堵和排队现象，但是拥堵和排队不代表车站设施的服务能力不足，在客流高峰期影响不大的拥堵排队现象是合理的[15]。因此选择一种直观、易于获取和理解的识别指标来评估车站设施服务能力与客流需求适应性非常重要。目前常用的识别指标主要有两类，第一类是基于系统仿真[16]的行人宏观交通流参数，包括客流平均移动速度、客流密度、客流量;第二类是基于排队理论[17]的排队理论性能指标包括平均排队时间和平均排队长度。行人宏观交通流参数可以直接用视频监控图像处理技术获取，但是将其作为识别指标忽略了乘客的感知，而且不够直观。将排队长度作为识别指标不仅在视频监控中更加直观，而且可以结合客流的时空分布特征，反映出车站各类设施拥堵的严重程度。因此本文采用排队长度即排队人数作为识别指标。

由于乘客出行特征多样，所以本文并没有采用《地铁设计规范》中各种设施的最大通行能力。通过对成都东站，武汉站客流高峰时段的现场调查发现，大型铁路客运车站内乘客携带的行李较多，影响了车站设施的通行能力。所以本文采用现场调研的形式获取客流高峰期各类服务设施的实际最大通行能力和乘客感受更加直观的最大，最小排队容忍时间等数据。而乘客所能容忍的最大，最小排队人数为实际通行能力与最大，最小排队容忍时间的乘积。现场调研获取的数据如表1所示。

分析现场调研的数据发现，面对不同设施的乘客最小、最大容忍时间差别较大，分析原因在于进站口作为领近车次所有乘客进入车站的通行设备，排队拥堵现象更普遍，所以乘客忍耐程度较高，而自动扶梯处由于旁边有楼梯的存在，当排队人数较多时，未携带行李或携带较少行李的乘客会选择走楼梯，因此乘客的容忍程度较低。通过分析调研数据，本文建立的客流需求与车站设施服务能力适应性评估的等级划分如表2所示。

3 案例分析

3.1 网络模型训练

为了提高训练的效果，本文使用的数据集应该满足：①數据集为密集的头部目标;②目标框标注类型。SCUT-HEAD作为一个规模特别大的头部检测数据集，包含4 405张图片，共计包含111 251个头部目标，平均每张图片含有25.3个头部目标，部分图片超过100个头部目标，因此本文选择SCUT-HEAD数据集作为实验数据集。参照YOLO v3原作者主干网络配置文件和训练权重文件，将神经网络训练类别改为单一类别，类别名称改为person，并且在编程中添加了一个计数器用于统计人数。本文使用SCUT-HEAD数据集训练了YOLOv3网络。在它的训练阶段，使用了动量项为0.9的异步随机梯度下降。权重衰减设置为0.000 5，最大的迭代次数设置是100 000，学习速率初始值设置为0.000 1，50 000次迭代后改成0.001，训练到70 000次后改成0.000 1，迭代到90 000次后改成0.000 01。

本实验的软硬件平台：CPU：Intel（R） Core（TM） i7-7700 CPU @ 3.20GHz * 12;GPU为：NVIDIA GeForce GTX 1080Ti;

操作系统：ubuntu 16.04LTS;深度学习框架为：darknet。

3.2 实验结果分析

通过大量的实验，YOLOv3算法在人群目标数据集SCUT-HEAD上成功训练，得到人群目标检测模型后进行训练实验，将三次实验的平均值作为最终实验检测结果（表3）。

表中AP表示人群目标检测精确率，81.25 %的精确率表明了YOLOv3具有良好的检测效果。FPS表示每秒检测的速度，在本文实验软硬件平台下每秒可以检测43张人群目标图片。整个网络模型从开始训练到模型收敛大约用时7 h 36 min。

3.3 案例

本文将采集到的150张车站安检处乘客排队图像处理作为YOLO v3模型的输入向量，对客流需求和安检设备服务能力的适应性进行评估，从准确率和速度两方面来分析识别结果，每副图像的平均检测时间为0.023 s，而平均误检为19.75 %，可以实现对车站设施服务能力与客流需求进行适应性评估实时检测。并以图3、图4作为实际场景下检测的效果展示。

通过检测，图3中安检处前乘客排队人数为13人，小于分级阈值18人，所以识别适应状态为良好，图4中安检处前乘客排队人数为33人，大于阈值30人，所以识别适应状态为极差。当识别出安检处前排队乘客人数大于最大阈值30人时，建议运营者再开一条安检通道，或者是增加经验丰富的工作人员，加快乘客安检速度。

4 结论

铁路客运车站已经进入网络化运营阶段，为了提高车站设施服务水平，本文提出了一种基于视频图像检测客流需求与车站设施服务能力适应性评估的方法。并且对多个实际场景图像进行案例分析，实验结果表明该方法能够较好的检测出车站重点设施范围内的乘客数量，结合分级规则，可以为运营管理者提供可靠的排队乘客数量和适应性评估。

参考文献

[1] 李臣，汪波，白云云，等.基于AFC数据的城市轨道交通突发事件客流影响分析[J].铁道科学与工程学报，2019，16（10）：2620-2627.

[2] 丁敬安，张欣海.基于手机信令数据的地铁乘客路径识别研究[J].中国电子科学研究院学报，2019，14（11）：1194-1201.

[3] 王婵婵，张琦.上海城市轨道交通日常大客流检测及预警需求研究[J].城市轨道交通研究，2018，21（10）：11-15.

[4] 夏令.铁路客运枢纽客流人数自动识别系统研究与实现[D].北京：北京交通大学，2011.

[5] Shao L， YangZ， ZhangW. The Application of Intelligent Device and Method for Detecting Dynamic and Static Human Body in Energy-Saving Control of Schools[J].Procedia Engineering ，2017， 205：4017-4021.

[6] Tong Li， Bo Jiang， Dihua Wu， et al.Tracking multiple target cows'ruminant mouth areas using optical flow andinter-frame difference methods [J].IEEE Access，2019（7）：185520-185531

[7] Marcin M， Olszewski P， Nowosielski A， et al. Pedestrian Traffic Distribution Analysis Using Face Recognition Technology[C]. In： Mikulski J. （eds） Activities of Transport Telematics. Berlin， Heidelberg： Springer，2013.

[8] Guo D，Van d V A L，Zhou X.Red blood cell tracking usingoptical flow methods [J].IEEE Journal of Biomedical &Health Informatics， 2014，18（3）：991-998

[9] 庞梦圆，杜彦君，厉超吉，等.基于图像采集技术的地铁站台客流引导系统研究[J].都市快轨交通，2017，30（2）：37-41.

[10] 彭博，蒋阳升.城市轨道交通车站拥挤踩踏预警技术探讨[J].公路交通科技，2016，33（7）：108-113.

[11] 何文玉. 基于深度学习的地铁客流检测与跟踪算法研究[D].江西：江西理工大学，2020.

[12] 徐畅，程文轩，杨远舟.关于Yolo目标检测算法的基础研究[J].电脑与信息技术，2020，28（4）：45-47.

[13] 陈毓伟. 基于深度学习理论的轨道交通乘客拥挤程度视频检测算法研究[D].南京：东南大学，2019.

[14] 盛蕊. 基于视频图像的地铁车站客流安全状态识别[D].南京：南京理工大学，2018.

[15] 单征. 地铁车站集散能力瓶颈识别方法研究[D].北京：北京交通大学，2015.

[16] 陈慧，汪波，朱江斌.基于系统动力学的城市轨道交通车站客流控制仿真与优化[J].大连交通大学学报，2020，41（5）：1-7.

[17] 单征，宋瑞，李婷婷，等.城市轨道交通车站集散能力瓶颈识别方法研究[J].交通信息与安全，2014，32（1）：117-121.

3057501908234