目标对象检测算法应用执法工作研究

2020-11-30徐卫峰王建鹏高青

科学与信息化 2020年31期

徐卫峰王建鹏高青

摘要目标对象检测算法属于计算机视觉领域的重要问题，目前应用于无人驾驶、车牌识别、交通违法检测等领域的应用方案已较为成熟。本文介绍了几种流行的基于深度学习的目标对象检测算法研究进展，然后探讨了将其应用于卫生监督执法工作的应用场景并对未来趋势做了展望。

关键词目标对象检测算法;深度学习;卷积神经网络;卫生监督

Absrtact object detection algorithm is an important problem in the field of computer vision. At present， it has been widely used in driverless， license plate recognition， traffic violation detection and other fields. This paper introduces the research progress of several popular object detection algorithms based on deep learning， and then discusses the application scenarios of applying them to health supervision and law enforcement work， and looks forward to the future trend.

Key words Target object detection algorithm; Deep learning; Convolution neural network; Health supervision

引言

目标检测，也叫目标提取，是一种基于目标几何和统计特征的图像分割，它将目标的分割和识别合二为一，其准确性和实时性是整个系统的一项重要能力。尤其是在复杂场景中，需要对多个目标进行实时处理时，目标自动提取和识别就显得特别重要。目标对象检测算法属于计算机视觉领域的重要问题，随着电子设备的应用在社会生产和人们生活中越来越普遍，数字图像已经成为不可缺少的信息媒介，每时每刻都在产生海量的图像数据。与此同时，对图像中的目标进行精确识别变得越来越重要[1]。我们不仅关注对图像的简单分类，而且希望能够准确获得图像中存在的感兴趣目标及其位置[2]，并将这些信息应用到执法监督、视频监控、自主驾驶等一系列现实任务中，因此目标检测技术受到了广泛关注。

目标对象检测算法在医学、交通、航天等领域越来越显示出巨大的应用场景。目前主要应用于医学影像的病灶检测、行人监控与识别、飞机航拍、卫星物体检测、交通执法等。同时，目标对象检测也是视觉处理和分析任务的重要前提，例如行为分析、事件检测、场景语义理解等都要求利用图像处理和模式识别技术，检测出图像中存在的目标，确定这些目标对象的语义类型，并且标出目标对象在图像中的具体区域[3]。在新冠肺炎疫情期间目标对象检测算法主要被应用于行人检测、远程温度检测的前置温检区定位、大数据追踪等。

1目标对象检测算法研究进展

应用深度学习的目标对象检测算法目前主要有目标区域建议（Region proposal）和基于端到端（End-to-End）兩种解决方案。基于目标区域经典算法主要有R-CNN、SPP-net、Fast R-CNN、Faster R-CNN、R-FCN等。基于端到端的算法有YOLO、SSD等。其算法性能在VOC 2012数据集上进行性能测试结果如表1所示，该表展示了各种算法的平均准确率（AP）。

从表中可以看出R-FCN、YOLOv2、SSD算法准确率较高，但在生产力设备处理条件能力有限的情况下，SSD和YOLOv2算法处理相较于R-FCN算法更有效率，在笔者电脑上测试表明三种每秒可处理帧数分别为6、60、58。后两种算法虽然准确率稍逊色，但其明显更具有应用前景。下面重点介绍下这两种算法。

YOLO的全拼是You Only Look Once，顾名思义就是只看一次，进一步把目标判定和目标识别合二为一，所以识别性能有了很大提升，达到每秒45帧，而在快速版YOLO（Fast YOLO，卷积层更少）中，可以达到每秒155帧。网络的整体结构如图14所示，针对一张图片，YOLO的处理步骤为：把输入图片缩放到448×448大小;运行卷积网络;对模型置信度卡阈值，得到目标位置与类别，如图1所示。

SSD的全拼是Single Shot MultiBox Detector，冲着YOLO的缺点来的。SSD的框架如图2所示，图2（a）表示带有两个Ground Truth边框的输入图片，图2（b）和（c）分别表示8×8网格和4×4网格，显然前者适合检测小的目标，比如图片中的猫，后者适合检测大的目标，比如图片中的狗。在每个格子上有一系列固定大小的Box（有点类似前面提到的Anchor Box），这些在SSD称为Default Box，用来框定目标物体的位置，在训练的时候Ground Truth会赋予某个固定的Box，比如图2（b）中的蓝框和图2（c）中的红框。

SSD和YOLO的网络结构对比如图3所示。

SSD在保持YOLO高速的同时效果也提升很多，主要是借鉴了Faster R-CNN中的Anchor机制，同时使用了多尺度。但是从原理依然可以看出，Default Box的形状以及网格大小是事先固定的，那么对特定的图片小目标的提取会不够好。YOLO算法目前已有V2、V3版本。YOLO虽然检测速度很快，但是在检测精度上却不如R-CNN系检测方法，YOLOv1在物体定位方面（localization）不够准确，并且召回率（recall）较低。YOLOv2在改进中遵循一个原则：保持检测速度，这也是YOLO模型的一大优势。YOLOv2的改进策略如图4所示，可以看出其在VOC2007数据集上平均准确率（AP）得到了提升。

2应用于卫生监督领域的应用探讨

目标对象检测算法在卫生领域应用广泛。目前目标对象检测算法在医学研究应用已较为成熟，其主要集中在对医学图像处理分析。增加经过训练后网络，可以发现早期结节、病变组织，并可进行预测。在卫生监督领域，目前应用较少，笔者认为可以应用于监督执法工作、案件质控快速分析工作、考勤等行政工作等。

在实际监督执法工作中，可考虑应用目标对象检测算法快速发现违法行为进行查处。在现场监督中，可应用执法记录仪实时收集分析上传加密后的执法数据，在后台可应用目标对象算法实时分析，进行分类然后在利用其他算法对其进行分析发现问题反馈。在利用摄像头等远程监督中，可将实时传回的数据进行分析查找违法线索，智能保留证据，方便后续执法。例如某市有相关控烟条例，公共场所禁止吸烟，那么可以在公共场所安装摄像头等装置，利用目标检测算法实时分析吸烟人员，并将其吸烟证据实时保存，方便对违法行为进行查处，通过监督执法提高人們的幸福指数，减少违法行为的发生。

在案件质控方面，可以应用目标对象检测算法对执法人员全过程执法进行分析，例如可以分析执法人员衣着是否符合规范、执法过程是否符合规范。另外也可以对相关执法文书进行分析，提高案卷质量。

另外可将目标对象检测算法应用于一些行政工作中。例如在考勤方面可应用目标对象检测算法分析上班人员，提高正确率。

参考文献

[1] Szegedy C，Toshev A，Erhan D.Deep Neural Networks for object detection[C].Advances in Neural Information Processing Systems. 2013：11-16.

[2] Felzenszwalb P F，Girshick R B，Mcallester D，et al. Object Detection with Discriminatively Trained Part-Based Models[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence，2010，32（9）：1627-1645.

[3] Zhang X，Yang Y H，Han Z，et al. Object Class Detection： A Survey[J]. ACM Computing Surveys，2014，46（1）：1-53.