基于卷积神经网络的机场周界异物检测论述

2024-03-28孙振浩张殿生董嫘嫘阮士峰

信息记录材料 2024年2期

孙振浩，张殿生，董嫘嫘，张政，阮士峰

（1 武汉科技大学资源与环境工程学院湖北武汉 430000）

（2 安阳工学院飞行学院河南安阳 455000）

0 引言

近年来，随着人们生活质量的不断提升，民航客机在交通运输中的比重逐步上升。民航飞行安全成为人们日益关注的话题。机场作为提供飞机安全、有序、高效运行的场所，其安全性在飞行安全中占有极大比重。《民用运输机场安全保卫设施》（MH／T7003－2017）［1］于2017 年颁布，规定需在飞机活动区域周边建设与公众活动区相分离的实体边界和辅助设施，并且提出了推进以人脸识别技术为代表的智能化机场建设的要求。同时，文件［1］中还提出视频监控系统在大场景跟踪、卡口等场景下的目标检测和识别需要达到新的高度。

传统的机场周界监测技术包括：监控探头、振动电缆、脉冲电子栅栏、红外成像、地下电缆探伤等［2］。传统监控技术可以有效地防止异物入侵，提高机场的安全性，可以在一定程度上实现监测功能，有效的防止异物入侵，但也存在各种各样的局限性，如监视器必须要有安保人员全天候实时查看，且不能自动发出警报；振动电缆易于翻越，易受到气候及其他因素的干扰而产生误报；具有稳定性和鲁棒性较差、误检率高和实时性较差等缺点。

因此，如何有效防止机场周界异物入侵事件的发生成为机场安全管理领域的重点研究课题，本文在机场周界场景的基础上，梳理和总结现有的入侵检测技术，重点从检测速度和精确度两个角度出发，对基于深度学习的各种入侵检测方法进行介绍。

1 入侵检测

机场周界异物入侵指的是不属于机场内部的外来人员或物品，如不明飞行物、无关人员等，以非常规途径进入机场周界以内，或出现在不该出现的位置，如飞鸟冲入跑道、旅客误入禁区等，直接或间接地对机场的安全性造成较大影响。基于机场周界场景下的入侵检测指的是结合监控设施，应用各种目标检测算法，对所有的目标进行实时检测，并对其进行分类和识别。判断发生异物入侵的可能性，可能性大于阈值则立刻发出警报并实时监控其位置及行为信息以保障机场起飞、降落等功能的正常运行。基于机场周界场景下的入侵检测主要存在以下问题和挑战：

（1）机场周界区域空间巨大，监控设施无法全方位无死角覆盖。

（2）机场周边及其附近人员组成复杂，极难判断是否为非法分子闯入。

（3）机场空域为视野开阔的开放区域，背景变化较快，无法有效识别目标对象。

（4）在夜间监控光照条件较差，且由于区域过大，视频中小物体对象较多。

除去监控设施无法全面覆盖不谈，良好的入侵检测算法可以很好地克服以上困难和挑战。传统的入侵检测方法大致可以分为基于特征和基于分割的入侵检测方法，基于特征的入侵检测指的是通过人为设计检测目标的相关特征，将图片或视频序列放入算法中进行特征提取，从而判断是否发生入侵，人为设计的主要特征有尺度不变特征［3］（scale-invariant feature transform， SIFT）、梯度直方图特征［4］（histogram of oriented gradients， HOG）和局部二值模式［5］（local binary patterns， LBP）等。而基于分割的入侵检测指的是通过对图像颜色、边缘及区域等进行分割，从而对图像进行检测和识别。在入侵检测早期，传统的入侵检测方法确实能够节省部分人力、物力，但由于机场周界环境的复杂性，时常有大量旅客进入机场或者机场与其所属空域有飞鸟经过，传统的入侵检测算法检测速度较慢且无法有效地判断是否发生入侵。而基于卷积神经网络的入侵检测算法能够快速准确地对机场周界场景下的目标进行检测。

2 基于卷积神经网络的异物入侵算法

自从Alexnet 在2012 ImageNet 图片分类比赛中获得了冠军，人们逐渐意识到，利用深度学习抽取特征比手工设计的方法更加高效。因此，基于卷积神经网络［6－7］（convolutional neural network， CNN）的入侵检测方法逐渐被人们所接受，并不断地优化网络结构以增强其性能。

2.1 区域卷积神经网络（region-based convolutional neural network， RCNN）系列

2014 年GIRSHICK 等［8］研发出首个基于CNN 框架的入侵检测算法RCNN，标志着目标检测算法的发展进入了新纪元。 RCNN 系列的基本思路是：首先在图像中随机产生大量的候选框，利用CNN 对候选框进行卷积操作以达到对目标特征提取的目的；其次把所抽取的特征输入支持向量机，经过多次卷积和池化操作后，最后输出目标种类、边界框等信息，大致流程如图1 所示。 RCNN 的成功将大量研究人员的目光吸引到基于卷积神经网络的目标检测算法上，之后又先后提出了空间金字塔池化网络（spatial pyramid pooling network， SPPNet）、RCNN 的升级版Fast RCNN 和Faster RCNN。 RCNN 系列总结如表1 所示。

图1 RCNN 流程图

现有的机场周界的监控视频1 s 有25 帧或者60 帧，虽然Faster RCNN 的检测速度相比之前有了大幅度提高，但距离达到实时检测目标还是略有差距。因为基于RCNN 发展的一系列入侵检测方法都是先进行候选框提取，后分类检测的两阶段检测方法，其复杂的网络结构限制了检测速度的提升。

2.2 YOLO 系列

YOLO［12－16］算法一经问世就迅速地引起了全球范围的广泛关注，其中2015 年发出的YOLOv1 是真正意义上第一个端对端检测算法，YOLO 系列的主要思想就是把对目标的检测问题转换成一个简单的线性回归问题，可以把任何大小的图像直接输入到网络中，经过检测识别后，得到目标的类别和位置信息。

随着近年来的不断发展，YOLO 已经从最初的v1 版本发展至YOLOv5 甚至是YOLOvx。其中YOLOv5 可以称作是巅峰之作。 YOLOv5 的网络结构是由输入端、Backbone、 Neck、 Transformer 预测结构（ Transformer prediction head， TPH）和输出端构成［16］。图片自输入端进行预处理后传输至Backbone，经由Neck 模块进一步提取特征后，最后传输至TPH 进行图像边界框和目标种类的回归，得出最后结果。如图2 所示即为基于YOLOv5 对机场周界环境下的异物入侵进行检测的示范图。

图2 YOLOv5 检测示范图

2.3 单阶段多尺度检测（single shot multibox detector，SSD）算法

SSD 是LIU 等［17］在2016 年提出的检测算法。相对于Faster RCNN 来说，在速度上有很大的优势；和YOLO 相比，在均值平均精度（mean of average precision， mAP）上也有很大的优势。与YOLO 类似，SSD 将检测问题转换为一个简单的回归问题，实现了对目标进行一次定位与分类。和YOLO 不同的是，SSD 同样继承了Faster RCNN 中的先验框（Anchor）思想，选用回归候选框思路，提高检测速度和检测精度。