APP下载

基于YOLO和帧间差分法的飞鸟检测算法

2021-06-28杨陆野

现代信息科技 2021年1期
关键词:像素点飞鸟雷达

摘  要:飞鸟是飞行物中典型的“低慢小”目标,具有低可观测性,在很多场景中它又是巨大的安全隐患。所以对飞鸟进行有效的检测和驱赶是机场、高压电站等高风险区域安保工作的重心。但飞鸟种类繁杂,其自身形态变化大且机动性极强的特点,让飞鸟检测的技术难度远高于传統的目标探测。文章对常见飞鸟目标检测技术的研究及发展进行了梳理,介绍了其中各项解决方案的利弊,并提出了以帧间差分法和YOLOv5深度学习模型为基础的新检测方案。

关键字:飞鸟检测;目标检测;运动检测;深度学习;YOLOv5

中图分类号:TP391.41;TP183;V279           文献标识码:A 文章编号:2096-4706(2021)01-0092-03

Bird Detection Algorithm Based on YOLO and Inter Frame Difference Method

YANG Luye

(Shanghai University,Shanghai  200444,China)

Abstract:Bird is a typical “low,slow and small” target in flying objects,which has low observability,and it is also a huge safety hazard in many scenes. Therefore,the effective detection of bird and driving it away is the focus of security work in high-risk areas such as airports and high-pressure power stations. But the kinds of bird are complex,their characteristic in own shape changes greatly and the mobility is very strong,which makes the technology difficulty of birds detection is more higher than the traditional target detection. This paper sorts out the research and development of common bird target detection technology,introduces the advantages and disadvantages of various solutions,and proposes a new detection scheme based on the deep learning model of inter frame difference method and YOLOv5.

Keywords:bird detection;target detection;motion detection;deep learning;YOLOv5

0  引  言

“鸟击”是指在航空器起落或飞行途中与鸟类等小型物体相撞的恶性事件。全球每年发生近21 000起鸟击事件,造成的直接或间接经济损失超过10亿。随着疫情趋缓,全球旅游业开始复苏,航班量的持续增长,使机场的“鸟击”防范压力愈发增大。传统的机场安全监测依赖于人力观测来预防“鸟击”,但若遇到观测点可见度低,观测场地距离过远,观测背景复杂、干扰因素多等问题时,简单的肉眼检测往往难以实现高效的鸟情安全预警。为实现全天候高效不间断的鸟情监测,经过30余年的发展,国内外相关机构已经研制出很多相对成熟的“雷达探鸟系统”,如美国Merlin雷达、加拿大Accipiter雷达、荷兰Robin雷达以及中国民航科学技术研究院开发的“机场雷达探鸟与驱赶联动系统”。多数雷达产品采用了S波段水平扫描雷达和X波段垂直扫描雷达共同检测的方式,但目前受限于检测精度不高(大多低于75%),且误报较多导致探测效果还不能完全满足机场的安保需求。本文对近年来各种场景下的飞鸟目标检测及识别技术的研究发展进程进行归纳总结,并结合深度学习模型及动态检测算法,建立全新的飞鸟识别解决方案。

1  现有解决方案及前沿技术

1.1  机场雷达飞鸟检测系统

雷达主要利用S波段水平扫描整体覆盖机场及周边低空空域,辅以X波段垂直扫描所有航空器起降通道,采用鸟情信息提取算法获取飞鸟目标信息,典型探鸟雷达如美国Merlin雷达。Accipiter雷达在Merlin雷达基础上增设X波段抛物面天线部分;Robin雷达则是在Merlin雷达基础上增设了调频连续波雷达,用来增强对飞鸟目标判定的准确率[1-3]。

1.2  基于微多普勒信号的飞鸟特征提取及判别

飞鸟的双翅震动会在由主体平动产生的雷达回波多普勒频移信号附近引入额外的调制边带,该信号称为微多普勒信号,产生微多普勒效应[4]。微多普勒效应反映的是多普勒频移的瞬时特性,表征了被检测目标运动的瞬时径向速度。

1.3  基于深度学习的飞鸟特征提取及判别

基于深度学习模型高效的信息抽取和特征提取能力,不少最新的研究将传统的鸟类雷达回波特征提取部分优化为深度学习模型提取。相较于传统机器学习模型和统计学方法,深度学习模型能够通过高维网络架构挖掘原始数据中的隐藏特性,从而达到更好的泛化应用能力,在实际检测中获得更强的鲁棒性。

目前流行的几大解决方案都有其局限性。在雷达飞鸟检测系统中,其主要观测目标回波特征、频率及其幅度还受到受检测目标姿态、回波传递中是否连续、环境中是否出现遮挡物等多方因素的影响。真实的回波模型远远复杂于理想建模,需要不断优化。在基于多普勒信号的特征提取系统中,常规外辐射源雷达工作效率较低,且由于飞鸟本身大小不一,其运动特性表现又不尽相同,精细化提取其特征进展较为缓慢,难以得到能够符合大部分场景的精细化分类通用特征库。在基于深度学习的飞鸟特征提取中,尚缺乏多场景下长期的数据观测结果作为底层网络结构建设的基础依据。

2  深度学习模型及动态识别模型

2.1  帧间差分法

对于定点采集的连续视频序列,可以利用连续帧之间的差值来检测运动物体所在区域。算法是通过计算前后帧同位置像素点之差得到差值图。再将差值图转化为灰度图,调整合适的阈值后进行判别,找到变动明显的像素点群。将像素点群经过聚类方法分化为若干个区域来排除噪声点等环境干扰因素影响。划选出所有可能区域后,再通过对场景目标物的特点进行分析和经验建模筛出运动物体所在区域。

算法设计关键在于灰度图时阈值的选取和差分法设计。若阈值选取过小将会导致噪点过多且无法排除背景干扰,阈值选取过高则会导致部分运动信息被忽略进而导致动态识别不准。常见的差分法有两帧差分法和三帧差分法:

(1)二帧差分法是通过每一像素点在前一时间间隔和后一时间间隔的绝对差值所得,转化为灰度图后再通过连通性分析得到判别结果。

(2)三帧差分法先获得时序序列前后帧灰度差值序列,再由前后帧差值序列中的前后值结果图像按位做“与”操作后得到对应灰度图,最后通过连通性分析得到判别结果。

两种算法中二帧数差分法运算速度更快,适合目标数量多,检测任务时效性要求高的场景,三帧差分法适合运动目标移动速度较快,环境噪音较大的场景。

2.2  YOLO v5网络

YOLO深度学习框架(You Only Look Once)是由DIVVALA等人在2016年初提出的基于回归的一种目标识别算法,至今已经发展到第五代YOLOv5[5]。YOLOv5在保留前几版本极高的识别效率的前提下,通过引入残差神经网络中残差块的概念,动态调优网络层级关系和已有预测模块逻辑,大大提升了对小型物体的识别准确率。而且相较于之前的二版本,YOLOv5大大压缩了算法模型规格,其中最小的模型YOLOv5s大小只有13 Mb,使得模型应用场景可以推广到小微型终端。

3  方案设计

由于检测目标飞鸟的种类众多、形态各异而且不同国家地区、不同地点鸟类形态差别极大,如我国鸟类常见种类为麻雀。而麻雀的主色灰白与水泥墙体背景色差距极小,所以在很多工业场合,很难将其直接识别出来。但若要训练能在日常环境中准确判断飞鸟位置的模型并保证其在多种环境下的鲁棒性,则需要准备大量标注好的多类别多形态鸟类图片。但是现有的所有已标注图像数据集大多为全类别标注数据集,其中鸟类对应的数據量都远远不足,即使像Microsoft COCO这样的大型成熟数据集中鸟类对应的图片也不到一万张。故若仅依靠累积数据量、标注完备数据集、训练成熟的深度学习模型来达到精确识别飞鸟的目标,则需要投入大量的人力物力。需要安排众多检测员对每个可能场景逐一进行针对性数据采集和标注。这样的方案不仅费时费力,而且训练出来的模型缺乏泛化解释能力,若转换新场景则需要重新采集数据训练。为达到高识别效率和多场景适应性,在观察飞鸟特有的多局部运动特点(真实场景中鸟类有非常多的局部运动,几乎没有完全静止的时刻,即使是在停立状态下仍有鸟喙,鸟翼,鸟头等位置的局部运动)后,我们引入动态检测算法帧间差分法作为辅助检测判断,用YOLOv5获得的鸟类识别结果图和帧间差分法获得的动态检测结果图综合判断以获得飞鸟所在区域,如图1所示。

其中K为0到1之间的正实数,是模型辅助判断的超参数,代表深度学习检测结果和动态检测结果之间权重。当视频清晰度较高,背景无过多噪音,鸟类整体识别度较高时,K可适当取大值以提升深度学习检测结果权重;当背景噪音较高,同类干扰物较多,鸟类目标难以正常识别时,可以适当缩小K值以提升动态检测权重,消除干扰物影响。

4  算法测试

在测试中的高压电站场景,背景杂音较小且飞鸟运动轨迹比较简单,移动速度较低,故我们选择二帧差分法作为动态检测算法,用已训练好的YOLOv5s轻量物体识别算法模型[5]作为物体识别部分算法其中YOLOv5和帧间差分法的检测结果分别如图2、图3、图4所示。

由动态检测和物体识别两部分算法得到置信度像素点级网格结果图,其中动态检测置信度像素点网格图为动态检测后获得的二值结果图,代表该像素点在该时间间隔内是否有变化,0代表物体没有运动,1代表物体发生了变化。物体识别置信度网格结果图则是0到1区间内的正常数,代表由YOLO算法给出的当前像素点归属于鸟类的置信度,0代表最不可能,1代表最可能。分别赋予物体检测模型和动态检测模型K与(1-K)的超参数,将两种模型检测出的可信度量化矩阵分别乘以K和(1-K)后相加。对于给定区域,如果其加总可信度值超过阈值(0.7)则判定为含有飞鸟的区域。

分别取超参数K=0.55/0.65/0.75/0.85/0.95,测试五个测试视频流下的检测准确率和测试效率(以FPS计)得到下表1,K在0.85时取得最大准确率94.4%和相对较高的检测效率24FPS。

5  结  论

本文以识别机场、高压电站等区域的飞鸟,排除安全隐患为目的,基于YOLOv5卷积神经网络结构的物体识别算法和帧间差分法的动态检测算法,对视频流信息进行分析,能够在保持高检测效率的前提下对复杂环境中的飞鸟进行识别。且由于在模型中加入动态检测算法,减轻了整体方案对已标注数据量的依赖,可以很快推广到安防工作中的其他智能检测中,如机场无人机检测,电站防护以及智慧校园中的安防检测。未来随着增加更多如光流法、背景减法等动态检测模块和尝试Detectron等成熟的物体识别深度学习框架,我们可以进一步优化这个“动静结合”的检测方案,将本方案切实推广到工业级应用里。

参考文献:

[1] 王维,项洪达.鸟击风险计算方法研究 [J].中国民航大学学报,2019,37(5):21-24.

[2] 于飞,刘东华,贺飞扬.无人机“黑飞”对电磁空间安全的挑战 [J].中国无线电,2018(8):43-44.

[3] 陈唯实.轻小型无人机监管、探测与干扰技术 [J].中国民用航空,2017(7):33-34.

[4] 张群,胡健,罗迎,等.微动目标雷达特征提取、成像与识别研究进展 [J].雷达学报,2018,7(5):531-547.

[5] REDMON J,DIVVALA S,GIRSHICK R,et al. You Only Look Once:Unified,Real-Time Object Detection [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas:IEEE,2016:779-788.

作者简介:杨陆野(1993—),男,汉族,上海人,初级工程师,硕士,研究方向:计算机视觉。

猜你喜欢

像素点飞鸟雷达
飞鸟
隐形飞机哪里躲
一种X射线图像白点噪声去除算法
基于灰度直方图的单一图像噪声类型识别研究
基于canvas的前端数据加密
图像采集过程中基于肤色理论的采集框自动定位
飞鸟
飞鸟
班上的“小雷达”
岛与飞鸟