基于视频的入侵无人机目标检测研究综述
2020-01-06蒋镕圻谢郭蓉
蒋镕圻 谢郭蓉
武警工程大学 研究生大队 陕西 西安 710086
引言
近年来在无人机技术不断成熟无人机趋于小型化、智能化的背景之下,民用无人机市场成为整个无人机市场的主要成分。随着我国对低空空域的逐步开放,民用消费级无人机使用数量逐年成指数增长,由此引发的无人机窃取隐私、扰乱航空秩序等事故也是逐年攀升,给公共设施和军事等领域构成了巨大威胁。
自目标检测这一概念提出以来,国内外学者针对这个问题做出了不懈的努力[1],有包括经典的运动目标检测算法[2]和传统的目标检测[3],到现在流行的基于深度学习的目标检测算法相继被提出[4-5]。近年来,基于视频的入侵无人机目标检测已经有了初步的研究与应用,特别是在目标检测算法上的不断创新,使得检测无人机这种弱小目标成为可能。
1 基于传统方法的检测
基于传统方法的检测通常包括经典的运动目标检测和传统的目标检测的方法。
经典的运动目标检测是寻找运动目标和静态背景之间的差异进行检测,主要包括光流法、帧间差分法和背景减除法。由于光流法[6]受光照变化等环境因素影响非常严重且复杂度较高难以满足实时性,所以帧间差分法、背景减除法以及两者的结合算法成为检测无人机的常用方法[7],例如Li等人通过使用三帧差分法改善两帧差分法存在的“空洞”等问题。运动目标检测算法能检测出运动的物体却无法区分识别目标,同时帧间差分法与背景减除法都要求背景保持一致,特殊天气下会出现极大的虚警,使得此类方法的使用受限。但由于此类方法能较快检测出运动目标,所以多与传统的目标检测法结合使用。
传统的目标检测方法多基于滑动窗口搜索整张图像提取候选区域,再提取区域的特征并输入到分类器进行分类。此方法通过人为提取相关特征[3]并训练出合适的分类器即可分类[8],例如Eren U等人基于无人机的SURF特征提高检测效果,又通过提取无人机的傅里叶描述子特征实现无人机与鸟类区分。但此类方法需要人为提取相关的特征,在面对环境多样性的条件下鲁棒性较差;同时以滑窗搜索整张图片再进行处理的步骤会带来巨大的运算量,无法达到实时检测的效果。
2 基于深度学习的检测
基于深度学习的目标检测主要分为两阶段法和端到端的单阶段法。
两阶段法遵循“候选区域+分类”的思路,在R-CNN网络的基础上不断发展并应用于无人机的检测[4],例如翟等人引入残差网络抑制深层次的卷积神经网络中出现的难以收敛的问题。以YOLO模型为代表的基于端到端的单阶段检测由于其快速检测的特性满足无人机目标实时检测的要求被众多研究者引用[5]。也有研究人员针对两者目标检测的效果做出了对比,通过实验证明基于候选区域的方法在检测准确率和定位精度上占优势,但检测时间较长,而基于端到端一阶段检测方法虽检测速度上较有优势,检测精度却比不上前者。就目前深度神经网路趋向轻量化、实时化的趋势来看,更多的研究人员更加侧重于研究在一阶段检测算法的基础上提升对无人机目标的检测性能。
但基于深度学习的检测算法需要大量的数据集做支撑,目前缺乏相关的公共数据集是研究入侵无人机目标检测的基础问题,大部分学者都是通过自己建立小样本实现对深度神经网络的训练,都是对简单背景下的单一无人机进行检测,并不能满足实际的情况要求。
3 结束语
虽然目前研究人员提出了多种无人机的检测方式,但上述检测多处于简单背景下的研究,并没有实现在光线不充足、有飞鸟干扰、城市高楼等干扰物庞杂的复杂环境下的检测;同时无人机数据集的不足是基于深度学习检测方法的硬限制,而传统的目标检测虽然在小的数据集中性能良好,但其巨大的计算量严重影响了实时性要求。目前扩大无人机数据集,研究适合检测无人机这类小目标的轻量化深度神经网络是目前对入侵无人机目标检测算法研究的主要趋势。