(1. 北京林业大学信息学院,北京 100083;2. 北京林业大学林学院,北京 100083)

无人机遥感是监测森林虫害的先进技术,但航片识别的实时性尚不能快速定位虫害爆发中心、追踪灾情发生发展。该文针对受红脂大小蠹危害的油松林,使用基于深度学习的目标检测技术,提出一种无人机实时监测方法。该方法训练精简的SSD300目标检测框架,无需校正拼接,直接识别无人机航片。改进的框架使用深度可分离卷积网络作为基础特征提取器,针对航片中目标尺寸删减预测模块,优化默认框的宽高比,降低模型的参数量和运算量,加快检测速度。试验选出的最优模型,测试平均查准率可达97.22%,在移动图形工作站图形处理器加速下,单张航片检测时间即可缩短至0.46 s。该方法简化了无人机航片的检测流程,可实现受害油松的实时检测和计数,提升森林虫害早期预警能力。


0 引 言





现阶段的目标检测框架中,SSD(single shot multibox detector)[28]作为一种轻量级目标检测框架,具有可实时、准确率高2个优点。SSD300框架在COCO[29]数据集测试,mAP(mean average precision)[30]达到41.2%,与基于区域候选的重量级目标检测框架Faster R-CNN[31]相当。同时使用NVIDIA TITAN X显卡,检测速度达到59 fps,远快于Faster R-CNN的7 fps,甚至比实时目标检测框架YOLO[32]的21 fps更快。


1 数据材料

1.1 研究区域概况

本文试验点位于辽宁省凌源市,如图1所示。该试验点样地共6块,每块样地大小为30 m×30 m,样地坡度约为30°,主要树种为油松。在该地区,红脂大小蠹是需要重点监测的虫害之一。

图1 样地位置

1.2 数据采集

本文以受红脂大小蠹危害的油松作为测试对象。数据采集时间为2017年8月,使用大疆“悟”系列第二代四旋翼航拍机,搭载大疆X5S云台相机,详细参数见表1。无人机挂载镜头为奥林巴斯25 mm F1.8定焦镜头,飞行高度为50~75 m,扫描拍摄1~6号样地,航片为含有地理坐标、飞行高度等元信息的JPEG格式图像,图像分辨率为5 280×3 956像素。

表1 无人机与大疆 X5S云台相机主要参数

1.3 数据集建立


2 检测方法

2.1 无人机实时监测系统

森林虫害无人机实时监测方法主要由航拍无人机、Android无人机遥控器和移动图形工作站3部分组成,监测过程如图2所示:首先无人机进行定点飞行,对受虫害林区进行扫描,间隔拍摄一张分辨率为5 280×3 956像素的林区航片;无人机遥控器的Android客户端实时接收并存储航拍图像,无需正射校正和拼接,经缩小及裁剪后,将12张300×300像素的图像作为一个批次,通过Tensorflow Serving系统[33],向移动图形工作站请求受害油松的检测识别服务;移动图形工作站运行精简的SSD300模型,在图形处理器(graphics processing unit,GPU)的并行加速下批量完成该批次的受害油松检测。

图2 森林虫害无人机实时监测系统架构

2.2 SSD目标检测框架

SSD目标检测框架是使用深度神经网络作为特征提取器的轻量级一阶段目标检测方法[28]。如图3a所示,文献[22]中SSD300框架使用VGG16[34]作为基础特征提取器,并在VGG16末尾增加抽象程度更高的特征层,最终以多尺度特征图P1~P6上的默认框为锚点,预测目标的类别及位置。P1~P6的每个单元都与一组默认框相关联,每组默认框在一个正方形基础框上,覆盖宽高比为{2,1/2,3,1/3}的默认框。用基础框与输入图像的面积比作为该组默认框的基础比例,各层基础比例分别为{0.1,0.2,0.37,0.54,0.71,0.88}。图3b为不同尺度特征图生成的基础框示例。图3c和图3d为特征图P2和P3生成的一组默认框示例,白色框为受害油松的标注框,黑色网格表示特征图P2、P3的单元数目,分别为19×19和10×10。虚线框表示以单元红色中心点为基准生成的一组默认框,其中蓝色框为基础框,黄色框为其他宽高比的默认框。P2与P3生成的默认框与标注框的IoU(intersection over union)最高。



2.3 基于深度可分离卷积结构的受害油松检测框架

2.4 评价指标

本文采用单张航片的检测时间及受害油松的测试平均查准率(average precision,AP)[30]作为检测速度和精确度的评价指标。AP为精确率(precision)和召回率(recall)曲线下的面积,精确率和召回率的定义为


3 结果与分析

3.1 模型训练与部署

训练模型的深度学习服务器安装为Ubuntu 16.04 LTS 64位系统,采用TensorFlow[37]深度学习开源框架。服务器搭载AMD Ryzen 1700X CPU(64GB内存),并采用NVIDIA TITAN Xp GPU(12GB显存)。训练阶段采用动量为0.9的随机梯度下降算法进行优化,设置初始学习率为0.001,正则化系数设为0.000 04,以16张图像为一个批次,共训练100 000次,每35 000次学习率下降原来的0.1倍。训练过程采用的数据扩充方式为随机水平翻转和随机图像裁剪。

训练完毕后,模型经计算图精简和常量化后,部署至火影影刃Z5移动图形工作站。工作站搭载Intel i7-8750H CPU(16GB内存)及NVIDIA GTX 1050Ti GPU(4GB显存)。

3.2 基础特征提取器对检测速度及精确度的影响

基础特征提取器是影响模型检测速度的因素之一。表2为不同目标检测框架的测试时间及测试AP,由表2可知,模型1将深度可分离卷积网络作为基础特征提取器,相比基于VGG16的SSD300目标检测框架,参数量减少约528 MB,单张图像检测时间提高了4 s。如5a的PR曲线所示,模型0的AP为98.70%,模型1比模型0的AP只降低了1.01%。基础特征提取框架的改变对精确度的影响较小,但会大幅提升检测速度。

3.3 精简SSD300预测模块

精简SSD300目标检测框架的预测模块可加快检测速度。如表2所示,预测模块保留了P2、P3的模型3、4,相比预测模块完整的模型1和保留了P2~P4的模型2,参数量更少,模型检测时间缩短至0.46 s。而由图5b可知,模型3的精确度与模型1相比,几乎没有降低。模型3和模型4删减预测模块各层默认框宽高比后,检测速度最快,均为0.46 s。如图5c所示,对比模型3,模型4的AP只降低了0.68%,而参数量进一步降低至18.8 MB。试验表明,针对本文数据集,模型4只保留SSD300目标检测框架预测模块中P2、P3层,以及适合数据集检测目标的默认框宽高比,AP达到97.22%,相比原模型仅降低了1.48%,可在保证精确度的前提下,降低模型参数量,最大程度地提升检测速度。

表2 不同检测框架的单张图像检测时间及测试平均查准率

图5 模型0~4的测试集Precision-Recall曲线

3.4 检测结果与典型错误分析

由表2可知,与重量级的二阶段目标检测框架Faster R-CNN相比,模型4的参数量仅为Faster R-CNN的10.85%,单张航片检测时间仅为Faster R-CNN的7.32%,而测试AP相当,仅降低0.69%。选择分类置信度>0.6为阈值,此时模型4的精确率和召回率分别为98.04%和83.33%。无人机在75 m高度拍摄的图像地面覆盖范围为38.18 m×50.95 m,无人机以经济速度15 m/s飞行,移动到无重叠的下一拍摄点需3.4 s,本系统完成一个批次的检测仅需0.46 s,可实现对森林虫害的实时监测。



图6 典型测试样本的检测结果示例

4 结 论

针对传统航片识别技术监测效率低、外业成本高、依赖预处理等问题,本文使用深度学习技术,提出了一种面向红脂大小蠹的无人机实时监测方法。本文在SSD300目标检测框架的基础上,将深度可分离卷积网络作为基础特征提取器,预测模块精简至P2和P3,且默认框的宽高比只保留{1,2,1/2}。结果表明:无需航片拼接、正射校正及边缘剔除等预处理,受害油松检测平均查准率可达97.22%,相比原模型仅降低1.48%,而模型参数量从550.1降低至18.8 MB,在移动图形工作站的图形处理器加速下,单张图像的检测时间仅为0.46 s,实现了受害油松的实时无人机监测。本方法简化了无人机航片的检测流程,可提高机组每次外业的针对性,及时定位虫害爆发中心,追踪灾情发生发展,满足森林虫害早期预警对时效性的需求。


