深度学习在遥感图像目标检测中的应用研究
2019-05-24黄金付发赵娜
黄金 付发 赵娜
摘 要:近年来深度学习在机器视觉领域应用非常成功,在图像的目标检测方面已经超越了人类。随着遥感技术向民用发展,遥感图像数据的研究和应用价值越来越大。文章利用深度学习的SSD卷积神经网络,对遥感图像中感兴趣的目标进行检测。遥感图像有包含信息多、目标较小且背景复杂等特点,针对遥感图像的特点,选取不同尺度的特征图进行融合,并对网络进行微调,提高检测精度。
关键词:深度学习;目标检测;遥感图像;卷积神经网络
深度学习是人工智能的重要部分,随着人工智能的发展受到世人的瞩目。神经网络是深度学习的具体表现,它是由数量众多的神经元组成的一个多层的神经网络。深度学习在机器视觉领域有广泛的应用,目标检测是机器视觉的重要研究内容。基于深度学习的目标检测技术是利用卷积神经网络[1],自动学习检测目标的特征并对目标进行识别。在世界各大比赛和应用中证明了它在目标检测领域的强大能力。
随着遥感技术的发展,它从军事领域发展到民用领域。在城市规划、资源调查、环境监测等方面有着很大的发挥空间。遥感图像有着尺寸大、背景复杂、目标多且小等特点,在遥感图像中进行目标检测有着很多难度。为此,本文采用的经典的卷积神经网络[2](Single Shot MultiBox Detector,SSD),相比其他基于神经网络的目标检测算法,具有速度快、准确性高、鲁棒性强等特点。但对小目标的检测不足,应用在遥感图像上的效果不好,本文对此网络作出改进以适应其在遥感图像上的应用。实验结果表明,调整后的网络检测效果不错,平均检测精度(mean Average Precision,mAP)达到0.819。
1 理论方法
SSD是一个单次深度神经网络,结合Faster-RCNN[3]和YOLO[4]的优点,使用单一的网络结构,并对整张图进行特征提取,和区域网络结构不同(没有类似RPN的额外网络结构)。最终的检测性能却超越了它们,以300×300的输入在VOC2007数据测试中,以59Fps的速度达到74.3%的 mAP。
SSD模型:SSD网络由前后两部分构成。前面是用于特征提取的卷积神经网络,我们称它为基础网络,后面部分是尺寸大小逐渐减小的卷积层,称它为额外网络。网络结构如图1所示。
SSD的输入是300×300×3的图像。基础网络使用截断的VGG[5]网络,对目标图像进行初步的特征提取。额外网络以基础网络的输出作为输入且尺寸逐渐减小,最后选取不同尺寸的特征图进行预测。在训练过程中,SSD算法会对默认框和真实框进行匹配,选取Jaccard值最大或者Jaccard值大于0.5的默认框。SSD在检测时会产生大量的默认框,为了消除重复没用的默认框,使用了非极大值抑制算法。
2 实验过程
2.1 实验数据和平台
本次实验的数据集总共有1 510张高分辨率遥感图像,分为汽车和飞机两类,汽车510张,飞机1 000张。把数据按训练集、验证集、测试集分为三大块,各占比例为70%,10%,20%。具体划分如表1所示。
相比于普通的图片,遥感图片尺寸较大,所包含的信息较多,目标在图像中占比较小,属于小目标,如图2所示。
实验配置:kears框架,后端为Tensorflow,显卡为NAVIDA tesla k20,内存为32 G,处理器:Genuine Intel(R)CPU 2.40 GHz,操作系统为Ubuntu16.04。
2.2 实验过程与结果
SSD卷积神经网络由基础网络和额外网络组成。在本次实验中,使用截断的VGG16作为基础网络用于对图像进行初步的特征提取。VGG16卷积神经网络是一个经典的网络,网络结构简单,卷积核大小是固定的3×3。额外网络是一个尺度不断变小的卷积神经网络,在基础网络产生的特征图上进行特征提取。
在卷积神经网络模型中,不同尺度上的特征图所表示的感受野不同,靠近底部的特征层提取的是局部、通用的特征,例如边缘、颜色、纹理等特征;而靠近顶部的特征图提取的是抽象的特征,所包含的细节信息少,对小目标的检测效果不足。为了提高检测率,我们抽取不同层的特征进行特征融合用于最后的检测。表2展示了抽取的特征层的输出尺度和连接该层的上一层。每一层提取的特征图尺寸大小不同、逐步减小,从底层具体的特征到高层抽象的特征都包含在内,适应不同尺度的目标以提高准确率。
本文对SSD的损失函数进行调整,默认损失函数的α=1,定位损失和置信损失在最后的总损失占比相同。提高定位损失在总损失中的占比,侧重卷积神经网络的目标位置提取。相应,我们降低Jaccard值,提高小目标的检测率。经过调整,我们使用mAP来对模型进行评估。实验结果如表3所示。
从表3可以看出,飞机的精度高于汽车,原因是在遥感图像中飞机相比汽车目标要大,在图像中属于易区分的目标。汽车在图像中占比很小,且与周边环境相似度高不易区分,给检测增加了难度。图3展示了两张不同类别的检测结果,左边是飞机、右边是汽车。可以看出置信度较低,是因为在训练期间调整了损失函数。
3 结语
本文主要探究深度学习中的SSD卷积神经网络在遥感图像上的应用。对遥感图像中的汽车和飞机两类进行检测,平均准确率为81.9%。结果表明,深度学习在遥感图像上的应用具有可行性且效果不错。由于训练的图片尺寸较大,与SSD网络输入大小相差太大,在特征提取的时候会把一些小特征忽略,使遥感图像中的小目标不易被检测到。以后的工作可以针对小目标进行,对遥感图像进行预处理并且调整网络结构,提升小目标检测率。
[参考文献]
[1]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[C].Vancouver:International Conference on Neural Information Processing Systems,2012:1097-1105.
[2]LIU W,ANGUELOV D,ERHAN D,et al.SSD: single shot multibox detector[C].Cham:European Conference on Computer Vision,2016:21-37.
[3]REN S,HE K,GIRSHICK R,et al.Faster R-CNN: towards real-time object detection with region proposal networks[C].Turkey:International Conference on Neural Information Processing Systems,2015:91-99.
[4]REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once: unified,real-time object detection[C].Las Vegas:Computer Vision and Pattern Recognition,2016:779-788.
[5]SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for large-scale image recognition[J].International Journal of Computer Vision,2014(3):211-252.
[6]周敏,史振威,丁火平.遙感图像飞机目标分类的卷积神经网络方法[J].中国图象图形学报,2017(5):702-708.