SAR图像舰船目标检测数据集构建研究综述

2021-11-30黄琼男朱卫纲李永刚

电讯技术 2021年11期

黄琼男，朱卫纲，李永刚

(航天工程大学 a.研究生院；b.电子与光学工程系，北京 101416)

0 引言

合成孔径雷达(Synthetic Aperture Radar，SAR)作为一种主动式微波成像传感器，具有全天时工作、全天候成像、作用距离远等特点，且能穿云破雾，在可见度极低的气象条件下仍能获得高分辨率二维图像[1]。此外，SAR图像能够获取不同频段下目标的散射特性[2]，极大地提高了所获取信息的丰富度，在国防、军事、环境等方面具有重大的意义。目前，SAR图像已经成为针对海上目标进行检测的重要数据之一[3]。自深度学习问世以来，其在人脸识别、物体检测、智能监控等领域掀起一股研究热潮，同样也在SAR图像解译领域大放异彩，如R-CNN系列[4-6]、YOLO系列[7-8]、SSD[9]等目标检测算法的相继提出，极大地提高了SAR图像目标检测技术智能化。影响深度学习目标检测技术的因素主要包括算法和数据两大方面，大多数学者专注于目标检测算法的改进和开拓，仅有少部分学者致力于数据的研究。数据作为推动深度学习技术发展的“原油”，大多数深度学习模型的训练需要依靠大量的数据。本文主要对几种公开的SAR图像数据集进行梳理与分析，其中包括数据集的构建方法、存在的不足等，以期促使更多高质量SAR舰船数据集的出现，提高星载SAR图像实际工程应用能力。

1 SAR舰船数据集的构建方法

现阶段，世界已经步入大数据时代，发展如火如荼的深度学习更是离不开“大数据”，构建特定任务的数据集是人工智能项目的第一步。缺少数据集，很多深度学习框架只是一副躯壳；杂乱无章的数据集只会使得算法纸上谈兵、停滞不前，缺少有效的实验进行验证。数据集的构建[10]不是一堆数据的简单集合，而是根据所研究的内容，依据具体的算法模型，经过合理的样本构建策略，精准的样本标注策略，以及对特定样本的扩充等步骤，构建成一个具有规模性、多样性、高效性、易扩展性的集合。

SAR舰船图像数据集更不是各种SAR舰船数据的简单收集，而是针对具体的影响因素进行特定数据的收集。影响SAR舰船目标检测性能因素包括SAR系统平台、场景环境以及舰船目标自身等因素。例如：SAR-Ship-Dataset数据集[11]针对复杂场景下舰船目标检测率低的问题，构建了一个用于深度学习目标检测任务的复杂场景SAR舰船数据集；LS-SSDD数据集[12]针对大场景小舰船目标构建了一个适用于小舰船目标检测的SAR图像数据集；等。上述两种数据集分别从场景环境和目标属性两种角度对SAR舰船数据集进行构建。此外，不同的SAR系统平台，其成像参数(分辨率、成像角度、极化方式等)各不相同，同一SAR系统的参数设置也有较大差异，对应的目标观测能力也不尽相同。少数学者从SAR成像属性的角度对SAR目标检测技术进行研究，但相关公开数据集较少。AIR-SARShip数据集[13]构建了一个高分辨率SAR舰船数据集，但未对分辨率进一步细分类。

SAR舰船数据集的构建基本流程如图1所示。