复杂环境下少样本域自适应雷达RD智能识别技术
2023-09-04石晓荣刘泽文
石晓荣,张 康,倪 亮,刘泽文,姜 丰,陈 鑫
北京控制与电子技术研究所,北京 100038
0 引言
雷达诞生于20世纪初,由于其工作不受天气和昼夜影响,可以实现对目标全天时、全天候、远距离的探测,因此在探测领域中有着十分重要的地位[1]。随着科技的逐步发展,仅仅探测目标位置信息的传统雷达已经不能够满足复杂场景下对目标多方面信息的需求,能够从雷达回波中提取出目标详细信息是雷达发展的必然趋势[2]。
在雷达应用领域中,海背景下的目标检测识别是当下研究的重点之一。不同于可见光数据,受复杂海洋环境产生的海杂波以及海面目标类型多样化的影响,雷达回波数据由于其本身特性,信息表现方式更为复杂,目标具有不封闭轮廓且呈现出多点散布的形式,且目标有效区域占比远不及可见光数据[3]。同时,随着复杂电磁环境场景的增加,雷达视场内目标增多、辨识难度提升,对雷达目标检测识别方法的鲁棒性和对真实目标的辨别能力均提出了更高的要求[4]。
针对典型海背景环境下的目标检测识别问题,在以往的应用中通常采用传统的恒虚警率[5]方法和模板匹配方法[6]等对目标进行定位和识别。前者需要构建杂波统计模型来确定检测阈值,参数估计和计算求解复杂耗时,后者需建立依赖专家知识的完整模板库。针对样本获取难度大的稀缺目标和场景,如极端电磁环境、低信噪比和高海情的复杂场景皆会直接导致传统算法性能骤降。同时,传统算法需要较为准确的专家先验知识和手工特征提取,存在算法设计门槛高、算法鲁棒性较弱的缺陷。
受益于深度学习技术的发展、数据量的增加和硬件设备的完善,目标检测识别领域的研究进展突飞猛进。相比传统算法,深度卷积神经网络的目标检测识别算法具备自动化和智能化属性,算法通过自适应特征提取和调整,与专家经验进行浅解耦,通过合理地设置优化方式达到较好的目标识别效果,能够准确定位出指定目标的位置并给出目标的详细信息。以Girshick等提出的Faster R-CNN[7]两阶段架构目标检测算法和Redmon等提出的YOLO系列[8]单阶段目标检测算法,改进了卷积神经网络的特征提取过程,同时增强了模型对小目标的检测能力,奠定了智能目标检测算法的典型基础架构。
当前,基于深度学习的目标检测识别研究多围绕可见光图像和视频展开,针对红外图像和SAR图像也存在部分研究[9-10],但面向雷达回波数据的相关研究相对较少。虽然深度学习具有较强的特征提取能力,但需要较大的数据量作为算法的训练保障,否则将无法充分发挥其优势。
综上所述,目前在雷达目标识别方面主要面临的问题如下:
1)现阶段雷达在复杂场景下目标检测识别手段严重不足,特别是在目标分布密集、类间特征区分度低的情况下,现有方法难以做到对识别目标的准确区分;
2)当多个目标间距离较近时,难以对目标做到精确定位,同时在高海情等较为复杂场景下,尤其是在目标信号较弱、噪声和杂波较强的情况下,无法定位目标;
3)数据的场景完备性难以保障,用于算法研究的训练数据与真实应用场景的数据存在跨域问题,并且数据量级较小,导致算法场景适应性差。
基于上述描述,针对典型海背景环境下对海面目标准确识别的重大需求,本文将深度学习技术应用到基于雷达回波的目标检测识别中来,建立了基于复杂场景的样本数据集,提出了一种基于少样本的域自适应雷达智能目标检测识别技术,设计了基于特征金字塔的双阶段目标检测识别算法架构,充分挖掘神经网络的目标定位和辨别能力,同时设计了域自适应技术对源域和目标域进行特征配准,提高了对不同域目标的精确定位和准确识别能力,实现了不同域下对具有不封闭轮廓、多点散布目标的精细化辨识,达到提升复杂环境下识别能力的目的。
1 复杂场景样本数据集
1.1 数据集构建总体思路
围绕复杂场景下基于雷达回波的智能目标检测识别具体需求,需要建立不同目标分布形式和不同场景构造(仿真数据和真实数据)的样本数据集以满足算法模型的训练和测试验证需求。
样本数据集按照“原始数据获取-处理与标注-数据集划分”的步骤进行构建,由仿真数据和真实数据以RD(距离多普勒)时频域数据的形式组成。其中仿真数据由全数字信号级仿真平台生成,通过搭建多类目标RCS特性数据库、电磁特性数据库、海杂波特性数据库形成用于生成数据的目标特性数据库,同时搭建信号级回波仿真模型、典型雷达信号处理模型形成雷达回波生成模型,用于RD时频数据的生成。
1.2 复杂场景构建
数据集以包含各类目标和电磁特性的雷达RD时频样本数据为处理对象,复杂场景描述见下表1。
表1 复杂场景构建方案
表2 样本及标注文件描述
其中仿真数据由全数字信号级仿真平台生成,首先设定仿真参数,其次生成雷达回波信号,根据场景配置索引目标特性数据库、电磁特性数据库和海杂波数据库,与参考信号卷积生成回波信号,最后生成样本数据和对应标注,雷达模型对回波信号进行脉压,输出RD时频数据。
图1 仿真样本示例
1.3 样本生成
针对仿真数据,通过其复杂场景的设置可生成对应的标注文件;针对真实数据,通过采集时的相关设备计算得到对应的标注文件,具体形式如下:
2 检测识别算法
针对识别中面临的低信噪比、目标分布稀疏、目标特征判别性弱、目标尺度小、背景复杂等难题,本方案以两阶段目标检测框架为基础,采用基于分离注意力的偏移区间配准智能识别算法。
如图2所示,首先针对给定雷达RD数据,对其进行抗幅度敏感性处理,然后将处理后的RD数据送入基于分离注意力的主干特征提取网络提取整幅雷达RD图像的特征,通过在残差块之间添加自顶向下的路径,结合基于特征金字塔的多尺度特征融合网络,提取多个尺度且语义丰富的目标特征,再采用基于候选区域对齐的目标特征选择网络生成可能包含目标的候选框,并将候选框映射到特征谱上,提取候选区域的特征信息,最后采用偏移区间分类网络Offset-Bin去实现精准的目标检测识别和定位目标,输出目标的类别、位置及置信度。
图2 基于分离注意力的偏移区间配准目标检测识别算法架构图
图3 偏移区间配准预测
2.1 数据抗幅度敏感性的预处理
雷达RD数据的幅度敏感性从理论上本应是识别目标时的有效特征,如果在完全相同的录取条件下,属于不同目标的雷达RD数据幅度信息可以反映目标尺寸大小等特性。然而这些条件在现实应用场景中很难达到,即使是相同雷达面对相同目标,在以上多种因素的影响下仍然无法获得回波强度一致的雷达RD数据,从而导致了雷达RD数据的幅度敏感性。
针对雷达数据中幅度敏感性、目标响应值差异较大、分布稀疏等特点,采用了归一化、标准化及尺度放大、翻转、平移、裁减、拼接等数据增广策略,以扩张数据集大小以及目标分布多样性,防止网络过拟合。同时,数据中距离和速度多普勒维表达了二维空间中的能量分布,强点特征较为明显,可通过数据增广的方式加强特征利用效率。
2.2 基于分离注意力机制的特征提取主干网络
针对目标特征判别性弱、类间目标易混淆的问题,区别于传统手工设计的特征,模拟人类视觉信息处理机制。通过加入分离注意力模块,基于智能识别经典模型深度残差网络进行修改,提升重要特征信息的提取权重,具有特征提取融合能力强,泛化能力好等优势,从而对于不同复杂程度的目标和图像都能提取语义丰富的特征,更容易区分目标和噪声。
根据目标尺度小的特点,基于自底向上的残差网络作为主干网络,通过添加自顶向下的路径,对语义抽象的低分辨率特征谱上采样,与细节丰富的高分辨率特征谱逐步融合,从而增强小目标的特征判别性,解决多类特征稀缺目标难以区分的问题。
2.3 基于特征金字塔的多尺度特征融合网络
针对雷达RD数据中目标距离域尺度小、特征不明显的问题,本文采用基于特征金字塔模型的多尺度特征融合网络用于聚合骨架模型提取到的多尺度特征。所采用的经典智能算法特征金字塔网络具有特征融合能力强、对目标尺度变化鲁棒、计算复杂度低等优势。
2.4 基于偏移区间配准的分类网络
针对精准定位目标的需求,本方案巧妙地将回归问题转化为分类问题,基于不同偏移区间的输出概率分布,采用偏移区间分类网络预测更精确的目标位置。不同于传统方法,目标定位通常利用回归网络预测锚点框和真实框之间的偏移,由于不充分地惩罚往往导致了次优的回归和不精确的定位。
具体首先将连续地偏移范围离散化为n个离散的偏移区间,其中每个区间的中值作为每个区间的表示偏移,从而构建离散的偏移区间,再基于特征金字塔网络提取的候选区域特征,预测偏移区间打分向量,则目标定位能够被转化为多分类问题,使用交叉熵损失函数优化定位网络的学习。最后,通过计算期望值,将离散的偏移转化为高精度的定位预测,解决目标间隔距离较近的问题。
3 智能目标识别算法
图4基于少样本的域自适应雷达智能目标检测识别算法架构图在部分应用场景中,真实数据的获取成本是较高的。即使最终获取到了数据,由于数量不足,直接训练网络会产生过拟合问题。故在面对使用仿真数据训练、真实数据测试的背景下,设计基于梯度反转层的域自适应结构,并利用一致性约束保障不同数据域下分类识别的正确性。
如图4所示,基于少样本的域自适应雷达智能目标检测识别算法由左右两部分组成,其中左边部分为在双阶段架构上改进的基于特征金字塔的目标检测识别算法,由源数据域提供数据和标注,学习检测识别任务;右边部分为基于梯度反转层的域自适应结构,由源域和目标域共同提供数据,实现特征域对准。
如图5所示,源域提供数据和标签用于检测任务的监督学习,目标域提供数据,并联合源域极少部分的数据对特征进行配准。
图5 域自适应示意图
图6 测试结果样例
网络优化时,一方面域分类器要尽可能区分特征所属的数据域,另一方面让提取到的特征迷惑域分类器。随着对抗过程的持续,源域和目标域特征逐渐靠近。配准之后,利用源域数据学习得到的分类界面也能够适用于目标域数据。
4 仿真校验
该项任务为二分类任务,即定位、分辨出目标和背景,故选用F1 Score作为评判标准。根据所建数据集进行训练测试,测试环境为Ubuntu 16.04.6 LTS,GPU加速集群为Nvidia Tesla A100,CUDA版本号为10.2。
4.1 偏移区间配准的检测识别算法验证
基于训练数据,针对基于特征金字塔的双阶段目标检测识别算法在测试场景1~3上进行测试,同时设置基于CFAR的传统方法得分作为基准线,具体结果如表3。
表3 各场景测试结果
经过测试分析说明:在仿真场景下,相较传统方法,该算法模型在测试集内可以达到较高的目标识别精度,尤其在假目标强度数倍于真目标和低于目标强度的情况下,能够做到目标的准确识别,证明了智能识别网络的有效性,这有望解决各类复杂场景应用中目标误识别的难题。
4.2 基于少样本的域自适应算法验证
基于训练数据,针对基于少样本的域自适应雷达智能目标检测识别算法在测试场景4中进行测试,同时设置基于直接模型训练微调方法的得分进行对比,目标域全部训练集为1000个,与仿真数据训练集个数对应,具体测试结果如图7。
图7 数据跨域场景下的测试结果
经过测试分析说明:在目标任务数据量不足的情形下,可以借助其他数据,利用域自适应方法提升目标任务的性能,通过与直接模型训练微调的结果对比也证明了该方法的有效性。目标任务数据量大小会影响到最终的性能,条件允许的情况下需要尽可能多地提供目标域的训练数据,保证目标任务的效果。
5 结论
针对雷达回波智能目标识别技术进行了研究,建立了复杂场景样本数据集,提出了基于少样本的域自适应雷达智能目标检测识别算法,进行了算法模型的训练和测试,证明了算法在仿真数据集上达到了较好的效果,同时在面临数据跨域时,使用少量样本即可较大幅度提高算法的检测识别精度。
验证了深度学习在雷达回波数据目标检测识别任务上的可行性,相比传统雷达检测识别算法,能够有效提取各类目标间更深层次的细微差异特征,从而达到较好的分类识别效果。同时,深度学习太过依赖于数据本身,导致在较差数据保障的应用条件下,算法模型常常面临场景适应性不足的问题,由于特征的自学习,也带来了算法性能边界条件模糊不清,识别对错原因无法溯源的问题,这些问题成为了深度学习在低容错场景下应用必须要翻越的“大山”,也是作者后续的研究方向。
在后续工作中,将研究算法泛化能力,尤其是在面向更多实测数据时算法的鲁棒性问题,同时形成实测与仿真的数据集构建闭环,深化对算法与数据迁移方面的技术研究,逐渐摸清算法的性能边界,持续提升算法模型的健壮性。