红外小目标SSD-DSST算法与目标模拟系统研究
2023-05-12郝永平
王 磊,高 扬,张 慧,郝永平
(沈阳理工大学机械工程学院,辽宁 沈阳 110159)
0 引言
红外小目标检测被广泛应用于红外制导、预警等军事领域[1]。红外小目标的像素与整张图的像素比不超过图像整体的0.15%,成像面积只有几个像素到十几个像素,在复杂背景的情况下,小目标往往只含有少量的语义特征。由于目标在成像系统较远处,红外辐射的能量在距离上显著衰弱状态,红外小目标易淹没在背景之中,目标检测难度较大,在此条件下的检测能力具有理论意义和应用价值。
为提升小目标的检测能力,国内外学者通过深度学习的计算机视觉技术在目标检测领域获得了重大进展[2-11]。目前,基于卷积神经网络[4]的深度学习检测算法成为主流,按照是否存在候选区可分为一阶段目标检测[5]和两阶段目标检测[6]算法。两阶段算法是在产生候选框的前提下在对候选区域内目标进行分类和回归,如CNN[7],R-CNN[8],Fast R-CNN[9]等,算法虽精度高,实时性差,检测小目标效果差;一阶段算法不对候选区进行提取,只用一级网络完成了分类和回归,这类算法主要有SSD[10],YOLO[11]等,算法虽实时性高,但检测精度低。
针对红外小目标识别过程受到复杂背景的干扰,目标特征不明显,易丢失等问题,提出了一种基于改进SSD与DSST方法的红外小目标检测算法,通过通道-空间注意力机制与FPN特征金字塔结构改进SSD网络,采用DSST对目标下一帧目标进行位置和尺度预测。在PC端与ZYNQ嵌入式平台联合搭建了目标融合模拟系统,可将待测小目标融入到复杂背景下,实现预定场景模拟,对所提算法进行评估和验证。
1 改进的SSD检测网络
1.1 加入通道-空间注意力机制的SSD算法
传统SSD卷积网络特征非线性程度不够,仅靠目标训练不能获得理想的识别精度[11]。在主干检测网络生成特征图阶段引入注意力机制,使检测网络更加关注特征图中目标可能存在的位置区域,提高卷积对特征图的遍历速度和小目标识别准确率。同时增加目标上下文信息,缩小检测范围,提升红外小目标的检测能力算法原理为:通过CBAM机制对网络生成的特征图Z分别产生一维通道注意力、二维空间注意力共两个尺度的特征图,推断出特征图的注意力权重系数。特征图中每一个通道作为一个特征检测器,选择利用最大池化和平均池化的方法学习目标的判别性特征,将特征送入一个共享的多层感知机(MLP)网络中得到通道注意力权重,将每个通道的权重与原卷积的特征加权融合[11]来提取目标特征信息,通道注意力参数矩阵为:
Mc(Z)=σ(W1(W0(Zavg,c))+W1(W0(Zmax,c)))
(1)
其中:Z为输入特征图;σ为激活函数;Zavg,c和Zmax,c分别表示平均池化和最大池化;W0,W1为两个全连接层各自的权重参数。
对于空间注意力机制关注特征图中重要信息的位置,将通道注意力产生的特征图拼接起来,对拼接起来的特征图上进行卷积操作产生最终的空间注意力特征图,空间注意力参数矩阵为:
Ms(Z)=σ(f7×7(Zavg,c;Zmax,c))
(2)
其中f表示卷积核为7×7的卷积核。
将通道注意力机制生成的通道注意力矩阵与输入特征图进行元素级相乘得到Z′,再将Z′与空间注意力矩阵进行元素级相乘得到输出特征图Z″,如式(3)、式(4)所示,式中⊗表示元素级相乘。
Z′=Mc(Z)⊗Z
(3)
Z″=Ms(Z)⊗Z′
(4)
1.2 FPN 算法改进SSD网络
针对红外图像对比度较低、分辨细节能力差、目标特征不明显问题,以及传统SSD卷积网络模型中并没有使用原始图像的底层特征,其深层特征的语义信息无法与浅层结构信息融合,造成目标细节信息丢失。
利用FPN算法将检测网络的浅层次特征与高层次特征在“自下而上”的数据流向基础上采用横向连接,把高层语义信息传递给浅层检测网络,实现多尺度的信息融合,丰富底层特征图的语义信息,提升小目标的检测能力。FPN算法改进的SSD网络架构如图1所示。
图1 FPN算法改进SSD网络架构图Fig.1 Improved SSD network architecture of FPN algorithm
以VGG16的SSD网络为基础对卷积网络进行改进,红色箭头代表Conv1×1卷积核的卷积操作,意在改变特征的输出个数的同时,不改变特征尺度,将反卷积和卷积输出的特征图保持数据一致性。绿色箭头代表上采样,通过反卷积操作使进行反卷积之后的深层特征图与邻近上一层特征图保持大小和通道数相同。“⊕”表示将上采样和Conv1×1卷积后的特征图对应元素线性叠加,所叠加两个特征图的宽度、高度以及通道数均相等。改进网络输出6种不同尺度的特征图,利用3×3卷积核对融合叠加结果进行卷积计算来解决上采样的混叠效应。
2 基于改进的SSD网络与DSST的红外小目标检测算法
上述的空间-通道注意力机制与FPN算法改进的SSD检测网络对红外小目标的检测能力有明显提高,但在复杂背景下易受其他目标干扰,导致小目标丢失和误检。为解决问题,将DSST算法与改进的SSD检测网络相结合,利用上一帧对目标当前帧位置和尺度进行精确估计,实现目标检测。通过给改进的SSD检测网络设置阈值来判别检测是否准确,将检测不准确的图像输入到DSST算法进行二次检测,此方法有效避免改进的SSD网络误检和漏检问题。基于改进SSD网络与DSST的红外小目标检测算法总流程图如图2所示。
图2 改进SSD网络与DSST的红外小目标检测流程图Fig.2 Flow chart of improving SSD network and DSST infrared small target detection