APP下载

空间信息自适应调控和特征对齐的红外甲烷实例分割

2023-12-04何自芬曹辉柱张印辉

光学精密工程 2023年20期
关键词:掩码空间信息金字塔

何自芬, 曹辉柱, 张印辉, 庄 宏

(昆明理工大学 机电工程学院,云南 昆明 650000)

1 引言

甲烷是天然气与煤气的主要成分,广泛存在于煤炭化工、石油开采、石油化工等化工行业,同时也是日常生活中主要清洁能源[1]。另外,甲烷作为温室气体之一,其对全球变暖的影响远远超过二氧化碳[2]。尽管甲烷在大气中寿命只有12年,但具有相较于二氧化碳28~34 倍的蓄热能力,使得它成为全球变暖的主要来源[3]。甲烷具有无色无味且易燃易爆的的化学性质,若无检测设备其泄漏就很难被察觉。一旦接触到热源或者明火,就可能导致严重的安全事故,如火灾、爆炸和环境污染,对社会和人民的生命和财产构成巨大威胁。因此,减少甲烷气体泄漏事故已成为化工生产中日益关注的问题,发展针对甲烷气体泄漏的高效安全检测和分割技术用于实时监测甲烷泄漏、快速定位甲烷泄漏源,以减少人民生命财产损失、保护环境,做到降本增效经济意义重大。

<1),且各件产品是否为不合格品相互独立.

传统气体泄漏检测主要依靠接触式气体传感器对管道中泄漏气体进行检测,包括人工检测、气体采样、土壤检测等[4-6]。此类方法不仅耗费大量的人力财力和时间,而且对管道、储气库及周边环境造成一定的破坏[7],同时检测结果易受安装位置和外界环境风向等因素影响,无法达到快速定位泄漏源的目的,且检测范围小、检测效率低。近年来,非接触式红外热成像探测技术,以其探测距离远、降低了检测难度和风险因素,同时还有灵敏度高、动态直观等优点,在石化装置及工艺管线的气体泄漏检测领域得到广泛应用[8]。与可见光气体成像不同,红外成像利用有害气体与背景之间的温度差,将无法直接观察到的红外辐射转换为灰度图像,有效将有害气体与周围环境分开,从而实现对有害气体进行泄漏监测。红外热成像技术可以更加直观地检测出某种气体物质的存在,并且能够准确地确定其位置,可以帮助我们更好理解和识别特定气体。

由于红外热成像技术具有快速响应、非接触测量和快速定位气敏传感器难以感知到的微小泄漏源等优势,因此在气体检漏领域得到了广泛应用[9]。尽管红外热像仪可以手持或安装在固定位置,但目前仍然依赖于人工进行视检使得人力成本增加[10]。近年来,由于人工智能技术飞速发展,以卷积神经网络为基础的深度学习算法已成为计算机视觉领域的重要技术手段,并且正被广泛应用于视觉检测中以替代传统的人工巡检[11]。

研究人员近年在红外气体泄漏检测方面投入了大量的工作,如基于目标气体红外图像进行分类[12-14]和目标检测[15]取得了很好的效果,但此类检测算法无法将泄漏气体从背景中分割出来也无法给出泄漏气体的轮廓边界,不利于后续对各个点源的泄漏等级进行量化以便制定维修方案。

实例分割是目标检测与语义分割在模型层面的统一,要求正确地检测并分割图像中每个对象实例,实现了像素维度的图像目标轮廓识别。目前广泛使用的基于深度学习的实例分割方法可分为两类。一类是双阶段实例分割算法,如Mask R-CNN[16]算法,采用深度卷积神经网络提取特征,在图像实例分割领域取得了较好的结果,在此基础上Mask Scoring R-CNN[17],HTC[18]等方法相继被提出。另一类是单阶段实例分割方法,如Yolact 在RetinaNet[19]基础上,对预测头模块放弃引入特征定位的步骤且增加一个掩码分支达到实例分割的效果,是第一个实现实时实例分割的方法。与之类似的还有SOLOv1-v2[20-21]和CondInst[22]等方法。此类单阶段实例分割算法不需要生成候选目标,直接通过网络预测目标的位置和类别,在保证精度的同时具有更快的检测速度。

综上所述,为保证模型对红外甲烷气体准确分割,利用红外甲烷气体图像完成特征学习,并克服由于红外甲烷气体目标实例尺度变化及拓扑形变导致分割边缘模糊和特征弥散丢失等问题,实现红外甲烷泄漏有效分割。本文以Yolact[23]为基础模型,提出一种空间信息自适应调控和特征对齐的实例分割网络模型(Adaptive spatial information regulation and Feature alignment Network,AFNet),在速度和准确性之间实现了良好的平衡,改进方法与目的如下:

(1)针对甲烷气体泄漏扩散区域形变复杂,模型采用ResNet[24]残差网络作为主干网络提取红外甲烷气体特征,通过自适应空间信息调控模块丰富主干网络中空间位置信息以及调控目标特征区域语义特征。

(2)针对特征金字塔自顶而下单一特征传播路径和模型过深导致的目标气体特征空间细节信息弥散丢失问题构建加权双向金字塔[25]模块丰富深层特征图下目标实例的边缘纹理信息,完善细粒度像素级回归任务以增强模型的目标区域聚焦能力。

(3)针对原型掩码分支利用全卷积网络[26]网络进行特征提取时仅简单利用卷积层增大其感受野,忽略不同维度特征图像之间的特征差异与不同特征对于目标分割精度的重要性,提出特征对齐模块捕获长距离范围内像素点之间的语义关系,对齐不同特征空间特征信息以生成高质量掩码提高分割精度。

2 网络模型

2.1 网络整体结构

由于环境温度变化和气流扰动等外界因素导致甲烷气体分子微观上不停做无规则热运动,宏观上甲烷气体在扩散过程中扩散区域呈现出不规则形状变化,气体边缘轮廓始终呈现为模糊不清的混沌状态,而且甲烷气体在红外成像下存在着缺少色彩信息,空间和纹理细节信息匮乏等问题,本文以Yolact 模型为基础,构建出一种精度高、掩码质量好的空间信息自适应调控和原型特征对齐的红外甲烷泄漏实例分割模型AFNet。AFNet 模型主要由两个阶段组成,分别为特征提取阶段和特征后处理阶段。特征提取阶段由ResNet 主干网络、加权双向金字塔网络和原型特征对齐模块组成;特征后处理阶段由预测头分支组成。在特征提取阶段,首先将红外甲烷气体图像输入ResNet 主干网络中,通过自适应空间信息调控模块增强骨干网络对目标特征的自适应聚合能力,丰富模型提取特征的信息量和增强上下文相关性,并对分割结果贡献大的特征权重进行自适应校准,调整模型关注区域,减小背景干扰。其次,引入加权双向金字塔弥补特征金字塔自顶而下的特征传播方式导致的低层特征空间位置和实例边缘信息弥散丢失问题,以适应甲烷气体复杂轮廓变化下前景气体目标定位检测和轮廓分割需求。最后设计原型特征对齐模块捕获长距离范围内甲烷气体像素点之间的语义关系,对齐不同特征空间特征信息从而丰富原型语义信息量以生成高质量掩码提高分割精度。在特征后处理阶段,将加权双向金字塔的多尺度特征图作为预测头网络输入,经过分类分支头、边界框分支头和掩码分支头三个并行分支头得到输出结果。AFNet 模型整体结构如图1 所示。

图1 AFNet 网络架构Fig.1 AFNet network architecture

2.2 自适应空间信息调控

由于红外甲烷气体图像存在缺少色彩、纹理信息,轮廓复杂多变且边缘模糊等问题,仅由主干网络浅层或深层学习到的特征往往难以表征气体全局特征。在特征提取网络阶段,ResNet 主干网络分别由Block_1,Block_2,Block_3 和Block_4 个特征提取模块组成,4 个模块特征图表征的语义信息依次由浅到深。浅层特征由于涉及的特征映射变换少,所以保留更多原始输入纹理特征。因此,浅层特征更有助于定位目标实例的边缘纹理,从而更好地进行分割。而深层特征经过逐层抽象变换可以更好地捕捉目标实例的语义要素,以指导模型的最终分割。针对上述问题,本文提出自适应空间信息调控模块(Adaptive Spatial Information Regulation Module,ASIR),在ResNet 主干网络中嵌入自适应空间信息调控模块丰富模型提取的特征空间有效表征甲烷气体特征,自适应空间信息调控模块结构如图2 所示。

图2 自适应空间信息调控模块Fig.2 Adaptive spatial information regulation module

自适应空间信息调控模块首先对主干网络Block_1,Block_2 和Block_3 分别采用卷积层进行通道信息压缩操作将三个特征图通道压缩至1维,分别与自适应权重因子ω1,ω2和ω3相乘。在模型训练过程中,通过PyTorch 深度学习运行库生成一组尺寸等于调控模块数量且初始值为一的全一张量,然后通过公式(1)所示的归一化方式,分别将每个张量值转化为所对应的指数形式的权重相对于所有权重的比例值,从而得到初始权重因子ωi,其中i=1,2,3。

根据Block_1,Block_2 和Block_3 特征层所包含空间信息量贡献程度大小差异,ω1,ω2和ω3在训练过程中依赖神经网络的反向传播进行梯度更新,达到自适应调整目的。然后再将Block_1,Block_2 和Block_3 通道压缩后的特征图进行通道拼接得到具有自适应能力的特征Fconcate(H×W×3);进一步将特征Fconcate(H×W×3) 经由卷积层使通道维度信息恢复到2 048,达到对特征空间信息压缩和激励目的。由于对特征空间信息进行了压缩与激励,拼接后的特征张量每个像素点均包含了不同尺度下该位置所有通道信息,将其送入堆叠的卷积层进行自适应特征学习,有效实现不同尺度下特征张量之间空间信息的流动,丰富模型提取特征细节信息量。最后将重编码后的特征Fre-feature(H×W×2 048)与最具抽象语义信息的Block_4 模块输出特征图进行像素点乘最终得到自适应多尺度空间信息特征图Fadaptive(H×W×2 048),实现低维空间信息在高级语义信息中自适应调控,达到对空间信息权重的自适应校准。自适应空间信息调控模块如公式(1)所示:

其中:ωi表示自适应权重,αi为初始化指数权重,αj为特征权重。Fconcate表示具有自适应能力的融合特征,Conv3×3表示3×3 卷积操作,Fadaptive表示最终输出特征图,Concate表示通道拼接操作,⊗表示像素点乘。

训练时主干网络中四个残差块Block_1,Block_2,Block_3 和Block_4 特征图进行可视化如图3 所示(彩图见期刊电子版),第一行为原始ResNet 主干网络特征图,第二行为空间信息调控模块输出特征图。从图3 中红色标注部分可以看出经过空间信息调控残差块特征图中气体目标轮廓特征更为明显,边缘区分较好,纹理细节信息丰富,极大程度降低复杂背景对前景分割质量的影响,对特征的拟合效果明显优于Yolact 原始模型,在Block_2,Block_3,Block_4 深度递增特征图上特征学习更为突出且在Block_4 特征图背景抑制效果明显。

图3 空间信息调控模块特征图对比Fig.3 Comparison of feature maps of spatial information regulation module

2.3 加权双向金字塔

Yolact 模型采用特征金字塔结构[27]实现不同尺度特征图的信息融合对气体目标进行预测。特征金字塔通过自顶向下和特征横向映射融合多尺度特征,但该特征映射传播方式存在一定问题。由于红外甲烷气体图像具有尺度差异大、纹理细节信息稀缺,不同深度特征经过单一自顶向下的特征横向映射和大量卷积操作会使得气体目标特征细节信息丢失,不利于精确识别气体目标。针对上述问题PANet[28]在特征金字塔的基础上增加自底向上路径,将浅层信息直接与高层信息融合,减少各网络层聚合的特征信息经过骨干网络造成的信息丢失问题,从而达到丰富网络提取的特征空间和使定位信息更为准确的目的。PANet 增加的自底向上结构在一定程度上使模型提取的特征信息更为丰富,但其所加分支也带来了附加参数量,使网络模型的时空复杂度增大,计算量有较大程度增加。BiFPN 即加权双向金字塔在保留PANet 高精度的同时,对多尺度特征信息融合方式进行调整,针对PANet 结构中部分节点只有一个输入,且没有进行特征融合操作的问题,在连接时将贡献度较低的输入节点删除以减少网络参数量使特征融合网络更加高效。同时为缓解网络链路较多造成特征损失问题,在输入节点和输出节点之间增加跳跃连接以实现特征的有效融合。因此本文引入加权双向金字塔减少不同深度特征横向映射过程中细节信息弥散丢失,丰富深层特征图中气体目标实例边缘纹理信息,完善细粒度像素级回归任务以适应甲烷气体复杂轮廓变化下轮廓分割需求,其结构如图4 所示。

图4 加权双向金字塔Fig.4 Weighted bidirectional pyramid

加权双向金字塔特征传播过程如式(2)、式(3)所示:

其中:Piin(i=3,4,5,6,7)表示输入到特征融合网络中的特征图,Pt i(i=4,5,6)表示加权双向金字塔先经过自顶向下上采样操作得到的中间特征,Piout(i=3,4,5,6,7)表示经过特征融合网络处理后的输出,Conv(·)表示对特征图进行卷积处理,R(·)表示对特征图进行匹配而进行的上采样和下采样操作。

为清晰解释加权双向金字塔内在工作机理对最终分割结果的有效性,在加权双向金字塔五个输出层特征图Piout(i=3,4,5,6,7)的通道维度进行最大池化,并与原图叠加得到类激活热力图后进行可视化对比分析。如图5 所示(彩图见期刊电子版),图中气体区域颜色越接近红色说明模型对其激活程度越大且关注度越高。图5 中第一行为原始特征金字塔的输出特征热力图,第二行为加权双向金字塔的输出特征热力图,从P3out和P4out热力图可以看出,加权双向金字塔输出层特征图热力分布覆盖了气体轮廓主要范围,比原始特征金字塔更能突出气体目标轮廓区域,从P6out和P7out热力图中可以看出加权双向金字塔热力分布相对于原始特征金字塔更集中在气体目标中,尤其在P7out表现更为显著。

图5 加权双向金字塔热力图对比Fig.5 Comparison of weighted two-way pyramidal heat map

2.4 原型特征对齐模块

Yolact 采用预测头掩码分支生成一组掩码系数,同时将金字塔P3out输出层作为与预测头并行的原型掩码分支输入,经由五层卷积组成的全卷积网络作为原型掩码分支生成通道维度为32的原型掩码模板,该通道维度与掩码系数个数相对应,将原型掩码模板和掩码系数以线性组合方式得到实例掩码。但Yolact 原型掩码分支仅简单堆叠卷积层增大其感受野,忽略了不同维度特征图像之间的语义特征差异与不同尺度特征对于甲烷气体分割精度的重要性,而且甲烷气体扩散范围各异,扩散范围在图像中的尺度大小随之发生变化,这将造成甲烷气体边缘分割结果精度低、气体边界定位不准确等问题。同时考虑到单一特征表达能力的局限性,尤其是难以适应甲烷气体与背景环境低对比度和扩散区域形变复杂的情况。本文需要在低对比度背景中对泄漏甲烷气体进行识别分割,同时甲烷气体形状、颜色、纹理特征与背景极为相似,故需要模型能捕获长距离范围内甲烷气体像素点之间的语义关系,同时也需要准确表征扩散甲烷气体的空间细节特征。为解决此问题,受文献[29]启发本文构建了原型特征对齐模块(Prototype Feature Alignment Module,PFAM)捕获长距离甲烷气体特征之间的语义关系丰富原型语义信息量以提高生成的目标掩码质量。原型特征对齐模块如图6 所示。

图6 原型特征对齐模块Fig.6 Prototype feature alignment module

为了充分利用不同维度特征图之间的语义特征差异,使网络训练时能获得更多上下文信息,丰富各维度特征之间语义信息的关联表达,本文将加权双向金字塔Piout(i=3,4,5,6,7)中任意两个输出特征Piout和Pi+1out作为原型特征对齐模块的输入特征,以捕获长距离甲烷气体特征之间的语义关系、丰富各尺度特征之间语义信息的关联表达,其中Piout代表维度低尺度大的特征,Pi+1out代表维度高尺度小的特征。原型特征对齐模块由两个分支组成,首先将Piout(H×W×C)经过第一分支全局平均池化操作将特征维度从(H×W×C)压缩至(1×1×C),从而得到特征聚合后的特征向量,然后将特征向量通过卷积层实现非线性跨通道交互,并且降低其卷积计算参数量,以控制模型复杂度。最后经过Sigmoid 函数归一化并与Piout(H×W×C)点乘映射到原输入特征中,再与Piout(H×W×C)进行元素相加操作实现特征二次映射,最后通过卷积层进一步融合得到特征FS,实现特征选择过程,第一分支如公式(4)所示:

其中:Conv3×3表示3×3 卷积操作,Sigmoid表示激活操作,Avgpool表示全局平均池化操作,⊗和⊕分别表示元素点乘和元素相加操作。

第二分支将特征FS与Pi+1out(H1×W1×C1)进行通道拼接操作聚合通道信息,经过卷积操作后与Pi+1out(H1×W1×C1)再次通道拼接实现两个特征图不同通道序列间的信息交互,然后经由可变形卷积来学习特征FS和Pi+1out(H1×W1×C1) 派生的特征偏移得到特征Fa,最后将具有可变形学习能力的对齐的特征Fa与特征FS进行元素相加得到融合特征Ffsm,实现捕获长距离特征之间的语义关系达到两个不同维度特征之间特征对齐目的。第二分支如公式(5)所示,融合特征Ffsm如式(6)所示:

其中:Concate表示通道拼接操作,DCNconv表示可变形卷积。

3 实验验证

3.1 数据集

由于目前未有公开带注释文件的红外甲烷图像数据集,本文所采用的数据集源自GasVid[12],GasVid 是一个由31 个视频组成用于深度学习训练的大型甲烷视频集。数据集视频由FLIR GF-320 红外热像仪拍摄。考虑到实验平台硬件性能瓶颈,对视频进行时域下采样稀疏处理得到2 188 张图片作为本次的实验数据集用于训练和测试使用。本文使用图像标注工具Labelme 根据甲烷气体泄漏区域与背景区域的像素差异性对训练集和测试集图像中甲烷气体泄漏区域进行像素级精细标注得到对应图像的真实值(Ground Truth, GT),保存为符合COCO 数据集标准格式的JSON 文件用于模型训练和测试。数据集图像及真实值标签如图7 所示。实验按照4∶1 的比例将数据集随机分成训练集和测试集,分别用于训练模型和验证最终模型的泛化能力。

图7 为数据集原图与真实值掩码,其中甲烷气体掩码边缘轮廓形变复杂,为模型掩码建模带来巨大挑战;图8 为前景目标气体像素与背景像素占比情况,其中前景目标气体像素在图像中占比远小于背景像素占比,导致在模型特征提取过程中带来大量冗余干扰特征,加大了训练难度。

图8 前景与背景像素占比Fig.8 Foreground to background pixel ratio

3.2 实验环境和超参数

实验环境为Ubuntu18.04 操作系统,Python版本为3.6,深度学习框架为Pytorch 1.6.0。CPU 为AMD R5-3600,16 GB 内存,GPU 为RTX2080Ti 11 GB 显卡,使用CUDA Toolkit 10.0 和CUDNN V7.6.5 加速模型训练,实验各项超参数如表1 所示。

表1 超参数配置Tab.1 Hyperparameter configuration

3.3 评价指标

为验证本文算法优越性及有效性,本文选取平均精度(mean Average Precision,mAP)、每秒检测红外图像的张数(Frame Per Second,FPS)共两种评价指标来综合评价算法模型。考虑到实际工程应用中对甲烷气体泄漏检测有一定误报和漏报的要求,若使用AP@95 可能会导致甲烷泄漏的漏检。综合来看,本文使用AP50@95,AP50 来综合衡量模型性能,该评价指标能反映在不同置信度下的分割结果,是目前实例分割任务最普遍采用的评价指标。

其中mAP 可以通过准确率(Precision)、召回率(Recall)计算得出。在[0.50,0.95]区间内以0.05 为增量取10 个交并比(Intersection over Union,IoU)作为阈值,对这10 个阈值下对应的平均精度AP 取平均值则得到mAP,大小为[0,1]之间,mAP 越接近1 说明模型分割效果越好。

其中:m表示红外甲烷气体数据集中的甲烷气体类别数量,Pij为真实类别为i而被预测为j的像素数,Pii表示真实类别为i,被预测为i的像素数,Pji表示真实类别为j,被预测为i的像素数。

其中:TP(True Positive)为真正例,即真实值是目标,预测也判别为目标,FP(False Positive)为假正例,真实值是目标,预测判别为不是目标。

其中:FN(False Negative)为假负例,即真实值不是目标,预测判别为不是目标。mAP 计算公式可表示为公式(10):

其中:m表示类别数量,n表示类别序号,J(P,R)为准确率P与召回率R所构成PR曲线与横纵坐标轴所围成积分面积。

3.4 实验结果

3.4.1 自适应空间信息调控实验

自适应空间信息调控模块对主干网络中Block_1,Block_2 和Block_3 输出特征根据其包含空间信息量贡献程度大小差异赋予不同权重,实现低维空间信息在高级语义信息中的调控,达到对空间信息权重的自适应校准效果。为验证自适应空间信息调控模块的有效性,本组实验以Yolact 为框架,采用ResNet-50 和自适应空间信息调控模块作为特征提取网络进行实验分析。其中Yolact-ASIR_1 表示自适应空间信息调控模块中采用单个自适应因子同时赋予Block_1,Block_2 和Block_3 三个残差块;Yolact-ASIR_3表示自适应空间信息调控模块中采用3 个自适应因子分别赋予Block_1,Block_2 和Block_3 三个残差块,实验结果如表2 所示,各层权重对比变化如图9 所示,后续实验在本节实验的基础上开展。

表2 自适应空间信息调控模块实验结果Tab.2 Experimental results of adaptive spatial information regulation module

图9 各层权重对比变化Fig.9 Comparison of weight changes of each layer

从表2 实验结果中可得出两种结构的自适应空间信息调控模块均能对分割精度产生积极影响。采用三个自适应因子对Block_1,Block_2 和Block_3 特征进行空间信息调控效果相对与采用一个因子的效果好,Yolact-ASIR_3 模型AP50 分割精度达到88.87%,较Yolact 提高了3%,分割速度FPS 达到36.94。本组实验验证了自适应空间信息调控模块能有效丰富模型提取的特征信息,自适应校准空间信息权重,并丰富当前尺度下目标实例的特征空间和细粒度信息,对实例目标的边缘轮廓信息量进行加强,提高定位和分割精度。

由图9 可知,Block_1,Block_2 自适应因子在训练阶段变化趋势均为由大到小变化直至收敛,在训练阶段中后期自适应因子趋于收敛状态,而Block_3 自适应因子在训练阶段则为小到大变化,到训练中后期亦趋于收敛状态,实现对Block_1,Block_2 和Block_3 特征信息自适应调控。

3.4.2 加权双向金字塔实验

加权双向金字塔模块通过自顶而下和自底向上两条特征传播路径实现不同维度特征融合,减少特征横向映射过程中特征细节信息弥散丢失问题,丰富深层特征图下气体目标实例的边缘纹理信息,完善细粒度像素级回归任务以适应甲烷气体复杂轮廓变化下轮廓分割需求。为验证加权双向金字塔能够有效弥补特征横向映射过程中特征细节信息弥散丢失问题,本组实验选择Yolact-ASIR_3 模型作为基准模型,实验结果如表3 所示,后续实验在本节实验的基础上开展。

表3 加权双向金字塔实验结果Tab.3 Results of weighted two-way pyramid experiment

由表3 可知,在引入加权双向金字塔模块后有效将深层网络的语义信息与浅层网络的空间信息进行特征融合,丰富模型提取的特征空间,带来一定计算量的提升,牺牲有限计算资源成本下使得Yolact-ASIR_3-BiFPN 模型AP50 分割精度达到90.67%,在Yolact-ASIR_3 模型基础上提升2.02%,分割速度达到36.03 FPS 仅下降0.91 FPS,本组实验验证了加权双向金字塔模块对于缓解自顶而下的特征传播方式导致的低层特征空间位置和实例边缘信息弥散丢失问题的有效性。

3.4.3 原型特征对齐模块实验

原型特征对齐模块通过对不同维度特征进行特征选择和对齐学习来捕获长距离气体特征之间的语义关系,丰富原型语义信息量以提高生成目标掩码质量,实现甲烷气体分割精度提升。为验证原型特征对齐模块能够捕获长距离甲烷气体特征之间的语义关系丰富原型语义信息量,本组实验选择Yolact-ASIR_3-BiFPN 作为基准模型,实验结果如表4 所示,后续实验在本节实验的基础上开展。

由表4 可知原型特征对齐模块的输入特征对分割精度存在影响,其中将加权双向金字塔P3out 和P4out 输出层作为输入特征效果最好,Yolact-ASIR_3-BiFPN-FAM-P3outP4out 模 型AP50 分割精度达到42.42%,较Yolact-ASIR_3-BiFPN 模型升3.36%,分割速度达到36.80 FPS。将P3out 和P4out 输出层作为输入特征对分割精度影响最显著,究其原因,P3out 和P4out 作为相邻输出层特征间语义信息关联大,训练过程中模型容易学习到两者间特征偏移关系,反之P3out和P7out 特征间语义信息关联小,训练过程中难以学习到两者间特征偏移关系导致对分割精度的影响不明显。本组实验验证了特征对齐模块有效对不同维度特征进行特征选择和对齐学习来捕获长距离气体特征之间的语义关系,丰富各尺度特征之间语义信息,提高原型掩码质量实现分割精度提升。

3.4.4 消融实验

为了进一步验证模型中自适应空间信息调控模块、加权双向金字塔、原型特征对齐模块对于提升模型分割性能的差异,本文在自建数据集上通过消融实验验证3 个模块组合嵌入对模型分割精度的影响,六组消融实验是单一模块或两两模块的组合算法,最后一组是本文的完整算法,实验结果如表5 所示。实验结果表明,自适应空间信息调控模块、加权双向金字塔、原型特征对齐模块单一或组合模块的嵌入在分割准确度上均可以产生正向优化效果,对甲烷气体分割精度都有不同程度的提升,加权双向金字塔模块的分割精度提升相对较少。自适应空间信息调控模块和原型特征对齐模块相较于Yolact 精度提升明显,AP50@95分割精度分别达到37.58%和36.19%,在Yolact基础上分别提升4.01%和2.62%。说明两者都可以作为模型的主要模块对特征进行处理。最后将三个模块同时嵌入模型,AP50@95 达到了42.42%,表明三个模块同时使用对模型的提升作用更大,可以有效实现甲烷气体准确分割。

表5 消融实验结果Tab.5 Results of ablation experiments

3.4.5 对比实验

为验证本文所提算法在自建数据集上的优越性及有效性,选择目前先进的实例分割算法SparseInst[30],E2EC[31],YolactEdge[32],SOLOv1,SOLOv2,CondInst 和QueryInst[33]与本文模型AFNet 进行对比实验。为保证验证结果的有效性,实验均在3.2 节介绍的实验平台上开展,使用的训练集和测试集均为本文自建数据集,算法性能对比如表6 所示。从表6 中可以看出,与其他8种模型相比本文设计的AFNet 模型的AP50@95分割精度最高达到42.42%,比SparseInst、E2EC、YolactEdge 分别高出16.97%,8.21%和9.63%,但分割速度低于SparseInst 和E2EC。对于SOLOv1,SOLOv2,CondInst 和QueryInst 等模型在精度和速度上均能体现出优势。综上所述,考虑到红外甲烷泄漏分割需要同时权衡模型的平均精度和推理速度,本文所设计AFNet 模型分割性能更好,因此更适用于红外甲烷泄漏分割任务。

表6 对比实验结果Tab.6 Comparison of experimental results

3.4.6 定性分析

为直观对比本文AFNet 模型与Yolact,SparseInst、E2EC,YolactEdge,SOLOv1,SOLOv2,CondInst 和QueryInst 等模型分割红外甲烷图像性能的鲁棒性,将以上9 种算法在同一测试集上对分割结果进行可视化如图10 所示。第1 行为原图,第2~9 行分别为模型可视化结果图,由可视化结果得知,在(a)列图像中,YOLACT 模型将一个气体实例误检为两个气体实例,而AFNet 模型分割准确;在(c)列图像中,YOLACT 模型将背景干扰因素误检为甲烷气体。在(b)和(d)列中,对于轮廓边缘相对模糊的红外甲烷气体,AFNet 经过自适应调控主干网络空间信息,更有效的表征甲烷气体特征,因此能有效分割出甲烷气体泄漏区域,对于形变复杂的气体轮廓能做到准确拟合,排除背景和管道干扰,由此得出本文AFNet 模型分割细节更为完善,克服背景干扰能力更强,并且误检率明显低于YOLACT 基准模型,能够适应低对比度下甲烷气体扩散范围的尺度形状变化,整体分割结果有明显提升。

4 结 论

本文针对红外甲烷气体泄漏实时分割需求提出空间信息自适应调控和特征对齐模型AFNet,达到在低对比度背景中对尺度形变复杂的甲烷气体进行高性能分割的目的,实现在红外成像环境中对甲烷气体目标实例泄漏扩散区域准确分割。针对主干网络中高层语义特征图的空间位置信息匮乏严重的问题,AFNet 模型以ResNet 为主干网络,提出自适应空间信息调控模块自适应调控主干网络不同尺度残差块权重,增强骨干网络对目标特征的自适应聚合能力丰富模型提取的空间特征信息;引入加权双向金字塔弥补特征金字塔自顶而下的特征传播方式导致的目标信息逐层抽象后造成的信息弥散丢失问题,优化模型预测层输出结果;最后构建原型特征对齐模块捕获长距离范围内甲烷气体像素点之间的语义关系,对齐不同尺度语义特征信息,丰富原型语义信息量,生成高质量掩码提高分割精度。

经过实验验证,与Yolact 基础模型相比,AFNet 对甲烷气体分割精度有明显提升,掩码分割精度AP50@95 和AP50 分别提升9.79% 和6.18%,并且AFNet 最高推理速度可达36.80 FPS,满足化工企业在生产过程中发生甲烷泄漏事故时要求及时准确分割气体的需求,为红外甲烷气体泄漏分割提供了一定的参考价值。在未来的工作中将进一步提升精度,并且加快模型推理速度,实现在红外场景下快速和精准分割泄漏甲烷气体目标。

猜你喜欢

掩码空间信息金字塔
“金字塔”
结合多层特征及空间信息蒸馏的医学影像分割
A Study of the Pit-Aided Construction of Egyptian Pyramids
海上有座“金字塔”
低面积复杂度AES低熵掩码方案的研究
基于布尔异或掩码转算术加法掩码的安全设计*
神秘金字塔
《地理空间信息》协办单位
基于掩码的区域增长相位解缠方法
基于掩码的AES算法抗二阶DPA攻击方法研究