APP下载

基于DMSANet-YOLOv7的雾霾下绝缘子缺陷实时检测方法

2024-09-19王海群王康

无线电工程 2024年6期
关键词:注意力机制目标检测

摘 要:针对复杂环境与雾霾天气下绝缘子缺陷过小,传统目标检测算法难以识别造成误检、漏检等情况,提出一种以YOLOv7 为基础模型并改进的缺陷检测算法。在图像预处理部分采用暗通道先验去雾算法,提高模型对特征的可分辨性与鲁棒性;为提高模型特征提取能力和识别小目标能力,在主干网络结构后端引入双重多尺度注意力机制(Dual MultiScale Attention Network,DMSANet);为减小模型尺寸,提高模型识别速度,采用基于SwinTransformer 改进的C3 模块替代E-ELAN 模块;在预测部分使用Wise-IOU 损失函数,提高模型收敛效率。实验结果表明,DMSANet-YOLOv7 算法相较于原YOLOv7 算法平均准确率、准确率以及召回率分别提高6. 3% 、7. 9% 、12. 3% ,单张图片检测速度达到12. 3 ms,参数量为37. 7 M。在提高检测精度的同时确保检测速度和性能的平衡,能够更好地搭载至无人机及其他平台,满足绝缘子及其缺陷的实时动态检测需求。

关键词:绝缘子缺陷;目标检测;注意力机制;YOLOv7;暗通道先验去雾算法

中图分类号:TM216;TP391. 4 文献标志码:A 开放科学(资源服务)标识码(OSID):

文章编号:1003-3106(2024)06-1431-09

0 引言

绝缘子在高压输电网中发挥着至关重要的作用,由于所处环境较为恶劣,因此绝缘子时常出现破损、掉串、腐蚀和裂痕等缺陷[1],给电网安全运行带来极大的不稳定因素。作为输电线网中的重要元器件,定期巡检成为电网公司的首要任务。由于绝缘子所处复杂的自然环境,且近年雾霾天气频发,给线路巡检带来了极大困难,因此如何设计出一种满足实时性、鲁棒性的绝缘子缺陷检测算法成为亟待解决的问题[2]。

在目标检测算法中深度学习是目前常见的前沿技术,其中包括一阶段(OneStage)目标检测算法和二阶段(Two-Stage)目标检测算法,其主流算法有Single Shot MultiBox Detector (SSD)算法、You OnlyLook Once(YOLO)算法、Faster R-CNN 算法以及Re-fineDet 算法[3]等。由于一阶段目标检测算法相比二阶段目标检测算法识别速度快,更适合应用于实时检测,因此成为现阶段的研究热点。

目前国内外已有不少研究使用目标检测算法在绝缘子缺陷识别上取得不菲的成绩。王道累等[4]提出一种基于YOLOv5 的轻量化检测模型,对主干网络中的残差模块进行改进并添加可分离卷积,设计DC-SPP 模块使网络在不损失细节信息的情况下增大感受野,提高模型检测性能。李斌等[5]提出一种基于多尺度的特征融合网络,使用残差注意力网络获取绝缘子不同分辨率的缺陷特征,并且使用Focal 损失和高斯非极大抑制方法进一步提升检测效果。张国宝等[6]提出使用传统的光线法智能定位装置,由此开发绝缘子缺陷检测的三维成像技术,此理论可以更好地将绝缘子全面覆盖检测。Zheng 等[7]提出改进的YOLOv7 模型,基于Kmeans++对绝缘子数据集目标框进行聚类,引入坐标注意(CoordAtt)模块和HorBlock 模块增强特征提取能力,利用SIOU 和焦点损失函数加速模型收敛,并改进非最大抑制方法,提高检测精度。上述研究模型虽然相较于原网络模型的速度和精度有一定的提升,但是仍无法满足现实需求,与要求存在一定的差距,且在雾霾天气与环境复杂的条件下,检测速度过慢精度较低,使得模型难以应用于动态实时检测工作。

因此,针对复杂环境和雾霾天气下绝缘子缺陷尺寸过小等问题造成检测精度较低,无法满足动态实时检测要求,采用较为新颖的YOLOv7 网络为基础模型,在头部网络引入基于自注意力机制的改进C3 模块,并融合DMSANet 注意力机制,使用Wise-IOU 损失函数充分发挥非单调调焦机制的潜力,降低高质量锚框的竞争力,并掩盖低质量样本的影响,提高绝缘子缺陷的检测的效率。

1 YOLOv7 算法原理

YOLOv7 算法网络结构如图1 所示,此算法基于YOLOv5 算法,引入模型重新参数化思想,并增加深度监督技术,改进了动态标签分配策略,提出了由粗到精的引导标签分配策略等[8]。其中,模型再参数化的作用是在训练过程中将整个模块拆分为几个相同或不同的模块分支,在推理过程中将多个分支模块整合为一个完全等价的模块。模型再参数化的好处是可以获得更好的特征表示,减少计算量和参数量,提高推理速度。

由于深层网络可以更有效地学习和收敛,因此YOLOv7 引入ELAN 结构并改进为E-ELAN,可以通过控制最短和最长梯度路径,使网络有效地学习到更多特征,并具有更强的鲁棒性。E-ELAN 可以完全不改变原有架构梯度传输路径,利用群卷积增加特征基数,并以Shuffle 和Merge 基数的方式将不同组的特征组合起来。这种操作方式可以增强不同特征图学习到的特征,以提高参数和计算的使用。

在结构上,E-ELAN 只改变计算块的体系结构,而过渡层的体系结构完全不变。此策略使用群卷积进行扩展计算块的通道和基数,将计算层的所有计算块使用相同的组参数和信道乘法器,紧接着每个计算块计算出的特征图按照设定的组参数进行洗牌,再将其拼接在一起。此时,每组特征图中的通道数将与原架构中的通道数相同。E-ELAN 除保持原有的ELAN 设计架构外,还可以引导不同组的计算块学习更多样化的特性,通过扩展、洗牌、合并基数策略,在不破坏原有梯度路径的前提下,不断增强网络的学习能力。YOLOv7 与以往YOLO 结构不同,其结构中MP 层同时使用Maxpooling 和3×3 卷积进行下采样,得到的输出通过并联进行连接,这使得网络能够更好地提取特征[9]。

2 DMSANet-YOLOv7 的提出

2. 1 改进C3 模块

在YOLOv7 中,ELAN 模块用于从输入特征映射中提取特征。然而,对于绝缘子缺陷的种类和大小存在巨大差异,不同种类缺陷之间也存在相似之处,并且绝缘子材质的不同以及光照影响,在拍摄过程中所得到的图像也会有所变化,因此ELAN 模块不能更好地提取有效特征。同时ELAN 模块包含更多卷积模块和残差连接,使得计算量增大,降低了推理速度。

基于上述原因,将YOLOv5 中的C3 模块如图2所示,改进的C3C2 模块[10]如图3 所示。C3C2 模块的设计灵感来源于SwinTransformer 的网络结构。它在原有C3 模块的基础上,将残差分支卷积模块改为简单的卷积结构,并去除归一化层和激活函数层,以减少参数计算量。鉴于Mish 激活函数比SiLU 激活函数具有更好的抑制过拟合的能力,因此Mish 激活函数对不同的超参数具有更强的鲁棒性。鉴于以上优点,将最终卷积模块中的激活函数由原来的SiLU 激活函数改为Mish 激活函数,并在最后的并联操作后输入卷积模块,增强了网络的非线性变化。

2. 2 DMSANet 注意力机制

在目标检测模型中引入注意力机制,可以避免模型计算能力向无价值的部分进行偏移,选择性地加强重要特征并抑制无用特征,降低图像干扰信息的影响,从而提高检测效果。

现有注意力机制难以做到对性能和模型复杂度之间的良好平衡,在兼顾通道和空间注意机制的同时带来额外的计算负担。因此引入双重多尺度注意力机制(Dual Multi Scale Attention Network,DMSA-Net)[11],其结构如图4 所示,由两部分组成:① 提取不同尺度的特征并对其进行聚合;② 使用空间与通道注意力模块对局部特征与全局依赖项进行自适应整合。

第一部分借鉴SKnet[12]与Sa-Net[13]的观点,将输入特征映射X 与通道尺寸分为N 部分,对于每个分裂部分,网络具有C0 = CS 的共同频道,并且第i 个特征映射是Xi ∈RC0×H×W ,各个特征在传递到2 个不同的分支之前进行融合。

第二部分由空间和通道注意力模块组成,用于语义分割。通道注意模块用于选择性地加权每个通道的重要性,从而产生最佳的输出特征,此方法可以有效降低参数量。网络首先建立一个空间注意矩阵,此矩阵对特征图像的任意2 个像素之间的空间关系进行建模;其次对注意矩阵与原始特征矩阵之间进行矩阵乘法;最后对得到的矩阵和原始特征进行逐元素求和运算。

在网络的最后一部分中,所有子功能都被聚合,使用“通道洗牌”运算符来启用沿通道维度的跨组信息流。模块最终输出与输入的输出大小相同,使注意力模块与其他网络较为容易的集成。

通过式(1)定义的拼接方式,可以得到整个多尺度预处理特征图:

F = Concat([E1j,E2j]), (1)

式中:F∈CC×H×W 为得到的多尺度特征图,E1j、E2j 为通道注意力机制与空间注意力机制输出结果。DM-SANet 注意力机制在特征描述符的引导下,跨通道自适应选择不同的空间尺度。该操作定义如下:

最后,将重新校准的多尺度通道注意力权重atti 与相应尺度Fi 的特征图相乘:

Yi = Fi ⊙atti, (3)

式中:i = 1,2,3,…,S-1,⊙表示相乘。

DMSANet 注意力机制与大多数现有模型相比,不仅达到了最佳性能,而且参数更少,由于其轻量级的特性,DMSANet 注意力机制可以很容易地与其他卷积神经网络集成。

2. 3 Wise-IOU 损失函数

边界框回归(BoundingBox Regression,BBR)损失函数是目标检测的一大关键,对目标检测至关重要,检测性能很大程度上依赖于损失函数的设计,而边界框损失函数作为其重要组成部分,其准确定义可以使检测网络拥有显著的性能提升。因此选择较为合适的损失函数成为目标检测的首要任务。

Wise-IOU 损失函数[14]是一种动态非单调调频损耗,可以降低高质量锚框的竞争力,同时减少低质量样本产生的有害梯度,使Wise-IOU 损失函数可以更好地提高网络的检测性能。当Wise-IOU 损失函数应用于YOLOv7 模型中,MS-COCO 数据集中AP75提高2. 77% ,因此本文选择Wise-IOU 损失函数作为BBR 损失函数,如图5 所示。

IOU 损失定义为:

式中:B 为预测边界框,Bgt 为真实边界框。

由于训练数据中包含低质量样本,距离和纵横比等几何因素会加重对低质量样本的惩罚,从而降低模型泛化性能。当锚框与检测框吻合良好时,良好的损失函数应能减弱几何因素的惩罚,而较少的训练干预将使模型获得更好的泛化能力。RWise-IOU ∈[1,e),将显著放大一般质量锚框的LIOU 。LIOU ∈[0,1]将显著降低高质量锚框的Wise-IOU ,并在锚框与目标锚框重合时,其关注中心点之间的距离。因此得到Wise-IOU 损失函数的距离损失公式:

式中:Wg、Hg 为最小封闭框大小,x、y 为预测框中心点坐标,xgt、ygt 为真实框中心点坐标。为了防止RWise-IOU 产生阻碍收敛的梯度,Wg、Hg 从计算图中分离出来(上标*表示此操作)。

非单调聚焦系数r 定义为:

式中:β 为离群度,表征回归框的质量; LIOU 为动量为m 的滑动平均值,其动态更新使整体β 保持较高水平,可以有效解决训练后期收敛速度较慢的问题;α、δ 为超参数,当回归框的离群度满足β = C(C 为预设值)时,回归框可以获得最高的梯度增益。同时由于LIOU 是动态更新的,回归框的质量划分标准也是动态调整的,使得Wise-IOU 可以在训练中随时做出最符合当前状况的梯度增益分配策略。

综上所述,Wise-IOU 损失定义为:

LWIOU = r· RWise-IOUL IOU 。(8)

2. 4 去雾算法

由于雾霾天气的影响使得绝缘子缺陷检测更为困难,因此本文算法采用暗通道先验(Dark ChannelPrior)去雾算法[15]在图像输入网络之前进行图像预处理。去雾效果对比如图6 所示,由于在图像中至少存在一个颜色通道且亮度值极低,因此结合雾成像模型与软抠图插值方法进行去雾处理,式(9)为暗通道先验:

式中:Jdark(x)为暗通道趋于0,Jc(y)为J 的颜色通道,Ω(x)为以x 为中心的局部区域。

由于透光量较少,直接恢复场景亮度容易产生噪点,因此设定传输t(x)限制在一个下限t0 ,因而在雾霾严重的地方保留了少量的雾霾。

经过公式推演,去雾算法如式(10)所示:

式中:J(x)为无雾图像,I(x)为有雾图像,A 为全球大气光值,t(x)为透射率。

经过以上改进得到DMSANet-YOLOv7 模型如图7 所示。图片在预处理阶段进行去雾操作以提高模型的识别能力与鲁棒性,进一步增强YOLOv7 网络结构的特征提取和融合能力[16],提高推理速度,使得网络更适合应用于绝缘子及绝缘子缺陷动态实时检测。

3 实验结果及数据分析

3. 1 数据集处理

本实验使用网络开源数据集与自采数据集,共计1 022 张。由于图片数量较少,在进行试验时容易因数据不足造成模型泛化能力差,导致过拟合现象出现,从而影响实验结果。因此通过亮度增强、水平翻转、随机角度、马赛克和灰度图等方法进行数据扩充并使用算法将正常图片雾化处理。图像增强实例如图8 所示。

经过数据增强最终得到8 176 张绝缘子图片,数据集规模不仅成倍扩充,还提高了网络模型的泛化能力。本文将数据集按照8 ∶ 1 ∶ 1 的比例划分为训练集、验证集和测试集,训练集与验证集将用于网络模型的训练,而测试集则用于检验网络模型的识别准确率。

3. 2 模型评估

本实验使用的模型评估指标分别为FPS、准确率(Precision,P)、召回率(Recall,R)和平均准确率(mean Average Precision,mAP)作为评估指标进行网络模型的性能评估。相关评估指标计算如下:

式中:Frameum 表示检测图片总数,ElapsedTime 表示检测所花费的总时间,TP 表示正样本正确识别为正类的数量,FP 表示负样本错误识别为正类的数量,FN 表示正样本错误识别为负类的数量,N 表示数据集中样本类别数量。

3. 3 实验环境

本实验采用的操作系统为Linux Ubuntu 发行版,CPU 型号为15 核心Intel(R)Xeon(R)Platinum8375C,内存为80 GB,GPU 选择NVIDIA GeforceRTX 4080,显存为24 GB。环境配置为Cuda 11. 0,对应的深度学习框架为PyTorch 1. 7. 0,编程语言环境为Python 3. 8. 0。

3. 4 模型主干网络实验

模型主干网络实验数据对比如表1 所示,在引入Wise-IOU 损失函数后平均准确率、准确率和召回率相比原YOLOv7 网络分别提高2. 7% 、2. 2% 、7. 8% ,从数据可以体现出Wise-IOU 损失函数可以更好地将预测框贴合真实框,降低高质量锚框的竞争力,并掩盖低质量样本的影响,从而达到快速准确地预测目标。

使用改进的C3C2 模块更换原EELAN 模块后平均精度、准确率和召回率分别提高4. 1% 、3. 1% 、10. 9% ,这证明C3C2 模块可以充分探索邻近的上下文信息,以一种高效的方式提升自注意力的学习,从而提高输出特征的表达能力,提高网络检测精度使其更好地应用于小型无人机进行动态实时检测,极大方便电力工人的巡检工作。

3. 5 注意力机制实验

为验证本文所提出的引入DMSANet 注意力机制相较其他注意力机制的优势设计此实验。不同的注意力机制对比实验数据如表2 所示,在主干网络后引入其他2 种较为常见的注意力机制进行对比,分别为CBAM[17]、GAM[18]。

不同注意力机制热力图如图9 所示,对比热力图可以发现,DMSANet 注意力机制对于绝缘子及绝缘子缺陷的关注度更高,发散程度更低。从可视化角度说明,DMSANet 注意力机制相较于其他注意力机制更为优越,对于绝缘子缺陷检测效果更好,可以有效地提高网络模型对目标的关注度,降低了复杂背景对绝缘子及其缺陷的检测的影响,更好地提升了模型性能。

由表2 中数据与热力图可得出结论,对于绝缘子及其缺陷在引入注意力机制后,检测效果显著提高,而DMSANet 注意力机制相较于其他注意力机制提升效果最大,与原网络相比mAP 提升6. 3% ,单张图片检测时间可达12. 3 ms,虽相较于原网络速度有所下降,但大幅提高了精度,可以更好地应用于绝缘子缺陷实时检测之中。

3. 6 模型对比试验

为进一步验证本文所提算法的优越性,设计各类模型对照试验,其中选取二阶段算法Faster R-CNN 与一阶段算法SSD、YOLOv4、YOLOv5、YOLOv7 与改进算法进行比较,结果如表3 所示。改进算法在检测精度与检测速度上具有较大优势,相较于其他5 类算法模型全部达到了最先进的结果,mAP 分别提高39. 9% 、45. 1% 、6. 5% 、4. 5% 、6. 2% ,且检测速度相较于其他网络表现更为优异,FPS 达到81,因此本文所提出的算法可以更好地保证动态实时检测的效果,更加准确便捷地对绝缘子缺陷进行检测。

3. 7 消融实验

为验证DMSANet-YOLOv7 算法的各项改进对绝缘子及其缺陷检测的影响,进行消融实验,对各个改进点进行评估,评估结果如表4 所示。

表4 第一行为原网络检测结果。通过表4 可以看出,引入Wise-IOU 损失函数,mAP 与原网络相比提高1. 7% ,准确率与召回率分别提高3. 8% 、8. 7% ,不仅提高了模型预测精度,而且预测框更加的符合真实框;将C3C2 模块引入主干网络后,mAP提高5. 13% ,准确率与召回率分别提高4. 9% 、6. 1% ,证明C3C2 模块对网络主干起到正向作用,使检测精度进一步提高;而在主干网络之后加入DMSANet 注意力机制mAP、准确率与召回率进一步提高4. 7% 、6. 1% 、10. 6% ,证明DMSANet 注意力机制可以更好地关注绝缘子及其缺陷目标,达到更好的检测效果;采用Kmeans 聚类算法后提高了定位精度,使训练更加稳定,在不影响检测速度的情况下mAP、准确率以及召回率分别提高6. 3% 、7. 9% 、12. 3% 。消融实验结果表明Wise-IOU 损失函数、C3C2 模块、DMSANet 注意力机制以及K-means 聚类算法对原网络检测精度均有正面影响。

图10 为YOLOv7 算法与本文改进算法在雾霾天气下与背景较为复杂的环境下对目标的检测效果图,DMSANet-YOLOv7 算法基于YOLOv7模型并加以改进,对雾霾天气下绝缘子及其缺陷的检测效果相比原YOLOv7 算法具有显著的提高。

图中数据结果表明,改进后的算法对雾霾天气与复杂背景下的检测效果有了明显提升,本文所提算法,显著提高了模型的特征提取能力,使算法可以快速准确地检测出目标,有效地减少了误检、漏检现象的出现,证明此算法在背景复杂与雾霾天气条件下仍然能够取得显著的检测效果。

由于单张图片检测时间可达12. 3 ms,因此DMSANetYOLOv7 算法可以更好地应用于实时检测中,基于YOLO 算法的特性,此算法搭载至无人机进行航拍检测,可在不断电的情况下进行缺陷检测,极大地保证了生产生活安全,对实时检测具有极大的现实意义。

4 结论

针对复杂背景及雾霾天气下绝缘子缺陷检测精度较低,未达到动态实时检测的要求,提出基于YOLOv7 的改进网络模型,主要结论如下:

① 改进主干网络模块C3 模块增加含有Mish激活函数的卷积,并替换E-ELAN 模块,进一步提高视觉表达能力,从而有效地促进自注意学习增强输出聚合特征图的表达能力。

② 针对绝缘子及其缺陷的特点,引入DMSANet注意力机制,使模型提高绝缘子缺点的关注度,提高目标检测的精度,并将预测框回归损失函数更换为Wise-IOU 损失函数,使非单调调频的潜力得到充分发挥,从而提高模型的预测精度,使改进后的网络更适合实时检测。

③ 在同一实验条件下,对DMSANet-YOLOv7 算法与其他深度学习算法进行对比实验,实验结果显示DMSANet-YOLOv7 算法虽然失去了一部分检测速度,但在检测精度与性能方面取得了更好的平衡,进一步提高巡检自动化程度和效率。

④ 由于在巡检过程中会遇到大风天气使得拍摄器材抖动镜头无法对焦,造成图像模糊,鉴于此类弱点及局限性,可以在图像预处理阶段使用深度学习的方法进行图像去噪,以提高图像的清晰度。

参考文献

[1] 陈奎,刘晓,贾立娇,等. 基于轻量化网络与增强多尺度特征融合的绝缘子缺陷检测[J/ OL]. 高电压技术:1-14[2023 - 05 - 17 ]. https:∥ doi. org / 10. 13336 / j. 1003 -6520. hve. 20221652.

[2] 苟军年,杜愫愫,刘力. 基于改进掩膜区域卷积神经网络的输电线路绝缘子自爆检测[J]. 电工技术学报,2023,38(1):47-59.

[3] ZHANG S F,WEN L Y,BIAN X,et al. Singleshot Refinement Neural Network for Object Detection[C]∥2018IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City:IEEE,2018:4203-4212.

[4] 王道累,张世恒,袁斌霞,等. 基于改进YOLOv5 的轻量化玻璃绝缘子自爆缺陷检测研究[J]. 高电压技术,2023,49(10):4382-4390.

[5] 李斌,屈璐瑶,朱新山,等. 基于多尺度特征融合的绝缘子缺陷检测[J]. 电工技术学报,2023,38(1):60-70.

[6] 张国宝,杨为,赵恒阳,等. 基于X 射线三维成像技术的在役GIS 盆式绝缘子缺陷检测[J]. 高压电器,2022,58(10):230-236.

[7] ZHENG J F,WU H,ZHANG H,et al. Insulatordefect Detection Algorithm Based on Improved YOLOv7 [J]. Sensors,2022,22(22):8801.

[8] 倪昌双,李林,罗文婷,等. 改进YOLOv7 的沥青路面病害检测[J ]. 计算机工程与应用,2023,59 (13 ):305-316.

[9] 宋智伟,黄新波,纪超,等. 基于Flexible YOLOv7 的输电线路绝缘子缺陷检测和故障预警方法[J]. 高电压技术,2023,49(12):5084-5094.

[10] WANG R J,LIANG F L,MOU X W,et al. Development ofan Improved YOLOv7based Model for Detecting Defectson Strip Steel Surfaces[J]. Coatings,2023,13(3):536.

[11] SAGAR A. DMSANet:Dual Multi Scale Attention Network[C ]∥ Image Analysis and ProcessingICIAP 2022.Lecce:Springer,2022:633-645.

[12] LI X,WANG W H,HU X L,et al. Selective Kernel Networks[C]∥ 2019 IEEE / CVF Conference on ComputerVision and Pattern Recognition. Long Beach:IEEE,2019:510-519.

[13] ZHANG Q L,YANG Y B. SaNet:Shuffle Attention forDeep Convolutional Neural Networks [C ]∥ ICASSP2021-2021 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP). Toronto:IEEE,2021:2235-2239.

[14] TONG Z J,CHEN Y H,XU Z W,et al. WiseIoU:Bounding Box Regression Loss with Dynamic FocusingMechanism[EB / OL]. (2023 -01 -24)[2023 -05 -17].https:∥arxiv. org / abs / 2301. 10051.

[15] HE K M,SUN J,TANG X O. Single Image Haze RemovalUsing Dark Channel Prior[C]∥2009 IEEE Conference onComputer Vision and Pattern Recognition. Miami:IEEE,2010:2341-2353.

[16] 杨锦辉,李鸿,杜芸彦,等. 基于改进YOLOv5s 的轻量化目标检测算法[J]. 电光与控制,2023,30(2):24-30.

[17] WOO S,PARK J,LEE J Y,et al. CBAM:ConvolutionalBlock Attention Module [C]∥ European Conference onComputer Vision (ECCV). Munich:Springer,2018:3-19.

[18] LIU Y C,SHAO Z R,HOFFMANN N. Global AttentionMechanism:Retain Information to Enhance Channelspatial Interactions [EB / OL]. (2021 - 12 - 10 )[2023 -05-17]. https:∥arxiv. org / abs / 2112. 05561.

作者简介

王海群 女,(1968—),硕士,副教授,硕士生导师。主要研究方向:智能控制与应用、机器学习。

王 康 男,(1998—),硕士研究生。主要研究方向:深度学习与图像处理。

基金项目:河北省自然科学基金(F2021209006)

猜你喜欢

注意力机制目标检测
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
InsunKBQA:一个基于知识库的问答系统
视频中目标检测算法研究
行为识别中的人体运动目标检测方法
移动机器人图像目标识别
基于背景建模法的运动目标检测