APP下载

基于改进DCGAN轮胎缺陷图像生成方法

2023-09-14李春华付睿智刘玉坤王愉霖

河北科技大学学报 2023年4期
关键词:注意力机制

李春华 付睿智 刘玉坤 王愉霖

摘 要:

针对深度卷积生成对抗网络的数据扩充方法存在生成图像质量差、模型框架不稳定、模型收敛速度慢等问题,提出一种改进DCGAN轮胎缺陷图像生成模型。将残差网络和注意力机制嵌入到DCGAN模型中,提升模型特征的提取能力;同时摒弃DCGAN损失函数JS散度,使用带有梯度惩罚项的Wasserstein距离,提高模型训练的稳定性。实验结果表明,使用给定模型生成的轮胎缺陷图像质量优于使用DCGAN,WGAN,CGAN与SAGAN所生成图像,其平均FID值可以达到116.28,最小FID值可以达到84.94。所提出的模型可以稳定生成质量更好的轮胎缺陷图像,为轮胎缺陷样本数据集的扩充提供了一种有效途径,有助于有效解决深度学习在缺陷检测领域发展所面临的小样本问题。

关键词:计算机神经网络;生成对抗网络;残差网络;注意力机制;数据扩充

中图分类号:TN958.98   文献标识码:A  DOI:10.7535/hbkd.2023yx04003

A method for generating tire defect images based on improved DCGAN

LI Chunhua1,FU Ruizhi2,LIU Yukun2,WANG Yulin3

(1.School of Grammar and Law, Hebei University of Science and Technology, Shijiazhuang, Hebei 050018, China;

2.School of Information Science and Engineering, Hebei University of Science and Technology, Shijiazhuang, Hebei 050018, China;3.The Electrical Engineering College, Guizhou University,Guiyang, Guizhou 550025, China)

Abstract: An improved DCGAN tire defect image generation model was proposed to solve the problems of poor image quality, unstable model frame and slow model convergence in the data expansion method of deep convolutional generative adversarial network. The residual network and attention mechanism were embedded in DCGAN model to improve the feature extraction ability of the model. At the same time, the DCGAN loss function JS divergence was abandoned and Wasserstein distance with gradient penalty term was used to improve the stability of model training. The experimental results show that the quality of tire defect images generated by this model is better than that generated by DCGAN, WGAN, CGAN and SAGAN,with an average FID value of 116.28 and a minimum FID value of 84.94. The proposed model can stably generate tire defect images with better quality, which provides an effective way for expanding tire defect sample dataset and alleviates the problem of small sample in the development of deep learning in the field of defect detection.

Keywords: computer neural network; generative adversarial network; residual network; attention mechanism; data expansion

近年来,随着国家经济的快速发展,汽车保有量越来越大,轮胎作为汽车最重要的零部件之一,其质量的好坏直接影响人们的生命健康。据统计,中国每年在高速公路上由于轮胎发生故障导致的交通事故约占总交通事故的46%[1],其中由于爆胎引起的交通事故约占70%[2],因此,轮胎的质量直接影响公共交通安全。目前很多轮胎制造商对轮胎缺陷的检测方法还停留在人工观察阶段,由于人工目测具有主观性,导致造成的误差难以控制,很容易出现误检、漏检等问题,大大降低了轮胎检测的效率。因此,如何提高出厂前轮胎缺陷检测的效率和自动化程度,是一项十分必要的研究内容。

深度学习借助大型数据集训练神经网络,目前已经在缺陷检测领域得到广泛应用[3]。数据是深度学习的核心[4],数据集质量好坏和范围大小直接影响检测的效果。数据集过小,则模型很容易出现不收敛、过拟合现象[5],导致缺陷检测精度低、效果差。然而,在实际工业生产中,受限于复杂的缺陷图像收集过程,轮胎缺陷图像严重不足,相关数据集十分有限。数据扩充是解决上述问题的一种有效方式。传统的数据扩充方法通过将现有样本进行旋转、平移、缩放、添加噪声等产生新的样本[6],由于扩充的样本与原始样本之间具有很高的相似性,因而无法保证新生成的样本有利于模型训练,甚至有时会加剧模型的过拟合程度[7 8]。另一种方法是通过生成式模型进行数据扩充,GOODFELLOW等[9]在2014年提出生成对抗网络(GAN)模型,GAN模型通过学习特征分布生成新的样本,但生成的图像质量差,训练不稳定,容易出现梯度爆炸。近年来,越来越多的研究者基于GAN进行改进优化,出现了很多新模型。MIRZA等[10]通過向网络中加入条件,监督样本生成,提出条件生成对抗网络(CGAN)模型,可以使网络朝着既定的方向生成样本,但并没有解决训练不稳定的问题。RADFORD等[11]提出了深度卷积生成对抗网络(DCGAN),使用带步长的卷积层代替GAN模型的池化层和全连接层,并且为了增加训练的稳定性,加入批归一化层(BN层)。DCGAN模型的提出基本确定了生成对抗网络的基本结构,但该结构仍然存在着特征提取能力有限、模型框架不稳定、生成图像样本质量差且过于自由等问题。

为了解决上述问题,在DCGAN模型的基础上,提出一种改进的DCGAN轮胎缺陷图像生成模型。该模型将注意力机制与残差网络融合成一个“基本块”嵌入到DCGAN网络结构中,并用带有梯度惩罚项Wasserstein距离替代原始DCGAN损失函数所使用的JS散度。残差网络的加入,增加了网络深度,使模型能够提取更深层次的图像特征。注意力机制具有自动分配权重的特点,使网络学习到更多的有用纹理信息,抑制无用噪声信息。

1 基于改进DCGAN图像生成模型

模型由帶“基本块”的生成器和判别器构成,轮胎缺陷图像生成整体流程如图1所示。首先,将一组服从均匀分布的随机噪声Z作为输入送入生成器中,输出生成样本G(z);然后,将真实样本和生成样本G(z)一起作为输入送入判别器中,实现对生成样本G(z)真假的判断。生成样本通过生成器和判别器不断对抗迭代优化处理,变得越来越接近真实样本,达到生成轮胎缺陷图像的目的。

1.1 DCGAN模型框架

DCGAN模型是以GAN模型为基础提出的,模型思想来源于博弈论中零和博弈[12]。在GAN模型基础上,DCGAN模型采用全卷积网络结构,使用带步长的卷积层替代GAN模型生成器和判别器的池化层,使用1×1的卷积替代全连接层;将BN层应用在除生成器的输出层和判别器输入层之外的每一层;生成器中使用ReLu作为激活函数,最后一层使用Tanh作为激活函数,而判别器中使用Leaky ReLu作为激活函数,最后一层使用Sigmoid作为激活函数。

DCGAN由生成器和判别器构成。生成器具有转置卷积结构,目的是尽可能地生成近似于真实的样本;判别器具有卷积结构,目的是对生成样本和真实样本进行判别,两者通过不断迭代对抗优化各自的性能,最终达到纳什平衡。生成器与判别器相互博弈的目标函数如式(1)所示:

式中:x为真实样本数据;Pr(x)为x的概率分布;E为数学期望;z为随机变量;Pg(z)为z的概率分布;V(D,G)为判别器和生成器的值函数。

尽管DCGAN模型在数据扩充领域应用十分广泛,但仍存在一些问题,比如模型崩溃、收敛速度慢、生成样本过于自由且不可控等。

1.2 网络结构改进

针对DCGAN模型在图像生成过程中所存在的网络训练崩溃、生成图像质量差等问题,所提模型在DCGAN模型结构的基础上进行改进,根据注意力机制“即插即用”的特点和不破坏网络原始结构的原则,将注意力机制和残差网络融合为一个“基本块”嵌入到DCGAN模型的生成器和判别器中。

1.2.1 注意力机制模块

传统卷积神经网络在作为生成器生成图像的过程中,由于卷积核的尺寸固定,且大小受限,关注的区域有限,无法将2个距离较远的像素点联系起来,在训练过程中通常只能学习到图像的局部信息,因而容易导致生成的样本出现错误。注意力机制CBAM模块的加入可以补充传统卷积操作无法学习到的信息,使2个距离较远的区域信息产生联系,捕获到更多的信息,更好地学习到全局特征之间的关系。

注意力机制CBAM模块[13]是由通道注意力和空间注意力2部分组成,通道注意力可以使神经网络更加关注对图像生成起关键作用的像素区域而忽略无关紧要的区域,即明确特征中哪些特征是有意义的;空间注意力用于处理特征通道之间的分配关系,即明确有意义的特征在哪里。CBAM模块结构图如图2所示。

通道注意力结构如图3所示。通道注意力的特点是可以保持输入特征图的通道维度不变,

压缩空间维度。首先,将特征图F作为输入,基于空间进行全局最大池化和全局均值池化操作,得到2个1×1通道权重矩阵,再输入到多层次感知网络中;然后,对输出的特征进行加和以及Sigmoid激活操作得到通道注意力特征权重Mc,该过程如式(2)所示:

Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))=σ(W1(W0(FcAvg))+W1(W0(FcMax))),(2)

将通道注意力特征权重与原始输入特征相乘,得到空间注意力的输入F′,该过程如式(3)所示:

空间注意力结构如图4所示。空间注意力的特点是使特征图的空间维度不变,压缩通道维度。首先将输入的特征图F′进行基于通道的最大池化和平均池化操作得到2个二维向量拼接;然后经过卷积计算和Sigmoid激活操作,生成空间注意力特征权重Ms,该过程如式(4)所示:

Ms(F)=σ(f7×7([AvgPool(F);MaxPool(F)]))=σ(f7×7([FsAvg;FsMax])) ,(4)

式中:f7×7代表卷积核为7×7大小的卷积层。

将空间注意力特征权重与输入特征相乘,得到显著特征图F″,该过程如式(5)所示:

1.2.2 残差网络与基本块

对于神经网络来说,理想情况下,网络的层数越深,性能越好。但是实际训练过程中,随着网络的逐渐加深,常常伴随着梯度不稳定、训练困难、网络退化等问题[14]。为解决上述问题,HE等[15]在卷积神经网络(CNN)的基础上提出了残差网络(Resnet),Resnet的核心在于引入了残差块,利用跳跃连接或快捷方式跳过某些卷积层,残差块结构如图5所示,多个残差块通过线性连接构成残差网络。

传统生成对抗网络存在卷积层数少、对特征提取不完全的问题,但只是单一地加深网络的层数则会出现模型计算速度减慢、梯度爆炸、网络退化等问题[16],因此引入具有跳跃连接结构的残差网络来抑制梯度爆炸和网络退化等问题。但残差网络在提取特征方面并没有直接的优势,而是通过不断逐层深入表征更多的特征,达到最理想的效果。

针对此问题,提出将注意力机制CBAM模块嵌入到残差块中,利用注意力机制自动分配权重的特点,弥补残差网络在特征表征中的不足,通过尽可能少的残差块提取到更多的特征,使网络更加轻量化。根据注意力机制“即插即用”的特点和不破坏网络原始结构的原则,选择在每个残差块的残差分支之后、聚合之前嵌入注意力机制CBAM模块。在该模型中将嵌入CBAM模块的残差块称为“基本块”,基本块结构如图6所示。

1.2.3 改进的生成器和判别器

生成器作为整个网络的核心,目的是生成轮胎缺陷图像,所提模型生成器结构如图7所示。将一个100维的线性向量输入到网络中,经过线性层重构为256×8×8的特征图,在特征图送入DeConv层之前引入“基本块”,“基本块”的加入只是对网络特征提取能力的提升,不会改变输出特征图的大小和通道数。将输出的特征图依次送入DeConv层、BN层、ReLu激活函数层得到128×16×16的特征图,之后重复2次上述操作,除网络末尾使用Tanh作为激活函数,其他均使用ReLu作为激活函数,得到3×64×64的特征图作为生成器的输出。

模型判别器结构如图8所示。判别器的输入为生成器的输出图像,判别器包含3个卷积层,输入3×64×64的特征图经过连续卷积变为256×8×8的特征图。3层卷积激活函数均使用Leaky ReLu,在第2、第3层卷积之前加入“基本块”并添加BN层。在第1、第3卷积层后加入Dropout层,目的是防止判别器过于优化导致训练出现过拟合[17]。最后将256×8×8的特征图经过一个Sigmoid激活函数得到生成器生成样本真或假的概率。

1.3 损失函数优化

对于传统生成对抗网络,如果只是单纯地改进网络模型的结构,并不能从根本上解决生成网络训练难、梯度不稳定等问题。传统生成对抗网络所使用的损失函数JS散度存在问题,当真实分布与生成分布没有交集时,JS散度就会变成常数,导致梯度消失模型训练不稳定。为此,ARGOVSKY等[18]提出利用带有梯度惩罚项Wasserstein距离改进损失函数,Wasserstein距离具有平滑性的优点,反映真实分布概率与生成分布概率之间的距离,Wasserstein距离越小,说明真实分布与生成分布越相似,生成样本与真实样本之间的差距越小。Wasserstein距离如式(6)所示:

式中:n为真实分布与生成分布之间的随机差值;Pn为真实分布与生成分布之间的差值;λ为正则项系数;SymbolQC@nD(n)为梯度约束。

2 实验设计

2.1 参数设置及评价指标

改进的DCGAN轮胎缺陷图像生成模型,训练参数的设置如表1所示,运行环境是基于Python3.6的Pytorch1.10.2框架,使用的GPU为NVIDIA 3060。采用Adam为该实验优化器,将生成器的

学习率设置为0.001,判别器的学习率设置为0.000 1,batch_size为8,惩罚项参数λ为10,迭代2 500个epochs后停止训练。实验数据来源于自建数据集,为了保证图像的精度,使用工业相机得到高分辨率轮胎图像,将得到的高分辨率轮胎图像经过裁剪得到图像大小为64×64的轮胎缺陷样本,随后通过人工筛选得到轮胎缺陷训练集,训练集共计500张图像。

文献[20]指出,评价GAN生成图像效果并没有固定的指标,为了更加客观地体现生成图像的质量,采用FID(frechet inception distance)值作为本次实验评估生成图像质量的主要指标[21]。FID是计算真实图像与生成图像特征向量之间的距离,FID值越小,说明生成图像越接近于真实图像[22]。FID通过预训练的Inception v3网络提取真实图像和生成图像两者的特征,计算公式如式(9)所示:

式中:μr为真实图像特征的均值;μg为生成图像特征的均值;∑r为真实图像特征的方差;∑g为生成图像特征的方差。

2.2 消融实验设计

采用3种改进措施对原始DCGAN模型进行改进,分别是将残差结构和注意力机制嵌入到DCGAN模型中;使用带有梯度惩罚项Wasserstein距离代替原始DCGAN模型的损失函数。为了验证改进措施对模型的增益作用,设计试验来验证3种改进措施对模型的提升效果。首先,将DCGAN模型选取为基准模型;然后,在基准模型的基础上,分别加入残差网络(DCGAN Resnet)、注意力机制(DCGAN CBAM)和带有梯度惩罚项的Wasserstein距离(DCGAN Wasserstein);最后,将所提模型与DCGAN,DCGAN Resnet,DCGAN CBAM,DCGAN Wasserstein从主观效果和客观指标2个方面进行对比,验证3种改进措施对模型的提升效果。消融实验分别选取所生成图像FID的平均值和最小值作为评价指标。

2.3 对比实验设计

为了进一步验证改进模型相比现有主流模型的优越性,将改进模型与现有主流的DCGAN,WGAN,CGAN,SAGAN模型进行对比。WGAN将传统生成对抗网络损失函数替换为Wasserstein距离但并没有加入惩罚项系数;CGAN在生成器和判别器的输入中加入条件约束;SAGAN将自注意力机制加入到模型结构当中。对上述5种模型从主观效果和客观指标2个方面进行对比分析,验证改进模型相比于其他模型的優越性。对比实验分别选取所生成图像FID的平均值和最小值作为评价指标。

3 结果与分析

3.1 改进模型图像生成结果

图9为改进模型生成的轮胎缺陷图像展示。为了更加详细地展示不同迭代次数所生成图像的效果,在训练过程中每经过200次迭代抽取一张生成图像作为展示,训练过程如图10所示。由图10可知,改进模型在迭代到600次时能够生成缺陷,但此时生成的图像严重失真;当迭代进行到1 400次时,生成的图像得到很大改善,但背景网格化程度十分严重;当迭代到1 800次时,除图像边缘部分还有些许网格外,生成图像已经接近真实图像;当迭代到2 000~2 500次时,生成图像已十分接近真实图像。

3.2 消融实验结果与分析

图11从主观效果方面展示了消融实验5种模型所生成的图像。由图11可知,基于DCGAN,DCGAN Wasserstein,DCGAN Resnet,DCGAN CBAM的模型,生成的图像已经有了缺陷的大致轮廓,但是缺陷边缘模糊,容易与背景融合,虚假纹理较多,图像质量不高。DCGAN模型所生成的图像虽然有了缺陷但是无法将缺陷完整地生成出来。DCGAN Wasserstein生成的图像与原始DCGAN模型相比,背景网格化问题依然存在,但缺陷形状较清晰,模型框架稳定,在训练过程中未出现梯度爆炸等问题,验证了损失函数改进的有效性。DCGAN CBAM可以将缺陷形状大致生成,验证了注意力机制嵌入的有效性,但是背景虚化严重。DCGAN Resnet可以将缺陷和背景进行区分,且图像背景更加清晰,验证了残差网络结构的有效性,但是所生成的缺陷形状不明显且严重失真。采用改进模型生成的图像缺陷边缘更清楚,图像噪声点显著减少并且整体缺陷和背景有了明显区分,生成的图像更加真实。

為了更加客观地评估所提模型生成图像的效果,消融实验分别对5种模型进行2 500次迭代,实验过程中发现模型迭代1 800次前所生成图像样本过于自由,图像质量非常差,会对消融实验结果造成较大误差,因此,从1 800次迭代开始,每隔100次迭代计算当前迭代的FID值,迭代到2 500次停止。消融实验5种模型生成图像的FID值如表2所示。由表2可知,3种改进措施模型所生成图像的FID平均值和最小值均低于原始DCGAN模型,进一步验证了3种措施的有效性。本文模型所生成的图像FID平均值和最小值分别为116.28和84.94,远低于DCGAN模型所生成图像的168.56和125.77。综合主观效果和客观指标,所提模型的3种改进措施均有利于生成图像质量的提高。

3.3 对比实验结果与分析

图12从主观效果方面展示了对比实验5种模型所生成的图像。由图12可知,DCGAN生成的图像虽然生成了缺陷但是无法将缺陷完整地生成出来。WGAN只是对损失函数进行改进,在训练过程中没有出现梯度爆炸等问题,但生成的图像较DCGAN相比没有明显提升。CGAN所生成图像缺陷边缘模糊,背景网格化严重。加入自注意力机制的SAGAN可以生成较清晰的缺陷,但缺陷边缘模糊,背景存在较多噪声点。所提模型生成图像对比其他4种模型,缺陷形状更加清晰,缺陷与背景融合更加自然,背景网格化问题得到很大改善,且在训练过程中没有出现梯度爆炸等问题。

为了更加客观地评估改进模型生成图像的效果,对比实验分别对5种模型进行2 500次迭代,从1 800~2 500次迭代,每隔100次迭代计算当前迭代所生成图像的FID值。对比5种模型生成图像的FID值如表3所示。由表3可知,所提模型生成图像样本的FID平均值和最小值分别为116.28和84.94,均低于其他4种方法,说明改进模型生成的图像样本更符合原始图像的分布,质量更高,证明所提模型在图像生成方面优于现有主流的4种模型。

4 结 语

在DCGAN模型的基础上,提出从网络结构和损失函数2个方面对其进行改进,有效改善了传统对抗网络生成图像质量不高、收敛速度慢、训练不稳定等问题。在网络结构方面,将残差网络和注意力机制CBAM模块融合成一个“基本块”嵌入到DCGAN模型中,提升模型特征提取的能力。在损失函数方面,使用带有梯度惩罚项的Wasserstein距离代替原始DCGAN模型所使用的JS散度,提高模型的收敛速度和稳定性。使用FID值作为生成图像的评价指标,实验结果表明,该模型生成图像FID平均值为116.28,最小值为84.94,生成图像质量优于DCGAN,WGAN,CGAN与SAGAN。所提模型不仅能够生成高质量的轮胎缺陷图像,还可以为不同应用场景下扩充样本数据集提供理论参考与方法借鉴,例如路面缝隙缺陷样本、精密金属零件缺陷样本、印刷品、纺织物缺陷样本等。但是该模型在提高缺陷图像多样性方面不够理想,未来将以生成多种类型缺陷图像为目的继续展开研究。

参考文献/References:

罗伟柱.驾驶员应了解轮胎的“四个理”[J].汽车运用,2017,15(4):35.

LUO Weizhu.Drivers should understand the "four principles" of tires[J].Automotive Application,2017,15(4):35.

[2] 陈思羽.轮胎质量顽疾难改[J].汽车观察,2009(4):82 83.

[3] 罗东亮,蔡雨萱,杨子豪,等.工业缺陷检测深度学习方法综述[J].中国科学:信息科学,2022,52(6):1002 1039.

LUO Dongliang, CAI Yuxuan, YANG Zihao, et al. Review of deep learning methods for industrial defect detection [J]. Chinese Science: Information Science, 2022, 52(6): 1002 1039.

[4] WANG Ning,WANG Yuanyuan,ER M J.Review on deep learning techniques for marine object recognition:Architectures and algorithms[J].Control Engineering Practice,2022,118.DOI:10.1016/j.conengprac.2020.104458.

[5] YING Xue.An overview of overfitting and its solutions[J].Journal of Physics:Conference Series,2019,1168(2).DOI 10.1088/1742 6596/1168/2/022022.

[6] JIA Shijie,WANG Ping,JIA Peiyi,et al.Research on data augmentation for image classification based on convolution neural networks[C]//2017 Chinese Automation Congress (CAC),Jinan:IEEE,2017:4165 4170.

[7] SHORTEN C,KHOSHGOFTAAR T M.A survey on image data augmentation for deep learning[J].Journal of Big Data,2019,6(1). DOI:10.1186/s40537 019 0197 0.

[8] CHEN Tingkai,WANG Ning,WANG Rongfeng,et al.One stage CNN detector based benthonic organisms detection with limited training dataset[J].Neural Networks,2021,144:247 259.

[9] GOODFELLOW I J,POUGET ABADIE J,MIRZA M,et al.Generative adversarial nets[C]//Proceedings of the 27th International Conference on Neural Information Processing Systems.Montreal:MITPress,2014,2:2672 2680.

[10]MIRZA M,OSINDERO S.Conditional Generative Adversarial Nets[DB/OL].https://arxiv.org/abs/1411.1784,2014 11 06.

[11]RADFORD A,METZ L,CHINTALA S.Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks[DB/OL].https://arxiv.org/abs/1511.06434,2016 01 07.

[12]王万良,李卓蓉.生成式对抗网络研究进展[J].通信学报,2018,39(2):135 148.

WANG Wanliang,LI Zhuorong.Advances in generative adversarial network[J].Journal on Communications,2018,39(2):135 148.

[13]WOO S,PARK J,LEE J Y,et al.CBAM:Convolutional block attention module[C]//Computer Vision ECCV 2018,Cham:Springer,2018:3 19.

[14]王珂,张根耀.基于ResNet模型的甲状腺SPECT影像诊断[J].河北科技大学学报,2020,41(3):242 248.

WANG Ke,ZHANG Genyao.Diagnosis of thyroid SPECT image based on ResNet model[J].Journal of Hebei University of Science and Technology,2020,41(3):242 248.

[15]HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al.Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas:IEEE,2016:770 778.

[16]GLOROT X,BENGIO Y.Understanding the difficulty of training deep feedforward neural networks[C]//Proceedings of the 13th International Conference on Artificial Intelligence and Statistics (AISTATS) 2010.Sardinia:JMLR,2010:249 256.

[17]SRIVASTAVA N,HINTON G,KRIZHEVSKY A,et al.Dropout:Asimple way to prevent neural networks from overfitting[J].Journal of Machine Learning Research,2014,15(1):1929 1958.

[18]ARJOVSKY M,CHINTALA S,BOTTOU L.Wasserstein GAN[DB/OL].https://arxiv.org/abs/1701.07875,2017 12 06.

[19]李庆旭,王巧华,马美湖.基于生成对抗网络的禽蛋图像数据生成研究[J].农业机械学报,2021,52(2):236 245.

LI Qingxu,WANG Qiaohua,MA Meihu.Poultry egg image data generating based on generative adversarial network[J].Transactions of the Chinese Society for  Agricultural Machinery,2021,52(2):236 245.

[20]SHMELKOV K,SCHMID C,ALAHARI K.How good ismy GAN?[C]//Computer Vision ECCV 2018.Cham:Springer,2018,6:218 234.

[21]HEUSEL M,RAMSAUER H,UNTERTHINER T,et al.GANs trained by a two time scale update rule converge to a local nash equilibrium[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems.LongBeach:CurranAssociates Inc.,2017:6629 6640.

[22]陳雪云,黄小巧,谢丽.基于多尺度条件生成对抗网络血细胞图像分类检测方法[J].浙江大学学报(工学版),2021,55(9):1772 1781.

CHEN Xueyun,HUANG Xiaoqiao,XIE Li.Classification and detection method of blood cells images based on multi scale conditional generative adversarial network[J].Journal of Zhejiang University(Engineering Science),2021,55(9):1772 1781.

猜你喜欢

注意力机制
基于注意力机制的行人轨迹预测生成模型
基于注意力机制和BGRU网络的文本情感分析方法研究
多特征融合的中文实体关系抽取研究
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法