APP下载

基于改进GAN的端到端自动驾驶图像生成方法*

2021-11-12孙雄风陈志军罗

交通信息与安全 2021年5期
关键词:标签卷积损失

孙雄风 黄 珍▲ 陈志军罗 鹏

(1.武汉理工大学自动化学院 武汉430070;2.武汉理工大学智能交通系统研究中心 武汉430063)

0 引言

端到端自动驾驶系统利用神经网络直接将传感器获取的环境信息映射为控制输出[1],具有提升系统感知与决策效率的潜力,受到了学者们的广泛研究。通过构建端到端系统,Wang等[2]实现城市仿真场景下的车辆自动导航;Doorakia等[3]使得智能机器人能够自动探索未知区域;Shi等[4]实现了无地图条件下的机器人自动导航,证明了端到端系统的有效性。Lecun等[5]利用约10万张带转向标记的图像训练浅层卷积网络,使越野车具备自动避障能力。Chen等[6]利用12 h的模拟驾驶图像和速度数据训练深层CNN,实现多车道高速公路的无人驾驶。可见,端到端自动驾驶系统存在巨大的训练图像需求。针对此种需求产生的图像生成模型主要包括变分自动编码器模型(variational autoencorder,VAE)[7]和生成对抗网络(generative adversarial network,GAN)[8]。前者通过网络训练输出类似输入训练数据的特征。后者包含1个判断生成伪造图像和真实图像的判别器和另1个生成伪造图像的生成器,在理想情况下能够伪造真实图像。相比于VAE,GAN网络直接从真实样本和生成样本采样,生成样本分布在训练过程中不断逼近真实样本分布,而不是预先设定好隐空间数据分布,故GAN网络生成的样本更接近真实图像。

随着GAN模型飞速发展,其被广泛应用于图像处理过程,如缺失图像修复[9]与模糊图像增强[10]等。在使用GAN进行图像生成发展进程中,Radford等[11]提出深度卷积GAN模型(DCGAN),利用转置卷积层生成图像,并通过CNN作为判别器区分真实与生成图像,为先进GAN模型打下了结构基础。Mao等[12]提出最小二乘GAN模型(LSGAN),改进损失函数为最小二乘损失,缓解了GAN模型训练不稳定和生成图像质量差的问题。Arjovsky等[13]提出WGAN模型(Wasserstein GAN)指出传统GAN网络中存在梯度消失问题,使用Wasserstein方法衡量生成样本分布和真实样本分布之间的距离,并 在WGAN-GP网 络[14](wasserstein GAN with Gradient penalty)中使用梯度惩罚的方式改进WGAN中依赖的1-Lipschitz连续性条件,使得GAN网络训练更加稳定有效。Mirza等[15]提出CGAN模型(conditional GAN),首次在GAN模型训练过程中引入了条件约束,指引图像生成方向,打开了定向生成图像的思路。Chen等[16]提出InfoGAN模型(information maximizing GAN),利用信息论中的互信息作为训练损失正则化项,使得模型能够学习到样本中的特征表示,实现了按特征的图像生成过程。Odena等[17]提出ACGAN模型(auxiliary classifier GAN),在生成器输入中加入标签信息,并在判别器中进行标签重构,有效提升了图像生成质量。在交通领域应用方面,王力等[18]提出1种路网交通数据补充方法,以基于时空信息补偿的路网关联数据作为GAN网络输入进行训练,实现对路网中二维信息图缺失数据的补偿或重构。王凯[19]提出1种驾驶感知图像预测模型,在端到端系统中引入预测控制思想,以实时感知图像为GAN网络输入,生成预测感知图像,为端到端系统提供未来可能的感知图像,提升系统容错率。Chen等[20]提出1种平行运动控制方法,以真实场景图像为GAN网络输入,生成险情场景图像,运动控制器对真实场景和生成的险情场景产生2套平行控制方案,为紧急情况时的控制决策提供了有效手段。

作为1种生成图像的有效方法,传统GAN模型具有扩充图像数据集的潜力,但其仍存在一些缺点与不足:①图像生成过程不稳定,由于GAN模型中判别器和生成器之间存在对抗博弈关系,二者相互制约,生成器容易出现梯度消失问题,导致模型训练不收敛;②生成图像特征缺乏多样性,GAN模型在图像生成过程中会衡量生成图像像素与真实图像像素间的相似度,当生成图像局部像素值接近真实图像时,此部分图像便不再优化,导致生成图像局部区域几乎相同,缺乏多样性;③生成图像特征不清晰,GAN模型在生成器网络中使用全连接层进行图像生成,不利于处理图像特征。

为克服上述不足,将GAN模型更好的应用于扩充驾驶图像数据集,笔者提出改进网络模型LS-InfoGAN。在优化代价函数中引入最小二乘损失,并在生成器中使用互信息特征学习方法和转置卷积层,提升驾驶图像生成过程的稳定性、改善生成图像的特征多样性,进而提升数据集图像扩充质量。针对端到端自动驾驶系统存在的大量训练图像需求,将提出的模型应用于扩充端到端驾驶决策网络所需图像数据集,通过网络训练提升了决策网络预测正确率。最后,对比不同数量生成图像的扩充数据集在决策网络上的训练结果,给出了扩充数据集时合理的图像生成数量。

1 基于改进GAN模型的端到端自动驾驶图像生成方法

1.1 端到端自动驾驶系统

为了分析GAN模型生成的图像对端到端自动驾驶系统产生的影响,笔者构建了典型的基于端到端学习的自动驾驶控制系统,结构见图1,其包含训练和控制2个阶段。

图1 端到端自动驾驶系统结构图Fig.1 End-to-end,self-driving system

在训练阶段,人类驾驶员根据载具的位置状态执行适当的驾驶动作,产生的控制行为作为载具和决策网络的输入。场景获取系统也会将此时的场景信息输入决策网络。通过训练,决策网络便可从类似的场景输入还原控制行为。在控制阶段,决策网络通过训练拥有了映射能力,它将会替代驾驶引导者,自主通过场景信息判断应该执行的驾驶行为。本文将端到端驾驶过程看作图像分类任务,故决策网络为分类网络。

1.2 经典GAN模型

GAN模型作为无监督学习方法,其基本思想是在生成器G和判别器D间建立1种博弈模型。GAN训练过程分为2个步骤:步骤1是生成器G根据随机噪声z生成与真实图像最小相似的图像G(z);步骤2是最大化判别器D辨别真实样本的能力。在模型训练过程中,G与D交替运行,二者相互博弈,不断优化,最终达到纳什均衡,即G最终能够生成与真实样本分布一致的生成样本,且D无法分辨输入是真实图像还是生成样本。GAN模型中判别器和生成器的优化目标函数L可以定义为式(1)。

式中:x~pr为x从真实样本分布采样;x͂~pg为x͂从生成样本分布G(z)采样,x͂=G(z),且z~pz满足标准正态分布;E(*)为期望值。

1.3 GAN模型缺陷分析

GAN模型的最终目标是从真实图像中学习其像素分布特性,并通过代价函数计算拉近生成样本分布与真实样本分布间的距离,在优化代价函数的过程中提升生成图像真实性。Goodfellow等[8]指出,在式(1)的优化过程中,当固定生成器G单独训练判别器D时,判别器的最优解D*(x)可表示为式(2)。当判别器D取最优解时,生成器G的目标代价函数可表述为式(3)

式中:KL散度计算可表示为式(4),其用于表示p1和p2这2个样本空间的距离,p1(x)和p2(x)分别为2个空间中各个分布点。式(3)中2个对称的KL散度可记为1个JS散度。

当pr和pg样本空间不同时,讨论式(2)中KL散度在2种情况下的计算结果可知:当pr≠0且pg=0时,或当pr=0且pg≠0时,生成器G的目标代价函数中2个KL散度和为lg2,生成器损失恒为-lg2,此时生成器在优化过程中会出现梯度不存在的问题。这就导致传统GAN模型在判别器训练的越好的情况下,生成器越容易出现梯度消失情况,使得训练过程不稳定。由于GAN模型训练初期真实样本分布和生成样本分布差异较大,2个样本分布不存在重合部分或存在极少重合部分,此时更易发生此种情况,使得梯度消失,导致训练不稳定。

对于GAN模型生成图像缺乏多样性的问题可作如下分析。对真实样本和生成样本间的KL散度计算公式进行变形可得式(5)。

移项可得式(6)。

式(1)中生成器代价函数最小化过程可写作式(7)。

式(7)的最小化过程与式(8)等价。

那么,式(6)等号右边即为生成器的等价代价函数。生成器目标函数最小化过程等价于对式(6)等号右边进行最小化。除去式(6)等号右边的常数和与生成器无关项后,其优化过程可表述为式(8)。

最小化过程中,等式右边第一项需要最小化真实样本分布与生成样本分布间的KL散度,同时第二项需要最大化真实样本分布与生成样本分布间的JS散度,即前者最小化2个样本分布间的距离,后者最大化2个样本分布间的距离。二者的矛盾行为导致生成器在优化过程中优化方向不确定,优化困难。在判别器训练的越好的情况下,生成器越倾向于保守地生成与已有真实分布相同的样本分布,而不是继续拉近其它真实样本分布与生成样本分布间的距离,导致生成图像特征缺乏多样性。

综上分析可知,GAN模型训练过程中存在的训练不稳定和生成图像缺乏多样性问题本质上与训练过程中的损失计算问题息息相关。且与判别器训练过程中太过强势导致判别器和生成器的博弈关系不平衡相关。

1.4 改进的GAN模型

为改善GAN模型图像生成能力,并满足驾驶图像特征分类需求,本文针对GAN模型缺陷和对GAN模型进行3处改进。

1)针对GAN模型训练过程不稳定问题,使用最小二乘损失函数替换原对抗损失函数。其损失定义见式(10)~(11)。

式中:a和b分别为生成样本和真实样本的标签,c为生成样本期望判别器得出的标签,取a为-1,b为1,c为0[12]。当固定生成器G单独训练判别器D时,判别器的最优解DLS*(x)可表示为式(12)[12],此时生成器的损失函数可以表述为式(13)。

2)对于驾驶图像生成需求和生成图像特征缺乏多样性问题。Mirza等[15]率先发现,在训练过程中给定训练图像类别标签时,GAN模型的生成图像质量得到提升。受此启发,本文在将图像输入网络前,先对训练图像进行分类,并将分类信息作为标签值输入生成器网络,使得生成器学习图像特征与输入标签间的联系,让图像生成能按照给定标签的方向进行,满足生成图像特征分类需求。此外,为了让模型学习到更多的特征信息,使用Chen等[16]提出的最大互信息方法提升生成器的特征生成能力,通过最大化生成图像特征与真实图像特征间的信息熵提升生成器特征学习能力。为计算互信息熵,需要在原GAN模型基础上添加1个分类网络Q对生成图像进行特征分类。互信息熵可表示为式(14)。

式中:c′~pc为分类器Q得出的分类标签c′属于分类标签集pc;x͂~(pg,c)为x͂采样自生成器输入标签为c时的生成图像;Q(c′|x͂)为在已知生成器输入标签为c的情况下,分类网络Q将生成图像x͂判定为c′的输出概率;熵值LI(G,Q)为此时生成图像x͂与标签信息c′之间的关联性大小;考虑到标签信息源自图像特征分类结果,本文在优化过程中使用生成器标签c和分类器标签c′计算得到的分类损失来衡量这一关联性。分类损失计算采用交叉熵函数,计算方法见式(15)。

即计算生成器输入标签为c的情况下,分类器Q输出标签也为c的期望值负值。分类损失越小,关联性越大,故可将互信息熵的最大化过程,转化为分类损失的最小化过程。

3)针对GAN模型生成图像特征不清晰问题,使用DCGAN模型生成器中的使用转置卷积层代替原模型中的全连接层,通过特征还原的方式进行特征放大,将特征值恢复成图像,提升生成图像清晰度。转置卷积是1种上采样方法,操作步长大于1,能够从图像特征值还原特征矩阵,并对特征矩阵进行拼接,实现由特征值到特征矩阵的反向放大过程。另外,使用DCGAN中提出的3种训练技巧提升模型训练效果:①在网络训练过程中,使用批处理方式,使得判别器学习整体真实样本的共性特征,平衡真实样本空间;②在判别器和生成器的多数层中使用批次归一化层,加快网络的特征学习速度,但在生成器的最后一层和判别器的第一层不进行批次归一化,让模型学习样本分布正确的均值和范围;③在判别器中使用LeakyReLU激活函数,防止梯度稀疏。

综合上述改进方法,笔者提出改进的GAN模型LS-InfoGAN,并对模型有效性和图像生成效果进行研究。

2 LS-InfoGAN模型结构

2.1 LS-InfoGAN流程框架

LS-InfoGAN图像生成模型流程框架见图2,包含判别器网络D、生成器网络G和分类器网络Q这3个部分。模型的生成器中使用转置卷积网络结构。使用最小二乘损失函数计算判别器D和生成器的G的对抗损失。分类器网络Q的分类损失使用交叉熵损失函数计算。模型训练过程中,首先通过给定标签c在生成器G中以随机噪声z进行图像生成,然后在判别器D中对生成图像G(z)和真实图像x进行真假判断像素内容差异,并使用最小二乘损失函数计算对抗损失,学习图像像素内容,最后在判别器Q中对生成图像进行分类,得出分类标签c′,计算类别特征损失,学习图像特征表示信息。

图2 LS-InfoGAN流程框架图Fig.2 Process of the LS-InfoGAN model

优化过程中,对抗损失大小为判别器D损失和生成器G损失之和,损失值大小表示生成样本图像与真实图像的像素内容差异。分类损失计算方式使用交叉熵计算方法,学习样本分布中的特征表示信息。故LS-InfoGAN模型的优化目标可表示为式(16)。

即在图像生成训练过程,最大化判别器判别能力的同时,最小化对抗损失和分类损失,使得生成图像在像素内容和特征信息上更接近真实图像。

2.2 LS-InfoGAN网络结构

LS-InfoGAN模型生成器和判别器具体的网络结构见图3,图中矩形方块代表了不同类型的网络层,各层上方数字从左至右依次代表卷积核大小、输出通道维数和卷积步长。标识Deconv,Conv,BN和FC的方块分别代表转置卷积层,卷积层,批次归一化层和全连接层。生成器网络中共包含4个转置卷积层,卷积核大小均为4,通道数分别为8,16,32,64,步长为2。判别器网络中共包含4个卷积层,卷积核大小均为4,输出通道维数分别为64,128,256,512,步长为2,LRELU层的α=0.2。除最后部分的卷积或转置卷积层外,每个卷积或转置卷积层与LRELU/RELU之间使用了批次归一化层。在生成器网络末尾使用sigmoid激活函数生成长宽为64×64像素的RGB图像。判别器网络最后使用1个全连接层(FC)给出对输入图像的真假判别结果。分类器网络以判别器网络输出的特征向量为输入,经过2个全连接层输出分类标签。2个全连接层通道数分别为128和3。

图3 LS-InfoGAN网络模型图Fig.3 Structure of the LS-InfoGAN model

3 仿真实验与结果分析

3.1 仿真实验设计

仿真实验主要包括3个部分:①仿真环境搭建;②驾驶数据集获取;③网络训练和测试评估。模拟驾驶环境在Gazebo平台中搭建,并人工完成数据采集工作以形成数据集。①和③的实验流程见图4。先通过人工驾驶采集场景图像。随后进行随机划分,将80%采集图像用于GAN模型训练,形成混合数据集。接着以混合数据集作为决策网络的输入进行训练,并以剩余的20%采集图像用作决策网络测试评估数据集扩充效果。

图4 实验流程图Fig.4 Process of the experiment

3.1.1 仿真环境与驾驶数据集获取

仿真实验场景为在Gazebo平台上建立的模拟驾驶环境。实验中使用的模拟驾驶环境见图5。图中左侧为驾驶场景,白色边线为模拟车道。右侧为机器人车辆对应采集的图像示例。2种场景均用于驾驶数据集获取。

图5 模拟驾驶场景图Fig.5 Driving scenarios of the simulation

网络模型训练过程中使用的数据集为带控制标签的场景图像。训练图像是在人类驾驶员通过键盘控制机器人小车的过程中完成的,采集图像主要携带3种控制信息,包括left(左转)、up(直行)和right(右转),采集图像为RGB模式。为避免过多冗余的图像,采图频率设置为3张/s,大小为64×64。实验过程中按照上述方法在2种驾驶场景中共采集了10 457张带标签的驾驶图像,并形成驾驶数据集。实验过程中的数据集具体组成见表1。

表1 训练集和测试集组成Tab.1 Configuration of the training and testing dataset

3.1.2 网络训练设置

使用获取的驾驶数据集对本文提出的模型进行了图像生成训练。实验过程中使用的各类GAN模型的判别器和生成器结构均与2.2中所述网络结构保持一致。网络模型参数设置上,LeakyReLU斜率参数设置为0.2,网络学习速率统一设置为0.000 2,批处理大小为128,优化器均选用Adam,并设置1阶矩估计的指数衰减率为0.5。判别器与生成器学习率同步。

考虑到自动驾驶系统需要应用到移动平台,在评估模型驾驶数据集扩充应用效果时加入了更适合移动平台的Mobilenet作为决策网络,并选用体量较小的MobilenetV3-small模型[21]。其通过SE-net学习图像不同通道特征的重要程度,并结合深度可分离卷积和具有线性瓶颈的逆残差结构进一步提升网络性能,减少计算消耗。参数设置上参考MobilenetV3-small原模型设置方法。

3.2 仿真实验结果与分析

仿真结果分2个方面来展示:①LS-InfoGAN模型在网络训练和图像生成上的表现;②LS-InfoGAN模型数据集扩充应用效果评估,即分析训练得到的MobilenetV3-small模型的预测性能指标。

3.2.1 GAN模型训练与图像生成结果

实验中使用的GAN模型均按照2.1.3所述配置训练了100个回合,各种GAN模型训练时的图像生成结果见图6。图中从左至右依次代表标签为左转、直行和右转的图像,图6(a)~(e)依次为原始图像、CGAN、ACGAN、InfoGAN以及LS-InfoGAN模型生成图像。

图6 生成图像结果图Fig.6 Generated results

对比生成结果,CGAN模型生成图像存在少量噪点,部分区域像素缺乏纹理,且标签为左转和右转的图像背景部分存在不合理像素区域,同时标签为右转的图像车道右侧部分明显缺失,图像车道线特征不明显。ACGAN模型生成图像背景部分较为模糊,存在较多不合理像素区域,且标签为右转和直行的图像车道线生成较为模糊。InfoGAN模型生成图像背景模糊,存在不合理像素区域,但车道线生成较为清晰。LS-InfoGAN模型生成图像背景细节缺乏纹理,图像存在少量噪点,但背景部分不合理像素较少,车道线生成较为清晰,方向特征明显,图像相对更合理。

由于GAN模型在训练过程容易出现生成图像缺乏多样性的出错情况,故需要对模型训练稳定性进行评估。以上4种GAN模型在保持之前的训练参数不变的条件下多次训练后的统计结果见表2。表2中可以观测到,LS-InfoGAN模型成功率最高,达到86.67%;ACGAN模型次之,为63.33%;InfoGAN和CGAN模型表现较差。

表2 图像生成训练结果Tab.2 Results of image-production training

此外,实验过程中监测了图6图像生成过程中对应的生成器与判别器损失变化,绘制曲线见图7。由于GAN模型在网络训练初期存在较大波动,故此处仅展示其在中后期的损失变化。对比图中结果,CGAN、ACGAN和InfoGAN模型的判别器损失趋于0达到收敛状态,但存在较大振幅的波动现象。3种模型的生成器损失均未趋于0达到收敛状态,并且同样存在较大振幅的波动现象。相反,LS-InfoGAN模型的判别器和生成器损失波动振幅较小,二者均趋于0达到收敛状态,故LS-InfoGAN模型在图像生成过程中较另外3种模型更稳定。

图7 多种GAN模型损失变化曲线图Fig.7 Loss curves of GAN models

综合上述实验结果,在相同的训练过程中,LS-InfoGAN模型图像生成过程最稳定,且在多次训练过程中成功率表现最优,验证了改进的有效性。

3.2.2 模型扩充数据集结果

模型在数据集扩充上的应用效果以决策网络模型在原始图像测试集(即随机划分所得到的原始采集图像的20%)上的查准率以及召回率进行评估。查准率计算模型为某一类图像预测正确结果数目与测试集总数的比值。召回率计算模型预测为某一类图像中正确的数目与预测为这一类的总数的比值。某个类别的查准率和召回率越大,表示模型对这一类图像的预测正确率越高。

使用4种GAN模型扩充得到的混合数据集以及原始人工驾驶数据集训练得到的网络模型在测试集上的评估结果见表3,评估过程中3个方向驾驶图像的生成数量均为2 900,生成图像总数为8 700,与原始图像训练集图像数量相近,查准率和召回率括号内的标准差均为5次训练之后的结果。表3中加粗部分为图像分类结果中各个类别上查准率或召回率的最大值。

表3 分类评估结果Tab.3 Assessment results of classifications

相比原始数据集训练得到的分类决策网络模型,使用CGAN模型扩充后的数据集进行训练减弱了决策网络的预测性能,综合查准率衰减了0.5%,召回率衰减了0.4%。使用ACGAN模型扩充后的数据集进行训练对于决策网络的预测性能有较少提升,且在直行方向上正确率提升最大,综合查准率提升0.2%,召回率提升0.5%。使用InfoGAN模型扩充后的数据集进行训练对于决策网络的预测性能提升较明显,综合查准率提升1.1%,召回率提升1.7%。混合LS-InfoGAN模型生成图像的数据集对决策网络的准确率提升最明显,其在除左转和直行查准率外的其他6个指标上取得最佳结果,综合查准率提升1.5%,召回率提升1.9%。这表明LS-InfoGAN模型生成图像更合理,对决策网络预测性能提升最佳。

由于实际的图像生成数量往往不是确定的,故需要评估生成图像数量对上述结果产生的影响。使用LS-InfoGAN模型按比例生成不同数量图像的分类评估结果见表4。对比结果表明,当生成图像数量是原始图像训练集的2倍时,分类决策网络模型取得了最好的性能提升效果,且使用LS-InfoGAN模型生成图像的数量并不是越多越好,但从分类结果的方差变化可以看出,多生成图像能增强测试结果的稳定性,但过多的生成图像可能适得其反。

表4 不同数量生成图像对比评估结果Tab.4 Assessment results of classifications with different numbers of generating images

3.3 讨论

基于改进GAN模型的驾驶图像生成方法为驾驶图像数据集的扩充提供了有效手段。传统GAN模型能根据图像数据集进行无监督学习自动生成图像,但其存在训练不稳定,生成图像缺乏多样性的缺陷,且无法根据需求定向生成图像。本文提出的改进模型较好地克服了此种缺陷,并可根据期望方向生成不同类别的驾驶图像,扩充的驾驶图像数据集质量较高。

LS-InfoGAN模型在训练过程中具有较好的稳定性,且扩充图像真实度高:①从3.2.1实验中的损失变化曲线看出,模型无论在训练初期还是中后期,损失变化都趋于收敛,且波动区间小,使得图像生成过程保持稳定;②从3.2.2实验看出,当使用模型扩充驾驶图像数据集时,相比使用原数据集进行训练,使用扩充的数据集进行决策网络训练能够提升决策网络的预测性能,表明扩充图像真实度高,能够提升决策网络的学习理解能力。

LS-InfoGAN模型本身是1种图像生成方法,模型在使用最小二乘对抗损失克服传统GAN模型训练过程中梯度消失问题的同时,采用最大化互信息熵的方式提升生成器特征生成能力,并通过转置卷积层将特征还原为图像,提升生成图像特征清晰度。实验过程中从仿真环境采集的驾驶图像虽然与真实图像相比差异较大。但无论对于真实驾驶图像还是仿真图像,模型所学习的内容都是图像中的像素分布信息和特征信息,所以实验结果从一定程度上证明了改进模型生成图像的有效性。

4 结束语

针对端到端自动驾驶系统存在的图像需求问题,提出1种改进网络模型LS-InfoGAN,改善图像生成过程,提升模型的稳定性。并将其应用于扩充驾驶图像数据集。

相较于CGAN、ACGAN和InfoGAN模型,本文方法生成图像的背景区域不合理像素较少,车道线特征明显,模型训练过程中损失变化趋于收敛,振幅较小,且在多次图像生成训练过程中的训练成功率最高,所以本文方法生成图像更稳定。此外,应用LS-InfoGAN模型扩充的数据集进行决策网络训练能在不采集新图像的情况下将端到端系统综合决策性能提升1%~2%。因此,本文模型能够达到稳定生成驾驶图像的目标,且应用此模型扩充驾驶数据集能在一定程度上提升端到端决策网络的预测性能。为达到最佳性能提升效果,建议将生成图像数量设置为原始训练集图像数量的1~2倍。

针对本文方法生成图像缺乏背景细节纹理和存在噪点的问题,进一步工作将针对该问题提出更优的解决方案,提升图像细腻程度。

猜你喜欢

标签卷积损失
基于3D-Winograd的快速卷积算法设计及FPGA实现
胖胖损失了多少元
从滤波器理解卷积
玉米抽穗前倒伏怎么办?怎么减少损失?
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
基于傅里叶域卷积表示的目标跟踪算法
标签化伤害了谁
一般自由碰撞的最大动能损失
科学家的标签