APP下载

迁移学习方法在医学图像领域的应用综述

2021-12-21徐巧枝

计算机工程与应用 2021年24期
关键词:源域医学特征

高 爽,徐巧枝

内蒙古师范大学 计算机科学技术学院,呼和浩特010022

近年,许多研究将深度学习技术应用于医学图像处理领域,以实现器官和病灶的自动分割、分类,取得了较好的效果。深度学习技术的有效性很大程度上依赖于大量训练数据,然而目前医学图像数据相比自然图像,在数量上比较有限,标注难度也较大,因此,基于深度学习技术的医学图像分析算法的精确度和准确性仍有待提高。为了解决医学图像数据缺乏而导致的训练集不足的问题,很多研究引入了迁移学习方法,利用自然图像数据集或其他医学图像数据集,对网络进行预训练,然后将学习到的知识迁移到目标任务,进而提高网络模型的性能。

本文调研了近几年医学图像领域中典型的迁移学习框架,并对这些框架进行了分析和总结,以帮助相关研究者对该研究领域的理解。

1 迁移学习

1.1 迁移学习的概念及其分类

迁移学习(Transfer Learning,TL)是一项允许对现有模型算法进行微调,以应用于新领域或新功能的技术[1]。在迁移学习中,研究人员通常将数据分为源数据和目标数据。源数据指与要解决的任务并不直接相关的其他数据,通常具有较大的数据集。目标数据是与任务直接相关的数据,数据量一般较小。迁移学习的目的是在获取某些附加数据或现有模型的前提下,将通用知识用于新的相关任务,以充分利用源数据来帮助模型提高其在目标数据上的性能,如图1所示。

图1 迁移学习的学习过程Fig.1 Learning process of transfer learning

根据源域与目标域之间的关系,迁移学习方法可分为三类[2]:基于实例的迁移、基于模型参数的迁移和基于特征的迁移,如图2所示。其中,基于实例的迁移学习是相对较简单的迁移学习方法,该方法从源域中挑选出对目标域训练有用的实例,将其作为训练集的补充,以扩大目标域的训练集,从而提升迁移效果[3];基于模型参数的迁移方法的主要思想是使源域和目标域共享模型参数[4],即在源域中通过大量源域数据对神经网络模型预训练,然后将预训练模型直接应用到目标任务上,在此过程中,可以选择重用全部或部分模型参数;基于特征的迁移方法分为特征提取迁移和特征映射迁移。基于特征提取的迁移方法会对源域中经过预训练的局部网络进行重用,将其转变为目标域深度网络的一部分;基于特征映射的迁移方法将实例从源域和目标域映射到新的数据空间[5],在新的数据空间中,来自两个域的实例具有相似的数据分布,适合用于联合深度神经网络,优点是通过调整数据分布,可以增加训练集,从而提升迁移效果。

图2 迁移学习方法分类Fig.2 Classification of transfer learning methods

1.2 一般迁移策略及常用模型

迁移学习改变了传统训练神经网络模型的固有模式,增加了使用其他域进行预训练的步骤,为网络模型的通用性提供了可能,同时降低计算资源损耗、减少内存占用,缩短训练时间。在医学图像处理领域,比较常见的迁移学习方法是利用大型非医学数据集(如ImageNet)对模型进行预训练,然后对该模型的卷积层进行微调或冻结(即参数不变),最后使用少量医学数据重新训练全连接层,如图3所示,其中微调的卷积层、模型的选用、微调的次数、顺序以及预训练数据集的选用都会影响到迁移的效果[6]。

图3 医学图像领域的主流迁移框架Fig.3 Mainstream migration framework in medical image field

由于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)具有出色的特征提取能力[7],许多医学图像研究将其作为预训练模型,其中AlexNet[8]、VGGNet[9]、GoogleNet[10]、ResNet[11]、DenseNet[12]和MobileNet[13]等是经常被用到的预训练网络模型,表1对它们的优缺点进行了总结。

表1 常用神经网络模型的优缺点Table 1 Advantages and disadvantages of common neural network model

2 基于迁移学习的医学图像分析研究

由于医学图像的特殊性,基于迁移学习的医学图像分析成为研究热点,下文将按照迁移学习方法的分类对这些研究进行介绍。

2.1 基于模型参数的迁移模型

该方法要求源域和目标域的特征空间具有相似性,具体方法是,先使用源域的大量数据对模型预训练,然后将得到的权重参数进行迁移,最后使用少量目标数据重新训练全连接层。该方法思想简单,却能大幅度提升模型性能,是医学图像领域早期使用的迁移方法。

Abbas等[14]提出的基于类分解的神经网络模型DeTraC,解决了跨域迁移时数据分布不一致所产生的负迁移现象,如图4所示,其中图4(a)是使用ImageNet预先训练好的卷积神经网络(Convolutional NeuralNetwork,CNN)模型和主成分分析(黑色箭头)进行特征提取,图4(b)是具有权重变换的类分解过程,图4(c)是使用类组成进行误差校正,微调ImageNet预先训练好的CNN模型用于输出预测。实验结果证明了该方法的有效性。

图4 DeTraC模型Fig.4 DeTraC model

Maghdid等[15]基于自然图像预训练的CNN模型进行COVID-19检测任务,迁移后的检测准确性达到98%,但是该模型提出于新冠肺炎出现之初,由于缺乏患者CT图像,导致无法进行对比实验。Gao等[16]将基于自然图像预训练得到的不同ResNet模型迁移到乳腺癌诊断任务,实验结果表明,多模型迁移的效果优于单一模型,并且在保证性能的同时,大幅缩短训练时间。Dawud等[17]使用与目标数据相似的脑血管图像在AlexNet上进行预训练,再利用SVM分类器进行微调训练,实验结果表明,在脑出血识别任务中,准确性达到93%,优于从自然图像的迁移方法,说明源数据与目标数据越相似,迁移效果越好。Yang等[18]提出一种多源迁移方法,使用乳腺图像、心脏图像作为源数据在CNN模型中预训练,最终将其用于阿兹海默诊断任务,实验结果表明,经过迁移的CNN模型收敛更快,训练时间更短,并且提高了诊断精度。Wahab等[19]使用自然图像对ResNet进行预训练,然后将其用于细胞有丝分裂的检测任务,实验结果表明,基于迁移学习的训练方法提供了良好的初始权重,减少了训练时间。Liu等[20]提出一种集成网络结构,使用三个自然图像预训练得到的VGG模型作为特征提取器,然后进行多尺度特征拼接,实验结果表明,集成模型的精度远超单模型,缺点是增加了计算成本。Patrini等[21]使用ImageNet在六个不同的CNN模型上进行预训练,将提取出来的特征进行加权融合,实验结果表明,该方法提取的特征更适用于自然图像迁移到医学图像。

表2 对医学图像中基于模型参数的迁移研究进行了总结。可以看出,大部分研究使用了ImageNet数据集进行预训练,从而使网络学习到图像的通用基本特征。但是ImageNet数据集中不包含人体骨骼、内脏等结构,源域与目标域相差较大,导致迁移性能仍有待提高。对于迁移学习来说,源域与目标域越相似,迁移效果越好,所以使用医学图像进行预训练可以使迁移性能更高。为了提升模型性能,表2中大部分研究使用数据增强技术来增加医学图像样本数,但是传统的数据增强方法可能会造成知识的负迁移,所以未来应积极探索更有效的数据增强方法,例如,利用生成对抗网络(Generative Adversarial Networks,GAN)技术生成仿真的医学图像。

表2 基于模型参数的迁移特征Table 2 Transfer learning based on model parameters

2.2 基于特征提取的迁移模型

基于特征提取的迁移学习方法通常将CNN模型作为特征提取器,然后使用少量医学数据对网络进行微调,基于不同的微调策略训练出来的CNN模型性能也不同,所以微调策略是该类方法被关注的重点。

Khan等[22]使用自然图像和部分医学图像作为源数据进行CNN模型预训练,并将三种常用的预训练模型用于乳腺癌细胞分类任务,迁移后性能最优的CNN模型分类准确性可达到94.5%,如图5所示,其实验也表明,不同CNN模型应用相同的迁移策略,虽然都有性能的提升,但对目标任务的准确性仍有不同。

图5 深度模型架构Fig.5 Block diagram of deep learning framework

Huang等[23]提出一种基于深度迁移CNN和极限学习机的肺结节诊断方法,首先采用最佳深度迁移CNN提取肺结节的高级特征,该模型已事先通过ImageNet数据集进行预训练,然后使用极限学习机分类器对良性和恶性肺结节进行分类,实验结果表明迁移后的模型所提取到的特征可以提升模型精度,分类器的训练对于迁移的效果也有一定影响。黄鸿等[24]提出一种结合部分注释数据的自监督学习算法,用于3D肺结节的分类任务。该方法在传统自监督训练的网络上,利用医学图像处理任务中大量未注释数据和少量注释数据作为训练集,由于目标域和源域高度相似,从而大大提高了迁移效果,有效解决了医学图像数据集缺乏的问题。Misra等[25]使用自然图像预训练的ResNet作为骨干网络,然后使用与目标数据相近的肺部X射线图进行微调,实验结果表明该实验的微调策略,相比无迁移的方法,分类准确度提高了3%。Jin等[26]通过随机初始化权重来替换预训练CNN的全连接层进行迁移学习,源任务是面部识别和验证,目标任务是面部诊断,两项任务的相似性为解决具有少量数据集的面部诊断问题提供了迁移的可能,使准确性达到95%。但是目前面部诊断技术还不成熟,影响因素较多且只能针对特殊疾病。

从自然图像到医学图像的迁移已被确立为医学图像分析中最实用的方法之一。但是,为了适应2D的自然图像模型,3D的医学图像必须转化为2D切片,导致丢失了丰富的3D解剖信息,并损害了模型性能。为克服此限制,Chen等[27]设计了一个异构3D网络,如图6所示,将人体8个不同部位的医学图像作为源数据进行预训练,然后进行肝脏分割和肺结节分类任务,该方法属于跨域的迁移学习,通过设计多分支解码器解决类不平衡问题,实验结果表明该迁移方法性能明显优于以前的模型。

图6 异构3D网络框架Fig.6 Heterogeneous 3D network framework

Zhou等[28]建立了一组称为“Models Genesis”的自监督模型。为了利用医学图像的空间信息,该方法使用3D-Unet作为网络架构的骨干网络,在预训练阶段,作者使用多域源数据,例如ImageNet、X射线图像、MRI等,这使预训练网络模型学习到更多图像特征,从而加强迁移学习的效果。实验证明,虽然“Models Genesis”模型性能领先于2D方法,但在3D数据中从头开始学习的模型不一定比从2D数据中或从ImageNet迁移学习获得更好的性能。Huang等[29]探索超声图像分割的跨组织/器官迁移学习方法,将超声图像分割的知识从肌腱图像迁移到乳腺肿瘤图像,将U-net架构与残差块结合,以充分利用两个组件的优势,实验结果显示,残差结构能够避免过拟合问题,经过修改的U-net能够使迁移效果更明显,但是3D网络架构占用过多计算资源,训练时间过长。

表3 对医学图像中基于特征提取的迁移方法进行了总结分析,从表中可以看出,大部分研究也使用ImageNet数据集进行预训练,不同之处是,预训练好的网络还要使用与目标数据相似或者目标数据的一部分进行微调,使网络更加适合处理目标任务,可在一定程度上降低自然图像与医学图像的差异。但是该类方法目前主要用于2D数据,迁移到3D医学图像时,会浪费3D图像的空间信息。虽然上述研究在各类评价指标下显示了较好的实验效果,但不同的微调策略会影响模型的性能,目前提出的微调策略主要是多尺度特征迁移,通过微调不同的网络层来学习目标数据的特征。但是对于不同迁移框架、不同网络层中学习到的知识并不是都值得迁移的,为更好地了解CNN决策机制,找出更值得迁移的网络层,未来可以探索可靠的可视化技术,提升迁移学习框架的性能。

表3 基于特征提取的迁移方法特征Table 3 Transfer learning based on feature extraction

2.3 基于特征映射的迁移

基于特征映射的迁移方法的主要思想是:两个域之间存在差异,但经过设计映射到新的数据空间后,可能更加相似。该方法通过调整源域数据的边际分布或条件分布后进行特征映射,以扩大训练集的规模,增强迁移学习的效果[30]。

相比基于特征提取的迁移方法,基于特征映射的迁移学习更加复杂。首先,要找到源域和目标域之间共同的特征表示,再将数据从原始特征空间映射到新的特征空间中。在新的特征空间中,源域与目标域的数据分布相同,可以更好利用已有的经过标注的数据样本进行模型训练,例如Indraswari等[31]提出了用于3D医学图像分割的多投影网络,可以通过应用2D内核进行资源存储,同时通过合并来自3D图像不同平面投影的切片获取空间特征,从而获得良好的分割结果,网络架构如图7所示,研究表明,拟议的网络使用加权成本函数可以解决不平衡数据集问题,提高2D图像迁移到3D图像的效果。

图7 多投影网络架构Fig.7 Architecture of multi-projection network

Du等[32]提出一种从DICOM数据中提取标签的迁移方法,该标签提供有关扫描外观的信息,用以训练医学图像领域3D卷积神经网络,该研究从大量的癌症成像数据集中提取了标签,实验证明,该方法可以有效提高迁移学习的效果。Zhou等[33]提出了一种无监督的预训练方法C2L,使用的源数据是无标记的X射线图像,该方法通过比较不同的图像特征迁移有用的知识。实验结果表明,C2L方法明显胜过ImageNet预训练的迁移方法。Li等[34]提出对齐数据分布的迁移学习方法,用以减少不同数据集之间的差异,并提高训练样本不足的数据集的分类准确性,实验结果显示,与仅基于原始小数据集的模型相比,准确性提高了约20%。Virk等[35]为解决网络模型参数量过大问题,提出了一种半监督的轻量级网络结构,预训练使用的源数据是多个身体部位的CT图像,迁移到身体部位分类任务,研究结果证明了较小的网络结构以学习更多有意义的特征并避免过度参数化。Manzo等[36]使用ImageNet预训练多种CNN模型,用作特征提取器,该框架在平行空间上训练各个分类器,并通过统计量度将提供的预测进行组合。实验证明,该方法可以综合各种CNN提取的特征,并给出组合权重,提升迁移学习的效果。

表4 对基于特征映射的迁移方法进行了总结分析,可以看出,大多数研究是针对跨领域的迁移,采取在源数据与目标数据之间引入一种度量来减少域差异的策略,并且取得了不错的成果。该类方法面临的主要问题是如何减少领域之间的差异,所以探索有效的领域特征对齐方法仍是未来研究的重点。

表4 基于特征映射的迁移特征Table 4 Transfer learning based on feature mapping

2.4 三种迁移方法的比较

表5 对上述三种迁移学习方法,从迁移策略、适用场景、优势以及局限性等方面进行了比较,可以看出,每种迁移学习方法都能在一定程度上缓解医学图像数据缺乏的问题。但是由于迁移策略和适用场景的不同,每种迁移学习方法也有各自的局限性。基于模型参数的迁移是初期使用的一种方法,这种方法局限性较大,需要源域和目标域较为相似,对于医学图像处理领域较为困难。目前主流的迁移方法是基于特征提取的迁移,不同研究通过制定不同的微调策略来减少该方法的局限性,微调策略的优化是该类方法的下一步目标。基于特征映射的迁移近年来是研究的热点,该方法理论上可以解决源域和目标域数据分布不一致问题,从而彻底解决医学数据缺乏的问题,但是目前研究还不够完善,未来跨领域特征对齐是该方法的研究重点。

表5 三种迁移学习方法总结Table 5 Summary of three transfer learning methods

3 迁移学习与其他新技术的结合

上述迁移学习策略及模型在一定程度上提升了深度神经网络对医学图像分析的性能,但仍有改善空间。近期,一些研究尝试将迁移学习与生成对抗网络、注意力机制、自监督学习等新技术结合,用于医学图像分析,取得了良好的效果,网络性能也得到进一步提升和改善。

3.1 迁移学习结合生成对抗网络

增加训练样本是提升神经网络性能的重要途径之一,GAN是近年应用比较广泛的一种数据增强方法,该方法能够生成与真实样本相似的虚假样本,从而可以扩充训练样本,达到提升模型性能的效果。

Liao等[37]提出了一种基于对抗训练的多模态迁移学习网络,如图8所示。该网络首先通过生成器网络重构MRI图像,然后利用鉴别器网络对重构的MRI图像进行优化,最后将网络从MRI图像(源域)迁移到CT图像(目标域),提高了CT图像病灶分割的精确性,验证了迁移学习与GAN结合的有效性。

图8 基于对抗训练的多模态迁移学习网络Fig.8 Multimodal transfer learning network based on confrontation training

肖儿良等[38]基于迁移学习,对WGAN-GP模型[39]进行了改进,提出Transfer-WGAN-GP,用于CT图像与MRI-T2图像融合。该网络首先利用生成器与鉴别器得到一个初始化参数的网络,然后微调网络参数,将其迁移到CT与MRI-T2图像的融合网络中继续训练,最终得到包含两种源图像语义信息的融合图像。

虽然GAN可以生成逼真的自然图像,但应用于医学图像领域仍存在很多问题,例如生成的样本质量有待提升、梯度消失、训练不稳定、模式崩溃等[40]。另外,现有比较典型的GAN都是2D网络架构,不能解决3D医学图像样本缺乏的问题,所以,利用GAN技术扩充医学图像样本仍是一个值得继续研究的领域。

3.2 迁移学习结合注意力机制

注意力机制自提出就一直是计算机视觉领域的热点。对于医学图像领域,注意力机制可以自动聚焦图像中对疾病诊断重要的关键部分,从而提升模型性能。

Cha等[41]提出一种基于注意力机制的迁移学习框架,如图9所示,该网络从三个预训练模型中收集特征,然后将注意力机制作为特征选择器,使实验结果的准确率达到96.63%,相比基线,准确性提升了1.28%。

图9 基于注意力的迁移学习框架Fig.9 Transfer learning framework based on attention

Tan等[42]提出一种基于注意力和迁移学习的脑电信号分类的新方法,通过考虑不同大脑功能区的重要性,提高了脑电图分类的准确性。该方法将ImageNet作为源域,将脑电图作为目标域,应用基于注意力的迁移学习框架,不仅获得了脑电图标签,还获得了一个额外的注意力图来反映人脑的活动。Guy-fernand等[43]利用预先训练的注意机制完成脑肿瘤分类的任务,然后在特定的受限数据集上使用迁移学习寻找脑肿瘤的相关区域,也获得了比以往研究更高的分类精度。

上述研究表明,注意力机制可以一定程度上提升模型的准确性,但是也会占用过多计算资源。近年来各种轻量级注意力机制被提出,例如Wang等[44]提出的ECA-Net,Zhang等[45]提出的SA-Net。但是注意力机制轻量化会损失一定模型精度,所以如何在保证精度的前提下,将轻量化注意力机制与迁移学习方法更有效地结合,是需要研究的问题。

3.3 迁移学习结合自监督学习

医学图像的标注是医学图像分析面临的另一个难题,为了解决这一问题,一些研究将迁移学习与自监督学习结合,首先通过设计前置任务,使用其他数据的信息来预测目标数据的信息,挖掘出大规模数据的潜在规律,进而学习有助于提升目标任务性能的特征;然后通过“预训练+微调”等方式,将学习到的通用特征应用到目标任务。

Zhuang等[46]提出的前置任务将3D医学图像集进行切割,然后对这些样本随机打乱,再对打乱的样本进行排序和定向恢复,实验表明,通过这种方法,神经网络可以学习更多的空间特征,但是对3D医学图像,预训练的权重只适用于全卷积网络(Fully Convolutional Network,FCN)的编码器部分,解码器部分仍需随机初始化,这可能会破坏预训练的成果并抵消预训练提升的模型性能。Zhu等[47]提出了名为“Rubik’s cube+”的前置任务,对Zhuang等提出的方法进行了改进,解决了目标任务为图像分割时随机初始化解码器的问题,实验表明,该方法预训练的CNN模型针对医学图像分割的迁移具有良好性能。Tao等[48]随后提出“Rubik’s cube++”,使用自然视频数据进行CNN模型预训练,并将其迁移到3D医学图像分割任务,进一步提升了分割精度,缺点是占用计算资源过多,训练时间过长,其架构如图10所示。

图10 Rubik’s cube++架构Fig.10 Architecture of Rubik’s cube++

医学图像分析对模型的精确度有较高要求,自监督学习的精确度目前还不能达到监督训练的水平,因此一些研究将半监督与迁移学习结合,半监督技术通常使用少量已标注样本进行训练,然后使用该模型预测未标记样本得到伪标签,再加入训练集,从而扩大训练集,提升模型精度。例如,Li等[49]提出一种半监督技术,通过已标注数据和未标注数据的正则化损失与少量标注数据的监督损失的加权组合来优化网络,在三个医学数据集上进行实验,与现有的方法相比取得不错成果。因此,半监督技术与迁移学习的结合也将是未来研究的方向之一。

除了上述研究,还有一些研究将联合学习与迁移学习相结合,在目标数据集很小的医学图像应用中,基于迁移学习的联合学习方法可以有效改善网络的泛化性和鲁棒性[50]。例如Heker等[51]将两种方法组合,解决肝脏病变的分割和分类问题,研究表明,简单的联合框架胜过常用的多任务体系结构Y-Net,实验结果也显示,与Y-Net相比,该研究方法的分类准确率提高了3%,实现了10%的分类准确率的提高。

表6 对上述研究进行了总结,这些研究打破了传统迁移方法单一传递参数的壁垒,都取得了一定的成果。首先,迁移学习与生成对抗技术结合,有效解决了医学数据缺少的问题,但是目前针对3D医学图像的生成技术仍不成熟。其次,注意力机制是当前研究界的热点,与迁移学习方法结合,可以有效提升迁移后的模型精确度,但是注意力机制的计算量较大,耗费计算资源过多,所以轻量化注意力机制的研究将是未来的研究热点。最后,为了解决医学数据标注难的问题,许多研究将自监督和半监督技术与迁移学习结合,但是基于该类方法的模型精确度很难超过有监督技术,这将是后续研究需要关注的问题。

表6 其他迁移方法的特征Table 6 Other transfer learning methods

4 研究展望

综上,通过整理近年迁移学习在医学图像分析中的研究,可以发现,虽然迁移学习在解决医学图像样本缺乏方面发挥了重要作用,但距离实际应用仍有一定差距,还有很多问题需要进一步研究、探讨和解决。下文从医学图像分析目前所面临的问题入手,分析了现有解决方法的不足并对相关领域未来的研究方向及需要解决的问题进行了总结和展望。

4.1 医学图像数据集缺乏

缺乏足够的训练样本是医学图像分析面临的难题之一。针对这一问题,现有的解决方法如下:

(1)利用迁移学习,通过使用源域样本进行预训练,再使用少量目标域样本微调网络,以降低CNN对目标数据量的依赖。但是现有研究针对不同医学图像,不同病灶的特点,设计了不同的预训练模型,这些模型的选取及后续微调策略的设置均没有统一的衡量标准,不具有一般性和普遍适应性,不利于未来的实际应用。

(2)利用生成对抗网络,生成仿真的医学图像样本,从而增加训练样本,提升网络模型精度。但是目前利用生成对抗网络所生成的医学图像仍局限于2D图像,在生成3D医学图像方面,存在的问题较多。

(3)还有一些研究将联合学习与迁移学习结合,使用不同源域的样本补充训练数据,取得了不错的成果,但是联合学习使用不同源域的数据进行特征学习,可能会造成知识的负迁移,另外,较深的网络也可能造成计算资源的浪费。

针对以上三种解决方法,本文认为,首先分析各种医学图像的普遍特点,研究并探讨统一的、具有普适性的迁移学习框架和预训练模型,应该是未来需要关注和进一步研究的内容。其次,由于医学图像大多是3D的,如何利用生成对抗网络生成3D医学图像是未来此领域的研究方向之一。最后,如何将联合学习与迁移学习更好地结合,避免或缓解领域不同带来的负迁移问题是值得进一步研究的问题。

4.2 医学图像标注困难

医学图像不同于自然图像,需要专业且经验丰富的医生进行标注,所以医学图像的标注成为医学图像分析面临的难题。针对这一问题,目前一些研究将自监督技术与迁移学习结合,应用于医学图像分析。自监督技术通过训练大量无标记样本,学习其中特征的潜在关系,解决医学图像标注难的问题。但是医学图像分析任务对于精确度具有较高的要求,自监督技术的精确度还有待提高。因此,一些研究将迁移学习与半监督技术结合,通过训练少量有标注数据,然后进行大量无标注数据的预测,获得伪标签,再进行模型的训练,在保证解决标注难的问题上,提升了网络模型的精确度。

因此,针对医学图像标注困难的问题,本文认为,自监督技术仍是研究瓶颈,探索半监督技术、迁移学习和联邦学习有效结合方式,以及有效的伪标签生成方法,将是未来解决医学图像标注难问题的重要手段和研究方向。

4.3 模型精度有待提高

深度学习模型的精度对训练样本量具有很强的依赖性,由于医学图像缺乏样本,标注困难等问题,导致网络模型的精度提升较为缓慢。近期,一些研究将注意力机制结合迁移学习应用于医学图像分析,其中注意力机制可使网络模型关注于目标任务相关的图像特征,从而使精度得到大幅度提升。但注意力机制占用计算资源过多,训练时间较长。

针对神经网络模型精度提升缓慢的问题,注意力机制是解决这个问题的关键,但是目前能够使模型精度有较大提升的注意力机制大都存在计算复杂,占用过多内存的问题,所以轻量级注意力机制的探索是十分有必要的。因此,探索轻量级注意力机制与迁移学习结合的有效途径,在提高精度的同时,降低计算量和资源使用量,是未来需要关注的研究方向。

5 总结

深度学习技术在计算机视觉方面取得了显著的成果,但是数据量不足和标注困难使其在医学图像分析领域所取得的进步相比自然领域较为缓慢。近年,一些研究利用迁移学习技术,或者通过将迁移学习与其他新技术结合,在解决这两个难题方面,取得了一定成果。本文首先对这些研究进行了调查、研究和总结,证明了迁移学习技术的有效性,然后分析了现有研究的不足,对未来研究方向进行了展望。总之,迁移学习对于解决医学图像数据集不足,是一种有效的途径,但是要达到实际应用,仍有一些问题需要进一步研究、探索和解决。

猜你喜欢

源域医学特征
医学的进步
基于参数字典的多源域自适应学习算法
预防新型冠状病毒, 你必须知道的事
如何表达“特征”
不忠诚的四个特征
抓住特征巧观察
医学
可迁移测度准则下的协变量偏移修正多源集成方法
医学、生命科学类
线性代数的应用特征