APP下载

深度学习方法在阿尔茨海默病脑图像方面的应用进展

2019-02-25朱映璇郭秀花

医学综述 2019年18期
关键词:编码器卷积影像学

朱映璇,冯 巍,郭秀花

(首都医科大学公共卫生学院流行病与卫生统计学系,北京 100069)

神经影像学是诊断阿尔茨海默病(Alzheimer′s disease,AD)及轻度认知功能障碍(mild cognitive impairment,MCI)的重要方法。运用于AD诊断的成像方法通常包括磁共振成像(magnetic resonance imaging,MRI)、正电子发射计算机断层显像(positron emission tomography,PET)、功能MRI(functional magnetic resonance imaging,fMRI)等。在与AD有关的多项研究中都会使用到网络公开数据库“阿尔茨海默病神经影像学计划”(Alzheimer′s Disease Neuroimaging Initiative,ADNI) 的数据库。该计划建立了合作研究和数据共享平台[1]。深度学习是机器学习的一部分,在各个领域,包括医学影像学中已经取得了令人瞩目的成果并且具有巨大的发展潜力[2]。在AD的影像学诊断方面,有研究者评估了大脑不同区域的图像在诊断上的不同意义[3]。也有研究者致力于设计一些方法将AD图像与其他脑疾病图像区分开,如Morabito等[4]提出了运用深度学习方法将克雅病和AD区分开。现就深度学习方法在AD脑图像分析方面的应用实践进行综述。

1 堆叠自动编码器方法及其在AD图像方面的应用

自动编码器是由输入层、隐含层和输出层3层结构构成的人工神经网络[5]。堆叠自动编码器是由多个自动动编码器串联堆叠构成。堆叠自动编码器的目的是为了逐层提取输入数据的高阶特征,在此过程中逐层降低输入数据的维度,将一个复杂的输入数据转化成一系列简单的高阶的特征,然后再将这些高阶特征输入一个分类器或聚类器中进行分类或聚类。

Liu等[6]运用堆叠自动编码器的方法对数据进行预训练,在运用ADNI数据库中758名受试者[包括180例AD患者,160例转化型MCI(converted mild cognitive impairment,cMCI)患者,214例非转化型MCI(non- converted mild cognitive impairment,ncMCI)患者和204名正常老化对照受试者]MRI图像数据的试验中,对二分类任务的总体准确度达82.59%,总灵敏度为86.83%;对多分类任务的总体准确度为77.78%,总灵敏度为75.00%。另外,该团队对ADNI数据库中的331名受试者(包括77例正常对照,102例ncMCI,67例cMCI,85例AD患者)的MRI和PET数据进行多数据模式融合分析也得到较好的试验结果。

Suk等[7]认为以往的图像分析方法存在一个主要的局限性,即只考虑简单浅层特征,而他们于2013年提出的堆叠自动编码器的新方法突破了这一局限性,提高了分类准确性。在借助ADNI数据库进行的试验中,上述方法对AD、MCI和cMCI的诊断准确度分别为 95.9%、85.0%和75.8%。2015年,Suk等[7]对该方法进行了改进。由于深度学习的预训练具有无监督的特点,可以通过目标以外的样本对堆叠自动编码器参数进行初始化,以此找到适应目标样本的最佳参数,从而进一步优化该方法在二分类任务中的性能。与Liu等[6]的研究结果相比,Suk等[7]的方法准确度和灵敏度更高。

深度学习方法在AD图像的分类上虽然显示了优越的性能,但是往往需要大量的数据来进行模型训练和参数调整。针对这一点,Adel等[8]提出了使用三维散射变换的方法,这是一种类似于深度学习但又无需各种学习性参数的方法。另外,Arbabshirani等[9]提出这种由于有限的样本量造成的问题可能通过“现代数据共享模型”来解决。数据共享的实现在当前的社会环境中必定会遇到多方面的困难,机构之间的数据管理体系不同,数据共享观念的不普及,缺乏共享平台等均是落实数据共享的不利因素,建议可以建立多中心数据共享平台。

2 降噪自动编码器方法及其在AD图像方面的应用

降噪自动编码器是在自动编码器的基础上,为了防止过拟合问题而对输入的数据(网络的输入层)加入噪音,使学习得到的编码器具有较强的鲁棒性,从而增强模型的泛化能力。Ithapu等[10]提出了一种新的深度学习模型,随机降噪自编码器,可以通过影像学生物标志物对MCI阶段的患者未来的认知和神经退行情况进行预测。MCI阶段的患者往往是有关AD疗法临床试验中的最佳选择。然而,MCI患者具有很大的异质性,并非每一个病例都会在试验时间内发展为AD,部分甚至不会发展为AD。如果能将这些最有可能在试验期内发展为AD,也因此最有可能从这些针对AD的疗法中获益的MCI病例鉴别出来,那么临床试验的效率将会大大提高,该治疗方法疗效评估的准确性和可靠性也会提升。

Ithapu等[11]对该方法进行了优化,新的方法基于随机降噪自编码器标记对PET和fMRI的图像进行了病变的鉴别。该团队运用改进后的方法对ADNI数据库中的516例患者的脑图像(其中包括101例AD患者、148例健康对照、131例早期MCI患者和136例晚期MCI患者)进行了试验,与现有的其他方法相比,该方法可以有效减少评估所需的样本量,使小规模的评估具有更高的准确性。2017年,该团队又提出了一种称之为随机神经网络的新模型来解决这一问题[12]。

总之,应以更加开阔的思维来看待深度学习在脑图像方面的应用,除对脑图像的神经影像学诊断外,在疾病的研究、治疗、预后等方面深度学习方法也具有广阔的应用前景。

3 深度信念网络方法及其在AD图像方面的应用

深度信念网络是一种生成模型,通过训练其神经元间的权重,可以让整个神经网络按照最大概率生成训练数据。流形学习方法是模式识别中的基本方法,其中等距映射[13]和拉普拉斯特征映射是医学图像分析中最常用的。这两种方法都需要一个预制邻近图。

Brosch和Tam[14]提出了一种基于深度信念网络的新型流形学习方法对3D脑图像进行分析。深度信念网络的组成元件是受限玻尔兹曼机,其训练是逐层进行的[15]。Brosch和Tam[14]的方法与大多数现有的流形学习方法不同,不需要多边形空间是局部线性的,并且不需要预先建立邻近图。该团队对ADNI数据库中的300名受试者MRI图像(包括AD和正常者)进行试验,结果表明基于深度信念网络的方法较传统基于卷积的方法更有效。Ortiz等[16]研究了用于AD早期诊断的图像分类方法,他们提出通过自动解剖标记方法划分出大脑区域,然后根据这些区域将各部分的灰质图像分割成为3D补丁。这些补丁将被用于训练不同的深度信念网络。集成这些网络,通过投票机制做出最终的预测。该团队对ADNI数据集的试验中,健康对照与AD分类准确度为90%,ncMCI与AD分类准确度为84%,健康对照与cMCI分类准确度达83%。

深度学习方法对AD脑图像分类的临床意义不仅在于确诊已经发生的AD,在疾病的早期诊断和筛查方面也有很好的应用前景,尤其是深度信念网络通过对ncMCI和cMCI的分类,对于疾病的预后、转归具有较好的提示意义。

4 卷积神经网络方法及其在AD图像方面的应用

卷积神经网络是一种前馈神经网络,其人工神经元可以响应一部分覆盖范围内的周围单元,在大型图像处理中表现出优异的性能,包括一维卷积神经网络、二维卷积神经网络以及三维卷积神经网络。

在AD图像方面,有关卷积神经网络方法的研究较多。Sarraf和Tofighi[17]利用卷积神经网络成功地将AD受试者的fMRI数据与正常对照区分开来,检测数据准确度达96.85%。在二维卷积的基础上,很多研究者发现了三维卷积的优势。Payan和Montana[18]将稀疏自动编码器和卷积神经网络组合,在整个MRI图像上使用三维卷积,产生了较二维卷积更好的性能。Gao等[19]提出一种运用卷积神经网络对CT图像进行分析从而辅助诊断AD的方法。该方法的创新点在于同时融入二维和三维卷积神经网络。Hosseini- Asl等[20]提出了深度三维卷积神经网络模型。该方法对AD、病变以及正常3种CT图像识别的准确度分别为85.2%、80%和95.3%,平均为87.6%。

此外,卷积神经网络在脑图像方面的应用潜力也引起国内许多研究者的兴趣。吕鸿蒙等[21]对卷积神经网络的模型进行了改进,使之在医学图像方面的应用更有针对性。林伟铭等[22]提出一种使用卷积神经网络对MRI脑图像的海马体区域进行识别的方法。程俊龙和赵越[23]提出一种基于深度学习的脑部MRI的灰质和白质分割算法。刘畅[24]搭建了一个深度卷积网络,用其进行MRI脑影像的分割,然后对分割的结果进行断层重建,并将其立体显示。

对多种影像学图像数据进行综合分析有利于提高诊断的准确性,但这种方法面临的一大挑战是并非所有受试者都有分析需要的所有影像学资料。卷积神经网络方法可能弥补这一数据上的缺陷,从而有效提高疾病诊断的准确性。Li等[25]提出了运用卷积神经网络评估AD脑图像成像数据缺失部分的方法,他们采用三维卷积神经网络捕获输入与输出数据间的关系。

虽然卷积神经网络具有上述诸多优势和应用、发展价值,但大规模的神经网络往往容易出现过拟合问题。Dropout是防止过拟合的一大有力手段。Dropout是指在深度学习网络的训练过程中,对于神经网络单元按照一定的概率将其暂时从网络中丢弃[26]。Li等[27]提出了基于MRI以及PET图像的鲁棒性深度学习系统对AD患者病情的不同进展阶段进行鉴别并使用Dropout技术对经典的深度学习方法进行优化,从而防止过拟合的出现。

5 其他深度学习方法及其在AD图像方面的应用

稀疏回归可以避免回归系数过大,防止过拟合,达到提取特征的目的。在各种引入AD影像学诊断的深度学习方法中,稀疏回归是其中效果较好的一种。

Suk等[28]认为,现有的稀疏回归方法往往基于最优回归系数,这种方法仅用一个步骤就完成了对图像特征的提取,这就可能使最优回归系数受到非有效信息或有效性低的特征干扰。为了解决这一问题,他们提出了一种新型的深度学习模型,通过分层的方式进行稀疏多任务学习,从而达到递归性丢弃非有效信息的目的。然而,最优回归系数确实能够反映一个特征的相对重要性,他们将在上一个层级中得到的最优回归系数作为在下一个层级中的特征加权因子。该团队还考虑了每一类样本的分布特点,使用聚类诱导亚类别标签向量作为稀疏回归模型中的目标响应值。上述方法在二分类或多分类任务中均表现良好。除了对方法的改进,Suk等[29]针对AD的诊断和预后开创性地将稀疏回归和神经网络这两种方法结合,构建了一个用于临床决策的深度卷积神经网络,称为“深度组合稀疏回归网络”。提示方法学的创新不仅在于构建全新的模型,对现有方法进行有针对性的改进或将不同方法进行巧妙有机的结合也是具有应用价值和前景的研究思路。

基于多种影像学数据的多模态分析,也引起许多研究者的兴趣。多模态分析虽然具有更好的可靠性,但也对算法设计提出了更高的要求。

深度多项式网络在针对大型数据集和小型数据集的试验中都表现出了具有较好的准确性和敏感性。Shi等[30]和Zheng等[31]提出了一种多模态堆叠深度多项式网络算法,这种算法先使用了2个堆叠深度多项式网络来学习MRI以及PET图像的高级特征,然后分别反馈到另一个堆叠深度多项式网络对多模态神经影像学信息进行融合分析。利用ANDI数据集对该算法进行二分类任务和多分类任务的试验,结果表明该算法优于许多现有的基于多模态特征学习的AD诊断算法。

Suk等[32]使用深波尔兹曼机作为构建块,从3D补丁中寻找潜在的分层特征,从配对的MRI和PET 补丁中获取联合特征,并为其配置一种基于多模态深波尔兹曼机的系统方法。该团队的研究成果在实际应用中具有较好的结果,对ADNI数据集中共398名受试者的影像学资料进行试验,在AD与健康对照、MCI与健康对照、cMCI与ncMCI的3个二分类任务中,最大精确度分别为95.35%、85.67%和74.58%。与同类针对多模态数据分析的方法相比,精确度较高,但是缺少在多分类上任务的试验。

脑图像结构的分割是深度学习方法对脑图像分析的第一步,特征的检出和提取则是诊断的关键步骤和最终做出图像分类决策的前提条件。与传统计算机辅助诊断方法运用固有算法的模式相比,深度学习方法运用基于大量现实数据的训练从而得出的模型对感兴趣区进行检出,该过程更加可靠,从而在临床实际工作中也能真正减少临床医师人工读取的工作量。

6 小 结

在人工智能蓬勃发展的大背景下,深度学习方法的运用有望进一步提高计算机辅助医学影像学诊断的效率和准确性,无疑具有巨大的发展潜力,但仍有诸多问题亟待进一步探索和解决。在脑图像分类上,从传统的二分类转向多分类,提高各种深度学习方法在脑图像多分类方面的准确度和灵敏度是深度学习方法在该领域进展的方向之一。针对多种影像学资料的多模态分析,可以有效提高疾病诊断的可靠性,如何为多模态分析设计和优化相关的深度学习方法也需要研究者进一步探索。此外,除构建新的模型,如何将已有的模型进行优化或进行有机的结合,从而运用于数据处理、图像诊断的不同方面也是一个有效的思路。除对方法进行改进,鼓励放射科医师积极参与数据库的建设、规范相关的法律问题等都将是重要的议题。

基于已有数据训练出的模型,一方面可以避免个人决策的失误和局限性,另一方面却具有保留和固化现有的普遍错误,尤其是未被人类注意到的潜在错误的风险。在医学决策中,结合基础研究、流行病学研究、临床表现、辅助检查等进行综合的判断和基于多种证据的决策仍需要由医师做出。

猜你喜欢

编码器卷积影像学
融合CNN和Transformer编码器的变声语音鉴别与还原
GM1神经节苷脂贮积症影像学表现及随访研究
基于3D-Winograd的快速卷积算法设计及FPGA实现
64排CT在脑梗死早期诊断中的应用及影像学特征分析
特殊部位结核影像学表现
卷积神经网络的分析与设计
从滤波器理解卷积
颅内原发性Rosai-Dorfman病1例影像学诊断
基于傅里叶域卷积表示的目标跟踪算法
基于双增量码道的绝对式编码器设计