APP下载

基于海马MRI 数据的三维DenseNet 和通道注意力模块相结合的阿尔茨海默病分类模型研究

2023-06-05沈小琪

医疗卫生装备 2023年4期
关键词:海马卷积准确率

金 悦,沈小琪,林 岚

(北京工业大学环境与生命学部生物医学工程系智能化生理测量与临床转化北京市国际科研合作基地,北京 100124)

0 引言

随着人口老龄化进程的加速,阿尔茨海默病(Alzheimer’s disease,AD)的发病率在逐年增加[1-2]。全球AD 的发病人数超过5 000 万,预计到2050 年,这一数字将增加到1.35 亿[3]。我国有1 000 万AD 患者,占全球AD 患者总数的1/5[3]。AD 患者的持续护理对家庭和整个社会来说都是一种巨大的负担[4]。AD 潜伏期较长,早期诊断对其早期干预和治疗非常重要。

神经影像对AD 的早期诊断具有重要价值,例如,通过结构磁共振成像可以显示AD 患者的病理性大脑萎缩。因此,将新的机器学习技术和大规模的脑成像数据集相结合,对于AD 的早期诊断及治疗具有一定的指导意义。深度学习是机器学习领域的一个重要分支,它在计算机视觉、目标检测和自然语言处理等方面都有着很好的表现[5-6]。与传统机器学习方法不同,深度学习技术以数据驱动的方式学习不同抽象层次的分层特征。在深度学习中,卷积神经网络(convolution neural network,CNN)是最流行的网络结构。CNN 目前已被广泛应用于基于神经影像学的AD 诊断与分类[7-8]。

张柏雯等[8]使用AlexNet,以迁移学习的方式提取图像特征,并对所提取特征进行三维重构,经主成分分析降维后进行AD、轻度认知障碍(mild cognitive impairment,MCI)与认知正常(cognitive normal,CN)受试者的分类。曾安等[9]提出了用于AD 诊断的多切片的CNN 集成模型,先使用一个8 层结构的CNN模型分别对矢状面、冠状面、横断面的二维MRI 切片进行训练,得到多个基分类器,再在每个方向中选择准确率排名前五的基分类器进行集成。该模型在AD/CN 分类任务中的准确率为81%。Cui 等[10]将三维CNN 与递归神经网络相结合,采用CNN 学习影像的空间特征,采用递归神经网络提取影像的纵向特征,在AD/CN 分类任务中的准确率为91.3%。在一项多模态影像研究中,Liu 等[11]采用级联CNN 的方式来学习MRI 和PET 中的多层次和多模态特征。首先,将每幅神经MRI 影像划分为27 个存在部分重叠的图像块。其次,使用多个VGG 结构的三维CNN 从图像块中提取高级特征。最后,通过级联一个二维CNN,将图像块中的特征进行集成。级联CNN 模型在AD/CN 分类任务中的准确率为93.26%。

上述的CNN 模型总体上网络结构比较简单,因此在网络结构优化方面仍有改进的余地。在DenseNet问世之前,CNN 的演化通常是通过增加层数和通道数来完成。DenseNet 是一种全新的神经网络架构,它不仅能缓解梯度消失,而且模型需要的参数量也更少。基于此,本文以海马图像块作为感兴趣区(region of interest,ROI),将DenseNet 和通道注意力模块相结合,构建AD 分类模型。该模型在DenseNet 网络结构基础上加入通道注意力机制,避免网络训练过程中出现过拟合的问题,使AD 分类准确率得到较大提升。

1 数据与方法

1.1 数据集

本研究所使用的数据涉及到4 个公开数据集,分别是阿尔茨海默病成像计划(AD Neuroimaging Initiative,ADNI)-1(http://adni.loni.usc.edu/)、ADNI-2、澳大利亚老龄化影像学、生物标志物和生活方式研究(The Australian Imaging,Biomarker &Lifestyle Flagship Study of Ageing,AIBL)数据库(https://aibl.csiro.au/)和AD 最小间隔共振成像(The Minimal Interval Resonance Imaging in Alzheimer’s Disease,MIRIAD)数据集(http://miriad.drc.ion.ucl.ac.uk)。ADNI-1 数据集中包含187 例AD 患者、229 例CN 受试者、138 例MCI 转化者(MCI converter,MCIc)和181 例MCI 非转化者(MCI non-converter,MCInc)的基线数据以及4次(6 个月、12 个月、18 个月和24 个月)跟踪随访数据。由于同一个受试者多次跟踪随访扫描图像具有相似性,为了避免数据泄露的发生,限制来自于同一对象的所有纵向数据只能出现在训练集、验证集、测试集任一划分中。在受试者层面,将训练集、验证集和测试集按7∶1∶2 的比例随机划分,共进行5 次随机划分。其中,ADNI-1 数据集在实验过程中被用于训练和测试模型,数据分布见表1。ADNI-2、AIBL 和MIRIAD 3 个数据集被作为独立测试集来验证模型的泛化性能。表2 列出了4 个数据集的人口统计学信息。

表1 ADNI-1 基线数据及2 a 内跟踪随访数据分布 单位:例

表2 4 个数据集的人口统计学信息

1.2 图像预处理

图像预处理的步骤如下:首先使用MRIcron 工具将DICOM 原始数据转换为NIfTI 格式的图像。随后,所有NIfTI 格式的图像均使用CAT12 工具箱(http://dbm.neuro.uni-jena.de/cat/)在SPM12 中进行分析处理(http://www.fil.ion.ucl.ac.uk/spm/software/spm12/)。T1加权MRI 图像被分割为灰质、白质和脑脊液,并通过仿射变换和非线性变换标准化到模板空间,以获得MNI-152 标准脑模板空间中的灰质密度图。将其与AAL(anatomical automatic labeling)模板对齐,以左(或右)海马为中心提取ROI 图像块。通过这种方法,每个灰质密度图可以生成2 个ROI图像块。图像块大小设为64×64×64 体素,以确保覆盖单侧海马体及邻近区域,如图1 所示。

图1 左、右海马ROI 图像块提取示意图

1.3 三维CAM-DenseNet模型构建

受到ResNet 中跳跃连接的启发,DenseNet 在前面所有层与后面层间建立了密集连接。DenseNet 包括密集块和过渡块2 个部分。在一个密集块中,每一层的输入包含前面所有层的输出特征,并通过过渡块将特征信息传递到下一个密集块。DenseNet 使用通道连接的方式来实现特征重用,这种方法可以高效地将传递特征给后续层,从而可以在较低的参数量和较少的计算成本下提高网络性能。

深度学习中的注意力机制与人脑中的视觉注意力机制相似。它可以将重点集中在图像中的特定区域,从而降低对非重要信息的关注程度,提升网络的分类识别效率。在本研究中,将通道注意力模块(channel attention module,CAM)引入三维DenseNet,以增强网络对关键有效特征信息的提取和利用,进而提升分类效率。本研究中使用的CAM 结构如图2所示。具体实现步骤如下:

图2 CAN 结构图

(1)CAM 的输入为经卷积层提取的特征图F,H、W 和C 分别为特征图的高度、宽度和通道数目。将F 分别经过全局最大池化和全局平均池化,可得到2 个1×1×C 的特征向量。

(2)将2 个特征向量送入同一个共享的多层感知机中,对多层感知机输出的2 个特征向量进行点和运算,再经过激活操作得到通道注意力权重Mc。

(3)将原输入特征图F 与通道注意力权重Mc进行点乘运算,得到特征融合后的通道注意力特征图Fc。

在DenseNet 的网络架构中加入CAM,构建三维CAM-DenseNet 模型,在保证DenseNet 对原始特征的完整传递的基础上,具备更强的特征提取能力。整个网络架构采用了2 个分支,分别作用于左、右海马图像块的特征提取,网络架构如图3 所示。这2 个分支具有相同的体系架构,每个分支均由1 个卷积块、4个密集块、4 个CAM 层、3 个过渡层和1 个全局平均池层组成。每个分支在初始的输入层后紧跟1 个卷积块,用于提取浅层特征。卷积块由3×3×3 卷积层、批归一化层、ReLU 激活层和最大池化层组成。在密集块中,每个密集层通过捷径连接来接收来自前面所有密集层的特征图。密集层由1 个1×1×1 卷积层、1 个3×3×3 卷积层、2 个批归一化层和2 个ReLU 激活层构成。所有密集块中都有4 个密集层。由于CAM不会改变特征图的大小,所以在CAM 后设置过渡层来对特征图进行降维。每个分支的最后部分均是一个全局平均池化层,可将高维特征压缩到一维,以减少参数数量。在全局平均池化层后将2 个分支的特征进行特征拼接,并利用全连接层和Softmax 层来获得分类概率。

图3 基于海马ROI 的三维CAM-DenseNet 模型结构图

1.4 模型评价指标

模型的分类性能由准确率ACC、敏感度SEN、特异度SPE 和AUC 值4 个评价指标进行评估,其中ACC、SEN 和SPE 的计算公式分别为

式中,TP、FP、FN 和TN 分别表示真阳性、假阳性、假阴性和真阴性的数量。

1.5 模型训练参数

模型是通过Tensorflow 2.4 平台在Python3.8 环境下构建的。在三维CAM-DenseNet 模型的训练中,采用了随机初始化方法来初始化网络权重。在此基础上,将损失函数用交叉熵来表示。该方法通过随机梯度下降算法对梯度进行更新,并对各参数进行优化。将初始学习速率设定为0.000 1,动量因子设置为0.9,权重衰减因子设置为0.000 5。该模型添加了L2 正则化以减少过拟合风险,使用批大小为32,进行了200 次迭代,并且设置了随机失活率为0.2。这些设置将有助于提高网络的泛化能力和减少训练期间的过拟合现象。验证集的主要作用是调整训练过程中的迭代次数,当验证集上的模型精度在20 次迭代后不再提高时,停止模型迭代。

2 实验结果

2.1 三维DenseNet 模型与三维CAM-DenseNet模型比较

在4 个二分类的任务中(AD/CN、AD/MCInc、MCIc/CN 和MCIc/MCInc),将三维CAM-DenseNet 模型与三维DenseNet 模型进行比较,准确率差异如图4 所示。三维CAM-DenseNet 模型在4 组二分类实验中的准确率均高于三维DenseNet 模型,尤其是在AD/CN分类任务中,其准确率提升了约5%。DenseNet 本身具有良好的特征表达能力,在加入CAM 后,网络可以更为准确地提取有效特征,提高了分类效果。

图4 三维DenseNet 模型与三维CAM-DensNet 模型的分类性能比较

2.2 基于基线数据的三维CAMDenseNet 模型分类结果

三维CAM-DenseNet 模型在4个二分类任务中的分类结果见表3。由表3 可知,三维CAM-DenseNet模型在AD/CN 组表现最好,其次是MCIc/CN 组,再次是AD/MCInc组,MCIc/MCInc组表现较差。海马和其他内侧颞叶结构的形态学特征在AD 分类中起着重要作用[12]。AD 患者的海马萎缩程度较高,因此三维CAM-DenseNet模型可以更好地区分AD 患者与CN 受试者。与MCInc相比,MCIc患者在双侧海马的萎缩更为显著[13],MCIc的脑部变化更接近于AD。因此,该模型在MCIc/CN任务中也能取得较好性能。尽管MCIc与MCInc在海马萎缩上存在一定差异,但就萎缩程度而言,更偏向于AD 与CN 中的AD 一侧。因此,AD/MCInc与MCIc/MCInc2 个任务的分类效果都不理想。

表3 三维CAM-DenseNet 模型在4 个二分类任务中的性能比较(均值±标准差) 单位:%

2.3 三维CAM-DenseNet 模型与其他基于海马图像的三维DenseNet 模型在AD/CN 分类任务中的比较

将三维CAM-DenseNet 模型与其他基于海马图像的三维DenseNet 模型进行比较,结果见表4。同时,为了比较全脑和海马图像块模型间的性能差异,建立了一个基于全脑图像的三维DenseNet 模型作为基线模型。实验结果显示,三维CAM-DenseNet 模型比基于海马图像的三维DenseNet 模型具有更好的性能。同时,以海马图像块作为输入可以减少模型训练过程中的过拟合,提升模型的学习效果。

表4 三维CAM-DenseNet 模型与多种三维DenseNet 模型在AD/CN分类中的性能比较

2.4 加入纵向数据对模型性能的影响

为了训练可用的CNN 模型,需要大量的训练数据。为使模型得到更好的训练,本研究在实验中添加了受试者2 a 内的纵向数据,以进一步扩充数据集。纵向数据并非一次全部采纳,而是分阶段逐步添加。在每个阶段添加纵向数据后,对模型进行重新训练,并在4 个分类任务中,分别观察添加纵向数据对模型性能的影响。

从表5 可以看出,在包含MCI 的3 个分类任务(MCIc/CN、AD/MCInc和MCIc/MCInc)中,模型的分类性能随着纵向数据的增加而逐渐改善。这表明,向MCI分类任务中添加纵向数据可以有效提高模型的分类效果。但是,在AD/CN 分类任务中,如果只采用基线数据,则该模型的性能是最优的,随着纵向数据的不断增加,模型的性能会逐渐降低。

表5 增加纵向数据后模型的分类结果(均值±标准差) 单位:%

2.5 模型泛化性

泛化是指模型经过训练后,应用到新数据并做出准确预测的能力。一般方法是对数据进行拆分获得验证集和测试集,但如果划分过程不严格,就有可能会出现数据泄露。为了更好地评估模型的泛化性能,最好使用一个完全独立的测试集。本研究中,分别以ADNI-2、AIBL 和MIRIAD 作为独立测试集对模型泛化性能进行检验。表6 显示了泛化评估结果。三维CAM-DenseNet 模型在3 个独立测试集上的分类准确率在86%~94%之间,具有良好的泛化性能。在3 个数据集中,ADNI-2 的分类准确率最低,这可能是由于ADNI-2 采用的是3T 磁共振采集设备,而其他几个数据集采用的是1.5T 磁共振采集设备。

表6 AD/CN 分类任务中的泛化评估结果(均值±标准差) 单位:%

3 结语

为了提升AD 分类准确率,本文提岀了一种DenseNet 和通道注意力模块相结合的CNN 模型。改进后的模型在保留DenseNet 对原始特征完整传递的基础上,提供了更强的特征提取能力。为了验证该模型的有效性,本研究将该模型与多种三维Dense-Net 模型进行比较,实验结果证明,本文提出的三维CAM-DenseNet 模型具有更好的分类性能。另外,在MCI相关分类任务中加入纵向数据可以提升模型的分类性能。同时,模型对不同数据集均具有较好的泛化能力。综上,本文提出的三维CAM-DenseNet 模型适用于AD 的分类研究。

本研究的不足之处在于研究重心集中于海马区域,虽然海马是AD 疾病中受影响最显著的脑区之一,但由于AD 是一种异质性的疾病,仅仅研究海马无法全面反映其异质性的病因。除此之外,本研究提出的模型是一种黑箱模型,缺乏必要的解释能力,直接影响了其在临床诊断中的应用价值。为此,本研究在未来将着重利用模型的优异特征提取能力,深入分析其对AD 疾病异质性病因的影响,以便更好地理解和诊断这种复杂的疾病。同时,应纳入基于梯度的解释方法,通过可视化等手段来揭示模型内部的计算机制和判断依据,以便更好地认识和了解模型的智能诊断依据。这些措施将有效提高模型的可解释性和应用价值,对于AD 临床检测与诊断的应用将产生重要的推动作用。

猜你喜欢

海马卷积准确率
海马
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
海马
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
“海马”自述