MRI影像组学在轻度认知障碍中的研究进展
2022-11-21蔡丽娜李晓陵潘洋王鹏彭彩亮韩胜旺侯玉王杨高瑞雪
蔡丽娜,李晓陵,潘洋,王鹏,彭彩亮,韩胜旺,侯玉,王杨,高瑞雪
与正常衰老状态相比,轻度认知障碍(mild cognitive impairment,MCI)以记忆加速衰退为主要特征,是阿尔茨海默病(Alzheimer's disease,AD)的早期表现[1]。流行病学研究表明,每年约有10%~12%的MCI 患者进展为AD,80%的患者在历经6 年的随访后发展为AD[2]。AD 是一种进行性神经退行性疾病,以记忆功能下降、认知减退为主要临床表现,确诊时已发生不可逆的神经元坏死,当今尚无有效的治疗方法。在全球范围内,预计未来20 年AD 患者人数将增加一倍,已经被世界卫生组织认定为公共卫生重点疾病[3]。因此,寻找一种能够有效诊断、预防和干预MCI 进展的方法,对提高患者生活质量和防止MCI发展为AD具有十分重要的意义。近年来,MRI影像组学的大力开发为解决上述问题提供了新的途径。在早期阶段,这种新方法被广泛应用于肿瘤性病变研究[4],现在已被用于MCI的诊断、分类及进展预测[5]。
1 MRI影像组学概述
影像组学最早由Lambin 于2012 年提出[6],是一种基于医学和计算机科学深度交叉融合的新方法。它通过图像特征反映疾病的异质性,具有成本低、无创的特点。在传统的临床诊断中,医生依靠图像的视觉解释,识别小病灶的能力有限。影像组学可以为疾病定性和定量分析提供更准确、更客观的依据。MRI影像组学隶属于影像组学,其分析过程需要一系列连续的步骤,包括MRI 图像采集、图像分割、图像特征提取和建模[7]。
1.1 图像采集
图像采集是指获取标准的MRI 图像数据,是影像组学分析的基础。与传统图像扫描相比,影像组学对于图像采集的要求强调标准化。由于图像特征分析的重复性和可比性受到设备、参数和临床实践等因素的影响,因此有必要制订标准化的图像采集和重建方案[8-9]。此外,为了避免因像素不一致、灰度不一致或分辨率不同而导致的偏差,主要采用重采样和归一化图像预处理,以确保后续分析的可行性和可重复性[10-11]。目前MCI 研究中常用的序列包括T1、T2 液体衰减反转恢复(fluid attenuated inversion recovery,FLAIR)序列和扩散张量成像(diffusion tensor image,DTI)序列[12]。采集完成后,收集图像构成一个大型数据库。用于MCI 的图像主要来自当地医疗机构、公开数据库和阿尔茨海默病神经影像学倡议(Alzheimer's Disease Neuroimaging Initiative,ADNI)数据库[13]。
1.2 图像分割
MRI影像组学的图像分割方法主要有手动分割、半自动分割和多重分割[14-15]。手动分割依靠影像科医生手动识别和注释感兴趣区(region of interest,ROI)。该方法具有精度高的优点,但耗时、效率低,不适用于大型数据库[16-17]。近年来,在一系列计算机算法的辅助下,半自动和自动分割得到了更多的发展[18]。此外,还有许多开源软件可用于分割,如ITK-SNAP、3D Slicer、MIM 和ImageJ 等[19]。这些新技术的开发和使用使得图像分割更加高效[20]。研究表明,海马和胼胝体萎缩发生在AD 早期[21-22]。由于海马在认知功能中起着重要作用,且海马体更为具体,能提供更为准确和稳健的信息,因此海马是MCI影像组学研究中最常选择的ROI[23]。此外,内嗅皮层、胼胝体、丘脑、一些自动解剖标记的大脑区域、甚至全脑等亦是MCI研究的ROI[24-25]。
1.3 图像特征提取
特征提取是分割ROI 的下一步。选择有用的信息来帮助表征正常和异常图像。此步骤是影像组学的核心,以便根据最具辨别力的特征进行分类或预测。特征可以分为两种类型:定性特征和对病变不可见特征的数学定量描述[26]。定性特征如位置、大小、形状等。对病变不可见特征的数学定量描述大致可分为四种类型:(1)以统计学数值表示的形态学特征;(2)反映病变不同灰度等级分布的一阶特征(直方图特征),主要包括标准差、能量、熵、峰度、锐度、偏度、方差等;(3)二阶特征描述病变异质性,解决像素或体素的空间关系,通常使用灰度共生矩阵和灰度游程矩阵;(4)高阶特征,利用各种滤波器提取,如小波变换、拉普拉斯滤波器和明斯基函数等[27]。
然而,有几个特征是不可取的。冗余和不相关的特征会影响模型的准确性和鲁棒性。为了避免过度拟合和提高精度,在建模之前需要从大量提取的特征中选择最重要、信息量最大的特征。这一步通常在各种机器学习方法中执行,例如相关或单变量回归等方法,以及最小绝对收缩和选择算子(absolute shrinkage and the selection operator,LASSO)算法等嵌入方法[28]。目前,MCI 相关MRI 影像组学分析中提取的图像特征包括形状、强度、纹理、梯度、小波等[29-31]。
1.4 模型建立
影像组学最终目标是建立一个诊断、分类和预测的模型。建模涉及三个主要方面:特征选择、建模方法和验证。特征选择是数据驱动的,为了实现整体模型的最佳效能,还应包括影像学以外的特征(如临床记录数据、治疗期间获得的数据或生物和/或遗传数据);建模方法的选择,确定最佳机器学习方法是实现稳定性和临床相关性的关键步骤,因此在理想情况下,应使用多种机器学习方法,并应完整记录实施状态;验证是完整分析不可或缺的组成部分,模型必须在内部进行验证,理想情况下应该完成外部验证。目前,影像组学研究中常用模型是基于机器学习算法的模型[32-33],如卷积神经网络(convolutional neural networks,CNN)、支持向量机(support vector machines,SVM)、随机森林(random forest,RF)等[34]。敏感度、特异度、准确度及受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under the curve,AUC)用于评价模型效能[35-36]。
2 MRI影像组学在MCI中的应用
MRI影像组学可以从标准图像中挖掘定量图像特征,提取数据并将其应用于临床决策,从而提高MCI 诊断、分类和发展预测的准确性,在MCI等神经系统疾病中得以应用。
2.1 MCI诊断及分类
当脑组织有病变时,MR 图像的纹理可能会相应改变。Leandrou 等[37]从正常对照(normal controls,NC)、MCI、进展为AD 的MCI (MCI converters,MCIc)和AD 受试者中提取纹理特征。结果发现内嗅皮质纹理特征差异有统计学意义。NC和MCI 的AUC 为0.710,MCI 和MCIc 的AUC 为0.730,MCI 和AD 的AUC 为0.764,研究表明内嗅皮质纹理特征可以对MCI 进行分类诊断。So 等[38]基于海马体纹理对AD 和MCI 分类的准确度达到72.5%,MCI 和NC 分类的准确度达75%。Feng 等[39]应用杏仁核纹理特征分析发现AD 与遗忘型MCI (amnestic mild cognitive impairment,aMCI)的分类准确度达到0.81,AUC达到0.84;aMCI 与NC 的分类准确度达到0.75,AUC 达到0.80。由此可见MRI 的纹理分析可以定量描述组织特征,反映其生理和病理阶段,揭示图像中肉眼无法识别的信息,为MCI 的分类诊断提供了重要的影像学生物标志物。
机器学习或深度学习逐渐成为MCI 影像组学研究的热点。Feng等[40]应用先进的3D-CNN评估其对提高MCI诊断准确性的贡献,结果显示对于NC、MCI和AD的诊断,2D-CNN、3D-CNN和3D-CNN-SVM 的 准 确 度 分 别 为82.57%±7.35%、89.76%±8.67%和95.74%±2.31%。这项研究表明3D-CNN-SVM 比其他深度学习方法能达到更高的准确度。此外,由于MRI 的安全性、无创性和无辐射性,3D-CNN-SVM 可作为MCI 的有效筛查方法。Liu 等[41]构建多任务深度CNN 模型,用于联合学习和海马分割。然后,构建一个3D 密集连接卷积网络,用来学习基于海马分割结果提取的3D 特征。最后,结合多任务CNN 模型和3D 密集连接卷积网络模型的学习特征对疾病状态进行分类。结果表明MCI 和NC 受试者的分类准确度为76.2%,AUC 为77.5%。以CNN 为代表的深度学习模型在MCI 诊断、分类方面具有良好的临床应用前景。
将影像组学分析与临床因素相结合可以显著提高诊断、分类效率。Spasov 等[42]结合了结构MRI、人口统计学、神经心理学和APOE4 基因数据,提出了一种新颖的深度学习架构。对进展型MCI (progressive mild cognitive impairment,pMCI)和稳定型MCI (stable mild cognitive impairment,sMCI)的分类准确度为86.0%、敏感度为87.5%、特异度为85%。Luk 等[43]用综合预测模型[包括纹理特征、APOE4 基因、简易精神状态检查量表(mini-mental state examination,MMSE)得分、性别和海马体积]诊断MCIc 和sMCI 受试者,准确度为76.2%。Kim等[44]发现在单一的MRI序列模型中,影像学模型诊断MCI 的AUC 为0.71;当T1 和T2 FLAIR 影 像 学 特 征 相 结 合 时AUC 为0.75;当年龄、性别、APOE4 基因与T1 和T2 FLAIR 影像组学模型相结合时预测结果最佳(AUC为0.79)。
2.2 MCI发展预测
临床因素与MRI影像组学相结合,可以提高预测MCI发展为AD的准确性。Park等[45]从MCI发展为AD受试者的MRI中提取双侧海马影像组学特征,开发了三个模型:(1)影像组学模型;(2)基于临床概况的临床模型;(3)基于影像组学和临床概况的组合模型。结果发现在预测MCI 发展方面,影像组学模型的AUC 为0.674,临床模型的AUC 为0.758,组合模型的AUC为0.823。此研究表明基于组合模型可以更好地帮助预测MCI 患者的状态。有研究采用三维全脑纹理分析方法分析MCI 患者T1WI 的纹理特征,观察比较了MCIc 和sMCI 的纹理变化。综合预测模型(包括纹理特征、APOE4、MMSE 得分、性别和海马体积)被用来预测MCI 患者发展至AD 的情况。结果发现综合模型预测MCI患者转为AD的AUC可达到0.95[46]。Shu等[47]从ADNI 数据库中选择了357 名MCI 患者。对于每个患者,磁共振T1WI 自动分割为白质、灰质和脑脊液,并从每个组织中提取影像组学特征,与APOE4 和神经心理学量表相结合构建模型。该模型在预测12个月内MCI进展为AD方面具有显著的诊断效力,AUC 为0.814,敏感度为72.6%,特异度为79.8%。Logistic 回归分析显示,APOE4、临床痴呆评分、AD 评估量表和影像组学特征是MCI进展为AD的独立预测因素。
Shen 等[48]提出了一种基于深度学习的模型,用于预测一年内从MCI 到AD 的发展概率。这项研究使用了来自ADNI 数据库的165 个样本。首先,基于CNN 方法提取图像特征,然后利用SVM分类器对这些特征进行分类。结果表明使用线性、多项式和径向基函数核(radial basis function kernel,RBF kernel)的准确度分别达到91.0%、90.0%和92.3%。Lin等[49]基于CNN的深度学习方法,旨在利用MRI数据预测MCI到AD的进展。该方法的准确度为79.9%,AUC 为86.1%。这些研究表明基于深度学习的方法在预测MCI 到AD 发展方面有很大的潜力。Kang等[50]开发了一种基于多模态数据特征建立的深度学习模型。结果发现其在区分发展为AD 的MCI 准确度达到94.2%,敏感度为97.3%,特异度为92.9%,AUC为0.953。此外,单模态的分类精度比多模态的分类精度低20.9%。表明与单模态数据相比,多模态数据可以提供更多信息来区分发展为AD的MCI和NC。结果证实深度学习结合多模态融合数据进行特征提取可以提高分类和预测性能,有利于AD的早期干预。
3 小结与展望
综上所述,MRI 影像组学作为一种新的定量分析方法,通过对高通量图像数据信息的深入挖掘,可以量化MCI 的结构特征,从而获得MCI的MRI图像定量生物学指标,是对传统MRI的重要补充。此外,MRI影像组学结合患者的临床因素可以为MCI的诊断、分类和进展预测提供更准确的信息。
MRI 影像组学在MCI 的诊断、发展预测方面的应用是临床中重点关注的部分,该方面的研究已有不少成果,但也存在不少问题:(1)其尚未应用于广泛的临床实践,这需要通过进一步的临床试验进行广泛验证和优化。(2) MRI 影像组学分析的样本量在预测模型中起着重要作用,目前虽然储存了大量的医学成像数据,然而,大多数已发表的文献样本量较少,缺乏大型和标准化的临床数据,且这些数据分散在不同的中心,并使用不同的标准获取。因此,未来的研究需要用独立的机构或数据库进行外部验证,以验证影像组学模型的真实性能。(3)由于不同的成像采集设备、技术参数、分割算法以及不同的重建算法,很难获得一致的成像结果和可用于临床的统一标准,为了实现影像组学特征的标准化和技术的可重复性,需要进行多中心试验,并在整个工作流程中进行强化和标准化的质量控制。尽管MRI 影像组学的分析存在一些不足,但其作为一种先进的定量分析方法,在MCI 的诊断、发展预测方面具有巨大的潜力,随着人工智能和医疗大数据时代的到来,MRI 影像组学将会得到更大的发展,为MCI 的精准医疗做出贡献。
作者利益冲突声明:全体作者均声明无利益冲突。