基于多模态影像的机器学习与深度学习在帕金森病诊治中的应用进展
2024-01-20熊金华
熊金华,席 芊
(同济大学附属东方医院医学影像科,上海 200120)
近年来,随着人工智能(artificial intelligence,AI)技术的发展,AI在医学数据分析和神经影像自动化诊断研究中的应用日益广泛。机器学习是目前AI实现的主要方法,能够提取PD患者脑结构或功能的形态学特征,从而进一步挖掘出与疾病过程直接相关的有效病理信息。机器学习方法通过对全脑影像特征进行特征选择及模型构建,实现了PD的自动分类及预测。深度学习是机器学习的子领域,其主要研究方法为卷积神经网络(convolutional neural network,CNN),可应用于帕金森磁共振(magnetic resonance imaging,MRI)图像的计算机辅助诊断,实现网络提取特征的可视化,有助于深入了解帕金森脑部影像诊断特征。本文将综述机器学习与深度学习在PD早期诊断、分型及预测中的应用。
1 机器学习与深度学习
机器学习是发展相对成熟的AI技术,可以进一步分为监督学习和无监督学习。其最流行模型包括支持向量机(support vector machines,SVM)、随机森林(random forest,RF)及人工神经网络(artificial neural network,ANN)。SVM已成为一种广泛使用的分类工具,SVM使用标记数据通过训练步骤生成最佳超平面,超平面最优地将数据分成不同类型[12]。RF由Breiman[13]引入,是一种集成算法,将多个弱分类器组合,通过对弱分类器进行投票或平均得到最终结果,从而达到更高的准确率和泛化性能。ANN由相互连接的人工神经元组成,通过数学表达式模拟神经元之间的信号传输,从而建立和可视化输入和输出之间的非线性关系。
深度学习是机器学习的一个子领域,是使用特定架构的监督机器学习方法,其优势在于可扩展性,很大程度上取决于自动提取相关特征的能力[14]。深度学习包含CNN、迁移学习及生成性对抗性网络。CNN由多层感知器演化而来[15]。CNN有多层卷积和激活,能够形成输入数据的高效表示[16]。迁移学习是一种将知识从一个域(源域)转移到另一个域(目标域),以在目标域中获得更好学习效果的深度学习方法。生成性对抗性网络是由Goodfellow等[17]提出,是近年来复杂分布无监督学习最有效的方法之一[18]。
2 基于神经影像标志物早期诊断PD
2.1 基于病变脑区早期诊断PD
PET和SPECT成像大量用于神经退行性疾病的诊断,已成为PD早期检测多巴胺变性和测量PD过程进展速度的客观工具[19]。多巴胺神经元的缺失主要集中于黑质致密部的尾部和外侧区,而其中的黑质小体-1区(nigrosome1,N1)是PD患者病理生理变化的潜在成像生物标志物[20]。Shin等[21]采用基于区域的物体检测方法和CNN模型YOLOv3检测N1区域并对其异常进行准确分类,结果表明识别和评估磁敏感加权MRI上的N1区域是可行的,表现出很高的诊断性能。Piccardo等[22]首次基于AI技术,开展了利用18F-DOPA PET/CT识别患者黑质纹状体变性影响的研究,测试了3D CNN模型在识别突触前多巴胺缺陷患者方面的诊断准确性,发现该模型具有非常高的灵敏度和特异性。
除了基于黑质纹状体变性早期诊断PD外,利用MRI数据还能观察出其他大脑区域受这种疾病的影响。Sateesh等[23]提出基于MRI的递归特征消除(recursive feature elimination,RFE)的元认知径向基函数网络(meta-cognitive radial basis function network,McRBFN)分类器来识别PD关键脑区,McRBFN分类器从MRI中提取基于体素的形态学测量(voxel based morphometric,VBM)特征,并采用基于投影的学习(projection based learning,PBL)算法,结果显示PBL-McRBFN分类器对PD预测具有较好的泛化性能,PBL-McRBFN-RFE选择的特征提示颞上回灰质缺失可能是PD发病的原因。Esmaeilzadeh等[24]基于三维MRI图像,使用CNN,同时将患者的年龄和性别特征也用于训练,发现在验证和测试集上取得了100%的准确率,同时创建的PD诊断的脑热图首次发现右脑顶叶上部分在PD诊断中也是非常重要的。
2.2 基于脑结构成像早期诊断PD
VBM是一种在体素水平对脑MRI影像进行分析的技术,能显示局部大脑灰质、白质密度和体积的改变,在PD研究中广泛应用[25-26]。Takahashi等[27]使用磁敏感定量图像(quantitative susceptibility mapping,QSM)和神经黑色素成像来评估PD,提出VBM的自动感兴趣区(region of interest,ROI)选择方法,获取黑质致密带的QSM值和神经黑色素值,结果显示PD组QSM值显著高于健康受试者(healthy controls,HC)组,PD组神经黑色素值明显低于HC组。Peng等[28]使用基于多级ROI特征来检测PD中敏感的形态计量生物标志物,将低级ROI特征(灰质体积、皮质厚度等)和高级相关性特征(ROI之间的连通性)整合起来构建多级ROI特征,基于特征选择和多核支持向量机的分类算法在PD与HC分类上表现良好,准确率为85.78%,特异度为87.79%,灵敏度为87.64%。
与灰质与白质的形态学差异研究不同,扩散张量成像(Diffusion Tensor Imagings,DTI)能够测量组织中水分子沿指定方向地随机运动,是一种表现组织微观结构的无创方法,目前广泛用于神经退行性疾病的研究[29-31]。Ramirez等[32]开发并评估了基于自动编码器模型,从全脑DTI数据中提取平均扩散系数及局部各向异性分数,根据图像体素重建误差的强度和定位来衡量区分HC和PD患者的能力,ROC曲线作为分类问题的性能测量,发现AUC较高的结构是黑质、红核、丘脑和所有皮质下结构的组合。
2.3 基于脑功能成像早期诊断PD
静息态功能磁共振成像是一种广泛使用的神经成像工具,可在没有任何受控实验方式的情况下测量整个大脑的神经血氧水平依赖信号的自发波动[33]。Tang等[34]根据血氧水平依赖信号的静息波动来预测帕金森病的存在,SVM能够在个体水平上进行预测,与HC相比,PD患者双侧舌回和左壳核的低频振幅发生改变,右侧小脑后叶的比率低频振幅发生变化。Rubbert等[35]发现基于模型、数据驱动的方法来区分PD与HC是可行的,在使用全关联方法分析全脑功能连接时表现出最佳的区分效果。与功能磁共振成像技术相比,SPECT是通过核素标记的分子成像技术,可以实现可视化和量化大脑的功能和代谢[36]。Rumman等[37]使用图像处理和人工神经网络对PD和HC进行对比,使用帕金森病进展标志物计划数据库中SPECT图像,进行后处理以找到尾状核和壳核的ROI,然后将ROI的面积值馈送到模拟人类模式识别的人工神经网络,对患有和不患有帕金森病的受试者进行分类,准确率达到94%,灵敏度为100%,特异度为88%。
2.4 基于脑网络连接早期诊断PD
已有研究表明,人脑网络的结构信息可以反映人脑的活动模式,而大脑疾病患者的活动模式往往与健康人群不同,并且复杂网络已在一些神经影像中得到有效应用。Amoroso等[38]提出了基于复杂网络的方法,利用MRI数据进行早期诊断,首先定义大脑区域的网络模型,并将每个区域的适当连接措施关联起来,每个大脑都通过一个特征向量来编码大脑区域相互交织的局部关系,RF进行特征选择和学习紧凑的表示,SVM将复杂的网络特征与PD前驱期的典型临床评分相结合,结果显示结合脑网络特征和临床评分能获得最佳诊断性能,ROC曲线下面积(area under curve,AUC)为0.97±0.02,准确率高达93%±4%。
2.5 基于影像组学早期诊断PD
影像组学是一门新兴的放射学领域,通过高通量计算,可以从断层扫描图像中快速提取无数的定量特征,将数字医学图像转换为可挖掘的高维数据[39]。Liu等[40]提取PD患者与健康受试者T1WI图像中尾状核和壳核的影像组学特征,并构建logistic回归模型,分析出PD患者尾状核和壳核的纹理值显著高于对照组,提示基于T2WI图像的新纹状体放射组学特征对PD具有良好的诊断性能,具有作为PD诊断标志物的潜力。Shu等[41]基于T1WI中全脑白质的影像组学特征、人口统计学特征及临床非运动症状作为预测因子,使用机器学习方法来构建模型,研究发现影像组学标志物在这些独立预测因子中具有最高的诊断效力,在识别早期PD患者方面表现出良好的性能。
3 PD分类研究
3.1 姿势不稳和步态困难亚型(PIGD)与非PIGD亚型的区分研究
帕金森病中姿势不稳和步态困难亚型(postural instability and gait difficulty,PIGD)患者是临床实践中的难治性挑战。尽管之前已经尝试研究PD人群中亚型特异性大脑改变,但仍然缺乏关于PIGD亚型患者的决定性神经影像学生物标志物。Gu等[42]首次引入基于机器学习的自动分类,在个体水平上区分PIGD亚型和非PIGD亚型患者,将PD患者结构和功能MRI数据集中显著变化的区域设置为ROI,用于亚型的特异性特征提取,使用SVM算法构建分类器,并使用灵敏度、特异度、准确性、测量AUC值和个体的指标评估其性能,该分类器显示出92.31%的诊断准确率,与临床分类的鉴别诊断几乎完全一致。
3.2 PD伴轻度认知障碍(PD-MCI)与不伴MCI(PD-nonMCI)的区分研究
3.3 帕金森病与非典型帕金森综合征的区分研究
进行性上核麻痹(progressive supranuclear palsy,PSP)、多系统萎缩(multiple system atrophy,MSA)与PD经常具有相同的临床特征,特别是在早期阶段,如何有效的进行区分对于临床管理十分重要。Zhao等[44]开发出了3D深度残差CNN,用于特发性帕金森病(idiopathic Parkinson’s disease,IPD)和非典型帕金森综合征的早期自动鉴别诊断,具有明显帕金森特征的患者接受18F-FDG PET成像,该网络对PSP、MSA与IPD的诊断的特异度及灵敏度都很高。Shinde等[45]使用CNN从神经黑色素敏感磁共振成像中创建PD的预后和诊断生物标志物,发现黑质致密部的类别激活图区分PD与非典型帕金森综合征的测试精度达到85.7%。Chien等[46]用ANN处理多巴胺转运体(dopamine transporter,DAT)SPECT图像,发现基于DAT-SPECT图像壳核区域的ANN分类器在区分PD与其他疾病引起的帕金森综合征方面优于经典生物标志物。
4 PD运动与认知功能的预后预测
除了在PD的早期诊断及分类研究外,学者对PD的运动功能进行了跟踪预测研究。DAT-SPECT显像已广泛应用于PD研究,使用放射学特征与非影像学特征对DAT图像进行定量分析,可预测患者的预后。Adams等[47]在不提取特征的情况下,通过CNN,使用基线水平的PD统一评分量表第三部分(part Ⅲ ofthe unified Parkinson’s disease rating scale,UPDRSⅢ)评分与完整DAT图像来预测患者第4年的UPDRSⅢ评分,将预测的评分与患者第4年UPDRSⅢ的实际评分进行10折交叉验证,所有交叉验证的平均准确率达到70.7%±7.7%,证明了CNN应用于图像和非成像特征进行临床预测的可行性。Salmanpour等[48]使用机器学习对帕金森病的运动与认知功能的预后进行了预测,分析患者18项特征(临床特征:第0年与第1年的UPDRS Ⅰ、Ⅱ、Ⅲ评分、年龄、性别、病程;DAT-SPECT成像特点:第0年与第1年壳核及尾状核的摄取)后,创建了32种特征组合,利用局部线性模型树及特征子集选择器算法,以第4年的UPDRSⅢ实际评分为预测结果的衡量标准,得出第0年和第1年的UPDRSⅢ评分是预测第4年运动症状严重程度的高度显著预测因子,同时基于基线水平和第1年时蒙特利尔认知评估量表,采用优化工具、特征子集选择器算法以及各类预测算法的最佳利用,可对患者第4年时的认知结果产生非常好的预测[49]。
深部脑刺激是PD的一种手术疗法,可改善PD患者的运动症状,但治疗效果仍然高度可变,因此对于临床术前决策及预测术后的运动情况相当重要。Liu等[50]基于患者术前QSM图像上黑质的影像组学特征,构建了影像组学联合机器学习的预测模型,发现对术后患者的整体运动和运动僵硬情况有较好的预测性能,且优于常规的术前左旋多巴激发试验反应的模型,表明该预测模型是一种创新实用的方法,可以辅助临床医生的术前决策。
5 结 语
综合以上研究,基于机器学习与深度学习的人工智能技术在PD早期诊断、分类、功能预测中发挥了重要作用。然而,当前研究仍存在一些局限性,如样本量少、规模小、训练集与验证集上数据检验不足等,易产生过拟合现象,可以通过收集更多的训练示例,增加训练数据量来解决。高维神经影像数据中需提取与PD相关性最高的分类特征,并通过特征选择以及添加临床数据改进分类模型,对多模态影像特征进行有效融合。同时PD存在不同的亚型,应深入细化PD的临床症状及病程分期研究、影像与神经病理学演变阶段对应的研究。机器学习与深度学习在PD早期诊断与分类研究中已有许多学者做了很多成熟的研究工作,但对于多模态影像下PD的结构与功能研究尚在发展阶段,同时也是未来研究的趋势。