机器学习在辅助检测神经退行性疾病中的研究进展
2022-05-28张元元杜科均屈直闯树海峰余思逊
张元元,杜科均,屈直闯,树海峰,余思逊
1.西南交通大学 医学院,四川 成都 610031;2.西部战区总医院 神经外科,四川 成都 610083
引言
神经退行性疾病的显著特征是大量神经元丢失且不可逆转,如帕金森病、癫痫、阿尔茨海默病等。随着全球人口老龄化问题的加重,这类疾病越来越普遍,为全球医疗、公共卫生和社会带来诸多问题[1]。
神经退行性疾病的传统诊断方式是由医生对病灶的影像表现综合分析后得出结论,其流程复杂、耗时、主观性强,且发生机制的复杂性和患者群体的异质性为诊断和治疗带来严峻挑战[2]。近年来,神经影像技术的发展和人工智能技术的日趋成熟,各种计算机辅助诊断模型大量应用到神经影像数据的定量分析中,加上磁共振成像(Magnetic Resonance Images,MRI)的无创性、低成本、空间分辨率高等特点,可以准确识别大脑组织结构和功能代谢异常等信息的改变[3]。因此,基于影像组学的机器学习和深度学习在神经退行性疾病的筛查、诊断、预后评估中扮演越来越重要的角色,其能量化、精细、客观地分析大脑内部组织结构的异常,在解决传统MRI扫描过程中所面临的不易观察病灶及检测病灶特征性变化等诸多方面展现出了明显的优势[4-5]。本文主要基于MRI影像组学的机器学习在辅助检测神经退行性疾病中的研究进展进行综述,并展望进一步改善机器学习的其他可能性相关方法,以便为后续神经退行性疾病的相关治疗研究提供依据。
1 影像组学与机器学习的具体流程
“组学”一词最早从分子生物学领域兴起,包括基因组学、蛋白组学、免疫组学、超声组学、影像组学等。其中,影像组学是一种大数据分析方法,即把传统医学影像中的一些肉眼无法识别的图像特征转换为高维的可识别的特征空间,然后利用机器学习和深度学习的方法进行统计学分析,最终建立具有诊断价值、预测价值的模型,辅助医生决策[6]。2012年由Lambin等[7]首次提出影像组学概念,在肿瘤领域率先发展,2020年全年影像组学相关的论文多达千余篇,可见影像组学在整个医疗领域的迅猛发展趋势。
传统影像组学主要强调通过从不同模态影像中高通量地提取特征并进行数据挖掘,如基因与分子标记、病理分型、临床决策和疗效监测等,增加机器学习的主要目的是建立模型,以使准确率提高且得到的结果也相对更加直观。基于影像组学的机器学习的优势在于可根据患者病史、分子特征和成像信息,识别更具体的生物标志物进行诊断,同时还可减少执行临床试验所涉及的时间和成本[2]。具体步骤如图1所示:① 采集图像:识别和整理大量具有相似临床参数的图像数据示例;② 图像分割:手动或自动在图像中分割出感兴趣区域(Region of Interest,ROI);③ 特征提取:提取一阶特征、二阶特征和高阶特征[8-9];④ 数据库的预处理:选择具有代表性的特征数据后,进行机器学习建立模型;⑤ 训练分类器:通过训练分类器分析和预测这些高维信息,从而达到较高准确率。机器学习分两类,即监督机器学习和无监督机器学习,区分方法为是否含有预测标签。无监督机器学习常用方法有分层聚类;监督机器学习常用方法有线性回归、神经网络、深度学习、随机森林、支持向量机等。
图1 基于影像组学的机器学习的具体步骤
以鉴别肿瘤类型和良恶性为例,Yin等[10]对脊索瘤、骨巨细胞瘤和骨转移瘤进行特征分析,通过回归算法筛选特征构建分类模型,联合T2加权序列和增强T1加权序列构建三分类模型,准确率为0.711。在神经成像中具有代表性的是基于支持向量机分类帕金森病患者的特征子集和预测疾病进展来创建放射组学特征,曲线下的面积达到0.836[11]。由此可见,影像组学的数据分析离不开机器学习的发展,更需要“医”“工”二者同时深入融合和发展,发挥结合优势以取得成功。
2 机器学习在两类代表性神经退行性疾病中的应用
下文针对癫痫和帕金森病两种代表性疾病,总结了机器学习在诊断与鉴别、预测和量化等方面的应用。
2.1 癫痫病灶的诊断与鉴别
局灶性皮质发育不良(Focal Cortical Dysplasia,FCD)是一种不易观察特征的皮质发育畸形,其由大量神经元、胶质细胞的异常增生和迁移导致。2011年国际抗癫痫联盟将FCD分为FCDⅠ、FCDⅡ、FCD Ⅲ三种类型,主要临床表现为药物难治性癫痫,手术切除是治疗的主要方法[12]。但FCD的常见特征不会全部在MRI中表现出来,如皮质厚度异常、脑沟形态异常,以及灰、白质交界处模糊等,因此不易观察病灶的具体位置和表现。为解决这一难题,可引入机器学习对成年患者进行FCD检测,通过两步贝叶斯分类器从MRI中提取出不同特征进行分类训练[13]。但儿童的大脑尚未完全发育,存在与成人大脑结构不完全一致的情况。根据独立性假设的条件——变量对类标签的贡献是独立的,因此引入一种成本低、准确性高的改进版本。该系统结合形态测量特征和MRI序列上的灰度共生矩阵进行纹理分析(表1):应用3个MRI序列组合能提高算法性能,在正确区分出所有健康受试者的同时,其对MRI阳性病例的主观敏感度达到97%,MRI阴性病例达到70%[4]。除了手动进行病变检测外,Jin等[14]的研究利用基于表面的MRI形态测量和机器学习在Ⅱ型FCD患者的混合队列中进行自动病变检测,用组织学证实的海马硬化症来评估方法的特异性,计算相应特征并将其融入非线性神经网络分类器中,对分类器进行训练以识别病变聚类。这种方法的优势在于通过对接收机工作特性的分析,优化了分类器输出概率图的阈值,最终灵敏度为73.7%。上述研究说明机器学习辅助基于表面的MRI形态测量具有优越性能,是在耐药癫痫患者术前评估中提高FCD检测效率的一种有价值的工具。
表1 机器学习在神经退行性疾病诊断中的应用
近年来,癫痫患者患精神共病的风险增加[19],有研究对所研究癫痫患者进行神经精神访谈时,用N-grams和语言查询及字数词类构建机器学习分类模型并以此检测患者自杀倾向,使用接收机工作特性曲线下的区域来测量性能,最终结果达到57%~78%。该结果提示当传统方法不适用时,可以考虑口语的机器学习分析[15]。
2.2 帕金森病的早期预测和程度量化
帕金森病(Parkinson’s Disease,PD)的发生机制主要是多巴胺能神经元进行性丧失,研究表明约60%多巴胺能神经元显著减少时,患者才会出现运动迟缓和姿势不稳等临床特征[20-21]。因此对PD的早期筛查干预和神经保护尤为重要。有研究处理11个不同的训练和测试数据并将从中获得的数据与统计数据进行比较,发现使用随机森林分类器的测试结果准确率可达到85.81%,说明随机森林算法是PD的良好分类器[22]。
早期预测研究根据霍恩-亚赫尔量表的测量结果,纳入基于全脑白质和临床特征的影像组学模型,根据患者序列号将整个数据分为训练集和测试集,再结合影像组学特征和临床进展评分构建联合模型。该模型对1期PD的预测准确率为82.7%,对2期PD的预测准确性为85.4%[16]。近年来,随着智能手机的快速发展,许多PD患者的运动症状非常适合用智能手机进行客观测量[23],该方法规避了传统式主观并依赖评分者测量的缺点;后续研究建立了PD严重程度的客观测量方法,评估了参与者在智能手机应用程序中完成5项任务(语音、手指敲击、步态、平衡和反应时间)的数据,得到步态特征贡献最大(33.4%)的结论。该研究利用新的机器学习方法,创建并验证了采用智能手机客观评估PD严重程度的方法及其有效性,这些评估有助于改善临床护理和新疗法的开发[17]。
除了早期预测和程度量化外,还可以采用多学科方法,利用来自不同机构的临床、人口统计学和神经影像学数据调查PD患者的跌倒情况,然后用机器学习的方法构建预测模型,预测的可靠性通过5折交叉验证和外部验证进行评估,最终准确率达70%~80%[18]。
3 机器学习新领域——深度学习在神经退行性疾病中的应用
深度学习是一种模仿大脑神经元传递过程来分析数据(即人工神经网络研究)的特殊机器学习方法,在医学成像如口腔肿瘤组织病理预后的提高和心血管医学的电生理指标中,应用卷积神经网络、深度信任网络等模型训练每层神经元,最后使用算法进行调优[24-25]。其最大特点是可以自主从图像中提取复杂的层次特征,进而对大量数据进行训练得到满意的结果,这种训练分类器的优势在于避免了经典机器学习算法的局限性,性能也大大提升[26]。
通过评估6种机器学习算法和深度学习算法在同一样本中使用相同功能性磁共振成像的特征,预测神经性疾病的临床改善状态,得出使用深度学习方法比浅层机器学习方法更能预测症状的改善,并且深度学习的准确率高达70%[27]。将深度学习和标准机器学习用于脑成像数据分析,结合结构MRI图像进行大规模的系统比较,结果表明按照传统的深度学习实践进行训练时,深度学习具有更好的伸缩性和显著的改进,在相对计算时间上也呈现出更低的渐近复杂性,进一步说明深度学习可以利用这些数据来生成卓越的任务区分以表征人脑[28]。此外,在量化组织萎缩的研究中,需要对脑组织进行分割和相应的测量[29],其中颅骨剥离是关键预处理步骤,对基于机器学习和深度学习的颅骨剥离技术进行对比发现,深度学习的颅骨剥离算法比传统的颅骨剥离算法准确率显著提高[30]。
阿尔茨海默病严重影响老年人的生活质量,也是最常见的神经退行性疾病。如表2所示,Liang等[5]研究提出了一种基于弱监督机器学习的深度学习框架,该框架由一个具有注意力机制的骨干网络和一个可同时进行图像分类与图像重建任务的网络组成,利用有限的注释对阿尔茨海默病进行识别和分类。在两个脑MRI数据集(2D MRI和3D MRI数据)上使用仅20%的标签进行微调,最终准确率达到99.69%。早期预测癫痫发作可以更好地改善患者的生存质量和治疗效果。有研究提出了4种深度学习模型来提取最具区分性的特征,利用卷积神经网络从不同的头皮位置提取显著的空间特征,并利用递归神经网络比现有方法更早地预测癫痫发作的发生率,提高了分类精度并缩减了预测时间,最终准确率达到99.60%[27]。
表2 深度学习在神经退行性疾病诊断中的应用
4 总结与展望
综上所述,传统诊断模式在很大程度上依赖神经外科医师的主观判断,而机器学习从输入的数据中学习特定的规则和见解,用计算机模拟和实现人类学习行为,利用经验改善系统自身性能后,对未知数据进行筛查和鉴别,并利用以深度学习为代表的卷积神经网络自适应、自学习的强大信息处理能力,决定了其在图像识别和辅助诊断中能够得到较高准确率。
虽然使用计算机辅助诊断技术大大改善了传统神经外科医生的诊断模式,但目前研究还有一些局限性:① 在常规采集的图像中,不同成像设备、成像参数、运动伪影等会使特征结果的可重复性降低,未来的研究应着重如何指定标准化指南来规范操作;② 手动划分ROI难以实现自动化大数据集分析;③ 可供研究的病例数目较少,深度学习的训练数据集也相对较小,算法结构基于监督学习,需要人工大规模数据处理信息标签,分类器的使用也相对单一,未来研究可扩大样本量、尝试使用多种分类器并提高结果可信度;④ 儿童属于特殊群体,配合度差,采集高质量的影像数据难度较大,给影像组学的进一步开展带来了困难。现在专门针对儿童的神经退行性疾病的影像组学相关文章较少。相信随着人工智能和机器学习方法的不断进步,其在神经退行性疾病研究领域可以发挥更大的作用。