APP下载

18F-FDG PET 图像联合可解释的深度学习影像组学模型对原发性帕金森病和非典型性帕金森综合征的鉴别诊断

2024-04-15李晨阳王晨涵王静焦方阳徐蒨张慧玮左传涛蒋皆恢

中国医学影像学杂志 2024年3期
关键词:解释性队列组学

李晨阳,王晨涵,王静,焦方阳,徐蒨,张慧玮,左传涛*,蒋皆恢,3*

1.上海大学生命科学学院生物医学工程研究所,上海 200444;2.复旦大学附属华山医院 PET 中心,上海 200235;3.核医学与分子影像四川省重点实验室,四川 泸州 646000;*通信作者 蒋皆恢 jiangjiehui@shu.edu.cn;左传涛zuochuantao@fudan.edu.cn

原发性帕金森病(primary Parkinson's disease,IPD)是常见的神经退行性疾病之一[1],其临床表现与非典型性帕金森综合征(atypical Parkinson's syndrome,APS)如多系统萎缩(multiple system atrophy,MSA)和进行性核上性麻痹(progressive supranuclear palsy,PSP)基本重叠,误诊率达20%~25%,此类患者初步诊断为IPD后又证实为MSA或PSP[2]。尽管目前已有多位学者进行广泛研究,但在临床上IPD准确诊断仍然具有挑战性[3]。因此,在制订此类疾病治疗与诊断策略的同时,设计一套可解释的分类预测模型挖掘影像生物标志物具有重要临床意义。

PET是一种非侵入性神经影像技术,基于不同靶点的显像剂,在可视化帕金森病患者脑内病理生理变化方面发挥关键作用[4-5]。目前可用的PET显像剂中18F-FDG具备早期检测神经退行性异常的潜力[6],在临床实际应用中可获得性最佳。人工智能计算机辅助诊断的出现使影像组学和深度学习(deep learning,DL)方法在该领域广泛应用[7-8]。然而,这两种模型具有各自的优缺点。影像组学方法可以提取可解释的影像标志物,但需要先验知识并对感兴趣区(ROI)和特征提取进行手动编码,操作烦琐[9-11];DL方法在实现高精度分类与预测任务上表现出色,但其特征缺乏可解释性,临床医师很难利用合适的DL特征作为影像标志物[7]。因此,迫切需要一种替代方法弥补传统方法可解释性和模型可重复性的差距。

本研究拟采用一种新提出的可解释的深度学习影像组学(interpretable deep learning radiomics,IDLR)模型探究和挖掘影像生物标志物。该模型能够利用影像组学特征指导和监督DL特征的筛选,从而保持DL方法固有的分类和预测精度,同时使DL特征具有影像学上的可解释性,进而验证IDLR模型在18F-FDG PET图像中对IPD和APS的鉴别诊断潜力。

1 资料与方法

1.1 研究对象 本研究为横断面研究,纳入2015年3月—2023年2月复旦大学附属华山医院帕金森病PET成像基准(HPPI)数据库内的330例受试者,包括IPD 211例[男131例、女80例,平均年龄(60.1±7.6)岁]、PSP 59例[男39例、女20例,平均年龄(64.7±6.9)岁]、MSA 60例[男31例、女29例,平均年龄(58.5±6.2)岁]。纳入标准:①根据相关诊断标准确诊为IPD与APS[12];②无脑炎或精神安定药物治疗等已知致病因素病史,无痴呆、核上凝视异常或共济失调;③临床数据的可用性。所有受试者随机分为2个队列,队列1为训练组(270例),用来构建不同的分类模型与特征筛选;队列2为测试组(60例),用来评估模型与分类效果。所有受试者由2名运动障碍高级研究人员进行筛查和临床检查,接受帕金森病临床量表评估和显像,包括Hoehn-Yahr分级量表(H&Y)和统一帕金森病评定量表(unified Parkinson's disease rating scale,UPDRS)[13]。本研究经本院伦理委员会批准[〔2013〕临审第(336)号]。

1.2 检查方法 使用GE 3.0T MR750扫描仪,不限时扫描,信号漂移率约为0.03%;图像重建速度13 000幅/s,视野45 cm,磁场均匀度0.5 ppm。受试者在检查前至少禁食6 h,在静息状态下采用西门子Biograph 64 HD PET/CT系统以3D模式定位。18F-FDG由复旦大学附属华山医院制备,放化纯>90%。受试者静脉注射185 MBq18F-FDG后休息60 min,随后行10 min PET扫描。最后使用有序子集最大期望值迭代法重建图像[14]。

1.3 图像预处理 所有图像采用统计参数图进行预处理,使用适当的变换参数将PET图像在空间上归一化到蒙特利尔神经研究所(MNI)空间。为了提高信噪比,空间归一化的PET图像使用8 mm各向同性高斯核进行平滑。所有18F-FDG PET图像均基于全局皮质摄取进行计数归一化和标准化,并以全部小脑作为参考区域计算全局淀粉样蛋白-PET标准化摄取值比值(standardized uptake value ratio,SUVR)。

1.4 IDLR模型工作流程 本研究提出的IDLR模型包括4部分(图1):①特征提取,由影像组学提取器[9,16]及3D深度神经网络提取器[17]组成;②特征筛选/融合,计算DL特征和一组筛选后16个关键影像组学特征的相关系数,与这些关键影像组学特征显著相关(P<0.01)的DL特征保留为IDLR特征;③特征可解释性分析,在模型的最后一层卷积层上使用Grad-CAM类激活图[18]加权与平均,生成切片热力图;④诊断/分类预测模型,筛选后的可解释特征构建不同的分类模型以评估性能。

图1 IDLR模型工作流程。Grad-CAM为梯度加权类激活图,SVM为支持向量机

1.5 二分类与对比实验 为证实IDLR模型的性能优越性,本研究与两种已提出的传统模型(Wu等[9]的影像组学模型和Sun等[15]的DL模型)进行比较分析。影像组学模型使用影像组学特征与支持向量机(support vector machine,SVM)结合作为分类器建立,而DL模型直接采用3D-ResNet残差网络作为分类器建立,并采用帕金森病脑区划分ROI的SUVR特征构建图像平均体素的分类器。这些分类模型均以队列1为训练组,在队列2中进行独立测试。机器学习与DL模型均采用10折交叉验证的训练和验证,使用受试者工作特征(ROC)曲线与分类评估指标(准确度、敏感度、特异度)评价模型的分类精度与性能指标。

1.6 模型可解释性 为增强DL模型学习表示的可解释性,并解释DL特征,本研究首先对筛选后的IDLR特征进行相关性分析,使用Grad-CAM应用于每个疾病种类的图像切片,为每种疾病的部分病例图像生成切片热力图,提供从Grad-CAM导出的特征重要性值,从而形成区域式热力图。特定位置的重要性表明它们对总估计的贡献,随后与传统影像组学提取的关键ROI[19-20]进行对比,更好地了解特定预测的关键大脑区域。

1.7 统计学分析 采用SPSS 24.0与R 4.3.2软件。符合正态分布的计量资料以±s表示,多组间比较采用单因素方差分析;计数资料以例数表示,采用χ2检验比较。不同ROC曲线下面积比较采用Delong检验。P<0.05为差异有统计学意义。

2 结果

2.1 一般结果 2个队列受试者的人口统计学信息见表1。2个队列各组受试者年龄差异有统计学意义(P<0.05),性别差异无统计学意义(P>0.05)。2个队列H&Y评分差异有统计学意义(P<0.001);队列1中UPDRS评分差异无统计学意义(P=0.895),队列2中差异有统计学意义(P<0.001)。

表1 2个队列受试者的临床资料比较

2.2 分类结果分析 IDLR方法在队列1区分MSA与IPD、MSA与PSP、IPD与PSP组间两两分类中均具有较好的分类和诊断性能,具有高准确度、敏感度和特异度(准确度均>0.83,敏感度均>0.88,特异度均>0.81),见表2。在队列2中,IDLR方法也具有较好的分类效果(图2),AUC最大,在IPD/MSA/PSP组间两两分类的精确性均显著提升(MSA与IPD 0.935 7,MSA与PSP 0.975 4,IPD与PSP 0.982 5),优于传统影像组学与SUVR模型(Z=1.31~2.96,P均<0.05;Z=1.22~3.23,P均<0.05),相较于DL模型准确度略有提升,但差异无统计学意义(Z=0.55~0.93,P均>0.05)。

表2 队列1中4种模型区分不同疾病的性能(±s)

表2 队列1中4种模型区分不同疾病的性能(±s)

注: MSA为多系统萎缩,IPD为原发性帕金森病,PSP为进行性核上性麻痹,SUVR为标准化摄取值比值,IDLR为可解释的深度学习影像组学,DL为深度学习

模型MSA与IPD MSA与PSP IPD与PSP准确度敏感度特异度准确度敏感度特异度准确度敏感度特异度SUVR模型 0.74±0.09 0.72±0.05 0.69±0.01 0.65±0.11 0.82±0.05 0.79±0.01 0.74±0.18 0.62±0.04 0.77±0.10 0.81±0.17 DL模型 0.88±0.14 0.91±0.03 0.77±0.11 0.81±0.11 0.72±0.13 0.88±0.02 0.86±0.12 0.83±0.02 0.79±0.04 IDLR模型0.94±0.02 0.88±0.03 0.97±0.05 0.83±0.08 0.92±0.01 0.89±0.03 0.98±0.02 0.94±0.03影像组学模型0.79±0.02 0.75±0.08 0.69±0.11 0.75±0.08 0.68±0.02 0.81±0.05 0.94±0.03 0.69±0.06 0.76±0.02

图2 队列2中4种模型区分不同疾病的ROC曲线。A为MSA与IPD;B为MSA与PSP;C为IPD与PSP;PSP为进行性核上麻痹;MSA为多系统萎缩;IPD为原发性帕金森病

2.3 模型可解释性分析 本研究计算DL特征与16个关键影像组学特征的相关性,筛选后的IDLR特征通过强相关映射回对应的ROI(图3),随后使用Grad-CAM方法在队列2中显示每种疾病分别生成的平均相关热力图(图4)。当IDLR模型在疾病组间两两区分时,大脑区域和高维图像特征Grad-CAM强调的显著特征位置与映射的帕金森病脑区ROI中部分关键影像组学特征的位置密切相关。这种对齐强调了IDLR模型的可解释性和这些关键影像组学特征空间分布的一致性。

图3 16个关键影像组学特征监督筛选后的IDLR特征映射的脑区ROI

图4 队列2中IDLR模型在影像组学特征筛选后关键特征的脑区ROI分布,每列为不同疾病组间Grad-CAM可解释性图像切片热力图。PSP为进行性核上性麻痹,MSA为多系统萎缩,IPD为原发性帕金森病

3 讨论

本研究提出一个IDLR模型与流程框架,利用18FFDG PET图像评估其对IPD和APS进行分类的临床适用性。本研究的模型利用深度神经网络提取器(3DResNet)的功能提取特征,在16个关键影像组学特征指导下选择IDLR特征。该方法不仅提高了分类和预测的准确度,而且保证了DL特征的可解释性。

3.1 IDLR模型的性能优越性 本研究利用影像组学特征的监督与指导提取IDLR特征,这些特征有望成为临床实践中有价值的影像标志物。目前多项研究基于FDG PET图像利用人工智能技术对APS进行鉴别诊断及挖掘相关影像标志物:Hu等[21]使用一种基于多变量影像组学模型在18F-FDG PET图像上对PD与MSA进行分类诊断,但数据量样本较小且流程较烦琐;Matthews等[22]使用多种机器学习分类器的方法基于FDG PET图像寻找帕金森病的影像标志物,但由于机器学习缺乏可解释性,辅助临床医师判断的说服力不足。本研究提出的IDLR模型旨在保证其高精度分类疾病的同时简化工作流程并解释模型,在分类实验中具有最高的分类精度,并超过传统影像组学和DL模型。其性能优越的原因如下:①巧妙地整合了影像组学和DL方法,充分发挥其优势提高整体性能;②通过采用影像组学特征作为指导框架消除冗余信息,保留最相关和最丰富的相关特征;③通过将IDLR特征、临床量表和影像组学特征协同整合到分类过程中,有效解决欠拟合问题,并简化传统方法分割等工作流程。这种综合方法有助于模型在分类任务中表现出色。

3.2 IDLR模型特征与脑区的相关性 本研究发现IDLR模型通过评估DL特征和16个关键影像组学特征的相关性,筛选出IDLR特征中的大多数与来自大脑内不同ROI的2个或多个关键影像组学特征呈高度相关,表明IDLR特征能够封装多个脑区的多样化高维度特征,从而解决传统影像组学方法中分类不平衡和获取影像参数异质性高的问题。此外,本研究选择的大多数IDLR特征映射回的脑区位于与既往IPD疾病相关研究一致的区域,如运动区域、内侧额上回、枕上回、枕中回与枕下回[23]。一方面,内侧额上回、枕回与相关运动区域是受到早期IPD相关神经环路功能障碍影响的脑区,也是基底神经节和双侧运动网络受到疾病影响易产生损伤的区域[24];另一方面也表明IDLR特征可以全面捕获来自多个脑区的各种有临床价值的信息,从而减少对仅从特定ROI脑域提取的传统影像组学特征的过度依赖。

3.3 IDLR模型的可解释性探索 本研究深入探索了模型的可解释性。Grad-CAM可解释性图像切片热力图突出显示的区域表明,本研究的IDLR模型在不同疾病组分类分析过程中识别出的不同可解释学习区域能够与各大脑区域相关联,与既往研究结果一致[25],证实了本研究模型可解释性的可靠性和一致性,并证明了其与该领域已建立的研究保持一致的能力。

3.4 本研究的局限性 ①主要集中于单一模态的18F-FDG PET成像数据,而MRI具有较好的脑部成像能力,且目前PET/MRI在中枢神经系统疾病的运用逐步增多,未来可探索更多成像模式中该方法的可解释性;②DL训练组和测试组可纳入更大的数据量,以提高研究的可信度;③测试组每个队列均构建了不同的分类模型,同样需要额外的测试彻底评估模型的可推广性和稳定性。

总之,IPD与APS的鉴别诊断具有重要临床意义。本研究提出18F-FDG PET图像结合可解释的深度学习影像组学方法构建的IPD与APS分类诊断模型,显著提升了传统计算机辅助诊断方法的分类精确度,为后续挖掘影像标志物提供了新的思路。

猜你喜欢

解释性队列组学
论行政自由裁量的“解释性控权”
队列里的小秘密
基于多队列切换的SDN拥塞控制*
口腔代谢组学研究
在队列里
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
英汉互译中的认知隐喻翻译探究
丰田加速驶入自动驾驶队列
融媒体时代解释性报道的发展之路
非解释性宪法适用论