APP下载

影像组学在神经系统常见非肿瘤性病变中的研究进展*

2023-04-05冯俊榜王光昶李传明何晓静

中国CT和MRI杂志 2023年2期
关键词:组学预测特征

冯俊榜 余 飞 王光昶 李传明 何晓静

1.重庆医科大学附属第二医院放射科(重庆 400010)

2.重庆市急救医疗中心医学影像科(重庆 400014)

3.重庆大学附属中心医院 医学影像科(重庆 400014)

4.成都医学院 大健康与智能工程学院(四川 成都 610500)

中枢神经系统是神经系统的主要部分,包括位于椎管内的脊髓和位于颅腔内的脑。中枢神经系统疾病病种复杂,临床表现多样,多数预后不良[1],严重威胁人们的健康。因此,早期正确的诊断、评估病情对病人的及时治疗和改善预后有很大的帮助。2012年Lambin等[2]首次提出影像组学的概念,其凭借对高通量影像数据信息进行更深层次的挖掘,解析影像与基因和临床信息如分型、疗效和预后等的关联,揭示了影像组学在疾病所有阶段发挥着重要作用,包括筛查、预测、活检检测指导、治疗计划和疗效评估等,对病例实现个性化、精准化治疗提供了巨大的帮助。目前对于神经系统肿瘤,影像组学已经取得较大进展,可以准确诊断,Minjae Kim[3]等人从多参数MRI中提取放射组学特征(n=6472),利用基于机器学习和广义线性模型分类器构建放射组学模型,结果显示多参数MRI放射组学模型预测低级别神经胶质瘤异柠檬酸脱氢酶突变的auc为0.747,肿瘤分级的auc为0.819。但对于神经系统非肿瘤病变,如脑血管性疾病[4]、脱髓鞘疾病[5]及退行性疾病[6,7]等研究关注度较少,具有较大的应用潜力,值得进一步深入研究,本文就影像组学在神经系统常见非肿瘤性病变中的最新研究进展进行综述。

1 影像组学定义及基本原理

影像组学专注于图像分析的改进[8],将用于诊断的图像如CT、MRI、PTE/CT等转化为可挖掘的数据,通过给定成像模式的自动或半自动软件对医学图像数据进行定量分析,使用高通量提取大量的医学图像定量特征,捕捉组织和病变的特性,如形状和异质性等,定量的分析病变的生理病理改变。不同患者可表现出不同的形状、纹理等特征,属于医学图像分析的最后一类创新,可以提供比医生更多、更全的丰富信息。主要有四个步骤:1、图像采集和重建;2、感兴趣区(ROI)分割;3、特征提取和筛选;4、建立预测模型。

1.1 图像采集和重建图像采集和重建是影像组学的基本基础,所有的工作都是在此基础上进行的。通过CT[9]、MRI[10]、PET/CT[11]、PET/MRI[12]等可以获得大量的数据,目前传统的人为分辨具有较大的差异性,且可重复性差,一致性也需进一步提高,不同的医疗机构和扫描参数都可能不同,因此,降低图像参数的差异性、建立标准化的数据库可以带来准确的预测数据。

1.2 感兴趣区(ROI)分割ROI分割[13]是影像组学的关键步骤,因为分割的ROI会生成特征数据。它是将一副图像根据属性分为多个兴趣区域并提取的过程。目前主要有两种方式:一种是人为的进行手动分割[14],但是这种过程比较繁琐、复杂,并且可重复性差,尤其对于高通量数据。另一种是近年来发展起来的半自动[15]或全自动[16]分割方法,Gau K[17]等以人工分割作为参考,比较了半自动(ITK-SNAP)和全自动(lesion_GNB)方法分割在癫痫患者切除的脑区在准确性,结果发现在适度的人工输入的情况下,半自动分割在切除的脑区提供了最准确的结果,因此与手工分割相比是一种可行的替代方法,特别是在大量患者队列的研究中。Layse[18]等开发了一种计算算法应用于磁共振成像自动分割脑肿瘤,结果与手工分割比较以确定算法的有效性,所得分割结果与金标准的相关符合率为89.23%。从目前研究来看,将两种方法有效的结合可提高效率和可重复性,这种方法效率高、可重复性好、应用范围广。

1.3 特征提取和筛选特征提取和筛选[19]是选择最有用的特征来识别图像,并且还要保证可重复性。一般可通过高通量技术从ROI中自动收集特征并提取出来。常用的组学特征分为:第一级,包括语义特征(形状、大小、异常位置、血管化程度、区域浸润等),已广泛应用于临床。第二级与三维图像中最小体积单位[20]的每个体素的定量参数相关联,它以直方图的形式呈现个体体素数值的分布,包块平均值、最大值、最小值、标准差、峰度、倾角、熵等参数。第三级,高阶结构的统计分析,显示了相邻体素之间的关系(相似和对等)。

1.4 建立预测模型特征提取完成之后,可以用多种统计模型来选择在特征提取过程中与假定的结果相关的各种主要特征,以提高预测的准确性。建立影像特征与临床相关的问题的模型[21,22],常用的分类预测模型包括支持向量机(SVM)、随机森林(RF)、K近邻、Logistic回归等。

2 影像组学在脑血管性疾病中的应用

脑血管性疾病作为神经系统常见病和多发病,是截止目前导致人类死亡的三大主要疾病之一,容易留下比较严重的后遗症,也是长期致残率、致死率高的原因,给家庭和社会带来非常沉重的负担。脑血管性疾病主要包括缺血性脑卒中、脑出血、颅内动脉瘤、血管畸形等颅内血管病变,影像组学目前已逐步应用于脑血管疾病的识别、智能分割、特征提取、智能诊断、治疗及预后评估[23]等多个方面。

2.1 影像组学在缺血性脑卒中的应用缺血性脑卒中(Ischemic stroke)[24]是由于脑的供血动脉狭窄或闭塞、脑组织供血不足导致的坏死的总称,由于其高发病率、高致残率、高死亡率而成为目前研究的热点。同时,缺血性脑卒中的诊断和预后高度依赖于影像学提供的信息,因此,有效、快速的开发出准确的诊断模型对临床意义重大。Marta Olive-Gadea等[25]开发的MethinksLVO软件模型在疑似急性脑卒中患者中,可以快速、可靠地识别并预测大血管闭塞,其灵敏度83%,特异度85%。而缺血性脑卒中治疗重点在于恢复灌注不足区血流量,以减少梗死。Tang等[26]分析了来自7个中心的168例患者,基于短期临床标签,采用特征选择方法对456个放射组学特征进行了评价,通过预测急性缺血性中风(AIS)患者3个月的临床结果来验证放射组学nomogram,开发出的基于半暗带量化的放射组学特征(R评分)可作为预后生物标志物,为当前的临床决策过程增加了更多价值,其外部验证数据集的一致性指数(C-index)为0.695[95%可信区间(CI) 0.667-0.723]。此外,预测良好临床预后的放射组学nomogram曲线下面积(AUC)在第7天达到0.886 (95% CI 0.809-0.963),在第3个月达到0.777 (95% CI 0.666-0.888)。W Qiu[27]等以67例ICA/M1 MCA段血栓患者接受静脉阿替普酶治疗为研究对象,从每个血栓的CT平扫和CTA图像中提取326个放射组学特征,采用支持向量机建立分类器,使用10次5倍交叉验证来评估训练分类器的准确性和所选特征的稳定性,结果发现结合NCCT、CTA的放射组学特征与静脉阿替普酶再通的早期相关最好(曲线下面积=0.85),来自CT平扫和CTA的血栓放射组学特征比之前已知的血栓长度、体积和通透性等影像学特征更能准确预测急性缺血性卒中近端闭塞患者静脉阿替普酶再通。耿立娜[28]采用ITK软件及支持向量机、Logistic回归分析、RF随机森林分类器模型对220例急性大脑中动脉梗死区病人的临床资料和DWI资料进行分析,发现用综合影像组学与临床年龄特征的综合模型评估脑梗死的预后效果是最好的。目前,采用影像组学的智能诊断模型已经可以辅助诊断早期卒中患者,实现自动化的临床分流和诊断。

2.2 影像组学在脑出血中的应用脑出血(ICH)是神经系统中常见的急症,原因包括高血压性脑出血、脑外伤、动脉瘤破裂和肿瘤卒中等,是一种高致残致死率的疾病。Zhan[29]等分析了313例小于10ml的小脑出血(ICH)患者的CT平扫图像,采用最小绝对收缩和选择算子算法或多变量分析建立放射组学模型和临床模型,结合放射组学评分和临床因素,建立了一个预测血肿是否扩大的联合模型,该模型对3-10 ml组不良预后的鉴别能力较好(auc为0.720)。Li Hui[30]等收集了258例急性自发性脑实质内出血患者,利用Radiomics软件对基线CT平扫图像进行血肿分割,并提取纹理特征。采用最小冗余和最大相关性(mRMR)和最小绝对收缩和选择算子(LASSO)选择特征子集,计算放射组学评分。所建立的放射组学模型和放射组学nomogram血肿扩大预测模型均具有较好的预测效果,曲线下面积AUC 0.83,0.82,且均优于临床模型AUC 0.66。目前许多研究表明影像组学模型可作为预测自发性脑出血患者血肿扩大的潜在生物标志物,对血肿扩大预测的临床因素具有较高的应用价值。

2.3 影像组学在颅内动脉瘤中的应用颅内动脉瘤破裂是一种高发病率和死亡率的破坏性医学紧急事件,目前越来越多的无症状、未破裂的脑动脉瘤在影像学检查中被偶然发现,一旦发现,这些动脉瘤的破裂风险需要仔细评估,因为手术和血管内治疗都有并发症的风险。影像组学在颅内动脉瘤的应用越来越广泛,对于动脉瘤的识别、破裂风险等方面已有相关报道。Zeng等[31]采用空间信息融合(spatial information fusion,SIF)方法,将深度学习方法应用于三维旋转血管造影(3D rotation Angiography)中颅内动脉瘤的检测,采用二维图像序列代替三维血管模型,最后得到了98.89%的准确率,灵敏度和特异性分别为99.38%和98.19%,证明了SIF特征的可行性和有效性。Podgorsak等[32]人也开发出了一种用于颅内动脉瘤血管造影参数成像分析的自动放射组学特征提取方法。Osamah等[33]对393例CT血管造影(CTA)图像进行放射组学分析,从每个动脉瘤中自动计算出1229个放射组学特征,使用尺寸、形状和Radiomics参数的逐步前向特征选择进行多变量统计分析,系统地减少特征数量,筛选出9个放射组学特征,并建立logistic回归模型,该模型对于的动脉瘤破裂分类在训练和测试队列中的ROC分别为:0.92和0.86,具有较好的表现性能。我们前期提通过全自动提取破裂和未破裂脑动脉瘤的影像组学特征,基于机器学习的方法鉴别破裂和未破裂动脉瘤,其AUC达0.82。影像组学用于动脉瘤特征评估的一个明显优势是,可以方便地使用单个平台(如3D Slicer26)进行整个图像处理、分割和特征测量流程。我们相信Radiomics分析将有潜力成为动脉瘤研究的一种强有力的工具。

2.4 影像组学在血管畸形中的应用脑血管畸形是脑血管先天性、非肿瘤性的异常发育,是指由局部脑血管发育障碍而引起的局部脑血管形态、结构和数量的异常,并影响到了正常的脑血流。虽然影像组学应用较少,但也有研究者将影像组学已经应用到检测和预后评估等多个方面。脑动静脉畸形(arteriovenous malformation,AVM)是由于病变部位的脑动脉和脑静脉之间缺乏毛细血管致使动脉与静脉直接相通,形成动静脉之间的短路,导致一系列脑血流动力学的紊乱。准确描述AVM病灶对于正确的AVM覆盖非常重要,因为这是放射治疗成功的最重要因素;而AVM的弥散性又是评估手术结果和预测出血性风险的重要因素;但是,由于诊断医生经验的不同导致判断的多样性和量化的困难,在识别和判断弥散性方面仍存在较大困难。因此,Jiao等[34]通过对 635例接受TOF-MRA成像的AVM患者进行手动勾画ROI,最终训练出的全自动识别AVM模型的AUC可达0.84,进一步的,研究者采用机器学习的方法来鉴别脑动静脉畸形的弥散程度,其准确度高达0.95,弥散的量化有助于更合理地分配分级系统的分数,并提高其准确性;该研究极大的推进了影像组学在该领域的发展。海绵状畸形是常见的脑血管疾病之一,出血是脑海绵状畸形常见且危险的症状,伽玛刀治疗是目前常用的治疗方式,但是治疗后仍有30%的患者出现再出血。kuo等[35]对经伽玛刀放射治疗的脑海绵状畸形患者进行了一项长期随访的回顾性研究,利用MRI的放射组学来确定可靠的成像生物标志物,以预测伽玛刀放射治疗后再次出血;结果发现将机器学习方法与纵向影像学特征相结合,可以预测伽玛刀放射治疗后的脑海绵状畸形患者的再出血情况,对临床治疗脑海绵状畸形具有重大指导意义。

3 影像组学在神经系统脱髓鞘疾病中的应用

中枢神经系统脱髓鞘疾病主要是以脑和脊髓以髓鞘破坏或缺失为主要特征。对该类疾病的早期检测和诊断,对于患者的预后有极大的帮助,Y.Liu[36]等回顾性的纳入了67例MS和68例有脊髓损伤的 NMOSD 病人,并把28例MS和26例NMOSD病人作为验证队列,从脊髓T2WI中提取病变的放射学特征,将提取的458个组学特征通过LASSO降维之后最终得到9个放射组学特征;通过将放射学特征和临床基本信息(性别、年龄、病程、复发次数、EDSS评分)及常规MRI测量值(脊髓病变长度和脊髓病变数量)相结合,建立的Nomogra预测模型可以很好的区分MS和NMOSD,其AUC达0.89。Zhao Y等[37]采用逻辑回归方法和SVM分别对MS患者人口统计学特征、临床特征及MRI特征的基线数据与纵向随访数据进行综合定量分析,结果显示T2病灶体积是极为重要的病程进展预测因子,且基于纵向随访数据的SVM预测准确率达0.86。随着影像组学的发展和应用,其综合能够将会有进一步提高,但目前由于脱髓鞘疾病存在单中心样本量少、前瞻性实验耗时长等研究问题,导致相应的组学模型偏少,因此开发前瞻性、大样本数据并进行多中心验证是今后发展的方向。

4 影像组学在神经系统退行性疾病中的应用

4.1 在轻度认知障碍和阿尔茨海默病中的应用阿尔茨海默氏病(AD)是一种严重威胁老年人健康的进行性神经退行性疾病。轻度认知障碍(MCI)被认为是AD的前驱阶段。迄今为止,AD或MCI诊断是在不可逆的大脑结构改变后建立的。目前,已有研究表明,放射组学分析可以作为AD和MCI的良好诊断和分类方法。Feng Q等[22]的对78例AD患者和44例健康对照者的三维t1加权磁化快速梯度回波(MPRAGE)图像进行放射组学分析。对每个被试的图像进行人工分割,经过计算得到385个特征。经过LASSO后最终选取11个特征,构建logistic回归模型,得到的AUC为0.720。这是首次表明基于机器学习的放射组学模型是一种有价值的AD诊断方法;研究还发现海马影像组学生物标志物和所建立的影像组学模型对MCI患者的诊断、鉴别诊断和治疗有较大的意义。但是,准确预测MCI是否及何时发展为AD,对于制定个体化治疗方案,延缓不可逆痴呆的发生具有重要意义。Tang从[38]团队前期从Alzheimer's Disease Neuroimaging Initiative (ADNI)数据库中收集了162例MCI患者的T1图像,在5年的随访中,68名患者转为AD,94名患者保持稳定,将患者随机分为训练数据集(n=112)和验证数据集(n=50),从MR图像的整个大脑皮质和皮质下核提取放射特征。使用LASSO Cox回归建立放射组学模型,通过一致性指数(C指数)评估每个模型的性能。建立了一个包含15个预测因子的多预测列线图模型,该列线图模型对单个疾病发展时间(time to progression,TTP)预测具有高精度,C指数为0.950(0.929-0.971),可以准确预测从MCI到AD的个体TTP。

4.2 在帕金森病中的应用帕金森病(PD)是继阿尔茨海默病之后第二大最常见的神经退行性疾病,其发病率随年龄增长而迅速增加,帕金森病临床症状多样,以运动性和非运动性症状为特征,可导致残疾、死亡和生活质量下降。Takuro等[39]从 帕金森病进展标志物主动性数据库分析了413例正常对照组和PD组的,随机的将数据分为训练数据集和两个测试数据集,分别来自不同的SPECT厂商。总共计算了930个放射组特征,包括感兴趣的尾状核、壳核和苍白球体积的强度和结构特征,采用LSSSO进行特征选择,采用放射组特征和/或半定量指标构建四种分类模型;结果发现SURputamen的分类性能高于其他半定量指标。与每个测试数据集中的SURputamen相比,放射组特征导致的AUC略有增加;结合SURputamen和放射组学特征,所有分类模型的auc均略高于单独SURputamen,结果表明,目前所提取的的放射组学特征将有助于PD的诊断。根据临床症状,PD可分为震颤显性(TD)亚型和姿势不稳步态困难亚型。与TD亚型相比,PIGD亚型对步态抑制、焦虑、痴呆等神经系统功能的损害更大。在治疗方面,PIGD亚型对脑深部刺激和左旋多巴反应较差 。因此,正确识别PIGD和TD亚型对制定治疗方案和预测预后具有重要意义。Sun等[40]前期从帕金森病进展性标记物主动性公共数据库中收集了42例体位不稳步态困难(PIGD)患者、92例震颤显性(TD)患者和96例健康对照。对于每个受试者,从148个皮层和14个皮层下大脑区域提取了4850个放射特征。采用方差阈值法、最小绝对收缩法和选择算子选择最优特征。建立了基于支持向量机、Logistic回归和多层感知器的分类模型,以评估最优特征对两个亚型的识别性能。结果发现支持向量机(Support Vector Machine)对两种亚型的鉴别效果最佳,曲线下平均面积为0.833,结果表明脑MR图像的放射组学分析可以区分TD、PIGD和对照组,在临床实践中具有很大的潜在价值。

4.3 在癫痫中的应用癫痫(epilepsy)是大脑神经元突发性的异常放电,导致短暂的大脑功能障碍的一种慢性疾病。Zhang Y[41]等回顾性的研究了117例未破裂的脑动静脉畸形(bAVM)的患者,筛选出两个大脑区域和四个放射性组特征作为癫痫的预测因子,最后发现癫痫易感性bAVM患者在T2加权成像上具有不同的位置和放射组学特征。Cheong[42]等采用36例海马硬化(HS)患者资料和50例健康对照建立放射组学模型。将患病海马和海马外区域的1618个放射组特征与健康对照和未患病侧的特征进行了比较。采用单变量t检验和弹性净惩罚的逐步选择方法,分别在海马区(H+)和海马外区(H-)选择识别颞叶癫痫的显著预测因子,从患者患侧选取48个H+显像和99个H-显像,分别制作海马模型和海马外模型。结果发现海马外模型(AUC=0.92)对患者患侧的诊断能力高于海马模型(AUC=0.69)。该研究表明放射组学显示颞叶癫痫患者患侧海马外异常,可能有助于鉴别MRI阴性颞叶癫痫。

5 展 望

影像组学是目前的研究热点之一,能挖掘出隐藏在医学影像中庞大的数字信息,可以为神经系统非肿瘤性病变的诊断、治疗及预后提供强有力参考依据,基于图像的影像组学模型模型已逐步应用于神经系统非肿瘤性病变的图像量化、通知工具、诊断与鉴别诊断、治疗预后等多个环节,具有很大的应用潜力;通过影像组学增加了对图像的深度解析,大大的节约了医师的时间,提高了工作效率。

但是,影像组学在神经系统非肿瘤性病变领域的应用中仍面临着很多问题。第一,目前大多数开发出来的模型需要较大的样本量计算,但对于发病率低的疾病:如脑血管病等就存在数据分布不均衡的问题,如何搭建高标准的数据库是影像组学应用的关键要素;第二,目前开发的许多影像组学都缺乏标准化的评价体系,许多疾病也缺乏标准的公开数据库进行参考,很难对模型进行客观的评价,不利于模型的转换、落地、推广。第三,许多构建的模型都是根据结果来反向进行训练和推测,仅仅给出诊断结果,但对于推理过程的可解释性还不够深入,导致许多临床医师接受度低,限制了其在临床工作中广泛推广;第四,构建的模型大多都停留在理论水平,未形成较为完整的影像-临床科室协作模式,如何将模型应用到真实临床工作仍然是目前需要解决的问题。

综上所述,虽然影像组学仍然有它的局限性,如回顾性分析、临床认可程度、数据源参数、可重复性等;但随着影像组学的逐渐发展,在以患者为中心解决问题的基础上逐渐解决上述局限性,影像组学可以为神经系统非肿瘤性病变提供非常广阔的应用前景。

猜你喜欢

组学预测特征
根据方程特征选解法
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
如何表达“特征”
不忠诚的四个特征
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
抓住特征巧观察
不必预测未来,只需把握现在