基于常规MRI的影像组学预测脑胶质瘤IDH突变的效果分析
2022-03-05杨靖,李可,敬洋,王芳,陈伟
杨 靖,李 可,敬 洋,王 芳,陈 伟
[1.陆军军医大学第一附属医院放射科,重庆 400038;2.慧影医疗科技(北京)股份有限公司科研组,北京 100192]
脑胶质瘤是最常见的原发性颅内肿瘤,占成人恶性原发性脑肿瘤的75%,发病率及病死率较高[1-3]。2016年WHO中枢神经系统指南表明,胶质瘤的诊断应主要基于分子生物标志物[4]。IDH突变在脑胶质瘤的分型中尤为重要,2021版WHO分型更强调了IDH突变在分型中的重要性[5]。有研究表明,IDH突变型脑胶质瘤患者的预后优于IDH野生型患者[6-7]。因此,研究IDH突变对于临床具有重要意义,术前准确识别脑胶质瘤患者的IDH突变状态对于预测其预后和设计个性化治疗策略至关重要。
免疫组织化学和基因组序列分析可以检测术后IDH突变状态[8],但目前尚无术前检测IDH突变状态的标准。多种常规和定量MRI方法已被纳入放射组学用于预测IDH突变状态[9-10],这类方法具有较高的可靠性,但需要先进的成像技术、复杂的操作方法和后处理技术,不利于临床应用。因此,本研究提取常规MRI特征,利用影像组学建立术前预测模型,评估基于常规MRI的影像组学分析预测脑胶质瘤IDH突变的效果,以期实现术前准确、无创地预测IDH突变状态。
1 资料与方法
1.1 临床资料
回顾性分析2016年1月至2019年12月陆军军医大学第一附属医院259例脑胶质瘤患者的临床资料。纳入标准:①经术后病理证实为脑胶质瘤;②术前1周行增强MRI扫描;③患者病理报告包含IDH基因型信息,IDH基因突变信息由分子检测确定。排除标准:①伴有其他全身性疾病;②MRI序列中缺少FLAIR或CE-T1WI序列;③图像质量欠佳,影响观察及勾画。最终共172例患者纳入本研究(82例IDH突变型和90例IDH野生型)。本研究获得了陆军军医大学第一附属医院伦理委员会的批准(批准号:KY2020038),并免除了患者知情同意要求。
1.2 MRI图像采集
所有患者都经3T TrioTim磁共振成像系统(德国,西门子)8通道头矩阵线圈扫描,磁共振成像包括以下序列:T1WI、T2WI、FLAIR和CE-T1WI。分割或标记的顺序如下:轴向FLAIR(TE=76 ms/2 680 ms,TR=7 800 ms,采集矩阵=256×192,视场=240×240,切片厚度5 mm);CE-T1WI(TE=3 ms,TR=459 ms,采集矩阵=320×218,视场=216×218,切片厚度2 mm)。
1.3 图像分割和特征提取
所有MRI数据均上传至RadCloud平台[慧影医疗科技(北京)股份有限公司]进行感兴趣区域勾画,选择FLAIR和CE-T1WI图像进行图像分割。FLAIR可显示肿瘤水肿及病灶范围[11],CE-T1WI可显示肿瘤实质及坏死改变[12]。根据勾画标准[13]并结合实际操作可能性,本研究选择对脑胶质瘤整个病灶(包括水肿)进行勾画。由2名神经影像医师采用盲法(不知道患者临床信息及病理结果)对病灶进行半自动勾画,并直观比较勾画结果,如果有差异则由这2名医师讨论后得出最终感兴趣区域勾画结果。采用组内相关系数(intra-group correlation coefficient,ICC)评价2名医师分别勾画的感兴趣区域组学特征的一致性,将比较讨论后得出的最终勾画数据进行特征提取及组学分析。感兴趣区域勾画的示例见图1。
a:原始FLAIR图像;b:原始CE-T1WI图像;c:在FLAIR上勾画病灶;d:在CE-T1W上勾画病灶;e~h:将勾画的图像进行三维重建,证明最终勾画的是感兴趣区域的三维立体图像
1.4 放射特征选择和模型构建
为了避免模型过拟合和多重共线性的问题,采用以下三种方法对提取的MRI特征进行降维:首先,采用方差阈值法进行特征降维,留下阈值大于0.8的特征;其次,利用单变量特征选择法,筛选不显著的特征(P>0.05则删除);最后,通过最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)选出与IDH突变状态最相关的指标,并得到这些指标的权重。上述降维方法集中执行5次,采用五折交叉验证法进行统计分析。使用以下公式计算每例患者的放射评分,放射评分作为影像组学特征的综合体现,纳入后续模型构建。放射评分的计算公式为:放射评分=截距+特征1×相关系数1+…+特征n×相关系数n。
诺莫图可以反映各影响因素在脑胶质瘤IDH突变预测中的价值,根据诺莫图结果可以证明放射组学特征在预测脑胶质瘤IDH突变上起最主要作用。在模型验证过程中,构建模型的诺莫图,并通过接收机工作特性分析评估每个模型的预测能力。此外,绘制校准曲线以评估模型预测的IDH突变状态和实际的IDH突变状态之间的一致性。
1.5 统计学分析
用R软件3.6.5对放射组学特征进行统计分析。年龄经正态分布检验为非正态分布数据,采用K-W检验,其余分类变量采用χ2检验或Fisher精确检验。采用受试者工作特征(receiveroperatingcharacteristic,ROC)曲线分析计算曲线下面积(areaunderthecurve,AUC)、精确度、灵敏度、特异度、F1评分等指标,评价模型的预测效果。P<0.05为差异有统计学意义。
2 结果
2.1 临床特征
IDH突变型患者和IDH野生型患者癫痫、WHO分级、影像所见强化及水肿比较差异有统计学意义(P<0.05),而其他临床变量差异无统计学意义(P>0.05),见表1。将具有统计学意义的4个临床因素纳入临床高危因素,进入后续模型构建。感兴趣区域组学特征的一致性结果显示,CE-T1WI的ICC为0.78~1.00,FLAIR的ICC为0.63~1.00,一致性较高,勾画结果可以用于后续特征选择分析。
表1 IDH野生型与IDH突变型患者的临床特征
2.2 特征提取结果
在特征提取中,从每例患者的FLAIR和CE-T1WI序列上各提取1 409个定量放射组学特征,包括270个一阶特征、14个形状特征、360个灰度共生矩阵特征、210个灰度相关矩阵(GLDM)特征、240个灰度游程矩阵(GLRLM)特征、75个邻域灰度差矩阵(NGTDM)特征和240个灰度大小区域矩阵(GLSZM)特征。采用方差阈值法、单变量特征选择法和LASSO对图像特征进行降维,最终共选出20个最显著特征。最终选出的20个特征见表2,特征选择采用的LASSO方法见图2。
表2 最终选出的最显著特征
2.3 模型的建立及评估
基于筛选得到的2个序列的组学特征以及4个临床高危因素建立多因素Logistic回归模型,基于2个序列筛选得到的组学特征建立单因素Logistic回归模型,分别是单因素(FLAIR)组学特征Logistic回归模型、单因素(CE-T1WI)组学特征Logistic回归模型。结果显示影像组学特征联合临床高危因素的多因素Logistic回归模型拥有更好的诊断效能。多因素Logistic回归模型的诺莫图见图3,模型的具体参数见表3。多因素Logistic回归模型在训练集中的AUC为0.833(95%CI:0.778~0.889),在测试集中的AUC为0.753(95%CI:0.628~0.895),见图4、表4。结果表明,放射评分、WHO分级、影像所见强化及水肿皆与IDH突变相关,从训练集与测试集的诺莫图可以看出,放射评分与IDH突变密切相关;基于FLAIR与T1增强的多因素Logistic回归结果优于单因素Logistic回归模型,同时也表明基于常规MRI序列的影像组学模型对IDH突变状态的预测效果较好。
表4 模型结果
a:LASSO回归模型中采用10倍交叉验证选择最佳调优参数(λ);b:利用λ获得20个非零系数影像组学特征(每条彩线代表其系数的变化情况)
a:训练集;b:测试集
表3 多因素Logistic回归模型的具体参数
2.4 模型的验证
本研究中,校准曲线显示模型在训练集和测试集中的预测情况与实际情况的吻合度高,说明模型预测的脑胶质瘤IDH突变与临床实际符合度高,本模型的准确性及可靠性较高。校准曲线见图5。
3 讨论
本研究成功构建了基于常规MRI影像组学特征的高性能模型,以预测胶质瘤IDH突变状态,达到术前准确、无创预测的目的。在感兴趣区域勾画时,本研究为证明不同医师勾画结果的一致性,采用ICC检验评估了不同医师的勾画结果,结果显示一致性良好。在模型构建时,本研究设计了3个模型进行对比分析。以上结果表明,影像组学模型在预测脑胶质瘤IDH突变状态方面具有较好的诊断效能,通过构建诺莫图发现,影像组学特征在脑胶质瘤IDH突变预测中具有重要价值。同时,本研究采用校准曲线来验证模型预测结果与实际结果的吻合程度,结果显示该模型在脑胶质瘤IDH预测中的准确性、可靠性较高。
a:训练集;b:测试集
a:训练集;b:测试集
影像组学通过高通量提取图像特征,并使用生物信息学工具将数字图像转换为可挖掘的数据进行分析[14]。有研究显示,放射组学在识别预后、预测生物标志物以及预测分子亚群和通路活动方面具有较大潜力[15-16]。已有许多影像组学方面的研究集中于预测胶质瘤中的IDH突变状态。一项荟萃分析显示,在训练集中预测IDH突变的敏感性和特异性分别为0.88和0.86,在验证集中则分别为0.83和0.85[17],结果表明影像组学在术前预测胶质瘤IDH突变方面具有较高的诊断准确性,证明构建胶质瘤术前预测模型具有可行性。同时,有研究采用2HG磁共振波谱进行建模,因为其具有更高的综合灵敏度[18-19]。因IDH突变与2HG直接相关,突变的IDH蛋白会产生假定的肿瘤代谢物D-2HG[20]。磁共振波谱作为一种预测IDH突变的无创方法,因其诊断准确性高而引起了放射科医生的关注。以往的影像组学模型在肿瘤分级、分类和侵袭性测定中显示出较高的诊断性能。然而,这些研究采用的序列复杂,MRI采集时间长,对技师的要求高,导致此类研究在临床大范围推广受限。考虑到以前研究的局限性,本研究使用FLAIR和CE-T1WI等常规序列开发了一个多参数磁共振影像组学模型。结果表明,该影像组学模型的精确度、灵敏度和特异度均较高,利于临床推广及应用。
近年来,多参数影像组学模型引起了放射医学研究界的关注。近期的一项研究表明,在127例低级别胶质瘤患者中,多参数磁共振影像组学模型在肿瘤分级和IDH突变状态的诊断性能方面有所提高[21]。另一项研究显示,多参数磁共振成像的影像组学特征预测胶质瘤IDH基因型的准确性为0.823,AUC为0.770[22]。与单因素模型相比,多因素模型往往更准确,具有更好的诊断性能。本研究使用常规的磁共振FLAIR和CE-T1WI两个序列,与其他先进的成像技术相比,这两种序列很常见,对操作技术要求不高,扫描时间短,可重复性高,因此更利于临床推广。
本研究也存在局限:首先,本研究为单中心临床数据,缺乏外部验证,考虑到这一点,在下一步脑胶质瘤研究中我们将纳入多中心数据;其次,作为一项影像组学研究,本研究样本量较小。但本研究在这一百多例患者的基础上就可以达到准确的ROC,校准曲线也验证了模型的准确性及可靠性,所以还是有一定的参考价值。在未来的研究中,我们会增加多中心数据,延长选择研究对象的时间,扩大样本量。