APP下载

基于CT影像组学模型预测骨巨细胞瘤术后复发

2022-09-14翟天童尹平孙超洪楠

中国医学影像学杂志 2022年8期
关键词:组学效能预测

翟天童,尹平,孙超,洪楠

北京大学人民医院放射科,北京 100044;*通信作者 洪楠 hongnan@pkuph.edu.cn

骨巨细胞瘤约占原发骨肿瘤的15%[1],可发生恶变。2020年世界卫生组织骨与软组织肿瘤分类中,将骨巨细胞瘤归类为交界性肿瘤[2]。骨巨细胞瘤的治疗方式以手术为主,包括病灶内刮除、广泛切除以及联合放疗等。术前预测骨巨细胞瘤的复发几率有助于对不同复发风险患者给出更合理的治疗建议[3]。

影像组学是将保存有肿瘤病理生理及基因表达信息的数字医学图像转换为高维数据,从医学图像中提取和筛选大量的定量数据,用以构建预测性模型,协助诊断、疗效评估,肿瘤分级、预后、预测治疗反应及术后复发等[4]。本研究拟建立一个基于术前CT图像影像特征的组学模型,预测骨巨细胞瘤3年内的复发风险。

1 资料与方法

1.1 研究对象 回顾性收集2007年2月—2018年5月北京大学人民医院经病理证实的95例骨巨细胞瘤患者,通过查询患者就诊记录及电话随访获取非本地复查患者的影像学检查结果,证实患者自发病以来3年有/无复发。按3∶1将患者随机分为训练组71例和测试组24例。纳入标准:①采集样本均为我院手术病理证实的骨巨细胞瘤患者;②每例患者术前在我院行CT检查,并选用最初的CT图像序列进行图像分割及数据分析;③随访3年及以上。排除标准:①患者3年内因其他原因死亡或失访;②术前CT检查存在手术治疗、联合治疗后(如地诺单抗)等干扰因素。本研究经本院医学科学研究伦理委员会批准(审批号:2020PHB293-01),豁免患者知情同意。

1.2 仪器与方法 所有患者术前均行CT检查,使用仪器:Philips Brilliance iCT 256层螺旋CT,管电压100/120 kVp,有效管电流由程序设置根据患者体型自动选择,范围约100~500 mA,层厚1 mm;GE Lightspeed VCT 64层螺旋CT,管电压100/120 kVp,有效管电流由程序设置根据患者体型自动选择,范围约100~500 mA,层厚1 mm;均采用骨及软组织算法重建。

1.3 感兴趣区(ROI)分割 本研究纳入样本采用2种不同的CT设备,首先对图像进行重新采样及灰度标准化的预处理工作,然后由2名具有10年阅片经验的医师使用ITK-snap 3.8(www.itksnap.org)进行逐层手动分割。首先随机抽取20例患者,分别由2名医师同时进行ROI分割,根据这20例CT提取的特征计算观察者组内相关系数(ICC),ICC>0.8为一致性良好。通过一致性检验后,由医师1对剩余75例CT进行勾画。以上图像分割过程均由1名具有20年以上诊断经验的放射科医师指导进行。

1.4 影像组学特征提取、筛选与影像组学模型建立及评估 设备1采集图像39例,设备2采集图像56例。刘涛等[5]研究表明体素大小对CT影像组学特征有很大影响,因此图像预处理工作是保证特征稳定性的良好方法。采用MITKwokbench平台(GE)进行图像预处理工作并提取影像组学特征。使用Launch IPMs软件(GE)对全部提取的组学特征进行筛选及模型建立。为避免影像组学标签过拟合,采用下列算法进行特征降维:首先筛选出ICC>0.8的可复性高的组学特征,纳入Spearman相关分析算法进行初次降维;其次选择最小绝对收缩与选择算子(least absolute shrinkage and selection operator,LASSO)方法及梯度提升迭代决策树(gradient boosting decision tree,GBDT)进行再次降维。将最终筛选出的影像组学特征,计算影像组学特征系数。使用逻辑回归(logistic regression,LR)及随机森林(random forests,RF)建立预测模型,得出受试者工作特征(ROC)曲线下面积(AUC)和准确度评价模型的效能;运用测试组患者的数据对预测模型进行验证。

1.5 统计学方法 采用SPSS 17.0软件,正态分布的计量资料以±s表示,组间比较采用独立样本t检验;非正态分布的计量资料用M(Q1,Q3)表示。计数资料以例(%)表示,采用χ2检验。用Spearman相关分析计算特征与特征之间的相关系数。采用ICC评价2位医师手动勾画ROI的一致性;绘制ROC曲线对模型的效能进行评估,并计算AUC、准确度、敏感度和特异度。P<0.05为差异有统计学意义。

2 结果

2.1 患者病例资料 95例骨巨细胞瘤患者中,男46例,女49例;年龄15~75岁,中位年龄32(25,42)岁。发病部位:脊柱7例,骨盆含骶骨36例,四肢长骨48例,肋骨1例,鼻窦1例,距骨1例,骰骨1例。复发27例,无复发68例。95例中,采取病变刮除11例,广泛/根治切除84例。复发与无复发患者性别、发病部位差异有统计学意义(χ2=3.931、10.780,P<0.05)。

2.2 影像组学特征提取及筛选 2位医师手动勾画的ROI的ICC为0.8~0.9,使用医学影像交互包,导入95例CT的原始图像及对应的ROI文件进行特征提取,共提取出1 316个影像组学特征。首先用Spearman相关性分析方法计算特征与特征之间的相关系数,筛选条件为0.7,经第1次筛选得到160个影像组学特征。采用LASSO算法进行2次筛选,保留34个重要特征;最终通过GBDT算法对所获特征进行最终筛选,共获得12个影像组学特征,包括2大类,3个一阶特征,9个灰度相关特征(表1、图1)。

图1 影像组学特征筛选流程。训练组(A)及测试组(B)通过相关性分析算法进行特征降维的热图,图中显示所筛特征的相关性强弱;经LASSO模型算法进行再次降维的路径图(C)与均方误差(D),在最佳alpha值0.031时筛取34个特征;训练组(E)及测试组(F)经GBDT算法进行特征降维的热图

表1 筛选后用于建模的组学特征

2.3 模型结果对比 本研究结果显示,训练组中,LR的AUC为0.962,准确度为0.892;测试组中,LR的AUC为0.924,准确度为0.824,见表2。

表2 影像组学模型结果

3 讨论

在传统影像学与影像组学研究中,骨巨细胞瘤的诊断和鉴别诊断已有成熟的体系,但关于预测术后复发的研究较少。本研究基于CT影像学标签建立了独立的预测模型,如果可以预测肿瘤的复发概率,将有助于选择最优治疗及随访方案。

3.1 影像组学概述 影像组学可以通过不同信号强度的成像体素的空间排列评估肿瘤的异质性,从而产生定量信息,用于协助肿瘤的诊断和治疗[6]。近年对影像组学在临床中应用的研究非常广泛。夏婷等[7]通过提取术前动态增强CT图像的影像组学特征并构建了关于肿瘤病理分级的预测模型,效能良好。梁翠珊等[8]构建术前影像组学模型预测结直肠癌的淋巴血管侵犯具有较好的效能,并且结合临床因子后使得组学模型的效能进一步提升。上述研究表明通过影像组学构建模型无论是独立应用或与临床结合,均有深远的探索意义。但通过影像组学预测骨巨细胞瘤复发的研究鲜有报道。由此可见通过影像组学预测骨巨细胞瘤的复发具有一定的临床需求,且具有可行性。尽管各地区的CT设备及扫描技术很难完全一致,导致各地区扫描图像中存在技术相关的异质性(噪声和伪影)[9],但部分研究发现在CT纹理特征具有较高异质性的前提下,基于CT的放射组学分析的差异性不大[10-12]。Yin等[13]对骨盆软骨肉瘤进行影像组学回顾性研究,结果证实基于mpMRI影像组学特征在预测骨盆软骨肉瘤早期复发方面具有良好的表现;Wang等[3]的研究显示基于CT影像组学特征预测脊柱骨巨细胞瘤的早期复发具有良好的表现。

3.2 影像组学特征分析 从筛选的几个特征中,一阶直方图特征包含均值和偏度,反映了图像的异质性。而纹理特征则包含了灰度尺寸区域矩阵(GLSZM)、灰度共生矩阵(GLCM)、灰度级运行长度矩阵(GLRLM)、灰度依赖性矩阵(GLDM)。从定义来看,GLDM量化了图像中的灰度依赖性,它定义为依赖于中心体素的特定距离内连接体素的数量。GLSZM量化了图像中的灰度区域,定义为具有相同灰度强度的连接体素的数量。GLCM是高级纹理特征,是建立在预估图像的二阶组合条件概率密度基础上的方法。GLRLM是基于GLCM某一像素值沿某一方向游行的长度所组成的矩阵[14]。上述纹理分析的一个缺点是特征的提取仅能依赖计算机算法。尽管如此,肿瘤的纹理可以显示肿瘤的异质性,这与肿瘤潜在的生物学行为相关,而影像组学分析则或许可以提供这一相关性的线索。

3.3 影像组学模型效能 本研究采用LR及RF模型。影像组学在肿瘤复发和预测研究中已经有很多研究,并通过不同的模型分别验证了影像组学特征的效能。既往研究显示LR和RF模型对于小样本数据有很好的稳定性和准确性,并且得到广泛应用[15-16]。但RF存在一定的过拟合问题。Yin等[15]通过术前影像组学特征、预测骨盆肿瘤的良恶性研究中,对比了多种模型的效能,结果显示LR的结果更优于RF。目前使用影像组学预测肿瘤复发的研究较为广泛,但针对骨巨细胞瘤的研究较少[3]。尽管Wang等[3]的研究显示影像组学预测脊柱骨巨细胞瘤的早期复发具有良好的表现,但样本量较小,仅62例,并且仅使用支持向量机模型预测研究结果。既往基于CT影像组学的研究在肺癌与甲状腺癌的鉴别中构建了RF、LR和支持向量机3种模型,结果显示支持向量机的模型效能较其他两者稍差,而RF的模型效能最优[17-18]。本研究使用并对比了LR和RF模型,均具有很好的结果,进一步验证了影像组学评估预测骨巨细胞瘤具有很好的效能,有望为临床尽早制订个体化治疗方案提供帮助。

3.4 本研究的局限性 首先,本研究纳入样本量较小。其次,该队列患者中,由于发病部位不同,导致治疗方法与手术选择不同。本研究95例患者中,11例行病灶刮除,84例行根治性切除术,术式不同和术者的不同可能是一个比较重要的干扰因素。尽管有研究显示基于Ki-67[19]、RANK/RANKL/OPG[20]、IMP3/IGF2[21]、P53[22]等分子生物学标志物检查,有助于预测骨巨细胞瘤的复发风险,并表示骨巨细胞瘤术后复发并不能完全归因于手术过程的不完整切除,后续研究将扩大样本量并按照发病部位、术式进行分类研究。第三,本研究仅分析了术前CT平扫图像,并未采集CT增强及MR的图像。一方面,胡奎等[23]研究认为碘对比剂强化程度在一定范围内,对CT组学的影像特征稳定性产生影响。本研究为避免更多的干扰因素,选择CT平扫图像进行数据提取。另一方面,样本中并非每一例患者均有增强CT图像资料。为保证样本量的完整性,选择了基数更大的CT平扫图像。Yin等[16]的研究中描述了基于MR T1WI、T2WI及表观扩散系数3个序列建立预测骨盆软骨肉瘤早期复发模型具有很好的表现,在结合临床特征后该模型的效能明显提升;也阐明了应用影像组学特征鉴别骶骨脊索瘤和骨巨细胞瘤具有良好的表现,结合临床特征后该模型效能亦得到很高的提升[24]。与前者研究相比,本研究样本量较小,且添加的临床标签不够充分(仅包括年龄、性别、发病部位),很多已经得到证实的临床特征因素在组学特征降维过程中被筛除,最终保留的稳定特征仅包含影像组学特征,导致结果并未提示临床标签对组学模型有优化作用。

总之,本研究对影像组学特征进行定量分析,探讨基于术前CT影像组学模型预测骨巨细胞瘤术后复发的可行性。研究结果表明基于术前CT图像提取的影像组学特征预测骨巨细胞瘤复发具有良好的效能。这将有助于制订个性化的诊疗策略与随访方案,给予临床更合理的治疗建议。

猜你喜欢

组学效能预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
影像组学在肾上腺肿瘤中的研究进展
提升水域救援装备应用效能的思考
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
充分激发“以工代赈”的最大效能