APP下载

基于肺癌CT建立淋巴结转移的诺莫图预测模型研究

2020-05-20

中国医疗设备 2020年5期
关键词:组学淋巴结肺癌

1.中国医科大学 生物医学工程系,辽宁 沈阳 110122;2.辽宁省肿瘤医院(中国医科大学肿瘤医院) 医学影像科,辽宁 沈阳 110042;3.济宁医学院 基础医学院 分子医学与化学实验室,山东 济宁 272067

引言

肺癌具有极高发病率和转移率[1-2],全球每年肺癌新发病例数约173万[3],其致死人数占全球癌症死亡人数的19%[4]。淋巴结转移是影响肺癌患者生存预后的一个重要因素[5],发生淋巴结转移的患者中,仅有26%~53%的患者生存期能超过五年[6-7]。临床上诊断肺癌淋巴结转移的金标准是病理活检,如胸腔镜手术和支气管超声等侵入性方法,但可能引起严重的并发症[8]。目前缺乏一种通过术前影像对肺癌淋巴结转移进行预测的技术方法。

计算机断层扫描因其具有较高的空间分辨率而在肺癌的常规诊断、分析、疗效评估中发挥着重要的作用[9-10]。CT图像中蕴含的结节的形状、大小、方位等临床信息对疾病的诊断预测具有重要意义[11]。

近年来,影像组学技术发展迅速,通过高通量提取医学图像中隐藏的深层次特征信息[12-13],能够准确反应肿瘤的生物学特性,可实现无创地对患者肿瘤进行分型及鉴别[14]。诺莫图模型通过结合患者的影像组学特征和临床指标,可充分揭示特征与疾病病理之间潜在的联系[15],具有良好的临床适用性。本研究利用肺癌患者CT影像与患者的临床指标建立诺莫图模型分析其对淋巴结转移进行预测的效果,以期为临床决策提供参考。

1 材料与方法

1.1 患者信息

回顾性分析2014—2017年于中国医科大学附属辽宁省肿瘤医院确诊的肺癌患者,共纳入211例肺癌患者(男性120例,女性91例;患者年龄在29~80岁之间,平均年龄59.1岁);有72人已发生淋巴结转移,139人未发生淋巴结转移。入组标准:① 术前进行CT扫描;② 有病理结果并作为金标准;③ 年龄在18岁以上。排除标准:① 同时患有其它肿瘤疾病;② 进行过化疗或放疗;③ CT数据不完整或病灶小于三层(扫描层厚5 mm,螺距1.0)。

1.2 临床CT扫描

扫描设备选用64排螺旋CT机(SOMATOM De finition单源CT机,德国西门子公司)。扫描参数:电压120 kV,电流200~350 mAs,扫描层厚5 mm,矩阵512×512。扫描范围:肺尖至肋膈角。

1.3 图像预处理

患者的CT扫描图像保存为DICOM格式文件,并储存在医院PACS系统中。为了获取每位患者的病灶区域(Region of Interest,ROI),由两位10年以上工作经验的影像科医生通过ITK-SNAP(3.6.0版本)软件进行手动勾画并保存为NII格式文件。

1.4 影像特征提取和筛选

通过Python 3.6编程从CT图像中提取影像组学特征,包括图像的一阶统计、形状、灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)、灰度区域大小矩阵(Gray-Level Size Zone Matrix,GLSZM)和灰度行程纹理矩阵(Gray-Level Run Length Matrix,GLRLM)[16-17]。利用LASSO算法对提取的影像组学特征进行筛选。

1.5 临床指标分析

根据患者性别、家族史、吸烟史、癌胚抗原(Carcinoembryonic Antigen,CEA)、神经元特异性烯醇化酶(Neuron Specific Enolase,NSE)和细胞角蛋白(Cytokeratin,CYFRA)临床指标,采用χ2检验、K-S检验及U检验,评价特征与治疗反应的相关性。P<0.05表明具有统计学意义。统计分析使用SPSS软件(24.0版本)。

1.6 构建诺模图模型

使用 LASSO(Least Absolute Shrinkage and Selection Operator)算法[18]构造影像组学标签,结合临床指标(年龄、性别、吸烟史、CEA、NSE、CYFRA),用R语言的rms软件包(v.3.5.1)建立诺莫图模型。决策曲线(Decision Curve,DCA)通过计算不同阈值概率下的净效益来评估诺莫图的临床应用价值。

1.7 验证方法

以受试者工作特征(Receiver Operating Characteristic,ROC)曲线下面积(Area Under Curve,AUC)、准确度、特异度和灵敏度作为比较指标,计算公式:① 准确度=(真阳性患者人数+真阴性患者人数)/(真阴性人数+假阴性人数+真阳性人数+假阳性人数);② 灵敏度=真阳性人数/(真阳性人数+假阴性人数);③ 特异度=真阴性人数/(真阴性人数+假阳性人数)。本研究全部算法运行的硬件平台为3.7GHz Intel i7-8700K CPU和64GB 3000 MHz DDR4 RAM。

2 结果

2.1 临床指标分析

本研究中患者的临床指标结果如表1所示。将所有患者以7:3的比例划分为训练集和测试集,年龄的测试集采用U检验,训练集采用t检验,其余临床指标训练集和测试集均采用χ2检验。训练组和测试组患者的性别、年龄、吸烟史、家族史、NSE和CYFRA均无统计学意义;训练组中患者的CEA具有显著统计学意义,P<0.001。

表1 测试集和训练集中患者的临床指标概况

2.2 构建诺莫图模型

从患者的CT图像中共提取855个影像组学特征,利用LASSO回归模型进行特征降维获得9个相关性较高的特征并构建了影像组学标签,即Ct score。

Ct score=(-5.50212843e01)×original_glcm_Imc2+(1.27936076e01)×original_glcm_InverseVariance+(-1.52741916e-01)×original_glcm_SumAverage+(3.21012323e-03)×original_glszm_LargeAreaLowGrayLevelEmphasis+(1.5 2245783e-05)×wavelet-HHH_ngtdm_Busyness+(1.52885379 e+00)×wavelet-HHL_glcm_Idn+(-8.46251468e-01)×wavelet-HLH_glcm_ClusterTendency+(-5.27286929e-03)×wavelet-HLH_glrlm_RunEntropy+(3.00252669e-01)×wavelet-HLH_glrlm_RunLengthNonUniformityNormalized

多因素逻辑回归构建的包含临床指标CEA和影像组学标签的诺莫图模型如图1所示,影像组学标签和CEA得分求和得出总分数(范围:0~100),将总分数定位在总分数轴上,自上而下画一条垂线与最底部的量表的交点即为恶性肺结节的淋巴结转移风险(范围:0.1~0.9)。

图1 多因素逻辑回归结合CEA和影像组学标签构建的诺莫图模型

经诺莫图模型绘制出ROC曲线,见图2。模型训练集的AUC为0.859(灵感度为0.810,特异度为0.773),测试集AUC为0.864(灵感度为0.820,特异度为0.753),结果表明诺莫图模型在预测肺癌淋巴结转移方面展现出了良好的预测性能。图3所示为诺莫图模型的决策曲线,分析曲线可知当患者发生淋巴结转移的阈概率大于0.06%时,使用诺莫图模型对患者进行淋巴结转移的预测相较另外两种治疗方案(假设所有患者均发生淋巴结转移和假设所有患者均未发生淋巴结转移)而言,能得到更大的净获益。这一结论凸显了诺莫图模型在淋巴结转移预测方面的临床应用价值。

图2 诺莫图模型训练集和测试集的ROC曲线

图3 诺莫图模型中的决策曲线

3 讨论

肺癌的淋巴结转移状态是患者的外科手术治疗的选择以及是否使用如淋巴结清扫术等辅助治疗的关键因素,术前无创预测淋巴结转移具有重要的临床意义。

本文通过ROC曲线来直观展示诺莫图模型的预测性能。ROC曲线下面积即AUC值作为模型准确评估患者患病的概率,可用于评价模型预测性能的优劣;特异性、敏感性用于辅助评价模型的性能。ROC曲线是一种判断模型优劣的最直观、最常用的方法。本研究诺莫图模型测试集AUC 为0.864,特异度为0.753,灵敏度为0.820,具有优秀的预测淋巴结转移能力。

诺莫图模型常用于影像组学的研究,能通过患者的个体特征评估临床事件发生的概率,是一种很好的预测分类模型[19-21]。相比于其他预测性统计学模型,其可视化的图标式结果,能更直观的反映患者的患病概率,并提供个体化的预后风险评估。CEA是一种血清肿瘤标志物,常被用于早期肺癌的检测。本研究对与肺癌相关的临床指标进行统计学分析,结果显示CEA与恶性肺结节的淋巴结转移相关性较高(P<0.001),是作为构建预测肺癌患者淋巴结转移的诺莫图模型的独立预后因子(表1),与既往研究一致[22-23]。本研究将临床指标CEA和通过LASSO算法构建的影像组学标签(LASSO算法对处理的数据要求低,是一种应用广泛的数据筛选方法)一同作为预测因子参与构建诺莫图。由模型绘制出的ROC曲线测试集AUC为0.864,灵敏度为0.820,特异度为0.753;Yang等[20]人通过肺癌LNM分级和影像组学特征标签建立诺莫图预测肺癌的淋巴结转移,测试集AUC为0.856、特异度为0.821、灵敏度为0.917,表明经CEA和肺癌组学特征建立的诺莫图模型具有优秀的预测淋巴结转移能力。DCA是一种评估模型在支持临床决策方面是否具有效用的统计学方法[24]。相较于ROC从准确性方面评价模型的优劣,DCA更偏向于从临床效益方面评价模型,即在假阳性和假阴性均无法避免的情况下,寻求一种使患者净受益最大的办法。本研究绘制了诺莫图决策曲线,图形表明当患者发生淋巴结转移的阈概率大于0.06%时,由诺莫图模型对患者淋巴结转移进行预测比“不治疗”或“全部治疗”策略更有效,显示出良好的临床应用潜能。

本研究有几个局限性。首先,所有的数据都来自同一家医院,不具有普遍性,在今后的研究中会引入多中心数据。其次,肺癌的淋巴结转移还与基因、蛋白质表达有关[25-26],而本研究并未纳入该类因素;最后,本研究中的影像组学特征依赖于医生手工勾画ROI,两位医生对肺结节病灶区域勾画的相关系数值为0.954,具有很高的一致性,但较为耗时。在未来的研究中,扩大样本容量、纳入不同地域的患者、融合更多的临床信息,采用更高效、更准确的病灶分割算法将更有可能改善模型的性能和普适性。

综上所述,本研究利用CT图像建立了包含临床指标CEA和影像组学标签的诺莫图模型。ROC和DCA结果析显示:诺莫图模型在预测肺癌淋巴结转移方面展现出了良好的预测效果和临床应用价值。

猜你喜欢

组学淋巴结肺癌
对比增强磁敏感加权成像对肺癌脑转移瘤检出的研究
影像组学在肾上腺肿瘤中的研究进展
氩氦刀冷冻治疗肺癌80例的临床观察
喉前淋巴结与甲状腺乳头状癌颈部淋巴结转移的相关性研究
长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
淋巴结肿大不一定是癌
按摩淋巴结真的能排毒?