基于临床病理特征和影像学及血清生物指标分析对肺结节性质预测模型的构建与验证
2024-01-30汪桃利余文辉张书楠罗胜华李运雷王向荣王家传郭海涛广州中医药大学第四临床医学院深圳市中医院检验科肿瘤科放射科病理科胸外科广东深圳518033
袁 瑞,汪桃利,余文辉,张书楠,罗胜华,李运雷,王向荣,王家传,郭海涛(广州中医药大学第四临床医学院/深圳市中医院.检验科;.肿瘤科;.放射科;.病理科;.胸外科,广东深圳 518033)
全球癌症(GLOBOCAN)2020 数据显示,中国肺癌发病数和死亡数分别占全球的37.0%和39.8%,肺癌已成为全球恶性肿瘤发病率及癌症相关死亡的主要原因,严重威胁人类健康[1]。临床试验已证实低剂量CT(Low-dose computerized tomography,LDCT)筛查可降低肺癌相关死亡率[2],提高肺癌早期检出率,降低晚期肺癌发病率[3]。肺癌防治已经成为我国恶性肿瘤防控面临的重大挑战。肺结节(pulmonary nodules,PN)性质预测模型,旨在帮助临床对PN 精准管理,指导PN 风险分层,实现肺癌早诊断。常见模型如梅奥诊所(Mayo Clinic,Mayo)模型[4]、退伍军人事务(Veterans Affairs,VA)模型[5]、Brock 大学(Brock University,Brock)模型[6]和北京大学(Peking University,PKU)模型[7]等是基于患者临床特征和影像学特征构建的,并未纳入生物指标进行研究。广州医科大学(Guangzhou Medical University ,GZMU)模型[8]只包含一种生物指标细胞角蛋白19 片段(cytokeratin 19 fragment,Cyfra 21-1)。目前国内尚缺少经过可靠外部验证且预测准确度高的模型。因此,创建新的PN 性质预测模型显得尤为迫切。本研究旨在综合患者临床病理特征、影像信息和生物指标构建准确可靠的PN性质预测模型,协助医生对PN 进行风险分层,制定个体化诊疗方案。
1 材料和方法
1.1 研究对象 收集2019年1月~2023年2月在深圳市中医院胸外科和肿瘤科接受手术切除或肺活检,明确病理诊断的816 例PN 患者病历资料进行回顾性分析。入选标准及排除标准参考中国肺癌低剂量螺旋CT 筛查指南(2018年版)[9]。剔除不符合纳入标准者共113 例。其中,病历资料不完整者37例,胸部CT 提示PN 最大直径>30mm 者25 例,伴胸腔积液17 例,伴肺不张11 例,五年内患有恶性肿瘤并接受治疗或既往接受肺部手术15 例,伴肺结核活动期8 例。余下703 例随机分成建模组(n=552,良性237 例,恶性315 例)和验证组(n=151,良性85 例,恶性66 例)。本研究经深圳市中医院伦理学委员会批准,签署知情同意书。
1.2 仪器与试剂 西门子X 线电子计算机断层扫描仪SOMATOM Force 开源CT(德国西门子公司);雅培i 4000 SR 化学发光分析仪(美国雅培公司),试剂为美国雅培公司配套试剂包括癌胚抗原(CEA),鳞状细胞癌抗原(SCCA),细胞角蛋白19 片段(CYFRA21-1)试剂盒、激发液、预激发液、冲洗液等。
1.3 方法
1.3.1 资料采集:临床资料采集包括年龄、性别、吸烟史、戒烟史和癌症家族史。影像学资料包括CT 肺窗上结节最大直径、病变位置(肺上叶/中叶/下叶,左肺/右肺)、边界清晰、分叶、毛刺、血管集束征、空泡、钙化、支气管充气征、肺气肿、结节性质(密度)及胸膜凹陷、结节数目。血清生物学指标包括CEA,SCCA,CYFRA21-1 等。
1.3.2 单变量分析:将建模组所有变量包括临床病理特征、CT 信息和生物指标等进行单变量分析,筛选有统计学意义的变量。
1.3.3 多变量回归分析:将上述筛选的变量进行多元回归分析,筛选独立预测因子。
1.3.4 建模及验证:将上述独立预测因子纳入logistic 回归分析,得出各变量相关系数和常量,建立回归方程,构建PN 性质预测模型。根据函数f(x)=ex/(1+ex),计算肺结节恶性概率。再将验证组数据分别代入本模型(proposed model)与Mayo,VA,Brock,PKU, GZMU 模型计算PN恶性概率,绘制受试者工作特征(receiver operating characteristic,ROC)曲线。根据曲线下面积(area under the curve,AUC)比较各模型的诊断效能。选取最佳临界值确定灵敏度和特异度。
1.4 统计学分析 采用SPSS 22.0 和MedCalc17.6进行统计分析。计数资料表示为n(%),组间比较采用Pearson 卡方检验。计量资料表示为均数±标准差(±s)或中位数(四分位数间距,IQR)[M(P25,P75)]。首先对计量资料进行正态检验,再根据检验结果,组间比较正态分布采用独立样本t检验,非正态分布采用Mann-WhitneyU秩和检验。利用AUC 评价预测模型诊断效能。以P<0.05 为差异有统计学意义。
2 结果
2.1 临床特征 建模组与验证组的临床特征包括年龄(t=1.805,P=0.581)、性别(χ2=1.462,P=0.144)、吸烟史(χ2=0.632,P=0.428)、戒烟史(Z=1.465,P=0.143) 和癌症家族史(χ2=1.343,P=0.180)进行比较,差异均无统计学意义。
2.2 建模组和验证组的单变量分析 见表1,2。将各变量进行赋值:性别(女性=1,男性=0),过去或现在吸烟(是=1,否=0),癌症家族史(是=1,否=0),位置(左肺=1,右肺=0;上叶=1,中叶或下叶=0),边界清晰(是=1,否=0),分叶(是=1,否=0),毛刺(是=1,否=0),血管集束征(是=1,否=0),空泡(是=1,否=0),钙化(是=1,否=0),支气管充气征(是=1,否=0),肺气肿(是=1,否=0),结节性质(部分实性或磨玻璃样=1,实性=0)及胸膜凹陷(是=1,否=0)。单变量分析显示,PN 良性与恶性患者除性别、肺左叶、结节数目、胸膜凹陷、空泡、支气管充气征、肺气肿、吸烟史和戒烟年限外(P>0.05),其他影响因素包括年龄、癌症家族史、结节最大直径、结节性质、肺上叶、钙化、血管集束征、分叶、边界清晰、毛刺以及血清CEA,SCCA,CYFRA21-1 差异均具有统计学意义(P<0.05)。
表1 建模组的单变量分析[±s,n(%),M(P25,P75)]
表1 建模组的单变量分析[±s,n(%),M(P25,P75)]
类 别良性(n=237)恶性(n=315)χ2/t/zP年龄(岁)61.5±13.468.9±12.37.10 <0.001性别(女)124(52.3) 178(56.5) 0.88 0.379吸烟史>5年46(19.4) 73(23.2)2.28 0.131戒烟12(7,21)13(8,15)0.58 0.562癌症家族史7(3.0)28(8.9)8.01 0.005结节数目(个)3(1,3)3(1,3)1.69 0.090结节最大直径(nm)6.1±2.312.3±6.713.21 <0.001结节性质(部分实性或磨玻璃样) 42(17.7)180(57.1)87.41 <0.001钙化47(19.8) 52(16.5)1.01 0.043血管集束征53(22.4) 135(42.9) 25.3 <0.001肺上叶103(43.5) 174(55.2) 7.51 0.006肺左叶109(46.0) 165(52.4) 2.21 0.138胸膜凹陷47(19.8)73(23.2)0.89 0.346空泡48(20.3)82(26.0)2.51 0.113分叶51(21.5)109(34.6)11.23 0.004边界清晰136(57.4)143(45.4)7.77 0.005肺气肿55(23.2) 81(25.7)0.46 0.499支气管充气征43(18.1)70(22.2)1.38 0.240毛刺47(19.8)184(58.4)82.72 <0.001 CEA(ng/ml)1.8(1.2,2.7)2.9(1.7,4.5)8.25 <0.001 SCCA(ng/ml)1.0(0.6,1.7)1.4(0.7,2.6)3.84 <0.001 CYFRA21-1(ng/ml)2.7(2.0,3.8)3.6(2.5,4.8)6.30 <0.001
表2 验证组的单变量分析[±s,n(%),M(P25,P75)]
表2 验证组的单变量分析[±s,n(%),M(P25,P75)]
类 别良性(n=85)恶性(n=66)χ2/t/zP年龄(岁)61.0±12.667.9±10.53.56 <0.001性别(女)42(47.7) 38(57.5)0.98 0.320吸烟史>5年13(15.3) 17(25.7)2.54 0.111戒烟22(14,25)12(12,22)1.53 0.127癌症家族史4(4.7)12(18.2)7.08 0.008结节数目(个)3(2,3)3(2,3)0.64 0.520结节最大直径(nm)8.0±3.211.1±3.45.54 <0.001结节性质(部分实性或磨玻璃样) 23(27.0)43(65.2)7.69 0.005钙化13(15.3)4(6.1)3.15 0.076血管集束征18(21.2) 35(53.0) 16.44 <0.001肺上叶30(35.3) 38(57.5)7.40 0.007肺左叶37(43.5) 23(34.8)1.16 0.281胸膜凹陷20(23.5)24(36.4)2.94 0.086空泡13(15.3)17(25.7)2.54 0.111分叶19(22.4)27(40.9)5.99 0.014边界清晰41(48.2)15(22.7)10.29 0.001肺气肿22(25.8) 21(31.8)0.64 0.424支气管充气征9(10.5)11(16.6)1.18 0.276毛刺9(10.5)25(37.8)15.76 <0.001 CEA(ng/ml)2.1(1.3,3.0)2.7(1.7,3.6)2.56 0.011 SCCA(ng/ml)1.3(0.8,1.8)2.5(1.1,3.2)4.92 <0.001 CYFRA21-1(ng/ml)2.6(1.9,3.7)3.7(3.1,4.7)4.79 <0.001
2.3 多变量回归分析 将单变量分析筛选具有统计学意义的变量包括年龄、癌症家族史、结节最大直径、结节性质、肺上叶、钙化、血管集束征、分叶、边界清晰、毛刺以及血清CEA,SCCA,CYFRA21-1 进行多变量回归分析,筛选出10 种独立预测因子包括年龄、癌症家族史、边界、结节最大直径、结节性质、肺上叶,毛刺以及血清CEA,SCCA, CYFRA21-1 等。
2.4 Logistic 回归分析及预测模型构建 将上述筛选的10 种独立预测因子纳入Logistic 回归分析,得出各变量相关系数和常量,见表3。建立回归方程,X=(-6.318 8+0.020 8×年龄+0.573 2×肺上叶+0.527 4×CEA-0.928 4×边界清晰+0.294 6×CYFRA21-1+0.294 0× 结节最大直径+1.220 1×癌症家族史+0.064 8×SCCA+1.461 5×毛刺+1.497 6×结节性质)。再根据函数f(x)=ex/(1+ex),计算肺结节恶性概率。
表3 肺结节性质独立预测因子的Logistic 回归分析
2.5 本模型与其他模型的诊断效能比较 见图1 和表4。本模型AUC 值高于其他5 种模型,本模型与Mayo 模型和VA 模型比较,AUC(0.799 vs 0.659,0.650)差异有统计学意义(Z=3.029,P=0.003;Z=2.638,P=0.008)。然而,本模型与Brock 模型、PKU模型、GZMU 模型比较,AUC(0.799 vs 0.762,0.773,0.799 vs 0.769)差异均无统计学意义(Z=1.063,P=0.288;Z=0.686,P=0.493;Z=0.757,P=0.449)。诊断灵敏度最高为Brock 模型(90.9%),最低为VA模型(50.0%);特异度最高为VA 模型(76.5%),最低为Brock 模型(55.3%)。阳性似然比(positive likelihood ratio,+LR)最高为本模型(3.25);最低为Mayo 模型(1.86)。阴性似然比(negative likelihood ratio,-LR)最高为VA 模型(0.66),最低为PKU 模型(0.23)。诊断效能从大至小依次为:本模型、PKU,GZMU,Brock,Mayo,VA 模型。
图1 本模型与其他模型的ROC 曲线比较
表4 本模型与其他模型的诊断效能比较
3 讨论
预测模型是一种具有客观、精确、稳定及可重复等优点的评估工具,能够协助首诊医生给予肺结节患者的肺癌风险评估,根据恶性概率将患者进行风险分层,制定个体化诊疗方案,实现合理配置医疗资源的同时,达到患者利益最大化[10]。21世纪全球开展两项大型随机对照试验,包括美国国立肺癌筛查试验(NLST)[11]与荷兰-比利时肺癌筛查试验(NELSON)[12],研究表明,肺癌早筛查与早诊治是降低人群肺癌死亡率的有效措施。最近,《柳叶刀》(THE LANCET)发表年度重磅肺癌筛查综述[13],汇集当前全球最新医学证据,针对全球当前肺癌筛查现状与未来方向,展开荟萃分析。随机对照试验表明,用于肺癌筛查的LDCT 有助于降低肺癌死亡率。指出肺癌发病率的地域差异,例如亚洲国家从未吸烟的人群中肺癌患者比例较高,需要特别注意改进选择标准和风险模型。本研究提示,是否吸烟对PN 恶性风险无明显影响,差异无统计学意义。这有别于欧美国家人群,可能因种族和地区差异所致。
本研究发现年龄、癌症家族史、边界清晰、肺上叶、结节直径、结节性质、毛刺及血清CEA,CYFRA21-1,SCCA,分叶、血管集束征、钙化等为肺结节的影响因子。其中,前面10 个变量为独立预测因子。除边界清晰为保护性因素外,其余变量为肺结节恶性危险因素。独立预测因子的优势比(odds ratio,OR)依大小排列为结节性质、毛刺、癌症家族史、CEA,CYFRA21-1,SCCA,直径、年龄、肺上叶、边界清晰。OR 值大于3 的分别是结节性质、毛刺和癌症家族史。磨玻璃结节(ground glass nodules,GGN),也被称为毛玻璃结节,指的是CT 影像表现为局限性的模糊密度增高影。如果肺泡腔内存在少许黏液和包含的细胞量少时,CT影像表现为GGN;如果结节内细胞或组织碎片大量堆积聚集、刺激胶原纤维成分大量增生时,CT影像则表现为混合磨玻璃结节(mixed ground glass nodules,mGGN)或部分实性结节(part-solid nodules,PSN )。研究发现PSN 或GGN 的恶性概率可能升高3.5 倍以上(OR= 4.5,95%CI:2.6~7.7),在建模组中,性质为PSN 或GGN 的良性与恶性结节分别占17.7%与57.1%,差异有统计学意义(P<0.001)。PSN 与肺腺癌相关,其恶性率高于纯GGN 和实性结节[14]。病理上,PSN 主要被证实为微浸润和浸润性腺癌,而纯GGN 多为原位腺癌,有时为微浸润腺癌[15]。
边缘出现毛刺的结节恶性概率可能升高3.3倍以上(OR=4.3,95%CI:2.3~7.9),在建模组中,良性与恶性结节具有毛刺患者分别占19.8%和58.4%,差异有统计学意义(P<0.001)。毛刺多由两种因素形成,一是肿瘤周围血管增生、增粗、牵拉引起,多表现为细短毛刺,二是病灶周围肺纤维化。年龄较大,肺气肿和毛刺的存在与恶性肿瘤有关[16]。具有癌症家族史患者恶性概率可能升高2.4倍(OR=3.4,95%CI:1.1~10.9),在建模组中,良性与恶性结节具有癌症家族史患者分别占3.0%和8.9%,差异有统计学意义(P=0.005)。肺癌家族史的个体比没有肺癌家族史的患肺癌的风险高2~3 倍。一级亲属中有癌症家族史的个体与无癌症家族史的个体相比,患肺癌的风险增加约50%,且这种关联不受性别、种族、组织学类型和其他已知肺癌危险因素的影响[17]。ANG 等[18]研究提示,有肺癌家族史的人群患肺癌的风险明显升高,可能因存在肺癌遗传基因易感位点。研究显示,在建模组中,良性与恶性肺结节平均直径(6.1 mm vs 12.3 mm)差异有统计学意义(P<0.001)。其中,结节直径大于10.0 mm 在良性与恶性组分别占12.0%和88.0%。LARICI 等[19]研究指出,结节大小和生长速度仍然是最广泛使用的预测因子,用于评估结节恶性概率。结节的初始大小、生长速度与恶性风险之间存在直接正比关系。这与本研究结果一致。尽管最近的指南引入了结节体积作为指标,到目前为止,结节管理一直基于结节直径大小。
研究最多的肺癌生物标志物包括CYFRA 21-1,CEA,SCCA 和NSE 等[20]。本研究显示,生物标志物OR 值依大小排列为CEA,CYFRA21-1,SCCA。生物标志物在不同病理分型中的表现不同,腺癌的CEA 水平明显高于其他类型。而非小细胞癌CYFRA21-1 具有较高表达。SCCA 异常高表达常见于鳞癌,包括肺癌、宫颈癌、卵巢癌等[21]。李辉等[22]研究发现,与肺良性疾病组比较,肺癌组患者CEA,CYFRA21-1,NSE,ProGRP,SCCA,CA125和HE4 的水平均明显升高。诊断性能评价中,单项检测时,诊断肺癌AUC 最大的为CYFRA21-1,其次为CEA。而CEA,SCCA,NSE 分别对腺癌、鳞癌和小细胞肺癌具有最佳诊断效能,这与本研究结果相近。彭瑛等[23]研究提示,NSE,CYFRA21-1,CEA,CA125,CA153,CA199 和SCCA 等7 种标志物中,SCCA 对肺癌诊断效能最高(AUC=0.817)。联合标志物的诊断效能优于单一指标,CEA+CA125+CYFRA21-1 联合应用诊断肺癌效能更高。中华医学会肺癌临床诊疗指南[24]指出,胸部CT 可有效检出早期周围型肺癌、明确病变所在的部位和累及范围。检测肺癌相关的生物标志物,有助于辅助诊断和早期鉴别诊断并预测肺癌病理类型。
研究显示,PN 恶性风险与年龄呈正比,PN 恶性风险率从小至大依次为≤50 岁[恶性33 例/(良性64 例+恶性33 例),恶性风险率34.0%,下同],>50 岁[348/(257+348),56.6%],>60 岁[283/(182+283),60.7%],>70 岁[170/(85+170),66.7%]。肺上叶结节发病率较高,原因可能为吸入的有毒或有害物质首先进入并聚集于肺上叶,引起局部组织慢性炎症、增生、恶变。
似然比(LR)是反映诊断真实性的一种指标,属于同时反映灵敏度和特异度的复合指标。本研究构建模型+LR 最高(3.25)。与Mayo,VA 等模型比较,本模型具有较高PPV 和NPV,且本模型AUC 值高于其他5 种模型。这可能归因于本研究参数更为全面,构建的模型更科学合理。研究提示,根据回归分析得出的OR 值不同,经计分确认OR 的权重如下:临床特征24.4%(4.76/19.55),CT 信息54.6%(10.68/19.55),生物指标21.0%(4.11/19.55)。可见,CT 信息权重最大,尤其结节性质,如果体检发现部分实性结节(PSN)或肺磨玻璃结节(GGN),应该根据恶性概率高低确定其危险度定期复查。其次,存在癌症家族史和(/或)生物指标异常,应根据预测模型计算结果分析判断,确定是否干预。
诚然,本模型存在一定局限,比如样本量偏小,缺乏大量外部数据验证。由于神经元烯醇化酶(NSE)检测结果受样本溶血及样本周转时间等因素干扰较大,胃泌素释放肽前体目前尚未开展,故这两个项目未纳入研究。再者,影像信息尚未将空洞、卫星灶、支气管截断征、晕征、结节周围支扩征、结节周围炎症等纳入研究。
综上所述,本预测模型具有较高的PN 性质预测准确度,可帮助临床提高诊断准确度,使患者得到早诊断和早干预,避免过度医疗,值得推广应用。