基于影像学特征构建风险评估模型预测肺结节良恶性的研究*
2022-09-02田博张旭东王霄马婧陈颖怡李强宋争放
田博,张旭东,王霄,马婧,陈颖怡,李强,宋争放
610041 成都,四川省肿瘤医院·研究所,四川省癌症防治中心,电子科技大学医学院 胸外科(田博、李强),药物临床试验机构(张旭东),宣传科普部(王霄),预防部/癌防办公室(马婧),临床流行病学与循证医学研究部(陈颖怡、宋争放)
肺癌是全球范围内高发的恶性肿瘤[1],在中国,肺癌的发病率和死亡率都居所有癌症的首位[2-3]。随着人们对健康体检的重视和低剂量螺旋CT(low-dose computed tomography,LDCT)的应用,肺结节的检出率日益增高。LDCT分辨率高,但此筛查手段带来的过度治疗和其假阳性问题尚未得到妥善解决,以及由此产生对患者精神和生活质量的影响,限制了LDCT的实用价值以及在健康体检人群中的推广应用[4-5]。
临床上对肺结节的良恶性判断及干预时间判断仍存在很多困难。在所有肺结节中,恶性肺结节的比例不足5%[6]。在手术切除的肺结节中,大约有30%为良性结节[5,7],这些患者承受了手术风险和手术后的并发症,降低了生活质量。过度治疗既加重了患者自身的经济负担也造成了社会医疗资源的浪费,如何正确处理肺结节逐渐成为困扰临床医生的难题和胸外科领域的热点问题。
因此,正确识别恶性肺结节就显得特别重要,才能做到早期发现,早期诊断,早期治疗。一个准确实用的预测模型可以有效判断肺结节良恶性,进而减少良性结节不必要的手术治疗。目前有多种用于临床预测肺结节良恶性的模型,其中以梅奥临床人员研发的模型应用最为广泛[8],福建医科大学的陈椿教授等[9]对原有肺结节良恶性预测模型进行了改良,可以准确鉴别恶性病变,在保证肺功能的同时,最大限度切除病变。而基于大样本量的真实世界研究有望为肺结节良恶性预测模型提供更为全面的数据基础,推动早期肺癌手术的发展。为此,我们回顾2018年1月至2019年12月在四川省肿瘤医院行肺部手术患者的临床资料,并利用患者的影像学特征构建了预测肺结节良恶性的模型,通过真实世界数据验证模型的准确性。
1 对象与方法
1.1 研究对象
病例来源于2018年1月至2019年12月在四川省肿瘤医院胸外科因肺结节行静脉全麻手术治疗的患者。1)纳入标准:因肺结节行静脉全麻手术治疗的患者。2)排除标准:信息缺失或失访,特别是术前相关影像学检查缺失的患者。本研究经四川省肿瘤医院伦理委员会批准(批号:SCCHEC-02-2019-019),在中国临床试验中心注册(编号:ChiCTR19 00027641)。
1.2 方法
收集患者的影像学资料,统计影像学特征,包括结节边界是否分界不清、静脉注射含碘对比剂扫描后是否不均匀强化、结节的密度(实性结节、部分实性结节或磨玻璃密度结节)、结节是否有钙化、形态是否不规则、密度是否不均匀、是否有分叶征、是否有毛刺征、是否有胸膜凹陷征、是否有支气管充气征、结节内是否有血管通过、结节内是否有空洞。基于影像学特征对所有患者进行风险评估,通过Logistic二分类分析,绘制受试者工作特征(receiver operating characteristic,ROC)曲线,并计算曲线下面积(area under curve,AUC),以Youden指数最大的分界点作为最佳诊断分界点。
1.3 统计学方法
应用SPSS 23.0统计学软件对数据进行分析,符合正态分布的计量资料,采用均数±标准差表示,两样本均数比较使用t检验;对非正态分布的计量资料,采用中位数表示,两样本比较使用秩和检验。采用ROC曲线来评价不同风险评估模型诊断的准确性,以P<0.05为差异有统计学意义。
2 结 果
2.1 一般资料
本研究共纳入351例患者,其中男性171例,女性180例。肺恶性肿瘤患者278例,平均年龄(60.8±6.9)岁;肺良性疾病患者73例,平均年龄(59.1±6.6)岁。肺恶性肿瘤患者结节最大径的平均值为(1.9±0.9)cm,肺良性疾病患者结节最大径的平均值为(1.3±1.1)cm,差异有统计学意义(P<0.001),其中肺恶性肿瘤患者结节≤1 cm有35例,肺良性疾病患者有22例;结节>1 cm,≤2 cm肺恶性肿瘤患者有126例,肺良性疾病患者有38例;结节>2 cm,≤3 cm肺恶性肿瘤患者有117例,肺良性疾病患者有13例。肺恶性肿瘤患者0期有2例,I期有202例,II期有19例,III期有33例,IV期有22例(表1)。
表1 两组患者的一般临床资料比较Table 1. General Clinical Data in Two Groups
2.2 影像学特征
通过单因素分析,实性结节在肺恶性肿瘤患者中的比例小于在肺良性疾病患者中的比例(70.1%vs93.2%,Z=-4.030,P<0.001);部分实性结节在肺恶性肿瘤患者中的比例大于在肺良性疾病患者中的比例(12.9%vs4.1%,Z=-2.136,P=0.033);磨玻璃密度结节在肺恶性肿瘤患者中的比例大于在肺良性疾病患者中的比例(16.9%vs2.7%,Z=-3.104,P=0.002);具有分叶征的比例,肺恶性肿瘤患者大于肺良性疾病患者(29.5%vs13.7%,Z=-2.728,P=0.006);具有毛刺征的比例,肺恶性肿瘤患者大于肺良性疾病患者(54.3%vs23.3%,Z=-4.716,P<0.001);内见空洞患者的比例,肺恶性肿瘤患者大于肺良性疾病患者(10.1%vs1.4%,Z=-2.400,P=0.015),差异具有统计学意义(表2)。
从表3可知,结节直径每增加1 cm(OR=3.166,95%CI:1.983~5.055,P<0.001)、结节边缘有毛刺(OR=4.721,95%CI:2.487~8.962,P<0.001)、非实性结节(OR=6.392,95%CI:2.915~14.018,P<0.001)为肺恶性肿瘤的独立危险因素,差异具有统计学意义。
表2 两组患者的影像学特征比较Table 2. Imaging Features in Two Groups
表3 多因素Logistic二分类回归分析Table 3. Binary Logistic Regression Analysis
2.3 模型的ROC曲线
基于影像学特征对所有患者进行风险评估,通过Logistic二分类分析,绘制ROC曲线,基于影像学特征的风险评估模型AUC为0.81(P<0.001)(图1)。
图1 模型的ROC曲线Figure 1.Receiver Operating Characteristic Curve
2.4 模型的Youden指数及其对应的敏感度和特异度
本研究模型Y=-1.618+1.153×X1+1.552×X2+1.855×X3[Y:结节为恶性的分值;X1:结节最大直径;X2:结节边缘是否有毛刺(1是,0否);X3:非实性结节(1是,0否)]。取敏感度和特异度之和减去1,最大值时对应的值为Cut-off值,在Cut-off值为8.95时,对应的Youden指数为0.518,敏感度为0.669,特异度为0.849(表4)。
表4 模型的Youden指数及其对应的敏感度和特异度Table 4. Youden Index,Sensitivity and Specificity of the Model
3 讨 论
肺癌是全球范围内高发的恶性肿瘤,其中非小细胞肺癌(non-small cell lung cancer,NSCLC)是肺癌中最为常见的组织学类型,约占80%~85%[1]。对于早期肺癌患者,应该首选外科手术。最新的数据报道IA期NSCLC患者术后5年生存率高达80%,而IIIC期患者术后5年生存率仅仅12%,因此如何正确识别早期肺癌尤为重要[10]。
2011年发表的美国国家肺癌筛查试验是LDCT应用于肺癌早筛的里程碑式的研究,LDCT相比普通胸片可以降低20%的肺癌死亡率[4]。2018年,世界肺癌大会发表了另一项关于LDCT的研究,指出使用CT筛查无症状的肺癌高危人群,可让更多的肺癌患者在疾病早期即被检出,从而让男性肺癌患者的10年死亡率降低26%,而女性肺癌死亡率降低更显著,幅度为39%~61%,因此早发现、早治疗对于肺癌患者的治疗效果影响显著[11]。
对于健康的体检者而言,随着肺部CT检查的普及,使得大量的肺结节被检出,伴随而来的是人们的焦虑、恐惧等心理,甚至被称为“肺结节综合征”,因为肺结节和肺癌是近邻,而肺结节包括良性结节和恶性结节,肺良性结节大多不用处理,恶性结节通过早期干预,预后亦较好[12]。因此,如何正确识别出恶性肺结节就显得特别重要。本研究基于我院真实世界情况,采用单中心回顾性研究的方法,以因肺结节行手术治疗的351例患者(包括278例肺恶性肿瘤患者和73例肺良性疾病患者)为样本,总结其肺结节的影像学特征,并尝试利用肺结节的影像学特征来构建预测模型。研究发现,结节直径每增加1 cm(OR=3.166,95%CI:1.983~5.055,P<0.001)、结节边缘有毛刺(OR=4.721,95%CI:2.487~8.962,P<0.001)、非实性结节(OR=6.392,95%CI:2.915~14.018,P<0.001)为肺恶性肿瘤的独立危险因素,差异有统计学意义。通过绘制基于影像学特征的风险评估模型,模型的AUC为0.81(P<0.001),模型在Cut-off值为8.95时,对应的Youden指数为0.518,敏感度为0.669,特异度为0.849。这些结果提示,随着结节最大径的增加,恶性结节的概率增加;边缘有毛刺的结节较边缘无毛刺的结节恶性概率更大;非实性结节较实性结节恶性概率更大。与既往通过临床医生的经验来判断肺结节的良恶性相比,通过此风险评估模型能辅助临床医生进行判断,提高判断的准确性。此外,本模型的AUC(0.81)不劣于现有的Mayo模型(0.696)、VA模型(0.634)、李运模型(0.681)、王欣模型(0.742)等[13],在实际临床应用中具有一定价值。
目前有多种临床肺癌预测模型,其中以梅奥临床人员研发的模型应用最为广泛,包括年龄、吸烟史、结节发现前的胸腔恶性肿瘤史、结节直径、结节有毛刺和结节位于上叶,都是肺恶性肿瘤的独立预测因素[8],但是梅奥预测模型主要针对实性结节。然而,近年来随着LDCT筛查的普及,肺磨玻璃样变(ground glass opacity,GGO)逐渐引起人们的关注,由于GGO与其他恶性结节之间有较大差异,其诊断则更值得关注。原发性肺癌诊疗规范[14]也指出结节的大小、形态、密度、内部结构、瘤肺界面及体积倍增时间是最重要的影像学诊断特征。上海市肺科医院诊疗共识也指出磨玻璃结节若出现分叶征、胸膜牵拉、支气管充气征通常提示微浸润腺癌[15-17]。形成毛刺的病理基础为肿瘤侵犯邻近小叶间隔、瘤周肺实质纤维变和/或伴有炎细胞浸润所致[14]。在评估肺结节是否需要手术治疗的时候,一般是在高度怀疑为恶性肺结节的时候才会建议患者行手术治疗,在进行评估的时候不仅需要看结节的大小,还需要结合其他影像学特征,比如有没有毛刺,是实性结节还是非实性结节,除了影像学特征外,也会使用到肺癌自身抗体这样的早诊标志物[18-19],综合考虑是否需要行手术治疗。
本研究所建立的风险评估模型虽可提高术前判断肺结节良恶性的准确性,但其敏感度、特异度均不高,预测能力有限。究其原因可能与以下有关:1)总体样本例数较少,因连续入组,导致良恶性例数不匹配,且实性结节例数偏高,导致结果有一定的偏倚;2)本研究影像学特征的提取来源于我院经过审核认定的医师所出具的正式检查报告记录,但是人工影像学特征提取有限,依赖于医务人员的临床经验,对结果会造成一定的偏倚。本研究所得出的结论来源于我院肺结节手术病人的真实世界情况,尚未开展前瞻性的研究。
近年来,随着人工智能技术的不断发展,开发基于人工智能技术的自动化肺结节检出、分级及早期肺癌筛查方案,建立基于神经卷积网络的人工智能程序,从胸部螺旋CT影像中检出、分割肺结节,检测并提取肺结节CT 影像参数,根据肺结节参数特征对肺结节进行分级的早期肺癌筛查方案,构建深度学习模型,更能提高术前判断肺结节良恶性的准确性[20-21]。总而言之,我们的研究发现,结节直径每增加1 cm、结节边缘有毛刺、非实性结节为肺恶性肿瘤的独立危险因素,由此构建的良恶性预测模型的AUC值不劣于现有的预测模型,或许具有一定的临床应用价值。
作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。
同行评议:经同行专家双盲外审,达到刊发要求。
利益冲突:所有作者均声明不存在利益冲突。
文章版权:本文出版前已与全体作者签署了论文授权书等协议。