肾集合管癌预后列线图的建立
2021-12-14冯骎王仙友李伊婷徐荣陶逸然
冯骎 王仙友 李伊婷 徐荣 陶逸然
集合管癌(collecting duct carcinoma,CDC)是一种起源于肾髓质Bellini集合管远端的恶性上皮性肿瘤(又称Bellini管癌),是肾细胞癌的一种极为罕见的病理亚型,仅占肾脏肿瘤的1%~2%[1]。临床上,CDC侵袭程度较高,多数患者首诊时已处于进展期或发生转移,因此预后极差[2]。据报道,50%~60%的CDC患者在最初诊断后2年内死亡,且2年癌症特异性生存率为47.3%[3-4]。亦有研究表明,60%~70%的患者在诊断后3年内死亡[5]。由于CDC极其罕见,几乎不可能开展大规模的前瞻性研究。迄今为止,较大的系列研究包括欧洲、日本以及来自美国国家癌症数据库的系列研究[4-7]。由于临床上可供研究的CDC病例较少,加上国内的大样本研究较为欠缺,因此临床上如何便捷、准确地评估CDC患者预后的难度较大。目前,国内外多应用列线图模型来分析各类肿瘤患者的预后情况。因此,本研究利用美国国立癌症研究所的监测、流行病学和结局(surveillance epidemiology and end results,SEER)数据库中CDC患者生存数据进行统计分析,筛选出对CDC患者生存具有重要影响的预后因子,并建立列线图模型,现将结果报道如下。
1 对象和方法
1.1 对象 从SEER数据库中(http://seer.cancer.gov/seerstat)筛选1975至2016年确诊为肾CDC(ICD-O-3编码为8319/3,Bellini管癌)的患者467例,剔除非组织学确诊、侧别不清或双侧、TNM分期不清及数据缺失、死于其他情况的患者,最终有282例患者纳入本研究。采用随机数字表法,按7:3的比例分为训练队列186例和验证队列96例。
1.2 观察指标 主要包括诊断时年龄、种族、性别、肿瘤侧别、临床分期、肿瘤直径、原发部位手术情况、放化疗情况、总生存期等。
1.3 统计学处理 采用R 4.0.2和RStudio 1.2.5033统计软件。呈非正态分布的计量资料以M(P25,P75)表示,组间比较采用Mann-Whitney U检验;计数资料组间比较采用χ2检验。使用survival软件进行单因素生存分析,筛选出对患者总体生存率有统计学意义的因素,再将这些因素分别纳入两个Cox多因素生存回归模型分析,根据AIC信息准则选择拟合优良性较好的模型变量并分别确定两个模型的最优解[8],比较两个模型的C指数并确定最优预测模型,使用rms软件建立预后列线图。通过ROC曲线及校准曲线分析评价并验证所建立的列线图预测效能。应用ggDCA的决策曲线分析计算一系列阈值概率的净收益来评估列线图的临床实用性[9]。P<0.05为差异有统计学意义。
2 结果
2.1 两组患者临床资料比较 训练队列与验证队列患者在性别、年龄、种族、肿瘤侧别、临床分期、肿瘤直径、原发病灶手术情况、放化疗情况、总生存期等临床资料比较,差异均无统计学意义(均P>0.05),见表1。
表1 训练队列与验证队列临床资料比较
2.2 列线图的构建 单因素分析显示,训练队列患者的年龄、肿瘤直径、T分期、N分期、M分期、TNM分期、原发病灶是否手术、是否行放化疗是预后影响因素。其中单独的T分期、N分期、M分期和TNM总分期之间存在关联性,因此将其分别置于两个不同的模型中。模型1的变量包括年龄、T分期、N分期、M分期、肿瘤直径、原发病灶是否手术、是否行放疗、是否行化疗,模型2的变量包括年龄、TNM分期、肿瘤直径、原发病灶是否手术、是否行放疗、是否行化疗。根据AIC信息准则得到两个模型的最优拟合变量,模型1包含年龄、T分期、M分期、原发病灶是否手术、是否行化疗,模型2包含年龄、TNM分期、肿瘤直径、原发病灶是否手术、是否行化疗,见表2。模型1、2的C指数及95%CI分别为0.772(0.735~0.809)和 0.778(0.741~0.815),差异有统计学意义(P<0.05),即模型2为更优模型。根据模型2得到的预后列线图,见图1。
图1 集合管癌(CDC)患者的预后列线图
表2 影响训练队列CDC患者生存的单因素及多因素分析
2.3 列线图的预测效能 ROC曲线分析显示,根据所建立的预后列线图计算得到3个月、6个月、1年、3年生存率的AUC均>0.8,提示该列线图具有较好的预测准确度,见图2。校准曲线分析显示列线图预测的生存率与实际生存率具有较好的一致性,提示该列线图预测效能较好,见图3。
图2 根据所建立的预后列线图预测训练队列集合管癌(CDC)患者3个月、6个月、1年、3年生存率的ROC曲线
图3 根据所建立的预后列线图预测训练队列集合管癌(CDC)患者3个月、6个月、1年、3年生存率的校准曲线
2.4 列线图的验证 在验证队列中,根据所建立的预后列线图计算得到3个月、6个月、1年、3年生存率的AUC均>0.7,提示该列线图具有较好的预测准确度,见图4。校准曲线分析显示列线图预测的生存率与实际生存率具有较好的一致性,提示该列线图在验证队列中表现良好,见图5。
图4 根据所建立的预后列线图预测验证队列集合管癌(CDC)患者3个月、6个月、1年、3年生存率的ROC曲线
图5 根据所建立的预后列线图预测验证队列集合管癌(CDC)患者3个月、6个月、1年、3年生存率的校准曲线
2.5 列线图的临床适用性 决策曲线分析显示,当训练队列的阈值概率(总体生存率)超过10%、验证队列的阈值概率(总体生存率)超过15%时,使用所建立的列线图预测CDC患者的预后比“所有患者全部治疗或全不治疗”的策略提供更大的净收益,这表明该列线图具有潜在的临床适用性,见图6。
图6 训练队列和验证队列验证列线图临床实用性的决策曲线分析(a:训练队列;b:验证队列)
2.6 列线图的网络访问 本研究所建立的CDC预后列线图可通过https://chingfeng.shinyapps.io/DynNomapp CDC/在线访问并使用。
3 讨论
CDC是肾细胞癌的一种罕见病理亚型,多数患者在初诊时就已表现出转移性特征,且TNM分期较晚,60%~70%的患者在诊断后3年内死亡[5-6]。目前对于常见肾脏肿瘤(如透明细胞癌、乳头状细胞癌等)已建立标准治疗方案,但对于CDC的最佳治疗策略尚缺乏共识[10]。目前,手术仍是CDC的主要治疗选择。有报道称,细胞减灭性肾切除术可以改善患者的癌症特异性生存率[11]。此外,亦有术后长期生存的报道[12]。但是考虑到多数患者确诊时已经存在淋巴结转移或远处转移,细胞减灭性手术能否使患者获益尚无定论。有文献报道,化疗可在一定程度上提高患者的客观缓解率[13]。先前的贝伐单抗、吉西他滨和铂类三联治疗转移性CDC的Ⅱ期临床试验结果显示,患者的无进展生存期和总生存期得到延长[14]。这些研究纳入的样本量均十分有限,其必要性仍有待进一步验证。因此,准确地判断CDC患者的预后对辅助治疗的选择具有重要意义。然而,目前文献中尚未指明预测CDC患者预后的最佳方法。因此,本研究建立了包含诊断时年龄、TNM分期、肿瘤直径、原发病灶是否手术、是否行化疗等因素的CDC预后列线图,并使用内部数据集进行验证,提示该列线图在训练队列和验证队列中均有良好的区分度和校准度。另外,决策曲线分析结果也提示其具有广阔的临床应用前景。
有学者建立疾病特异性风险模型来预测CDC患者的癌症特异性死亡率,其参数包括肿瘤直径、转移、Fuhrman核分级、淋巴管浸润以及美国麻醉医师协会评分[4]。同样,本研究所构建的列线图也包含肿瘤直径,但遗憾的是由于后几项因素SEER数据库中并未提供,故未纳入研究。不同于上述疾病特异性风险模型的是,笔者发现69岁以上患者的总体生存率较69岁以下患者明显下降,故有理由认为高龄是CDC患者预后不良的因素。TNM分期是本研究所建立的列线图最终风险评分的主要部分,结合年龄、肿瘤直径以及治疗相关因素后对CDC患者预后的预测效能更佳。考虑到社会环境和医疗环境的不同,希望未来可以进一步得到外部临床数据,对列线图进行个性化调整,以便更好地应用于临床。
综上所述,本研究所建立的CDC预后列线图(包括年龄、TNM分期、肿瘤直径、原发病灶是否手术、是否行化疗等因素)具有较高的预测效能及临床适用性,临床医生可通过https://chingfeng.shinyapps.io/DynNomappCDC/在线访问并使用。但本研究也存在一定的局限性:(1)剔除了缺少临床数据的患者;(2)由于某些信息在SEER数据库中无法获取,本研究未纳入某些潜在的预后预测因子,如 Fuhrman核分级、Ki-67指数等;(3)治疗相关因素未细化到具体方案;(4)临床数据均来源于回顾性分析,所构建的列线图仍需要在前瞻性临床试验中作进一步验证。