APP下载

基于SEER数据库探讨转移性肾癌预后预测模型的构建与验证

2022-03-16邓薇冉亮王刚张宪

肿瘤预防与治疗 2022年2期
关键词:生存率病理数据库

邓薇,冉亮,王刚,张宪

401220 重庆,重庆医科大学附属长寿区人民医院/重庆市长寿区人民医院 肾内血液科

肾细胞癌,简称肾癌(renal cell carcinoma,RCC)是最常见的泌尿生殖系恶性肿瘤[1],占全部恶性肿瘤的1.8%,占泌尿系统恶性肿瘤的77.2%[2],发病率和死亡率分别位居泌尿系恶性肿瘤的第2位和第3位[3]。RCC的病程较为隐匿,约有20%~30%的患者在早期诊断时已发生转移[4],有约30%的患者在行根治性手术治疗后仍会出现复发或转移[5],转移性肾癌(metastatic renal cell carcinoma,mRCC)的预后更差,中位生存期仅约12个月,2年生存率低于20%,5年生存率低于10%[6-7]。mRCC预后预测模型的相关研究,可以帮助临床医生的治疗决策。SEER数据库是由美国国家癌症研究所开发并供全球开放获取分析使用,SEER数据库在全球癌症临床数据库分析中应用广泛[8]。因此,本文纳入SEER数据库中2 880例mRCC患者作为研究对象,构建预后预测模型,并对该模型的诊断效能和实用性进行验证。现将相关结果报告如下。

1 资料与方法

1.1 临床资料

提取SEER(Surveillance,Epidemiology and End Results,SEER)数据库(https://seer.cancer.gov)中2010~2015年2 880例初诊RCC远处转移患者的相关临床资料。SEER数据库覆盖美国18个州和地区超过全美30%的人口数,具有详细可靠的临床资料和比较完整的随访资料,SEER数据库为公开开放获取,不需要专门的伦理审查和知情同意。

1.2 纳入排除标准

纳入标准:1)病理诊断为RCC,包括透明肾细胞癌、乳头状肾细胞癌、嫌色肾细胞癌和其他类型;2)初诊时已明确有远处转移(包括脑、肝、肺、骨等主要器官转移);3)临床病理资料完整、随访数据完整,可评价。排除标准:1)RCC原发部位不详;2)合并有其他恶性肿瘤。

1.3 资料收集

主要收集患者的临床病理及随访资料,包括性别、年龄,肿瘤部位、治疗方案(手术治疗、放化疗)、病理类型、病理分级、T分期、N分期、远处转移的部位,生存状况和总体生存期(overall survival,OS)。进一步采用随机分割样本法(分割比为7∶3)将2 880例患者分为基本数据集(n=2 016)和验证数据集(n=864)。

1.4 统计学方法

采用SPSS 22.0统计软件对数据进行统计学处理,对基本数据集中的计量资料采用均数±标准差进行统计描述,组间比较采用t检验;计数资料采用例数(百分比)进行统计描述,组间比较采用χ2检验或Fisher确切概率法;以预后生存状况作为因变量(Y),采用单因素和多因素Cox比例风险回归模型筛选独立预后因素并构建预测模型。利用验证数据集,采用受试者工作特征(receiver operating characteristice,ROC)曲线下面积(area under the curve,AUC)对构建的模型的诊断效能进行外部验证。以P<0.05为差异具有统计学意义。

2 结 果

2.1 mRCC患者临床病理特征分析

2 880例mRCC患者临床病理特征分布情况见表1。基本数据集与验证数据集中患者在性别、年龄、肿瘤位置、病理类型、病理分级、T分期、N分期、转移情况、治疗情况之间差异均无统计学意义(均P>0.05),说明两组数据具有可比性。

表1 2 880例mRCC患者临床病理特征

2.2 mRCC预后单因素及多因素Cox比例风险回归分析

基于基本数据集数据,以患者预后总生存作为因变量(死亡:Y=1,存活:Y=0),以患者的临床病理资料作为自变量(X)进行单因素和多因素Cox比例风险回归模型分析(变量筛选方法:Forward为LR,变量入选标准为0.05,剔除标准为0.1),单因素分析结果显示:年龄、病理类型、T分期、N分期、脑转移、肝转移、肺转移、手术治疗、放射治疗均与患者预后OS相关(均P<0.05)。进一步多因素分析结果显示,年龄≥70岁(HR=1.596)、乳头状细胞癌(HR=0.631)、T4分期(HR=1.669)、N1分期(HR=1.733)、脑转移(HR=1.505)、肝转移(HR=1.624)、肺转移(HR=1.419)、手术治疗(HR=0.361)是mRCC预后独立影响因素(均P<0.05,表2)。

表2 mRCC预后单因素及多因素Cox比例风险回归分析

2.3 mRCC预后预测模型构建

根据多因素Cox比例风险回归模型分析结果,预测指数(prognostic index,PI)为:PI=1.596X2+0.631X4+1.669X6+1.733X7+1.505X8+1.624X9+1.419X10+0.361X12。构建Cox比例风险回归指数模型表达式为:h(t)=h0exp(1.596X2+0.631X4+1.669X6+1.733X7+1.505X8+1.624X9+1.419X10+0.361X12)。

2.4 基于预后预测模型的外部验证

ROC曲线分析显示,预后预测模型用于预测验证数据集mRCC患者的3年生存率和5年生存率的AUC分别为0.744和0.761,显示该模型在预测预后方面具有较好的可靠性和重复性,见图1、2。

图1 模型用于预测验证组mRCC患者3年生存率的ROC曲线

图2 模型用于预测验证组mRCC患者5年生存率的ROC曲线

3 讨 论

由于RCC患者的早期临床症状较为隐匿,因此,约有20%~30%的RCC患者在初次诊断时已存在远处转移[4]。mRCC患者的预后较差,无远处转移的RCC患者的5年生存率可达90%,而mRCC的5年生存率却不到10%[9-10]。因此,了解mRCC患者的预后影响因素并构建相关预后预测模型对mRCC的治疗及提高预后生存至关重要。RCC患者的预后状态具有明显的异质性,单一模式的预测模型对肿瘤总体生存率的预测存在明显的不足[11-12]。因此,科学的构建基于患者临床病理信息的统计学预后预测模型,并明确各临床指标的权重,将有助于指导临床治疗和决策。本研究利用SEER数据库的2 880例mRCC患者临床病理及随访数据,构建具有实际可操作性的预后预测模型,并验证了其实用性和可靠性。

本组基本数据集数据结果显示,高龄,T分期越高、N分期越高、存在脑转移、肝转移、肺转移,病理类型为透明RCC,未行手术治疗和行放射治疗与mRCC患者不良预后相关。将8个临床指标及年龄因素纳入多因素Cox比例风险回归模型,发现年龄≥70岁(HR=1.596)、乳头状细胞癌(HR=0.631)、T4分期(HR=1.669)、N1分期(HR=1.733)、脑转移(HR=1.505)、肝转移(HR=1.624)、肺转移(HR=1.419)、手术治疗(HR=0.361)是mRCC预后独立影响因素,并进一步构建了预后预测指数模型。在本研究中,我们基于基本数据集数据中的各种危险因素的组合构建了一个较为全面的预测模型,可以更好地预测mRCC患者的预后。并通过验证数据集的进行了外部验证,证实该模型对mRCC患者预后3年生存率预测的AUC为0.744,5年生存率预测的AUC为0.761,说明该曲线的拟合优度及诊断效能均比较理想。同时我们也发现,本研究构建的预测模型与既往报道的mRCC预后危险因素部分一致,也存在一定差异,如本研究中的性别、种族、病理分级及是否发生骨转移等因素为进入到预测模型当中[13-14],分析其原因可能与本研究的样本来源、样本量以及研究变量的纳入等方面存在差异有关[15]。

综上所述,本研究基于大样本回顾性数据构建了包括年龄、病理类型、T分期、N分期、脑转移、肝转移、肺转移和手术治疗等8个指标的预后预测模型,并通过验证数据集的数据经ROC曲线分析证实具有较高的可靠性和实际应用价值。

然而,本研究同时存在一定局限性,首先,研究数据为基于SEER数据库的回顾性研究,数据可能存在一定偏差;其次,在研究变量选择时,由于SEER数据库未包含关于复发的相关数据,同时一些手术相关的细化指标如手术切缘、血管侵犯等指标均未包含在里面,这些可能影响在预后预测模型构建时指标的全面性;最后,在纳入排除标准中,我们剔除了临床病理资料及随访资料不完整的患者,这也可能导致纳入样本的代表性产生一定偏倚。因此,本研究只是一种探索,还有待进一步的前瞻性研究加以证实。

作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。

学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。

同行评议:经同行专家双盲外审,达到刊发要求。

利益冲突:所有作者均声明不存在利益冲突。

文章版权:本文出版前已与全体作者签署了论文授权书等协议。

猜你喜欢

生存率病理数据库
分析乳腺癌病理诊断对临床诊治的价值
小细胞肺癌病理特征及免疫研究进展
术前MRI检查对宫颈癌病理分期及宫旁浸润评估的诊断价值
『5年生存率』啥意思
“五年生存率”不等于只能活五年
为何要病理会诊和免疫组织化学检测
日本首次公布本国居民癌症三年生存率
日本癌症患者十年生存率达59%左右
数据库
数据库