利用SEER数据库进行胃印戒细胞癌患者生存预后Nomogram图的构建
2020-08-07王震赵春临毛浩勋
王震,赵春临,毛浩勋
(郑州大学第一附属医院 胃肠外科,河南 郑州 450052)
胃癌是世界上最常见的肿瘤[1-2],根据其形态学分类可以分为腺癌、黏液腺癌、印戒细胞癌、腺鳞癌等[3]。胃印戒细胞癌是胃癌病例中恶性程度极高的一种类型,在原发性胃癌中占3.4%~39%[4-5],分化程度差,恶性程度高[6]。目前,胃印戒细胞癌的发病机制并不明确。有报道称,胃印戒细胞癌起源于黏膜固有层中腺体颈部未分化的干细胞,其特点是能够在黏膜层内广泛播散,但侵犯至黏膜下层相对于胃非印戒细胞癌较慢[7-8],一旦突破黏膜下层就会快速进展,导致患者预后较差。早期胃印戒细胞癌诊断率并不高,一般发现时已经处于进展期[9-10]。尽管目前胃癌外科手术、辅助化疗及系统治疗方案较前明显改善,但胃印戒细胞癌的预后仍然不容乐观。本研究基于监测、流行病学和结果(Surveillance,Epidemiology and End Results,SEER)数据库,分析胃印戒细胞癌预后的影响因素,并构建列线图(Nomogram图),旨在探讨胃印戒细胞癌患者的预后,以预测胃印戒细胞癌患者的生存率。
1 资料与方法
1.1 一般资料数据来源于美国国立癌症研究院(National Cancer Institute,NCI)在1973年建立的SEER数据库。通过SEER*Stat 8.3.5软件提取了2010—2015年SEER数据库登记的胃印戒细胞癌患者信息,共2 439例。患者纳入信息包括年龄、性别、种族、原发部位、分化程度、肿瘤分期、肿瘤大小、淋巴结转移、手术方式、化疗。从SEER数据库获得了访问和使用数据集的签名授权和权限。由于SEER数据库的数据是公开的,并且去除了患者身份识别信息,无需获取当地伦理委员会对SEER数据库数据的批准。
1.2 选取标准纳入标准:(1)病理结果明确诊断为胃癌;(2)随访信息完整的数据;(3)依据第8版UICC/AJCC TNM 分期系统对病例进行分期。排除标准:(1)多源性肿瘤;(2)死于其他癌症或死因不明;(3)肿瘤类型、分化程度及分期等不完整的数据。
1.3 统计学方法应用SPSS 23.0统计软件对数据进行分析,以P<0.05为差异有统计学意义。采用Kaplan-Meier法计算患者1、3、5 a生存率,并采用Log-rank检验进行分析。对有统计学意义的患者变量,采用Cox比例风险回归模型进行多因素分析。将多因素分析中有统计学意义的变量纳入RStudio 1.1.463软件构建Nomogram图。采用Bootstrap法(自抽样次数B=1 000)进行内部验证,绘制受试者操作特征(receiver operator characteristic,ROC)曲线,然后使用曲线下面积(area under the curve,AUC)评估,显示模型的预测准确度,AUC为0.5~1.0,AUC越大表明区分受试者结果的准确性越高。对构建的Nomogram 图进行校准,同时绘制校正曲线。校准图形越接近于斜率为1的直线,Nomogram图预测越准确。
2 结果
2.1 胃印戒细胞癌患者临床病理参数与预后的关系采用Kaplan-Meier法计算患者1、3、5 a生存率,并进行Log-rank检验分析。结果显示,年龄、种族、原发部位、肿瘤分期、肿瘤大小、淋巴结转移、手术方式均与胃印戒细胞癌患者的预后相关(均P<0.05)。见表1。
表1 胃印戒细胞癌的生存率比较(n,%)
2.2 生存预后的影响因素分析根据胃印戒细胞癌生存分析结果,进一步进行多因素Cox 风险回归分析,以风险比(hazard ratio,HR)和95%置信区间(confidence interval,CI)为指标。研究结果显示,年龄、肿瘤分期、肿瘤大小、淋巴结转移、手术方式是影响胃印戒细胞癌患者预后的独立危险因素(均P<0.05)。见表2。
表2 胃印戒细胞癌的单因素和多因素Cox回归分析
2.3 构建Nomogram图纳入多因素Cox 风险回归分析模型中的有统计学意义的预后影响因素,包括年龄、肿瘤分期、肿瘤大小、淋巴结转移、手术方式,构建1、3、5 a生存率的Nomogram图。见图1。根据每一特征的不同分类向上投射到小尺标即可得出每一项的分值,将各项分值相加即为总分值,从总尺标向下投射即可得出患者1、3、5 a生存率。
图1 胃印戒细胞癌患者的Nomogram图
2.4 Nomogram图的验证采用Bootstrap 法对 Nomogram 图进行内部验证,自抽样次数B=1 000。对模型进行1、3、5 a生存时间的ROC曲线绘制并建立校准曲线,1 a生存时间AUC为0.747(95% CI:0.745~0.749),3 a生存时间AUC为0.784(95% CI:0.782~0.786),5 a生存时间AUC为0.788(95% CI:0.786~0.790)。见图2。结果显示,具有良好的预测价值,建立校准图。见图3。1、3、5 a生存率的校正曲线均靠近理想的斜率为1的直线,表示预测值和实际观测值之间具有良好的一致性。
A为1 a生存时间ROC曲线;B为3 a生存时间ROC曲线;C为5 a生存时间ROC曲线。
A为1 a生存率校正曲线;B为3 a生存率校正曲线;C为5 a生存率校正曲线。
3 讨论
本研究基于SEER数据库构建了一个预测胃印戒细胞癌患者预后的Nomogram图模型,并进行了验证。Nomogram图可将不同因素对预后影响的大小进行整合并将结果可视化地展现出来,以对患者的生存率进行个体化的预测,被广泛用于肿瘤患者的预后评估[11-12]。近年来,已有许多通过结合多种预后相关因素,对某些恶性肿瘤进行风险评估及量化,并成功构建Nomogram模型的报道[13-14]。相对于传统方法,Nomogram图可以更快速、便捷及精确地作出预测,其预测价值优于其他评价体系[15]。SEER数据库是美国癌症数据主要来源之一,涉及多个系统的肿瘤,收集了大样本的肿瘤登记数据,为肿瘤学的临床研究提供了良好的数据支持,对肿瘤预后的研究很有价值[16]。经美国SEER数据库提取分析能够快速、准确得出肿瘤患者的预后影响因素,为构建Nomogram图提供了充分的数据支持。
本文纳入2 439例胃印戒细胞癌患者,纳入了多种可能影响胃印戒细胞癌预后的因素,计算1、3、5 a生存率,进行Log-rank检验,并通过多因素Cox回归分析得出年龄、肿瘤分期、肿瘤大小、淋巴结转移、手术方式为影响胃印戒细胞癌预后的独立危险因素。(1)性别。有研究显示,由于胃印戒细胞癌组织中雌激素和孕激素受体高表达[17],胃印戒细胞癌多见于女性患者[5]。也有研究显示,胃癌还是好发于男性患者[18]。性激素是否为胃癌预后的危险因素,仍需进一步的研究[19-20]。本研究纳入数据中女性患者为1 154例,男性患者为1 285例。本研究中,Cox比例风险回归分析提示高龄为影响胃印戒细胞癌预后的危险因素。(2)种族。胃癌是一种受环境、生活习惯等因素影响较大的肿瘤,所以不同地域差异也是影响胃癌的重要因素之一[21]。本研究中,生存分析显示其他人种生存率高于黑种人、白种人。多因素分析进一步说明人种为胃印戒细胞癌预后的危险因素。(3)分化程度和分期。胃印戒细胞癌呈弥漫性进展,具有分化程度差、恶性程度高的特点,肿瘤分期越晚,往往提示预后越差。本研究中,生存分析表明分化程度无显著差异,可能是因为本研究纳入的胃印戒细胞癌数据多为低分化期病例,生存预后未表现出统计学差异。(4)治疗方式。有研究报道早期胃癌预后较好,术后生存率可达90%[22]。对于进展期胃癌,首选治疗仍然是手术切除。一般认为由于胃印戒细胞癌分化程度差,侵袭转移能力强,淋巴结转移率高,大多发现时肿瘤已处于进展期,均可考虑行全胃切除术。也有部分研究表明位于远端胃的原发肿瘤,根治性远端胃切除和全胃切除在肿瘤复发率上无明显差异[23-24],这可能是由于大部分胃全切术后患者营养状态较差,导致总体预后不好。本研究中,胃印戒细胞癌手术方式生存率分析显示胃部分切除组患者预后优于胃全切除手术治疗组,且Cox比例回归分析显示手术方式为胃印戒细胞癌预后的危险因素。因此,对于胃印戒细胞癌的手术治疗,在保证切缘切除阴性及解剖结构合理的基础上,考虑合理地缩小手术切除范围,可达到良好的预后。根据最新胃癌治疗指南,认为辅助化疗可以改善胃癌的预后,但部分研究提出,胃印戒细胞癌的化疗敏感性低于非印戒细胞癌[25],也有研究认为这种评估结果仍然存在争议[26]。本研究结果提示胃印戒细胞癌患者未化疗组预后较差。由于数据库未提供更加具体的化疗方案,无法进一步研究胃印戒细胞癌的化疗敏感性。
本研究将多因素Cox回归分析中影响胃印戒细胞癌患者预后的危险因素全部纳入,构建了Nomogram图。ROC曲线结果显示1、3、5 a生存时间的AUC具有较好的预测能力,校正曲线也表现出良好的一致性。但本研究仅基于SEER数据库,具有一定局限性,需要进行进一步的外部验证。此SEER数据库未给出具体的化疗方案,无法探究胃印戒细胞癌对化疗药物的敏感性,且在手术方式中未统计腹腔镜下手术的案例。但是,本模型对胃印戒细胞癌患者预后的影响因素进行了定量化、数字化,可使临床医生便捷且较为准确地评估患者的预后,为患者的个性化治疗提供参考。总之,胃印戒细胞癌是胃癌病例中恶性程度极高的一种类型,具有侵袭性强、预后差的临床特点,早发现,早治疗,选择合理的治疗模式,可以提高患者的预后。构建Nomogram图,可以个体化地对患者的预后作出快速准确的评估,从而更好地指导胃印戒细胞癌患者的治疗工作。