胃印戒细胞癌生存预测的列线图模型的建立和验证
2020-09-15范天晴胡国潢
范天晴,胡国潢
(湖南师范大学附属长沙医院,长沙 410006)
自二十世纪中叶起,由于幽门螺杆菌和胃癌关系及其应对措施的发明,胃癌的发病率在世界范围内呈下降趋势[1-2],与此同时,胃印戒细胞癌(signet ring cell carcinoma,SRCC)的发病率却呈现上升趋势[3-4],有研究提示它可能是一个与胃癌不良预后独立相关的因素。迄今为止,我们对胃SRCC预后已经做过了相当的研究,虽然争议重重[5-7],但总的来讲指向不良的预后结果。美国国立癌症研究所监测、流行病学和结果(Surveillance,Epidemiology,and EndResults,SEER)数据库收集了美国29%癌症患者的各类癌症相关数据,拥有较为完整的随访结果。列线图在医学研究中广泛应用于癌症预后[8-9],是一种可以有效且方便地预测癌症个体化结局的工具[10],不仅可以构建临床上影响某疾病预后的多个因素整合分析的模型,而且可以实现我们对该疾病个体化医疗的追求。但迄今为止,仍缺乏一个胃SRCC患者的生存预测列线图模型。因此,本研究旨在建立并验证第一个胃SRCC预后的列线图,为临床诊断和治疗提供依据。
1 材料与方法
1.1 数据的获取与处理使用SEER*Stat(软件版本8.3.5)从SEER-18数据库中提取2004年~2014年间按照美国癌症协会第六版胃癌分期(The sixth edition of American Joim Committee on Cancer stage,ACJJ6)标准诊断为SRCC的患者信息。符合筛选条件的胃SRCC患者包括:①经病理或组织学证实为SRCC的患者;②具有积极的随访和完整日期信息;③完整的临床病理信息(年龄、种族、TNM分期、肿瘤分级、治疗方案等)。由于SEER数据库中的患者信息是被隐藏身份并公开的,因此我们的研究不受机构审查委员会的监督。
纳入的变量包括:①患者特征(年龄、种族、性别、保险状态、婚姻状态);②肿瘤特征(大小、组织学分级、TNM分级、T分期、N分期、M分期、远处转移、检查淋巴结总数);③治疗策略(手术淋巴结数量、淋巴结清扫区域、放疗、化疗);④随访数据(随访时间和生存状态)。其中种族分为白人、黑人及其他人种,根据AJCC-TNM第6分期系统进行分类,肿瘤大小以2cm及5cm为分界点,远处转移的部位纳入了肝、肺、骨、脑,治疗策略中手术定义为原发部位肿瘤的切除、放疗是指原发性肿瘤的局部治疗。总生存时间定义为5年随访结束时患者的生存状态,本研究的主要终点是总生存率(overall survival,OS)。
1.2 患者的生存分析按纳入及排除要求从SEER数据库中提取了1459例病例,将所有符合筛选标准的患者按随机分为训练集(n=730)和验证集(n=729),分别用来建立列线图模型及从外部验证它。首先,我们观察了全部患者、训练集和验证集的人群基线特征,然后使用单因素COX分析来评估每一个个体变量对疾病预后的影响大小,接下来,将有统计学意义的变量纳入多因素COX分析法,拟合增加多方面的综合评价。多因素COX分析对预后影响有统计学意义的均纳入独立危险因素。最后,将5年生存率设为终点,并使用这些对OS影响最显著的变量构建列线图模型。
1.3 列线图的构建与验证训练集和验证集分别用于构建列线图和判断及校准该模型的性能。以训练集构建出的模型中所有数据风险值的中位值为分界,将患者分为了高风险组和低风险组两组,采用Kaplan-Meier分析和log-rank检验探讨高风险组与低风险组的生存差异。为了评估该列线图的预测精度,我们采用一致性指数(Coherence-index,C-index)和受试者工作特征曲线(receiver operator characteristic curve,ROC)检验列线图预测的准确性。C-index反映了实际值和预测值之间一致的概率。一般来说,C-index作为列线图精度的度量,大于0.75的值通常表示相对较好的区分,且越接近1.0越精确,适用于删失数据,ROC曲线下的区域(area under the curve,AUC)与之相似。然后引入校准曲线将预测一年、三年和五年的OS与实际OS的预测精度差异用图形直观地展示出来。最后使用决策曲线分析(decision curve analysis,DCA)来评价列线图的临床应用价值。所有分析均使用R语言(软件版本3.4.3)进行(http://www.R-project.org/)。P<0.05时两侧差异有显著性统计学意义。
2 结果
2.1 一般资料和COX单因素回归分析本研究回顾性分析了SEER数据库中2004~2014年间1459例符合条件的SRCC患者的资料,所有患者的中位年龄为64岁,男女比例约1∶0.86,69.8%的患者为白人,病理分级为Ⅲ级的患者占94.8%,在两组中大部分人都进行了手术治疗和化疗。随后,我们使用单因素COX回归分析进行变量的初步筛选,发现SRCC患者预后与诊断年龄、婚姻状况、肿瘤大小、TNM分期、T分级、N分级、M分级、骨转移、肝转移、肺转移、原发肿瘤手术、手术淋巴结数目、淋巴结清扫区域、放疗相关。
2.2 COX多因素回归分析将有单因素分析中有统计学意义的变量全部纳入多因素COX回归分析后得到了9个独立的预后因素,分别是:诊断年龄、肿瘤大小、TNM分期、T分级、N分级、手术淋巴结数目、放疗、淋巴结清扫与骨转移(以上有统计学意义变量P均<0.05)。
2.3 列线图的建立和验证我们用训练集中被确定与OS相关的独立变量构建了列线图。见图1。该列线图总结了各危险因素在量表上确定的分数,通过将列线图中积分量表上确定的分数相加,可根据图底部显示的总分预测单个患者5年的生存率可能性。
图1 SRCC生存预测的列线图
训练集和验证集的Kaplan-Meier分析显示了对两个集通过该模型将患者分成的高低风险组有明显的生存差异,该列线图模型经评价得到C-index为0.753(95%CI为0.730~0.775),ROC分析显示该模型在训练集和验证集均表现良好,见图2。此外,对训练集及验证集两组均构建了校正曲线(图3),从图中能直观的看出两组的预测OS值和实际生存率之间均有相当大的一致性。
图2 基于风险分层系统分层的总生存率的ROC曲线
接下来,我们还应用了DCA来评价该列线图的临床应用价值(图4),可见在两个组的广泛死亡风险范围内,该列线图模型均显示了很大的正向净收益,说明该模型在预测SRCC患者5年OS方面均拥有良好临床实用性。
3 讨论
SRCC作为一种发病率日益升高,总体预后不良结局的疾病,理应获得更加个体化及精确的治疗方案[11]。不少学者对此病进行了各方面的探究[12-13],但现在它还没有一个能可靠的评估生存率的模型。为了解决这个问题,我们使用了1459例数据进行了分析,开发和验证了一个可以方便地应用于临床的列线图模型。后期验证从C指数、ROC、校正曲线、DCA的分析结果来看,列线图表现均良好。
本模型的临床意义可以从DCA看出,主要在于能准确地预测SRCC患者1年、3年和5年生存率,这可为SRCC患者的个体化咨询与治疗提供临床建议。既往有研究显示SRCC对不同药物有着不同的化疗敏感性,特别是对于临床一线最常使用的氟嘧啶反应率较低[14],本次研究中,发现化疗并不是对预后有关键影响的因素,这提示了对那些预后不良且风险高的胃SRCC患者其他的治疗方式(如放疗)的重要性。对于这些患者,他们可能需要更加个体化的临床治疗手段,如去有经验的临床中心进行手术,个体化化疗药物,规范放疗,随最新的研究进展进行有效的靶向治疗[15]或免疫治疗等。
图3 校正曲线
图4 决策曲线分析
本研究中,OS的独立预后变量共有9个,在这些变量中,手术中切除的淋巴结数目表现出最高的影响力。SRCC的手术治疗在亚洲地区提倡尽可能进行广泛的淋巴结清除术,而在西方国家尚没有明确的建议,JGCA指南对其他组织学类型建议清扫的淋巴结数目为15个。在我们的研究中,手术中切除的淋巴结数目是胃SRCC患者预后的明显保护因素,这也许为亚洲地区的治疗策略提供了一定的理论基础。之前的研究均提示胃SRCC晚期最常转移至腹膜[16],有些医生对此提出常规腹腔镜检查完善诊疗方案的治疗策略,本次研究中,骨转移作为一个独立危险因素,在病人初诊有胃SRCC后可对此进行简单有效的检查,如:血钙,ALP等,而这些指标在消化道肿瘤的检查中常常不被重视。对于转移性或复发胃癌群体中有骨转移的患者,化疗是指向预后良好的有利因素(HR 0.33,95% CI 0.22~0.49)[17],所以提示对于胃SRCC伴骨转移的患者,应当更加重视多元化治疗方案[11]。有意思的是,虽然没有被纳入独立预后因素,婚姻状况中离婚状态(或丧偶)在风险分析中呈现危险因素并且具有统计学意义(HR=1.210,95% CI:1.010~1.440,P=0.004),这或许与离婚(或丧偶)患者缺失家庭和配偶责任感,缺少家庭、社会支持有关[18],提醒了医务人员对该类患者诊疗过程中应提供更多的关注与心理支持。
不可否认,本次研究具有局限性。首先,我们按标准排除了那些缺少我们需要收集的数据的患者,这可能会导致选择偏倚,数据库中登记的癌症数据可能是错误的,这可能会对我们的研究造成重大的偏差;其次,虽然本列线图是用一个大的研究队列建立的,并且在对照组中得到了验证,但是它们仅仅基于美国病人人群,不能代表其他国家。因此,仍然有必要在不同国家、不同地区的患者身上进行外部验证,如果能在随机临床试验的患者中使用该列线图将是验证其性能的金标准;第三个局限是我们的列线图只使用了9个临床病理因素,某些额外的变量也可能提供潜在的预后信息,如生物标记、基因或雌激素[19],有待在以后的研究中进一步探讨。
总而言之,我们建立了第一个用来预测SRCC患者的生存率的列线图模型。多项验证表明,该模型具有良好的性能和临床应用的价值。建立这种实用的预后模型有助于其他研究者对该病进行后续临床研究,协助完善实验决策、设计,也有助于患者对疾病的咨询,还便于临床医师为胃SRCC患者提供量身定制的治疗方案。然而,为了追求准确,这个模型也应该在其他人群中进行反复的外部验证。