APP下载

基于SEER数据库Gleason评分7分前列腺癌临床预测模型的建立及验证

2022-03-22杭天昆李通义马志方山西医科大学第一临床医学院泌尿外科太原03000山西医科大学第一医院泌尿外科通讯作者mailzhifangma63com

山西医科大学学报 2022年2期
关键词:根治性生存率预测

杭天昆,李通义,马志方(山西医科大学第一临床医学院泌尿外科,太原 03000;山西医科大学第一医院泌尿外科;通讯作者,E-mail:zhifangma@63.com)

前列腺癌(PCa)是中国男性癌症相关死亡的前十大原因之一,在美国排名第二,在欧洲排名第三[1-3]。同时也是2020年男性癌症患者死亡的第五大原因,2020年新增病例近140万例,死亡病例约37.5万例[4]。此前的研究表明,高龄是主要的风险因素,超过75%的PCa患者为65岁及以上的男性[5]。因于地理上的差异,可能造成世界各地发病率的不同。对大多数男性来说,PCa进展缓慢,不会在早期出现临床症状,近些年,随着生活水平的提高以及体检的普及,PCa患者可以实现早发现,早治疗。

临床上根据前列腺特异性抗原值(PSA)、肿瘤分期和Gleason评分(Gleason score,GS)将PCa患者分为低危组、中危组和高危组,利用GS评分系统初步预测患者的预后,指导治疗决策[6]。GS系统是1974年引入的PCa病理分级系统,已成为预测PCa患者预后的最有力的工具[7,8],最近于2014年修订[9,10]。然而,中度风险PCa(GS=7分)中的GS 3+4和GS 4+3被认为是同一预后组,这是Gleason评分系统的主要缺陷之一[11]。许多后续研究发现,GS 4+3组的PCa患者的预后明显差于GS 3+4组[12-14]。国际泌尿外科病理共识会议(ISUP)在2014年更新了最新的GS系统,进一步阐明了2014年ISUP中GS 3+4和GS 4+3之间的临床差异[10]。目前已有多项研究探讨了GS 3+4和GS 4+3对PCa患者预后存在的差异,其主要研究侧重于无生化生存(BFS)和无进展生存(PFS)[15,16]。但是对于从总体生存率(OS)的角度评价GS 3+4和GS 4+3的生存结果尚有不足。

为了最大限度地提高PCa患者的风险分层,使他们能够获得个性化的生存预测和治疗,我们进行了一项大规模的统计研究,以求发现GS 7分PCa患者的独立危险因素,并建立适用于GS 7分PCa患者的Nomogram模型,以达到个体化预测患者预后。

1 材料与方法

1.1 数据来源

本研究基于SEER(Surveillance,Epidemiology and End Results)数据库中GS 7分PCa患者的临床数据。SEER数据库中包含18个地区的癌症登记处,包含了约28%的美国人口。通过SEER*Stat软件检索SEER数据库中病理诊断为PCa的患者,使用国际肿瘤学组织学分类第3版(ICD-O-3)代码8140/3进行识别。

1.2 纳入标准与排除标准

1.2.1 纳入标准 ①在2010—2016年期间,诊断为PCa患者(ICD-O-3/WHO 2008形态学编码为8140/3);②均经前列腺穿刺活检组织病理检查确诊,且PCa组织学评分为GS7分;③临床资料完整者,包括:诊断时的年龄、种族、确诊年份、原发部位、前列腺特异抗原值(PSA)、分期、手术方式情况、化疗、放疗、婚姻状况及相关资料信息等;④随访资料完整者。

1.2.2 排除标准 ①随访资料不完整者;②原发肿瘤不为一者;③分化程度、分期、人种、手术方式、是否行放疗、是否行化疗以及婚姻状态等信息缺失者。

1.3 统计学处理

本研究所有数据均来自SEER数据库。利用使用SEER数据库中患者数据不需经患者同意的特点,使用软件SEER*STAT(8.3.6版)提取2010—2016年PCa患者相关数据。

本研究采用SPSS 26.0、和R version 4.10软件进行数据统计。对入选病例进行生存分析。

对入选病例采用Kaplan-Meier法计算生存率并绘制生存曲线,展示年龄、种族、PSA水平、病理分期、临床分期及手术方式等各个因素对于PCa患者生存率的影响,组间生存率的比较采用Log-rank检验。通过R软件,以7 ∶3的比例对符合纳入标准的病例进行随机分组,建立训练集(n=58 405)与验证集(n=24 858),采用单因素和多因素Cox比例风险模型计算训练集的危险比(HR)和95%可信区间(CI),并确定预后因素与OS之间的关系。通过训练集构建了预测2年和3年生存率的Nomogram,运用Bootstrap法进行1 000次自主抽样对模型进行验证,并使用C-index对其一致性进行了测试,验证组对其进行外部测试。其中患者年龄分为5组:<50岁组,50~59岁组,60~69岁组,70~79岁组,≥80岁组。手术类型编码则由训练有素的编码员提取,用于对手术切除范围进行分类。根据手术方式被分为3组:未手术组(no surgery)、单纯切除组(subtotal resection)、根治性切除组(radical resection)。其中P<0.05被认为其差异具有统计学意义。

2 结果

2.1 分组及特征

本研究共纳入病例83 263例。通过R软件将患者进行随机拆分后,建模组58 405例,验证组24 858例。两组中各项指标相比较,均P>0.05,提示训练集与验证集之间的差异无统计学意义。患者的人口学和临床病理特征见表1。在年龄分布上,46%以上的患者60 ~69岁。白种人在全部患者中的比例最高,达到了75%以上。绝大多数患者的PSA为4 ~10 ng/ml。约有49%的患者行手术治疗,其中以根治性手术占绝大多数。使用放疗的患者占总数40%左右。大多数患者的婚姻状态为离异,约占总数的74%。

2.2 各因素对生存结果的影响

2.2.1 Kaplan-Meier分析 采用Kaplan-Meier单因素分析,Gleason 7分的PCa患者2年和3年生存率分别为65.1%和51.8%。经Log-rank检验,年龄(P<0.000 1)、种族(P<0.01)、PSA(P<0.000 1)、肿瘤原发部位(P<0.01)、年龄(P<0.01)、组织学分级(P<0.000 1)、GS(P<0.000 1)、肿瘤分期(P<0.000 1)、手术方式(P<0.05)、是否放疗(P<0.000 1)及婚姻状态(P<0.000 1)与生存率有关。创建Kaplan-Meier曲线,Log-rank检验表明,年龄≥80岁、非白种人、PSA>20 ng/ml、肿瘤原发部位对称、GradeⅡ、Gleason 4+3、Stage Ⅳ、T4、N1、行前列腺部分切除术、未行放疗及已婚均与较差的生存预期有关(见图1)。

表1 患者人口统计和临床特征 例(%)

2.2.2 单因素和多因素Cox分析结果 采用Cox回归模型对训练集中的数据进行单因素Cox回归分析,将单因素Cox回归分析中P<0.05的14个因素纳入多因素Cox回归分析分析中。对这些变量的初步分析结果汇总于表2。单因素Cox分析中若P<0.05,则代表该因子与患者预后相关;在多因素Cox分析结果中,当P<0.05时,代表该因子是影响患者预后的独立危险因素。

单因素Cox分析示:年龄<70岁、PSA水平、种族、病理分级≤Ⅱ、GS 4+3、肿瘤位置、肿瘤分期、T分期(T1/T2/T3)、N分期、前列腺根治性切除术、是否放疗、是否化疗和婚姻状态均是影响PCa患者生存的影响因子。

进一步进行Cox多因素分析用于评估这些变量对PCa的影响,结果显示:年龄<70岁、PSA水平、其他人种、病理分级≤Ⅱ、GS 4+3、肿瘤位置、肿瘤分期、T分期(T1/T2/T3)、M分期、手术方式(部分切除术/根治性切除术)、是否放疗和婚姻状态均是PCa患者生存率的独立预后因素。

图1 前列腺癌患者Kaplan-Meier生存曲线Figure 1 Kaplan-Meier survival curve of prostate cancer patients

表2 患者生存率的单因素和多因素Cox回归分析

(续表2)

2.3 Nomogram分析和预测能力验证

根据年龄、种族、原发部位和肿瘤分期(TNM)、手术方式、放疗、PSA值、Gleason评分和婚姻状态建立与解释Nomogram,以达到预测PCa患者2年和3年生存率的目的。使用Nomogram时,首先将每个患者的分数放在每个变量轴上,并画一条线来确定每个变量应得的分数。这些分数的总和放在总分数线的数轴上,并垂直向下绘制一条直线到生存轴,以得到患者2及3年生存率(见图2,3)。模型组内部训练集的C指数为0.735(95%CI 0.733~0.737),外部验证集为0.737(95%CI 0.735~0.739)。图4中的曲线拟合度较好,说明该模型具有较好的预测能力。这项研究的结果表明,年龄50~59岁、其他种族、临床分期Ⅱ期、T3、肿瘤原发部位为前列腺左侧、未行放疗、未行手术治疗、PSA≥20 ng/ml及单身均是降低GS 3+4 PCa患者OS的主要因素。而年龄60~69岁、其他种族、临床分期Ⅳ期、T4、肿瘤原发部位为前列腺左侧、未行放疗、行根治性手术治疗、PSA≥20 ng/ml及单身均是降低GS 4+3 PCa患者OS的主要因素。

图2 GS 3+4分PCa患者2年、3年生存率预测的NomogramFigure 2 The 2-year and 3-year survival rates of PCa patients with GS 3+4 predicted by Nomogram

图3 GS 4+3分PCa患者2年、3年生存率预测的NomogramFigure 3 The 2-year and 3-year survival rates of PCa patients with GS 4+3 predicted by Nomogram

图4 GS 7分PCa生存率的校正曲线Figure 4 Calibration curve for the survival rate of PCa with GS 7

3 讨论

GS于1974年实施,是局部疾病预后的一个强有力的预测指标[7,17,18]。ISUP于2014年开发了最新的格里森分级系统,该系统是在2005年版本之后开发的。修改后的格里森分级系统根据格里森评分的组织学特征和PCa患者的预后进行分组,相较之前的格里森评分系统有显著改进:①可根据PCa的病理学提供更准确的分层;②分类简化格里森分数的划分;③根据PCa患者的生存情况进行分组[10,11]。并且,2014年格里森分级系统将GS 7分PCa分为GS 3+4和GS 4+3[10],其复发率、预后和治疗效果均不尽相同[19]。因此,本研究目的是详细研究GS对PCa患者OS的影响。PCa是成年男性中最常见的恶性肿瘤之一,是一种个体差异性较大的恶性肿瘤,5年生存率从局限性PCa的100%到转移性PCa的29%不等。GS 7分PCa于行根治性前列腺切除术后个体复发率存在很大差异,这取决于原发性Gleason模式(GP),GP 3 +4的5年无生化风险生存率为88%,而GP 4 +3 PCa的5年无生化风险生存率仅为63%[14]。也有报道称,与GP 3 +4 PCa相比,GP 4+3 PCa的死亡率增加了3倍[11,19]。

而Nomogram是一种基于统计学的预测模型[20],其作为一种重要的医学工具,不仅可以预测疾病风险或生存结果,还可以帮助医生筛选高危患者并确定适当的治疗措施[21,22]。通过整合大量的临床病理特征,预测模型准确地量化了对每个风险的影响[23]。本研究以2010—2016年SEER数据库中确诊的83 263例PCa患者的临床资料为基础,建立了评估PCa患者预后的个体化Nomogram模型,为临床医生评估PCa患者的预后结果提供了一种便捷的工具。

在单因素和多因素COX回归分析的基础上,将年龄、种族、PSA、GS、肿瘤分期及婚姻状态等作为PCa患者的独立预测因素,并建立了标准曲线。然而,该模型的C指数为0.735(95%CI 0.733 ~0.737),表明建立的Nomogram显示出了良好的判别能力。与其他常规分期系统相比,新Nomogram在预测患者预后方面显示出更高的准确性。此外,预测模型的使用方法简单,且结果容易理解。首先,用户可以从每个因子到“点”线画一条垂直线,然后将所有因子的“点”相加,得到“总分”。最后,从“总分”到“2年或者3年生存率”画一条垂直线,就可以得出PCa患者2年及3年生存率。例如,一位61岁的已婚白人男性患者被诊断为PCaⅡ期、T1c期,Gleason 4+3分、PSA为25 mg/ml,原发部位为前列腺右侧,行根治性PCa切除术,未行放疗。根据Nomogram和积分表,总分为351分,他的2年生存率为约65%,3年生存率约为40%。尽管如此,Nomogram准确的辨别力和校准性能并不等同于在临床工作中的实用性。

本研究表明PCa患者的临床及病理特征与患者预后结果之间存在一定的相关性。GS、初诊年龄、种族、原发部位、T分期、PSA水平、婚姻状况、治疗方法等混杂因素均与OS相关。将年龄分成不同的层次,不难理解,无论Gleason评分如何,老年组的OS都较差。在种族或民族方面,非洲裔美国人是影响预后的重要因素之一,非洲裔美国人的PCa发病率和死亡率是世界上最高的[24],在一项由1 527 602例符合条件的PCa病例组成的研究中,高加索男性的1年、3年和5年净存活率高于非裔美国男性[25],但是在该项研究中,表明其他种族(除非洲裔美国人及白种人以外)预后不良,可能与其病例数较少有关。将PSA值纳入了研究,患者被分成四个水平:<4 ng/ml、4~10 ng/ml、10~20 ng/ml和>20 ng/ml。与先前的报道和NCCN指南的风险分级一致[26],最高水平(>20 ng/ml)在GS 7分的肿瘤患者中显示出最低的生存优势。婚姻状况作为癌症患者的关键社会外部因素,已被研究与PCa患者预后的关系[27-29]。虽然婚姻状况不影响PCa根治术后生化复发和转移生存率[28],但它被报道为PCa患者OS的独立预测因子[27,29],这与我们的研究是一致的。但是有趣的是针对于GS 3 +4 PCa患者,根治性前列腺切除术是患者的保护因素。但是对于GS 4+3 PCa患者,拒绝手术反而成了患者的保护因素,其原因可能是因为此次研究中患者随访时间较短,导致其根治性PCa切除术患者与拒绝手术患者之间的差异未得到明显区分。也可能是因为GS 4+3 PCa中未接受手术的患者,在行放疗及化疗后明显好转,其生存时间未见显著减少,导致出现这样的结果。

基于这些预后因素,我们利用SEER数据库中的数据分别建立了预测GS 3 +4及GS 4+3的PCa患者OS的诺模图。C指数分别为0.733(95%CI 0.731 ~0.735)和0.738(95%CI 0.734~0.741),对2年和3年的生存率有较好的预测精度,对OS的预测具有最好的一致性。

对于那些首次发现时未被诊断为GS 7分PCa患者,Nomogram可以通过收集容易获得的信息来计算后续远处转移的特定风险。与成像评估措施不同,这种易于使用的Nomogram不仅可以降低可能的辐射风险,还可以降低个人医疗费用。对于那些首次发现时被诊断为GS 7分PCa患者,Nomogram可以通过收集容易获得的信息来评估患者2年及3年生存率;与临床上传统的评估方式不同,这种Nomogram是一种更为准确的个体化评估方式,通过患者的检查化验指标及手术方式、是否放疗、是否化疗等相关信息,更为准确地预测患者预后结局。

然而,我们还注意到此次研究的局限性。首先,由于缺乏病人的随访资料,术后或放疗后影响疾病进展的因素,如术后血清PSA水平>0.2 ng/ml、局部复发的证据或远处转移的放射学证据在随访期间无法评估。这限制了对影响生化无复发生存期(BFS)、无进展生存期(progress free survival,PFS)和其他重要预后指标的进一步研究。其次,这是一项回顾性研究,即使在应用了多变量分析之后,也存在潜在的偏移。第三,体质量指数、吸烟、饮酒等有意义的致病因素,和其他特定的外科因素如淋巴结阳性或精囊侵犯等也对预后有重要影响,这些信息均未被SEER数据库收录其中。第四,在这项研究中,训练集和验证集数据均来自SEER数据库,这可能会导致模型过度拟合,这需要其他机构的更多独立外部队列来验证模型的准确性。此外,本研究中的案例来自美国,我们的模型是否适用于亚洲人群还需要更多的后续研究。

综上所述,我们构建了一个全新的预测模型来量化PCa患者的2年及3年生存率。通过Nomogram可以更为精准地评估患者的预后结果,也为临床医生提供了一个新的治疗策略决策的角度。然而,这项研究中的局限性也需要进一步改进。

猜你喜欢

根治性生存率预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
胰腺癌根治性切除手术的围手术期护理效果及并发症发生率评价
选修2—2期中考试预测卷(A卷)
根治性肝切除与外囊摘除治疗肝包虫的临床疗效及并发症对比
『5年生存率』啥意思
膀胱癌患者根治性膀胱切除术治疗对患者并发症发生与术后肠道恢复时间的影响
“五年生存率”不等于只能活五年
日本首次公布本国居民癌症三年生存率