基于SEER 数据库建立和验证甲胎蛋白阴性肝细胞癌患者癌症特异生存期的列线图
2024-02-12余孝鹏杨仁义贺佐梅曾普华
余孝鹏, 杨仁义, 贺佐梅, 曾普华,3
(1. 湖南中医药大学研究生院,湖南 长沙 410208;2. 湖南中医药研究院附属医院肿瘤二科,湖南 长沙 410006;3. 湖南中医药研究院中医肿瘤研究所,湖南 长沙 410006)
肝细胞癌(hepatocellular carcinoma, HCC)是最常见的消化系统肿瘤之一,占肝脏恶性肿瘤的75%,在全球常见癌症中排第6 位,在癌症相关死亡原因中排第4 位[1-2]。血清甲胎蛋白(alpha fetoprotein,AFP)是诊断HCC 可靠的肿瘤生物标志物,与HCC 复发、血管侵犯、转移和预后有密切关联[3-4]。血清AFP 水平>400 μg·L-1是诊断HCC 的指征之一[5]。AFP 水平越高,HCC 患者预后越差、肿瘤侵袭性越高且治疗效果也越差[6]。有30%~40%的HCC 患者血清AFP 为阴性表达,即血清AFP 水平<20 μg·L-1,该种情况可能会影响HCC 患者的早期诊断、治疗和预后的判断[7]。研究[8-10]表明:AFP 阴性HCC 患者的肿瘤一般较小,分化更好,术后复发率和生存率优于AFP 阳性患者。但血清AFP 是HCC 临床筛查、诊断、复发和预后监测的主要生物标志物,因此AFP 阴性HCC患者的预后预判应区别对待[11-12]。目前对于AFP阴性HCC 患者预后风险的相关研究较少,因此本研究通过分析影响AFP 阴性HCC 患者的危险因素,并以此建立预测癌症特异生存(cancer specific survival,CSS) 列线图,以便临床工作者对AFP阴性HCC 患者进行正确的预后判断。
1 资料与方法
1.1 病例筛选
采用 SEER*Stat 8.4.0.1 软件,从监测、流行病学和最终结果(Surveillance,Epidemiology,and End Results, SEER) 数据库中筛选确诊的HCC 患者,所有患者均来自美国。纳入标准:①组织学代码为8170/8171/8172/8173/8174/8175;②AFP 阴性患者;③具有明确的生存状态和生存时间。排除标准:①缺少有关年龄、性别、婚姻状况、基于美国癌症联合委员会(AmericanJoint CommitteeonCancer,AJCC) 标准的肿瘤分期、肿瘤大小、手术类型、放化疗信息及骨和肺转移信息;②患者在 1 个月内死亡或自初步诊断后不到1 个月内接受随访;③其他原因死亡或死因不明。基于SEER 数据库病例筛选的独立危险因素,纳入湖南省中西医结合医院2012~2022 年期间确诊为AFP 阴性HCC 癌患者101 例作为外部验证。纳入标准:①确诊为HCC;②血清检测AFP 为阴性,即AFP<20 μg·L-1。排除标准:①缺少年龄、病理分级、手术、放疗、化疗、肺转移、T 分期、M 分期、肿瘤大小(肿瘤最大直径)和婚姻状况信息的患者;②并发其他组织恶性肿瘤的患者;③非肿瘤疾病引起死亡的患者;④在 1 个月内死亡或自初步诊断后1 个月内接受随访的患者;⑤失访的患者。
1.2 训练集和验证集的确定及筛选变量
采用R 软件将2 604 例患者按7∶3 比例分为训练集和内部验证集,以确保结果事件在两个队列之间随机分布。训练集用于筛选变量和建立模型,内部验证集用于验证模型。从SEER 数据库中筛选13 个变量,包括患者年龄(诊断时)、性别、病理分级、肿瘤T 分期、肿瘤N 分期、肿瘤M 分期、手术情况、放疗情况、化疗情况、骨转移情况、肺转移情况、肿瘤大小和婚姻状况。基于独立危险因素,从湖南省中西医结合医院筛选101 例HCC 患者作为外部验证集,纳入10 个变量进行外部验证:患者年龄、病理分级、手术情况、放疗情况、化疗情况、肺转移情况、肿瘤T 分期、肿瘤M 分期、肿瘤大小和婚姻状况。
1.3 统计学分析
采用R 软件进行统计学分析。患者年龄和肿瘤大小的最佳截断值通过受试者工作特征曲线(receiver operating characteristic curve,ROC)进行计算,组间比较采用卡方检验;训练集病例采用单因素和多因素Cox 回归分析,并计算相应的风险比(hazard ratio,HR)及其95%CI。将单因素Cox 回归分析所得到的危险因素纳入多因素Cox 回归分析中,多因素Cox 回归分析得出独立危险因素纳入列线图的构建;采用风险评分计算公式计算列线图的风险评分,通过时间依赖ROC 曲线下面积(area under curve,AUC)评估列线图的判别能力,采用Calibration 校准曲线评价列线图模型的效能和校准度。通过决策曲线分析(decision curve analysis,DCA)[13]评估列线图的临床净收益。采用X-tile 软件[14]对列线图总分进行风险分层,采用Kaplan-Meier 分析比较列线图和AJCC 肿瘤分期的风险分层。以P<0.05 为差异有统计学意义。
2 结 果
2.1 AFP 阴性HCC 患者的基线资料
从SEER 数据库中筛选2 604 例符合条件的AFP 阴性HCC 患者,按7∶3 比例随机分为训练集(n=1 822)和内部验证集(n=782)。患者的基线资料见表1。
表1 训练集和内部验证集AFP 阴性HCC 患者的基线资料Tab.1 Basic data of AFP negative HCC patients in training cohort and iternal validation cohort[n(η/%)]
2.2 训练集中AFP 阴性HCC 患者CSS 的独立预后因素
采用单因素和多因素Cox 回归分析,确定训练集中AFP 阴性HCC 患者的独立预后因素。单因素Cox 分析结果显示:患者年龄、性别、病理分级、手术情况、放疗情况、化疗情况、骨转移情况、肺转移情况、肿瘤大小、婚姻状况、肿瘤T 分期和肿瘤M 分期是AFP 阴性HCC 患者的独立预后因素(P<0.05)。多因素Cox 分析结果显示:患者年龄、病理分级、手术情况、放疗情况、化疗情况、肺转移情况、肿瘤大小、肿瘤T 分期和肿瘤M 分期是影响HCC 患者CSS 的独立预后因素(P<0.05)。见图1。
图1 AFP 阴性HCC 患者单因素和多因素Cox 回归分析森林图Fig. 1 Forest map of univariate and multivariate Cox regression analysis on AFP negative HCC patients
2.3 构建AFP 阴性HCC 患者CSS 预后列线图
基于训练集多因素Cox 回归分析结果,用训练集病例构建AFP 阴性HCC 患者3、4 和5 年CSS 预后列线图(图2),主要由以下独立危险因素组成:患者年龄、病理分级、手术情况、放疗情况、化疗情况、肺转移情况、肿瘤大小、肿瘤T 分期、肿瘤M 分期和婚姻状况。列线图中对应于每个变量的线的长度表示预测变量对生存结果的贡献值。
图2 AFP 阴性HCC 患者CSS 预后列线图Fig. 2 Nomogram of CSS prognosis of AFP negative HCC patients
2.4 列线图的验证
基于训练集病例构建列线图,采用内部验证集和外部验证集进行内部验证和外部验证[15-16]。
2.4.1 外部验证集病例基线资料 选择2012—2022 年于湖南省中西医结合医院确诊为APF 阴性HCC 患者101 例作为外部验证集,其基线资料见表2。
表2 训练集和外部验证集AFP 阴性HCC 患者基线资料Tab. 2 Basic data of AFP negative HCC patients in training cohort and external validation cohort [n(η/%)]
2.4.2 时间依赖ROC 曲线验证AFP 阴性HCC 患者CSS 预后列线图的预测性能 采用时间依赖ROC 曲线评估CSS 预后列线图在不同组集中的预测性能。在本研究中,训练集3、4 和5 年时间依赖ROC 曲线AUC 分别为 0.807 (95%CI:0.786~0.828)、0.804(95%CI:0.782~0.826)和0.813(95%CI:0.790~0.835),内部验证集3、4 和5 年时间依赖ROC 曲线AUC 分别为 0.776(95%CI:0.743~0.810)、0.772 (95%CI:0.737~0.808)和0.789 (95%CI:0.752~0.826),外部验证集3、4 和5 年时间依赖ROC 曲线AUC 分别为0.773(95%CI: 0.677~0.868) 、 0.746 (95%CI:0.620~0.872) 和 0.736 (95%CI: 0.577~0.895)。AJCC 分期3、4 和5 年时间依赖ROC 曲线AUC,训练集分别为0.609(95%CI:0.587~0.621)、0.604(95%CI:0.562~0.644)和0.605(95%CI: 0.571~0.652), 内部验证集分别为0.624(95%CI:0.588~0.661)、0.623(95%CI:0.586~0.660) 和 0.614 (95%CI: 0.574~0.654), 外部验证集分别为0.582 (95%CI:0.461~0.731)、0.676 (95%CI:0.539~0.846)和0.646(95%CI:0.486~0.825)。本研究结果表明:构建的AFP 阴性HCC 患者CSS 预后列线图预测性能明显优于AJCC 分期。见图3。
图3 时间依赖ROC 曲线图评估CSS 列线图和AJCC 分期在不同组集中的预测性能Fig. 3 Pridiction abilities of CSS nomogram and AJCC stage in different cohorts assessed by time-dependent ROC curve
2.4.3 列线图的校准曲线 采用校准图将列线图与校准图的完美曲线进行比较。灰色线表示理想的参考线,黑色、红色和蓝色实线分别代表3、4 和5 年列线图预测线,预测线越贴近灰色线拟合情况越好,列线图预测的生存率就越准确。列线图的校准曲线结果显示:本研究中列线图预测结果与观察到的AFP 阴性HCC 患者生存率之间具有较高的一致性。见图4。
图4 AFP 阴性HCC 患者列线图的校准曲线图Fig. 4 Calibration curves of nomogram of AFP negative HCC patients
2.4.4 训练集、内部验证集和外部验证集的DCA曲线 将列线图的临床净收益与基于AJCC 分期的临床净收益进行比较。训练集、内部验证集和外部验证集的DCA 曲线显示:列线图在某特定概率阈值(x 轴线)的净收益(y 轴线)明显高于AJCC 分期在某特定概率阈值时净收益。见图5。
图5 AFP 阴性HCC 患者DCA 曲线Fig. 5 DCA curves of AFP negative HCC patients
2.4.5 列线图和AJCC 分期的风险分层 将训练集患者的生存状态、生存时间和风险评分总分整合到X-tile 软件中计算列线图风险评分临界值[14],以风险评分临界值进行列线图风险分层,分为低风险组(<130 分)、中风险组(130~220 分)和高风险组(>221 分)。AJCC 分期风险分层以SEER 分期划分。以内部验证集和外部验证集对该临界值风险分层的稳定性进行验证。Kaplan-Meier 生存曲线分析结果显示:在所有队列中,不同风险亚组患者生存率比较差异均有统计学差异(P<0.01);与AJCC分期比较,列线图具有较好的识别高风险人群的能力。见图6。
图6 AFP 阴性HCC 患者列线图(A-C)和AJCC 分期(D-F)风险分层Fig. 6 Nomograms(A-C) and AJCC stage(D-F) of risk stratifications of AFP negative HCC patients
3 讨 论
HCC 是全球发病率和死亡率较高的癌症之一,尽管治疗方法多种多样,但其复发率和死亡率仍然很高。肝癌预后评估系统如巴塞罗那分期、TNM分期和中国肝癌分期等分期系统较为完善,但在临床应用上仍有不足之处,其忽略了许多重要的危险因素,如年龄、性别和治疗经过等。在许多癌症中,列线图已被证实较传统的分期系统更为准确[2,4,12,17]。血清AFP 是HCC 临床筛查、诊断、复发和预后监测的主要生物标志物[18]。但在临床上,并非所有HCC 患者AFP 均为阳性。研究[10]显示:HCC 患者中AFP 阴性占52% (261/502),在TNM Ⅰ期患者中AFP 阴性患者占53.5%(51/95),在TNM Ⅳ期HCC 患者中AFP 阴性患者占41.5% (24/58),表明约一半的HCC 患者为AFP 阴性。AFP 阴性HCC 患者在随访中增加了检测成本,且临床价值有限[19],因此对于该类患者应区别对待。目前,AFP 阴性HCC 患者复发和预后等监测主要依靠影像学方法[20]。但是,影像学检查价格较昂贵,不适合在短时间内重复。AJCC分期系统作为HCC 患者预后的评估系统并非为AFP 阴性HCC 患者制定,因此对HCC 患者预测价值有限[21-22]。
研究[21,23]表明:AFP 阴性HCC 患者的预后优于AFP 阳性HCC 患者,因此对AFP 阴性HCC患者进行预后预测具有重要的临床意义,可对预后危险因素的早干预和早治疗提供依据。本研究中,多因素Cox 回归分析确定了年龄、病理分级、手术情况、放化疗情况、肺转移情况、肿瘤大小、婚姻状况、肿瘤T 分期和肿瘤M 分期是影响HCC 患者CSS 的独立预后因素,与有关研究结果[2,17]具有一致性。骨转移是癌症患者的独立危险因素[24-25],但在本研究AFP 阴性HCC 患者的结果中并未得出该结果,可能与患者接受的治疗有关[26]。本研究结果表明:接受手术、放疗和化疗等治疗的HCC患者预后更好,该结论可用于指导医生和患者的选择。另外,年龄也是患者的危险因素之一[27],在本研究中,年龄>75 岁的患者生存率更低,可能与老年患者的免疫力低下和身体退化有关[28-30]。
最后,对列线图进行了内部数据验证和中国病例外部数据验证。本研究中,CSS 预后列线图的时间依赖ROC 曲线AUC 值超过0.70,在验证集的结果也相同,预测AFP 阴性HCC 患者CSS 的能力优于AJCC 分期,在校准图中也证实了列线图预测的CSS 概率与实际概率高度一致,与传统AJCC 分期比较,列线图预测AFP 阴性HCC 患者生存率具有更高的净收益,且列线图中3 个风险组患者CSS 比较差异均有统计学意义,与传统的AJCC 分期比较,列线图也有较好的识别高风险人群的能力。本研究也存在一定的局限性,首先大样本回顾性研究基于SEER 数据库,该数据库可能存在一些固有的偏倚;其次,SEER 数据库中缺少一些重要预后相关因素的数据,如乙型肝炎病毒表面抗原和血管浸润情况及并发其他疾病等,上述指标均为HCC 的预后危险因素。
综上所述,本研究结果表明:年龄、组织学分级、手术情况、放疗情况、化疗情况、肺转移情况、肿瘤大小、肿瘤T 分期、肿瘤M 分期和婚姻状况是AFP 阴性HCC 患者的重要预后因素,可用于评估患者的生存期,本研究构建的CSS 列线图能够很好地指导临床实践。
利益冲突声明:
所有作者声明不存在利益冲突。
作者贡献声明:
余孝鹏参与数据整理和分析及论文撰写,余孝鹏和杨仁义参与研究设计,余孝鹏、杨仁义、贺佐梅和曾普华参与论文审校。