APP下载

皮肤梭形细胞黑色素瘤患者生存预测模型的构建及验证

2022-04-15王子茂王琪影

中国癌症杂志 2022年3期
关键词:线图生存率建模

王子茂,曹 原,王琪影

郑州大学第一附属医院整形外科,河南 郑州 450000

梭形细胞黑色素瘤(spindle cell melanoma,SCM)是一种罕见的黑色素瘤变体,其特征是肿瘤细胞具有明显的梭形形态,并呈层状和束状排列[1-2]。由于SCM缺乏传统的黑色素瘤细胞学特征,易被误诊,常需利用细胞形态识别和免疫组织化学等方式与其他上皮性肿瘤进行鉴别[3-8]。且确诊时常伴有转移,疗效较差[9-10]。既往有研究[11-12]报道,SCM患者预后与某些临床特征有关,但未见有研究基于预后影响因素构建列线图对SCM患者的癌症特异性生存率(cancer-specific survival,CSS)和总生存率(overall survival,OS)进行个体化预测。本研究从监测、流行病学和最终结果(Surveillance,Epidemiology,and End Results,SEER)数据库中提取数据进行回顾性分析,经过单因素和多因素COX回归分析确定与预后相关的因素,据此构建并验证SCM患者5和10年生存率的列线图预测模型。

1 资料和方法

1.1 一般资料

通过SEER*Stat 8.3.9软件(http://seer.cancer.gov//seerstat/)从SEER数据库中筛选出满足条件的SCM患者共1 445例。纳入标准:①确诊时间为2004—2015年;② 经组织病理学检查确诊符合《国际疾病分类肿瘤学专辑》第三版(ICD-O-3)分类的SCM(8772/3,8773/3,8774/3);③原发部位位于皮肤[在ICD-O-3/世界卫生组织(World Health Organization,WHO)2008部位编码中为Melanoma of the Skin,Primary Site相应编码为C49.0-C49.6]。排除标准:①临床信息不完整,如人种、美国癌症联合委员会(American Joint Committee on Cancer,AJCC)分期、T分期、N分期、M分期、部位、肿瘤厚度及是否溃疡未知的;② 患者报告来源仅限来自尸检及死亡证明;③死亡原因不详;④ 随访生存时间<1个月;⑤ 年龄<18岁。SEER数据库是美国大型公共数据库,可免费获取其中数据,且并不显示患者个人信息。本人已签署数据使用申请与保证书,并获得相应的登录账号和使用权限(用户名:19352-Nov2019),因此本研究无需获得机构审查委员会的批准和知情同意。

1.2 方法

根据纳入和排除标准,从SEER数据库中共筛选出1 445例患者,通过随机数字(seed=123 456)随机分为建模组(n=1 011,70%)和验证组(n=434,30%)。根据临床经验和文献回顾,将以下11个变量作为可能的预后影响因素:年龄、性别、人种、肿瘤部位、肿瘤厚度、溃疡、N分期、M分期、手术、放疗及化疗,因为T分期由肿瘤厚度和溃疡决定,因此本研究未再纳入。本研究中,按年龄划分最佳临界值为≤65岁和≥66岁,肿瘤厚度最佳临界值依据AJCC分期分为≤1.00 mm、1.01~2.00 mm、2.01~4.00 mm和≥4.01 mm[13]。根据临床经验及COX回归分析结果,利用确定的预后因素,基于建模组建立列线图生存预测模型,用于预测皮肤SCM患者5和10年生存率,并基于验证组数据进行外部验证。

1.3 观察指标

本研究终点为患者因SCM死亡和因各种原因死亡,观察指标为皮肤SCM患者5和10年CSS和OS。

1.4 统计学处理

人口统计学和临床病理学特征采用描述性统计分析,建模组与验证组之间的相关性采用χ2检验,COX回归分析用于研究可能的预后因素与生存之间的关系,采用Kaplan-Meier法进行生存分析,并采用log-rank检验进行比较。在建模组中,应用单因素和多因素COX回归分析,筛选出独立预后影响因素以及相应的风险比(hazard ratio,HR)和95% CI。通过R软件的“rms”包生成列线图。利用建模组和验证组的一致性指数(concordance index,C-index)和受试者工作特征(receiver operating characteristic,ROC)曲线来评估列线图的区分辨别能力,利用校准曲线图来评估列线图预测与实际结果之间的距离[14],最后决策曲线分析(decision curve analysis,DCA)通过量化不同阈值概率下的净效益来确定预测模型的临床价值[15]。所有数据均在R 4.0.4(http://www.r-project.org)版本下得到分析结果,所有显著性检验为双侧,P<0.05为差异有统计学意义。

2 结果

2.1 人口学和临床病理学特征

本研究的中位随访时间为64个月(1~178个月)。人口学和临床病理学特征主要包括年龄、性别、人种、肿瘤部位、肿瘤厚度、溃疡、N分期、M分期、手术、放疗及化疗。建模组和验证组患者的人口学和临床病理学特征见表1。

表1 1 445例SCM患者的人口学特征和临床病理学特征Tab.1 Demographic and clinicopathological characteristics of 1 445 SCM patients [n (%)]

2.2 预后影响因素

预后影响因素的选择关系到后续列线图的建立,选择列线图变量不仅根据单因素及多因素COX回归分析的结果,也需要参考其他相关文献和临床经验,考虑到临床应用等实际问题[16]。单因素COX回归分析结果显示,患者CSS及OS与年龄、性别、肿瘤部位、肿瘤厚度、溃疡、手术、放疗及化疗有关(P<0.05),而与人种无关(P>0.05)。多因素COX回归分析结果显示,患者年龄、肿瘤部位、肿瘤厚度、溃疡、N分期、M分期及手术为独立预后影响因素。CSS和OS单因素COX回归分析结果见表2,CSS和OS多因素回归分析结果及森林图见图1。

图1 SCM患者多因素COX回归分析森林图Fig.1 Forest plot of SCM patients by multivariate COX regression analysis

表2 SCM患者单因素COX回归分析Tab.2 Univariate COX regression analysis of SCM patients

2.3 预后预测模型的建立及验证

本研究共确定了7个因素纳入预后模型,包括年龄、肿瘤部位、肿瘤厚度、溃疡、N分期、M分期及手术。将这7个预测因素通过R软件的“rms”包,生成具有预后预测价值的列线图(图2)。列线图中各变量的长度越长,其对患者生存结局的影响比重越大,可见N分期对患者CSS有较大影响,年龄和N分期对于患者OS有较大的影响,各个因素对应分值见表3。根据个体每个因素分值相加得到总分值,总分值越大,生存率越低。对预后模型进行校准和验证,建模组和验证组的C-index见表4,建模组5和10年CSS的曲线下面积(area under curve,AUC)分别为0.815和0.825,5和10年OS的AUC分别为0.803和0.825,验证组5和10年CSS的AUC分别为0.777和0.836,5和10年OS的AUC分别为0.754和0.799(图3),列线图预测SCM患者5和10年CSS和OS的校准曲线见图4,建模组和验证组预测SCM患者5和10年CSS和OS的DCA见图5。

表3 各因素在列线图中对应的分值Tab.3 The corresponding score of each factor in the nomogram

表4 SCM患者CSS和OS预测模型的C-indexTab.4 C-index of CSS and OS prediction models

图2 SCM患者预测5和10年CSS(A)和OS(B)列线图Fig.2 Nomogram for predicting 5-and 10-year CSS (A) and OS (B) of patients with SCM

图3 建模组和验证组SCM患者5和10年CSS(A和B)及OS(C和D)的ROC曲线及AUCFig.3 ROC curves and AUC of 5-and10-year CSS (A and B) and OS (C and D) of SCM patients in the training cohort and validation cohort

图4 列线图预测SCM患者5和10年CSS(A和B)和OS(C和D)的校准曲线Fig.4 Calibration curves for 5-year and 10-year CSS (A and B) and OS (C and D) predicted by nomogram in SCM patients

图5 建模组和验证组预测SCM患者5和10年CSS(A和B)和OS(C和D)的DCAFig.5 DCA for training cohort and validation cohort to predict 5-and 10-year CSS (A and B) and OS (C and D) in SCM patients

3 讨 论

SCM在1967年首次被报道,组织学表现为单纯或混合纺锤体样肿瘤细胞群[17]。由于SCM具有生物侵袭性行为,且不易早期诊断,转移风险高,尽管可以进行手术治疗、放疗、化疗或免疫治疗,但疗效不佳[10,12,18]。因此,提高SCM患者确诊后的监测、随访和干预能力,对延长AM患者的生存时间和改善预后可能具有积极意义。而列线图预后模型可以将复杂的回归分析结果转化为可视化的图像,使预后预测模型更具可读性,可以提供个体化信息,便于临床医师评估患者的生存和预后[19]。

本研究通过单因素和多因素COX回归分析,确定患者的年龄、肿瘤部位、肿瘤厚度、溃疡、N分期、M分期及手术为SCM患者的独立预后影响因素,而性别、人种、放疗及化疗对患者预后的影响差异无统计学意义。因此,患者的年龄越大、肿瘤位于头颈部、肿瘤厚度越大、肿瘤存在溃疡、N分期和M分期越晚,患者预后越差,而手术可在一定程度上改善患者预后,这与之前有关皮肤黑色素瘤预后研究[11-12,20-21]的结果一致。

基于上述独立预后影响因素,可以分别构建预测SCM患者5和10年CSS和OS的列线图并进行验证。通过参考列线图的个体化预测结果,临床医师可增强或减少监测与干预强度,实现个体化治疗和随访[22]。同时为避免模型数据过度解释和确定其临床实用性,需对列线图进行校准和验证[16]。在CSS和OS预测模型中,建模组和验证组的C-index均大于0.7,说明其辨别能力较好。5和10年的AUC建模组和验证组均大于0.75,同样说明预测模型具有较为准确的辨别能力。建模组和验证组的5和10年生存率校准曲线和45°线较贴合,显示出预测概率和实际概率的一致性,说明模型具有良好而准确的预测能力。此外,本研究DCA结果表明,在较广泛的阈值概率范围内,应用预测模型来预测患者5和10年生存率均可以为患者带来净收益,显示出预测模型良好的临床实用性。

本研究也存在一些局限。首先,本文为回顾性研究,存在一些固有偏倚,如选择性偏倚等。其次,SEER数据库缺乏基础疾病、合并症等重要临床信息,因此难以判断这些混杂因素对患者生存的影响,存在混杂偏倚的现象。最后,SEER数据库也缺乏手术切缘、手术范围、放疗、化疗及免疫治疗方案等详细信息,难以进一步了解不同手术方式、放疗、化疗及免疫治疗对治疗效果及患者预后的影响。因此,本研究结论有待于进一步的大型随机对照试验结果来验证。

综上,本研究将年龄、肿瘤部位、肿瘤厚度、是否溃疡、N分期、M分期及手术纳入列线图生存预测模型,并通过区分度、校准曲线验证及决策曲线分析,展现了列线图对生存率预测良好的区分辨别能力、准确性及临床实用性,表明该列线图对于SCM患者5和10年OS和CSS具有良好的预测能力,对临床医师减少或增强随访监测强度、更好地与患者沟通及为患者提供个性化的临床信息具有重要的临床意义。

利益冲突声明:所有作者均声明不存在利益冲突。

猜你喜欢

线图生存率建模
基于FLUENT的下击暴流三维风场建模
肿瘤复发,为何5 年是一个坎
一些图运算的调和指标与调和多项式的线图∗
预测瘢痕子宫阴道试产失败的风险列线图模型建立
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
“五年生存率”不等于只能活五年
求距求值方程建模
日本首次公布本国居民癌症三年生存率
基于PSS/E的风电场建模与动态分析
日本癌症患者十年生存率达59%左右