APP下载

基于SEER数据库的乳腺髓样癌预后分析及预测模型构建

2024-03-25陈勇许正丁锦华

浙江医学 2024年4期
关键词:训练组亚组生存率

陈勇 许正 丁锦华

乳腺髓样癌(medullary breast carcinoma,MBC)是一种罕见的浸润性乳腺癌亚型,发病率较低,不到所有乳腺恶性肿瘤总数的5%[1-2]。基于组织学特征可将MBC 分为典型乳腺髓样癌(typical medullary breast carcinoma,TMBC)和不典型乳腺髓样癌(atypical medullary carcinoma of the breast,AMCB)[3]。MBC 通常采用Ridolfi 标准进行诊断,其中TMBC 的诊断要点包括:(1)主要呈现细胞合胞生长,模式占比超过75%;(2)在显微镜下表现为包膜完整且边界清晰;(3)无导管内成分;(4)中度至显著的弥漫性单核细胞间质浸润;(5)核级别为1 或2;(6)无微小腺样特征。如果符合第一要点,并且存在最多2 个非典型特征,则可以诊断为AMCB[4]。尽管MBC 的免疫组化结果通常以三阴性表型为主,但过去的研究表明,与浸润性导管癌(invasive ductal carcinomas,IDC)相比,MBC 具有较好的预后[5-8]。临床关于TMBC 和AMCB 的预后仍存在争议。Jensen 等[9]对丹麦一家医院24 年内的60 例MBC 病例进行了回顾性研究,结果表明,与AMCB 相比,TMBC表现出较好的生存优势。Mateo 等[10]基于美国全国癌症数据库(national cancer database,NCDB)进行的研究结果显示,相比于TMBC,AMCB 在临床表现、治疗和预后方面没有明显的差异,但未就不同地区、不同人群差异展开研究。本研究基于美国国家癌症研究所监测、流行病学及结局项目(the surveillance,epidemiology and end results,SEER)数据库信息比较TMBC 与AMCB的临床病理特征和生存差异,构建和验证MBC 患者的预后预测模型,为MBC 患者提供更加个体化的治疗决策支持,从而改善患者的预后和生存质量。

1 资料和方法

1.1 资料来源和纳排标准 收集SEER 数据库(https://seer.cancer.gov/seerstat/)中2004 年1 月1 日至2017 年12 月31 日诊断为MBC 的2 174 例患者资料,其中TMBC 2 017 例,AMCB 157 例。纳入标准:(1)年龄>20岁;(2)经病理学诊断为MBC(ICD-O-3 代码为8510/3、8512/3、8513/3);(3)原发部位为乳腺;(4)原发侧为单侧。排除标准:(1)美国癌症联合委员会(American Joint Committee on Cancer,AJCC)分期、淋巴结状态信息未知者;(2)死亡或尸检时诊断为乳腺癌的患者。鉴于SEER 数据库在2010 年之前不包含人类表皮生子因子受体2(human epidermal growth factor receptor 2,HER2)信息,为了确保样本量足够充分,将HER2 信息未知的患者也纳入到研究中。该研究资料来源于开放获取数据库,免除伦理审批。

1.2 统计学处理 采用SPSS 25.0 和R 4.2.2 统计软件。计数资料用频数和构成比表示,采用χ2检验比较两组患者的人口统计学和临床病理特征差异。采用Kaplan-Meier 法绘制生存曲线,采用log-rank 检验分别比较两组患者总生存期(overall survival,OS)和乳腺癌特异生存期(breast cancer-specific survival,BCSS)的差异。采用Cox单因素回归分析影响MBC患者OS的危险因素,计算风险比(hazard ratio,HR)以及相应的95%CI,采用Cox 多因素回归分析独立危险因素,采用列线图构建预后模型。绘制ROC 曲线和校准曲线评估预测模型的效能和准确度,使用决策曲线(decision curve analysis,DCA)评估预测模型在不同阈值下的决策效果,比较预测模型和AJCC 分期系统预测的净收益。在单因素分析中,综合考虑统计显著性和实际意义,双侧P<0.10 为差异有统计学意义,其余双侧P<0.05为差异有统计学意义。

2 结果

2.1 TMBC 和AMCB 患者临床病理特征比较 2 174例MBC 患者中,TMBC 患者2 017 例(7.22%),AMCB 患者157 例(92.78%)。 两组患者的年龄、性别、婚姻状况、种族、原发侧、分级、AJCC 分期、淋巴结状态、雌激素受体(estrogen receptor,ER)、孕激素受体(progesterone receptor,PR)、HER2 状态、手术、放疗、化疗和肿瘤大小等临床病理特征比较,差异均无统计学意义(均P>0.05),见表1。

表1 TMBC 与AMCB 患者临床病理特征比较[例(%)]

2.2 TMBC 和AMCB 患者的生存比较 生存曲线分析结果显示,两组患者OS 和BCSS 比较,差异均无统计学意义(均P>0.05),见图1。亚组分析结果显示,在肿瘤直径>5 cm 的亚组中,AMCB 患者OS 较差(P<0.05),见图2。

图1 两组患者总生存期和乳腺癌特异生存期比较(A:总生存期;B:乳腺癌特异生存期)

图2 两组患者总生存期的亚组分析(A:年龄<50 岁;B:年龄≥50 岁;C:已婚;D:未婚;E:淋巴结阳性;F:淋巴结阴性;G:肿瘤直径<2 cm;H:肿瘤直径为2~5 cm;I:肿瘤直径>5 cm;J:HER2 阳性;K:HER2 阴性;L:HER2 未知)

2.3 MBC 患者预后模型的构建和验证 将MBC 患者按7∶3 的比例随机分配到训练组和验证组,两组临床病理特征比较差异均无统计学意义(均P>0.05),见表2。对训练组患者变量进行单因素分析,结果发现年龄、婚姻状况、原发侧、AJCC 分期、淋巴结状态、PR、放疗、化疗和肿瘤大小等9 个因素与患者OS 有关(均P<0.10),见表3。多因素分析结果显示,年龄、婚姻状况、AJCC 分期、淋巴结状态、化疗和肿瘤大小是影响MBC 患者OS 的独立危险因素(均P<0.05),见表4。基于这些独立危险因素构建预测MBC 患者1、3 和5 年OS 的列线图,见图3。

图3 乳腺髓样癌1、3、5 年总生存率的列线图

表2 训练组和验证组的临床特征比较[例(%)]

表3 影响MBC 患者OS 的单因素分析

表4 影响MBC 患者OS 的多因素分析

2.4 模型预测效能的评价 预测1、3、5 年OS 的ROC曲线显示,训练组AUC 分别为0.844、0.777 和0.727,验证组AUC 分别为0.891、0.675 和0.714。见图4。训练组和验证组1、3、5 年OS 的校准曲线结果显示,模型的预测结果与实际观察结果具有良好的一致性,见图5。DCA 表明,该预测模型能够在不同患者风险阈值下评估其性能,进而确定最佳决策,见图6。

图4 列线图预测1、3、5 年总生存率的ROC 曲线(A:训练组;B:验证组)

图5 列线图预测总生存率的校准曲线(A:训练组1 年总生存率;B:训练组3 年总生存率;C:训练组3 年总生存率;D:验证组1 年总生存率;E:验证组3 年总生存率;F:验证组5 年总生存率)

图6 列线图预测总生存率的决策曲线(A:训练组1 年总生存率;B:训练组3 年总生存率;C:训练组3 年总生存率;D:验证组1 年总生存率;E:验证组3 年总生存率;F:验证组5 年总生存率)

3 讨论

MBC 在临床上较为罕见,既往研究证明MBC 预后要优于其他的乳腺癌组织学类型[11]。1977 年Ridolfi 明确了MBC 的定义,并提出了TMBC 和AMCB 明确的诊断标准(6 项基本标准)[4]。由于MBC 发病率低,其中AMCB 更是罕见,因此获取足够样本量非常困难。目前关于这两者的研究相对较少,且对其预后差异仍存在争议。SEER 数据库数据来源广泛且收录了多维度数据,可满足MBC 的预后研究。本研究显示,TMBC 与AMCB 在临床病理特征、OS 以及BCSS 方面比较,差异均无统计学意义。以部分临床病理特征作为自变量进行亚组分析。结果显示,在年龄、婚姻状况、HER2状态和淋巴结状态等亚组中,两组患者的OS 比较,差异均无统计学意义(均P>0.05)。但对于肿瘤直径>5 cm 的亚组,TMBC 患者的预后明显优于AMCB(P<0.05)。需要注意的是,由于亚组的样本数量不足,因此该结果并不一定可靠。Mateo 等[10]利用NCDB数据库将IDC 作为参考点,比较了TMBC 与AMCB 的OS,结果显示TMBC 与AMCB 在预后方面相似,并且都优于IDC。值得一提的是,该项研究随访期长达10年,但并未涉及BCSS 的分析,也未进行亚组研究。在最近的一项研究中,Qin 等[12]利用SEER 数据库分析了激素受体状态对MBC 患者预后的影响,结果显示激素受体阴性的AMCB 患者,生存率明显低于TMBC 患者。这种差异很可能是由于样本筛选条件的不同所致。本研究在两者生存情况没有明显差异的前提下进一步进行亚组分析,并证实AMCB 和TMBC 患者的预后相似。基于这一结论,本研究将两组患者合并起来以分析MBC 的危险因素并构建用于预测预后的列线图。列线图可以通过整合多种临床变量来计算产生临床事件的概率,已被发现优于肿瘤-淋巴结-转移(tumor-node-metastasis,TNM)分期系统[13-15]。本研究中,年龄较小且淋巴结阴性的患者表现出较好的预后,这与Dai 等[16]的研究结果一致。单因素和多因素分析显示,AJCC 分期是影响OS 的独立危险因素,分期越高,预后风险也越高。殷清华等[17]对38 例MBC 患者的分析显示,肿瘤直径<2 cm 和>5 cm 的患者生存率要略高于2~5 cm 的患者,但本研究发现生存风险与肿瘤大小呈正相关,这可能是样本量不同所致。婚姻状况是OS 的独立危险因素。Ding 等[18]通过SEER 数据库分析了婚姻对乳腺癌预后的影响,结果显示已婚患者无论之前的婚姻状况如何,OS 和BCSS 均优于未婚患者。同时,Guan 等[19]的研究指出未婚患者在心血管死亡风险上相较已婚患者要高。此外,ER 和PR 阳性通常被认为是乳腺癌预后良好的因素,因为患者可能从内分泌治疗中获益[20-23]。但本研究结果表明,ER 和PR 的状态与患者预后无关。放疗和化疗都是治疗浸润性乳腺癌不可或缺的手段。Lim 等[24]的多因素分析结果显示,化疗能够显著改善MBC 患者OS(P=0.007)和BCSS(P=0.009),但在肿瘤直径较大(>2 cm)的患者中,化疗效果受到限制。Aihara 等[25]的研究指出,ER和HER2 阴性的MBC 患者死亡风险约为IDC 患者的一半。此外,术后化疗被证实能够有效降低患者的死亡率和复发率。但在Dai 等[16]的研究中,无论是放疗还是化疗,均与MBC 患者预后无关。本研究发现,化疗对MBC 患者的预后可起到改善作用,而放疗与预后无关。使用Cox 回归模型对MBC 患者的OS 进行单因素和多因素分析,结果发现年龄、婚姻状况、AJCC 分期、淋巴结状态、化疗以及肿瘤大小均是影响OS 的独立危险因素;并由此建立MBC 患者预后的预测模型。ROC曲线和校准曲线都表明列线图对患者1、3 和5 年OS有良好的预测能力,DCA 分析显示列线图的临床应用价值优于AJCC 分期。

本研究还存在一定局限。首先,由于SEER 数据库中没有关于内分泌治疗、靶向治疗和化疗方案的具体信息,因此模型无法为MBC 患者提供更全面的治疗方案。其次,由于排除了一些信息不完整的患者,研究可能存在选择偏倚,并且也会对样本量造成限制。未来仍需利用更大规模的样本,并综合考虑更全面的临床病理特征和治疗方案,以构建更为理想的预测模型,从而为MBC 患者提供个体化的治疗方案。

猜你喜欢

训练组亚组生存率
慢性阻塞性肺疾病患者膈肌移动度分析
新型抗阻力训练模式改善大学生身体素质的实验研究
槭叶铁线莲亚组的研究进展
跑台运动训练对脊髓损伤大鼠肺功能及HMGB-1表达的影响
线上自主训练与线下指导训练表面肌电差异分析
“五年生存率”不等于只能活五年
冠心病患者肠道菌群变化的研究 (正文见第45 页)
人工智能助力卵巢癌生存率预测
日本首次公布本国居民癌症三年生存率
“五年生存率”≠只能活五年