基于SEER数据库对5634例唾液腺腺样囊性癌患者生存预测模型的构建
2023-06-10李晨曦龚忠诚
刘 英 李晨曦 方 昌 刘 慧 龚忠诚
唾液腺腺样囊性癌(adenoid cystic carcinoma,ACC)是一种生长缓慢但侵袭性高的恶性肿瘤,起源于外分泌腺,占头颈部恶性肿瘤的比例不到1%,主要累及腮腺等大唾液腺,较少发生在泪腺或分布于鼻窦、气管、以及其他呼吸道部位的小唾液腺[1,2]。根据SEER 数据库[3][美国国家癌症研究所监测,流行病学和最终结果数据库/The Surveillance, Epidemiology,and EndResults(SEER) Program of the National Cancer Institute (NCI)]发现ACC 发病率为每年每10万人中0.5~2.5 人,且具有较高复发倾向和延迟远处转移的发生[4,5]。众所周知,ACC 的临床病程较长,且复发后,患者仍可存活数年[6,7],然而,对ACC 的病因构成与总体预后趋势了解甚少。
通过评估SEER 数据库,分析解构其中大规模ACC 患者流行病学特征、治疗相关结果及预后因素,优化疾病风险分层并进行预后分析,为我国ACC 患者选择临床治疗方案提供科学合理的依据,最终以期弥合大数据调查这一研究差距。
材料和方法
1.样本选择和研究设计:从SEER 数据库中提取自2010 年至2017 年注册的8283 例ACC 患者的数据。排除其中未成年数据(n=11)、转移未知和手术及放化疗数据缺失(n=2330)、其他变量(肿瘤大小、肿瘤分期等变量)缺失(n=308),最终纳入模型数据(n=5634)。
2.研究变量:提取年龄、性别、种族、累及腺体、组织学形态、肿瘤TNM 分期、手术情况、化疗及放疗情况、肿瘤原发灶大小等可变定义信息在诊断时进行编码,并将淋巴结转移作为结局变量。
对于种族,本研究将患者重新划分为5 组:“西班牙裔”或“非西班牙裔白人”或“非西班牙裔黑人”或“非西班牙裔亚裔”或“其他人种”。原发肿瘤部位分为“腮腺”或“颌下腺”或“舌下腺”或“腭腺”。在本研究中,SEER 条目的所有信息都是免费提供给公众的,因此不需要医学伦理委员会的批准。
3.模型的构造和验证:本研究根据“淋巴结转移”变量分为淋巴结转移组(n=444)和非转移组(n=5190)。首先,使用模型内部验证方法将数据集分为训练队列和验证队列(7:3),研究训练队列和验证队列之间的平衡问题;然后对训练队列数据进行单变量logistic 回归分析,将有意义变量纳入多因素模型;最后,利用后向归纳法,以受试者工作特征(receiver operator characteristic, ROC)曲线和校准曲线构建最终确定预测模型。
4.统计分析方法:所有统计学检验均采用双侧检验,以P<0.05 认为检验差别具有统计学意义。所有统计分析过程均采用SAS9.4 统计分析软件完成。采用Kaplan-Meier 法对可能影响预后的因素进行单因素生存分析,比较生存结局。用R 语言编写建立ACC 患者淋巴结转移列线图预测模型。
描述性数据分析中,正态分布的计量资料以均数±标准差(Mean±SD)描述,非正态资料以中位数和四分位间距[M(Q1,Q3)]描述,计数资料以例数和构成比[n(%)]描述。训练集和测试集均衡性分析中,有序多分类资料以例数和构成比[n(%)]描述,组间比较采用Mann-Whitney U 秩和检验,无序分类资料以例数和构成比[n(%)]描述,组间比较采用χ2检验或Fisher 精确概率法。
结 果
1.研究样本基线特征:SEER 数据库中共计获取自2010 年至2017 年诊断为ACC 的5634 例患者,根据模型内部验证方法,将3943 例获得资料随机分配到训练集,1691 例随机分配到验证集。两组患者的研究变量信息见表1。
2.单因素Logistic 回归分析:对训练集数据进行单因素Logistic 回归分析,结果表明,相比于男性患者,女性患者发生淋巴结转移的风险减少了0.359倍;非西班牙裔白人患者发生淋巴结转移的风险是西班牙裔患者的1.659 倍;非西班牙裔黑人患者发生淋巴结转移的风险是西班牙裔患者的1.939 倍;患病部位中,相比于腮腺,累及颌下腺的ACC 患者发生淋巴结转移的风险减少了0.499 倍,累及舌下腺的ACC 患者发生淋巴结转移的风险减少了0.669倍,患病部位在腭腺的ACC 患者发生淋巴结转移的风险减少了0.604 倍;组织学形态中,管状型ACC患者的淋巴结转移风险低于实性型,而相比于实性型,腺性(筛状)型发生淋巴结转移的风险减少了0.695 倍;临床分期中,相比于Ⅰ期患者,Ⅱ期患者发生淋巴结转移的风险增加了0.649 倍,Ⅲ期患者发生淋巴结转移的风险增加了0.255 倍;未进行过手术治疗的患者发生淋巴结转移的风险是进行过手术治疗患者的14.737 倍。详见表2。
3.多因素Logistic 回归分析:考虑到年龄为常见的重要影响因素,故将年龄和单因素分析结果中具有统计学意义的性别、种族、原发部位累及腺体等变量纳入多因素Logistic 回归分析,采用后向归纳法,最终确定预测模型。
结果表明,相比于18~64 岁患者,年龄分组中≥80 岁患者发生淋巴结转移的风险减少了0.390倍;ACC 累及腺体中,相比于腮腺,原发于舌下腺的患者发生淋巴结转移的风险减少了0.695 倍;临床分期中,相比于Ⅰ期患者,Ⅱ及Ⅲ期患者发生淋巴结转移的风险均有所增加;未进行手术治疗的ACC 患者发生淋巴结转移的风险是进行过手术治疗患者的14.548 倍。详见表3。
表3 多因素Logistic 回归模型
4.生存分析:结果显示,性别、T 分期、N 分期、M分期、手术、化疗是早期ACC 患者术后生存的危险因素,相应各变量的生存曲线对比详见图1,(P<0.001)。
图1 生存曲线
5. 模型评价:预测模型在训练集和测试集的ROC 曲线如图2 所示,训练集曲线下面积(area under curve, AUC)为0.851(0.829~0.873),测试集AUC 为0.849 (0.813~0.885),表明模型具备优良的区分能力。模型校准曲线如图3 所示,由校准曲线可知,该模型整体拟合度良好;模型具体参数如表4 所示。
图2 训练集和测试集ROC 曲线
图3 预测模型校准曲线
表4 模型参数结果
6.生存结果预后列线图
多变量回归分析中具有统计学意义的变量为独立预后因素。基于logistic 回归分析结果,纳入特征变量,每个预测变量对应最上方标尺的分值,在相应的“生存轴”上画一条垂直线,以得到预测值。3 年和5 年生存结果如预后列线图(图4)所示,年龄、淋巴结转移、TNM 分期等对预后的影响较大。
图4 生存结果预后列线图
讨 论
本研究使用SEER 数据库的数据分析了ACC患者在最初诊断时淋巴结转移发生的频率和总生存期,并建立ACC 患者淋巴结转移的预测模型。在病例对照研究中,将不同变量纳入多因素Logistic 回归分析,并采用后向归纳法,最终确定预测模型。单变量和多变量统计分析结果显示,年龄、性别、种族、原发腺体等自变量对ACC 患者淋巴结转移的发生有一定影响,结果进一步证实了预测模型具有良好的判别能力。
手术是ACC 的标准治疗方法。研究发现ACC诊断后应尽快进行手术[8]。肿瘤对腺体侵蚀越小,对神经功能的损害越小。虽然没有大样本数据支持,但许多系列研究表明ACC 切除的患者具有更好的生存和预后[8~10]。本研究表明,手术的发生是总生存期的一个重要的独立预测因子。ACC 因其肿瘤浸润性生长的特点,切除范围难以确定,因此需术中行快速冰冻病理明确病灶边界以决定手术范围[11]。另外,ACC 具有特殊的神经侵袭性,故在考虑处理临近区域神经时应根据患者主观意愿、术中所见及预后情况,慎重决定是否保留,尤其是术前神经功能完整的患者[8,12]。
采用多因素Logistic 回归分析确定ACC 诊断的危险因素。研究发现,当患者具有以下因素时,更有可能在诊断时发生淋巴结转移:年龄、原发腺体、组织学形态。正如本研究所怀疑的,老年患者常伴有侵袭性更强的肿瘤,可导致淋巴结转移的常见表现。研究发现,75%的老年患者发生远处转移,相比之下,10 年随访的老年患者的这一比例为15%,这表明ACC 患者迫切需要早期诊断和有效治疗,以降低这些老年患者的极端死亡率[13,14]。此外,ACC 患者的人口统计学特征、临床信息和生存率因原发肿瘤部位而异[15]。正如预期,肿瘤分期似乎是一个重要的生存预测因子,尽管无法在这个队列中评估TNM 分期系统。此外,原发腺体部位似乎是局限性ACC 患者生存的一个重要预测因子,但对于病情更严重的患者则不那么重要[16,17]。
本研究根据统计发现,淋巴结转移与腺样囊性癌患者TNM 分期呈现正相关。王张嵩[18]等人通过一项多变量分析证明淋巴结状态是唾液腺ACC 患者总体生存的重要的独立预测因素,有淋巴结转移患者的5 年、10 年总生存率分别为45.1%、13.7%,无淋巴结转移患者的5 年、10 年总生存率分别为82.1%、56.2%(P<0.05)。黄擎等[19]发现在部分转移淋巴结位置远离原发病灶的病例,显然直接浸润或嗜神经侵犯无法合理解释,其可能通过脉管系统(通过淋巴道和/或血管转移)迁移并定植于颈部淋巴结,并在其内部增殖并最终突破淋巴结包膜浸润至结外软组织。另外,颈部淋巴结转移是腺样囊性癌患者不良预后的重要指标之一,目前ACC 颈部淋巴结转移相关的分子标记物也成为研究的热点。肿瘤能够通过淋巴循环系统迁移至颈部淋巴结,在其内部增殖并最终突破淋巴结包膜浸润至结外软组织。Fiedler M等[20]在一项多因素回归分析中发现,肿瘤T 分期的级别越高其肝细胞生长因子受体、磷酸酶及紧张素同源蛋白异常均是预测淋巴转移阳性的重要因子,相比之下,表皮生长因子受体的差异对预测颈部淋巴结转移无统计学意义。同时Zhu X 等[21]发现Pim-1 原癌基因与肿瘤淋巴结转移分期弱相关。其次,在淋巴结转移过程中Pim-1 和FOXO3a、BCL-2 的表达呈显著正相关性(P<0.05)。
本研究通过SEER 数据库收集了2010~2017 年5634 例ACC 病例,时间跨度大,范围广。确定年龄、性别、原发肿瘤部位、组织学形态、T 分期等独立预测因子,将这些预测因子整合到列线图模型中,准确预测患者淋巴结转移情况。这些研究结果为ACC 在我国的流行病学特征分析提供了新的理论基础,并加强了目前关于ACC 的观点。然而,本研究未收集重要的临床病理参数的信息,如全身治疗、分子靶向治疗和疾病进展,因此潜在的残余混淆可能会夸大结果。