基于SEER数据库亚洲及太平洋岛民人群中结肠癌患者的预后模型构建
2022-03-08徐杰盛勤松
徐杰 盛勤松
结肠癌作为一种恶性的消化道肿瘤,目前排在世界上癌症致死原因的首位,并且随着我国的发展及物质生活水平的不断提高,我国人口饮食结构中动物性蛋白及脂肪/膳食纤维比例发生变化,导致结肠癌在我国的发病率和死亡率逐年升高,对我国国民健康造成极大的影响,增加社会及经济负担。
有研究发现,中国患者结肠癌的生存率要低于美国患者,并且在美国的亚洲人种相较于美国其他人种而言发病率与生存率也存在差异。目前基于国际抗癌联盟(union for international cancer control,UICC)/美国癌症联合会(American joint committee on cancer,AJCC)肿瘤分期(tumor node metastasis,TNM)虽然经过多次改版,但其对肿瘤分期及预后的评估仍然存在缺陷。本研究目标人群为SEER 数据库中亚洲及太平洋人群,收集SEER 数据库病例信息,筛选关键因素,构建预后模型,历史性回顾2004~2020 年SEER 数据库中病例信息,以期为我国现阶段结肠癌诊疗提供参考价值。
1 材料与方法
1.1 材料 筛选了2004~2020 年SEER 数据库登记保留有完整随访记录的亚洲及太平洋人群结肠癌患者,提取信息包括患者年龄、性别、肿瘤原发部位、组织学类型、分级、肿瘤大小、TNM 分期、原发部位是否手术、切除送检淋巴结个数、肿瘤数量、家庭平均收入、生存时间及生存状态。
1.2 方法 运用SEER*Stat 软件筛选符合条件的患者并提取相关信息,按照7∶3 的比例分为建模队列和验证队列并统计基线资料。通过单因素及多因素分析建模队列,并筛选影响预后及生存率的危险因素,绘制生存曲线。根据多因素分析构建模型,对改模型进行区分度与一致性的验证。
1.3 统计学方法 利用R 软件进行基线资料统计以及COX 单因素、多因素回归分析、构建生存曲线。利用R 软件构建列线图并计算C-Index 及Bootstrap抽样检验模型3 年、5 年一致性分析。设P<0.05 为差异有统计学意义。
2 结果
2.1 患者临床特征 本次研究共筛选出26 151 名患者,随机分组后建模队列18 394 名,验证队列7 757 名。其中原发部位为乙状结肠的患者居多,组织学类型多为腺癌,分级多为Ⅱ级中分化,T3、N0及M0 分期的患者居多,原发部位切除的患者占86%左右,切除并送检淋巴结≥12 个的患者占60%左右,肿瘤数量大多数为单发。
2.2 预后影响因素分析 利用单因素COX 风险比例模型回归分析中存在统计学差异的年龄、性别、肿瘤原发部位、组织学类型、分级、肿瘤大小、TNM分期、原发部位是否手术、切除送检淋巴结个数、肿瘤数量以及家庭平均收入纳入多因素COX 风险比例模型回归分析中,最终排除了家庭平均收入因素。结合生存曲线可以分析得出,年龄>60 岁、性别为男性、发病部位为盲肠或者肝曲、组织学类型为印戒细胞癌、分级>Ⅱ级、大小>3 cm、淋巴结及远处转移、未手术、切除并送检淋巴结小于12 个以及原发肿瘤个数>1 为导致患者预后不佳的影响因素(见封二图1)。
图1 生存曲线
2.3 构建nomogram模型见图1
由图1 可见,根据COX 回归构建了nomogram 模型,并利用验证队列进行验证,分别计算C-Index 为0.82(建模队列)及0.85(验证队列)。通过R 软件分别构建两队列3 年与5 年生存的模型一致性曲线,有较好的一致性。
图1 根据COX回归构建的nomogram模型
3 讨论
UICC/AJCC TNM 分期应用广泛,自发布伊始多次更新,但其缺陷一直不容忽视,其中不均衡的权重以及未综合考虑T、N、M 三者的关系便笼统划分为肿瘤分级(Ⅰ~Ⅳ级)的做法欠妥[1]。目前多项研究已表明nomogram 列线图预测模型较传统分期具有更好的预测能力[2~4]。然而由于临床数据库建设还不完善,数据互通还未实现,使得获取我国大量临床病例资料进行研究仍存在困难。本研究基于美国SEER 数据库,提取亚洲及太平洋岛民人群数据进行研究,结合临床及统计分析充分纳入数据库所提供的影响结肠癌患者预后的影响因素,以期构建较为精准的临床预测模型,为后续我国结肠癌研究提供借鉴价值。
本次模型中,年龄>60 岁的患者,随着年龄增加其预后变差,可能是因为临床医生更倾向于对年轻患者进行积极治疗,而年老患者对治疗方案耐受较差,进行姑息治疗的比例更高[5,6]。在处理老年患者时需要更加谨慎以及增加随访。从原发部位来看,肝曲预后较差,而乙状结肠及降结肠预后较好,原因可能为左、右半结肠存在起源、血供、基因表达以及对化疗及靶向药物的敏感性方面的差异[7,8]。此外,右半结肠不易肠梗阻,结肠癌早期往往无明显临床症状,原因在于右半结肠肠壁较薄,扩张较左半结肠容易,内容物含水量较多且通过,已有研究表明左半结肠预后好于右半结肠癌[9~11]。组织学类型的模型结果也符合目前的共识,类癌恶性程度较低生长缓慢,腺癌占据结肠癌发病的绝大多数,其中印戒细胞癌原发于腺上皮细胞,属于黏液分泌型,恶性程度较高并且分化较低,侵袭性较强,符合模型对于预后的预测[12]。预测模型还显示,肿瘤体积>3 cm 患者预后较差,且预后随着肿瘤体积增加而降低。肿瘤体积的大小可间接体现出肿瘤潜在的侵袭性生物学特征。获得淋巴结数量是影响肿瘤分期准确性的重要因素,是5 年全因死亡率的重要预测因子,已作为预后的独立指标[13]。UICC 和AJCC 建议术中至少检出12 个淋巴结。淋巴结以及远处转移为结肠癌恶性程度的表现,从预测模型中也可以看出N2、M1期的预后较差。
总之,SEER 数据库亚洲及太平洋人群中年龄、性别、肿瘤原发部位、组织学类型、分级、肿瘤大小、TNM 分期、原发部位是否手术、切除送检淋巴结个数、肿瘤数量都为影响结肠癌预后的影响因素,通过结合临床经验及统计分析构建的nomogram 模型就有较好的预测性能,为后续深入地研究打下基础。