基于生物信息学构建宫颈鳞癌预后相关的免疫基因风险模型①
2021-08-23大连大学附属中山医院大连116001
李 纯 张 青 魏 巍 (大连大学附属中山医院,大连116001)
宫颈鳞状细胞癌(cervical squamous cell carcino‑ma,CSCC)严重威胁女性健康,每年可导致几十万例患者死亡[1]。早期宫颈癌患者建议采取手术治疗,但晚期患者现有治疗手段疗效较差[2]。目前,国际妇产科联合会FIGO 分期是CSCC 最重要的预后因素,但无法反映CSCC 的生物学异质性。因此,识别与CSCC 预后相关的生物标志物,实现精准个体化治疗对患者尤其是晚期患者极为重要。免疫治疗是癌症个性化诊疗的主要驱动力,是新的宫颈癌治疗模式[3]。但免疫相关基因(immune related genes,IRGs)在宫颈癌临床相关性和预后中的意义尚未阐明。因此,本研究拟基于宫颈癌的IRGs构建风险模型,对宫颈癌患者进行分组,系统分析IRGs与预后的相关性,深入了解IRGs对宫颈癌预后的潜在临床应用价值,为宫颈癌靶向治疗提供新的生物标志物。
1 材料与方法
1.1 材料 从TCGA 和GTEx 数据库下载268 例CSCC临床样本的mRNA数据和临床信息,其中包含255例肿瘤标本和13例非肿瘤标本。通过免疫学数据 库 和 分 析 门 户 TCIA 数 据 库(https:/ /tcia. at/home)下载IRGs。
1.2 方法
1.2.1 差异基因分析 采用limma 包以FDR<0.05和|log2(FC)|>1 为阈值对所有转录数据进行差异分析,筛选所有差异IRGs。采用DAVID 数据库行GO和KEGG功能富集分析。
1.2.2 生存分析及TFs 的调控 通过单因素COX回归分析与生存相关的IRGs。从STRING 在线数据库提取临床相关转录因子(TFs),通过Cytoscape 软件构建IRGs 和TFs 调控网络,探讨TFs 和转录组的调控联系。
1.2.3 建立免疫相关基因的预后模型 基于多因素COX 回归分析整合的IRGs 作为独立的预后指标,以IRGs 表达数×Cox 回归系数构建预后模型。将患者按中位PI 值分为高、低风险组,评估不同宫颈癌患者PI 的预后价值。分别采用单因素和多因素COX 回归评估临床变量及风险评分与患者预后的相关性,判断风险模型可否作为独立的预后指标。采用Kaplan-Meier 曲线法分析高、低风险组OS,采用受试者工作特征(ROC)曲线评估模型的预测性能。
1.3 统计学处理 通过R 软件包计算生存ROC AUC,采用独立t检验检验临床参数差异。P<0.05为差异有统计学意义。
2 结果
2.1 差异表达IRGs 及功能富集分析 limma 包共识别出293 个差异表达IRGs,其中105 个下调基因和188 个上调基因(图1A)。对 293 个IRGs 进行GO和KEGG 分析,GO 词条中,生物学过程(BP)、细胞成分(CC)和分子功能(MF)富集最为丰富的分别是regulation of leukocyte activation、side of membrane、cytokine receptor binding。KEGG 功能富集分析主要富集于NF-κB、细胞黏附分子、细胞-细胞受体相互结合等信号通路(图1B)。
图1 差异表达的IRGsFig.1 Differentially expressed IRGs
2.2 预后相关差异表达IRGs 鉴定 单因素COX回归分析显示,有33 个差异表达IRGs 与患者OS 相关(图2A),包括24 个低风险基因及9 个高风险基因。将上述33个基因进行多因素Cox分析,筛选出7 个 IRGs 与 OS 相 关 ,其 中 FOXP3、ANKRD22 和FRAT2 与 OS 呈正相关,而 CCL20、NRP1、CXCL1 和SPP1与OS呈负相关(图2B)。
图2 预后相关IRGsFig.2 Prognosis related IRGs
2.3 建立免疫相关基因的预后模型及生存分析 基于以上7个IRGs表达谱构建预后风险评分模型,风险值(PI)=(CCL20×0.128 7)+[FOXP3×(− 0.765 7)]+(NRP1×0.435 3)+[ANKRD22×(−0.287 4)]+[FRAT2×(−0.369 3)]+(CXCL1×0.149 1)+(SPP1×0.228 7),计算各患者PI 值,以 PI 中位数为截断值,将患者分为高、低风险组。与高风险组相比,低风险组平均OS 较长,死亡数明显减少。热图显示,7个IRGs在高、低风险组中的表达值存在明显差异(图3A)。此外,Kaplan-Meier生存分析提示,高风险组患者OS显著缩短(P=6.116e-11,图3B)。
图3 基于IRGs的预后模型Fig.3 Prognostic model based on IRGs
2.4 生存影响因素的Cox 回归分析 对年龄、FI‑GO 分期、分级及风险值与OS 的相关性进行单因素和多因素Cox 回归分析,结果显示,预后模型风险值是OS 的独立预后因素且为高风险因素(P<0.001,图4)。
图4 宫颈癌OS预后因素的回归分析Fig.4 Regression analysis of cervical cancer prognostic factors for OS
2.5 IRGs 临床相关性分析 对7 个IRGs、风险值与临床变量,如年龄、FIGO分期、分级进行相关性分析,结果显示,ANKRD22、CCL20 在grade3-4 中低表达;SPP1 与 riskScore 在stage3~4 中高表达(P<0.05,图5)。表明以上IRGs在预后预测方面具有一定价值。
图5 IRGs表达与临床变量相关性分析Fig.5 Relationships between IRGs expression and clinico⁃pathological factors
2.6 TFs 网络图 为探讨预后相关差异表达IRGs的潜在分子机制,检测318 个TFs 表达谱,筛选出99 个差异表达 TFs 与 CSCC 相关(图 6A)。对 99 个TFs 与33 个预后相关差异IRGs 进行相关性分析,构建6 个TFs 和24 个预后相关差异IRGs 的网络图(CorFilter>0.3,图6B)。
图6 TFs调控网络Fig.6 TFs regulatory network
3 讨论
CSCC 是女性常见恶性肿瘤,其发病率逐年上升[4]。本研究共筛选出293个差异表达IRGs,KEGG分析发现,以上IRGs 主要富集于NF-κB 通路。NF-κB 信号途径在免疫调节及肿瘤发生发展中起重要作用,被认为是导致宫颈癌HPV 持续感染的重要因素[5]。COX 回归构建 7 个 IRGs 预后模型,将患者分为高、低风险组,两组患者OS差异显著,且模型风险值是OS 的独立预后因素,表明IRGs 预后模型对CSCC预后评估及个体化治疗有重要意义。
预后模型中,FOXP3、ANKRD22 和 FRAT2 表达与OS呈正相关,属低风险IRGs。熊洁[6]发现FOXP3在高-中分化组中阳性表达率显著低于低分化组,且与患者年龄分期无关。本研究发现,ANKRD22 与分级呈负相关,在前列腺癌中ANKRD22 表达与分期呈负相关,具有保护作用[7]。FRAT2 是 WNT 信号通路的正调控因子,通过激活WNT信号通路参与肿瘤发生[8]。
此外,本研究中 CCL20、NRP1、CXCL1 和 SPP1与患者OS 呈负相关,属高风险IRGs。宫颈癌组织中CCL20表达明显增高,并与宫颈癌复发相关[9];体外实验证实,CCL20/CCR6 可促进宫颈癌细胞迁移[10]。此外,研究发现,抑制 NRP-1 基因表达可降低宫颈癌细胞活力,诱导细胞凋亡,其表达与癌细胞活性呈正相关[11]。血清CXCL1 表达在宫颈癌患者中明显升高,与宫颈癌血管生成相关,并可诱导癌细胞增殖和克隆形成[12-13]。研究报道,SPP1 与宫颈癌发生有关,在 CSCC 中显著上调[14]。CHEN 等[15]采用基因芯片技术发现,SPP1在宫颈癌组织和细胞系中呈高表达,抑制SPP1 表达可抑制HeLa 细胞增殖,诱导凋亡,增加顺铂敏感性。本研究中,CCL20、NRP1 CXCL1 和 SPP1 在 CSCC 组织中呈高表达,是宫颈癌的危险因素,与既往研究结论相符。
本研究构建了1 个TFs 与IRGs 网络图,其中STAT1、TP63、、BATP 等 TFs 在该网络中占据重要位置。STAT1在CSCC中有重要意义,STAT1在恶性肿瘤组织中表达显著增加[16]。此外,TP63基因甲基化率在宫颈癌组织中显著升高[17]。文献显示,BCL11A在宫颈癌组织中高表达且与淋巴结转移密切相关[18]。Sox2 在宫颈鳞癌中高表达,并可促进宫颈癌进展[19]。但BATP和IRF5在宫颈癌中的作用有待进一步研究。
本研究通过生物信息学分析筛选出7个与预后显著相关的IRGs,基于以上7个IRGs 构建的风险模型将患者分为高、低风险组,且独立于其他临床变量预测患者预后,为CSCC 预后预测及免疫相关个性化治疗方案制定提供依据。