基于铁死亡相关基因构建肝细胞癌的预后模型
2021-10-10王道笃赵其炯周志标何永越
王道笃,赵其炯,周志标,何永越
原发性肝癌是全球第七大最常见的恶性肿瘤,肝细胞癌是原发性肝癌主要类型(75%~85%),具有预后差、复发率高的特点[1]。肝细胞癌在患者之间、肿瘤间以及肿瘤内,都具有高度的异质性[2-4]。在全球范围内,肝细胞癌患者的总体生存率差异显著。由于复杂的病因以及高度的异质性,使得对于该疾病的预后研究具有高度的挑战性。由于目前肝细胞癌治疗手段有限,急需开发新的预后模型。
铁死亡是最近发现的一种铁依赖性的细胞程序性死亡的形式,不同于细胞坏死、细胞凋亡、细胞自噬,铁死亡是由脂质过氧化的积累驱动的[5,6]。近年来,诱导肿瘤细胞铁死亡已经成为了一种有前景的治疗方式,尤其是针对传统治疗方法无效的恶性肿瘤[7,8]。最近的研究表明,除铁死亡诱导基因外,许多其他的基因也被确定为铁死亡的调节因子或标志物。目前,这些铁死亡相关基因与肝细胞癌患者的预后的关系尚未明确。
本研究从癌症基因图谱(TCGA)数据库以及国际癌症基因组联盟(ICGC)数据库下载了肝细胞癌患者的基因表达谱及相应的临床病理数据。然后,我们在TCGA队列中构建了铁死亡相关基因预后模型,并在ICGC队列中验证了此模型。此外,我们进行了功能富集分析,以探讨其潜在机制。
1 材料与方法
1.1 数据收集
从TCGA(https://portal.gdc.cancer.gov/)数据库及ICGC(https://dcc.icgc.org)数据库中下载肝细胞癌患者的基因表达谱及相应的临床病理数据,最终在TCGA数据库中纳入了370名肝细胞癌患者作为训练队列,在ICGC数据库中纳入了231名肝细胞癌患者作为验证队列。TCGA和ICGC的数据都是公开的。因此,本研究不需要地方伦理委员会的批准。本研究遵循TCGA和ICGC的数据访问政策和出版准则。
铁死亡相关基因从铁死亡数据库(FerrDb)(http://www.zhounan.org/ferrdb/)中下载,并与TCGA和ICGC数据库中的基因表达谱取交集,最终纳入了227个铁死亡相关基因进行研究。
1.2 铁死亡相关基因预后模型的建立和验证
首先,在TCGA队列中,提取227个铁死亡相关基因的表达数据,对总生存期(OS)进行单因素COX回归分析,用以筛选与预后相关的铁死亡相关基因。为了减少过拟合风险,结合R包“glmnet”,使用LASSO COX回归分析建立预后模型。回归分析的自变量为与预后相关的铁死亡相关基因的表达量,因变量为TCGA队列中肝细胞癌患者的总生存期和生存状态。最终我们构建了一个基于铁死亡相关基因的预后模型。该模型根据各基因的FPKM标准化表达水平及其相应的回归系数计算患者的风险评分。风险评分计算公式如下:
其中,xi为每个基因的FPKM标准化表达水平,Coefi为相应基因的系数。计算队列中所有患者的风险评分,并根据中位值将队列中所有患者分为高风险组与低风险组。使用R包“survivalROC”绘制生存曲线。基于模型中基因表达情况,使用R包“limma”[9]进行主成分分析(PCA),使用R包“scatterplot3d”对结果进行可视化。
1.3 功能富集分析
首先,使用R包“limma”对高低风险组做基因差异表达分析,将|log2FC|≥1,FDR<0.05的基因作为高低风险组差异表达基因。进一步进行基因本体(GO)和京都基因组基因百科全书(KEGG)分析。使用R包“GSVA”进行单样本基因富集分析(ssGSEA)来计算28种免疫细胞的浸润评分。
1.4 统计学分析
采用log-rank检验和Kaplan-Meier曲线比较高低风险组之间的总体生存期。使用单因素和多因素Cox回归分析来评估该模型对肝细胞癌患者总体生存期的独立预后价值。所有统计分析均采用R(Version 4.0.2)或SPSS(Version 25.0)进行。如果未特别注明,P值小于0.05被认为具有统计学意义。
2 结果
本研究最终纳入了TCGA数据库中370名肝细胞癌患者与ICGC数据库中231名肝细胞癌患者。
2.1 在TCGA队列中构建预后模型
首先,在TCGA队列中,提取227个铁死亡相关基因的表达数据,对总生存期(OS)进行单因素COX回归分析,得到了16个显著与总生存期相关的铁死亡相关基因(P<0.0001),将得到的16个预后相关的铁死亡相关基因进行LASSO COX回归分析以构建预后模型。根据最优的λ值确定了一个10基因的预后模型(图1A-B)。这10个基因相对应的相关系数如图1C。
图1 A~C:LASSO回归及模型中每个基因的系数
计算所有患者的风险评分,并根据中位风险评分将TCGA队列中所有患者分为高风险组(185例)和低风险组(185例)。Kaplan-Meier生存曲线显示,高风险组肝细胞癌患者生存率较低,生存时间较短(图2A)。风险评分和生存状态分布如图2B-C所示。此外,接受者操作特性曲线(ROC)显示,该模型对肝细胞癌患者的总体生存期具有良好的预测能力,ROC曲线下面积(AUC)值分别为:0.797(1年)、0.706(3年)、0.688(5年)(图2D)。PCA分析显示,在TCGA队列中,低风险组患者和高风险组患者的分布有显著差异(图2E)。
图2 TCGA队列中患者的风险评分A:Kaplan-Meier生存曲线,TCGA队列中高风险组与低风险组患者的生存率;B:TCGA队列中患者风险评分的分布以及中位值;C:TCGA队列中患者的OS状态、风险评分的分布;D:TCGA队列中模型的ROC曲线及AUC值;E:TCGA队列中主成分分析结果
2.2 在ICGC队列中验证模型
为了检验在TCGA队列构建的预后模型的准确性,使用相同的计算公式计算ICGC队列中每个肝细胞癌患者的风险评分,同样根据中位值将ICGC队列中所有肝细胞癌患者分为高风险组和低风险组。与在TCGA队列中得到的结果一致,高风险组的肝细胞癌患者生存率较低,生存时间较短(图3A)。ICGC队列的风险评分和生存状态分布如图3B~C所示。PCA分析显示,在ICGC队列中,低风险组患者和高风险组患者的分布有差异(图3D)。此外,ROC曲线显示,该模型在ICGC队列中对肝细胞癌患者的总体生存期同样具有良好的预测能力,AUC值分别为:0.696(1年)、0.723(2年)、0.752(3年)(图3E)。
图3 ICGC队列中患者的风险评分A:Kaplan-Meier生存曲线,ICGC队列中高风险组与低风险组患者的生存率;B:ICGC队列中患者风险评分的分布以及中位值;C:ICGC队列中患者的OS状态、风险评分的分布;D:ICGC队列中主成分分析结果;E:ICGC队列中模型的ROC曲线及AUC值
2.3 预后模型的独立预后分析
使用单因素及多因素COX回归分析来评估该预后模型是否为肝细胞癌患者的独立预后因素。在TCGA队列中,单因素COX回归分析显示,风险评分(riskScore)与肝细胞癌患者的总体生存期显著相关[风险比(HR)=3.042;95%置信区间(CI)=2.315~3.996;P<0.001](图4A)。多因素COX回归进一步显示风险评分是总体生存期的独立预后因素[HR=2.785;95%CI:2.068~3.751;P<0.001](图4B)。该结论在ICGC队列中同样可以得到验证[单因素COX回归分析:(HR=2.288;95%CI:1.554~3.368;P<0.001)(图4C);多因素COX回归分析:(HR=2.021;95%CI:1.343~3.040;P<0.001)](图4D)。上述结果表明,我们所构建的预后模型可以作为一个独立预后因素。
2.4 在TCGA队列中进行功能性分析
为了研究高低风险组之间的分子异质性和潜在的生物学过程与途径,我们在TCGA队列中发现了201个差异表达基因[|log2(fold change)|>1,P<0.05]。KEGG和GO分析显示,这些差异表达基因主要富集在以下几个方面:细胞色素P450的代谢、碳代谢、糖酵解/糖异生、类固醇代谢、酒精代谢、有机酸合成等生物学过程(图5A~B)。
为了进一步探讨风险评分与免疫之间的关系,我们采用ssGSEA对不同的免疫细胞的浸润程度进行量化。结果显示,在TCGA队列中,低风险组和高风险组的活化CD4+T细胞、中央型记忆CD4+T细胞、中央型记忆CD8+T细胞、效应记忆CD4+T细胞、调节性T细胞、II型辅助性T细胞、活化树突状细胞、嗜酸性粒细胞、髓系抑制性细胞的浸润有显著差异(图6)。
3 讨论
本研究首先研究了227个铁死亡相关基因在肝细胞癌患者肿瘤组织中的表达及其与肝细胞癌患者总体生存期的关系,我们在TCGA队列中构建了一个包含10个铁死亡相关基因的预后模型,并在ICGC队列中进行了验证。此外,本研究还进行了一些功能性分析,结果显示,许多能量代谢及免疫相关通路被富集。
本研究中所构建的预后模型由如下10个铁死亡相关基因组成:EIF2S1、PCBP2、PRDX1、RRM2、SLC1A5、SLC2A1、SLC7A11、SRXN1、STMN1、ZFP69B。研究表明,PRDX1调节多种细胞功能[10]。最初,PRDX1被认为是一种抗过氧化物酶,而进一步的研究表明,PRDX1还可以作为分子伴侣、肿瘤抑制因子调节细胞功能[11]。SLC1A5是一种细胞表面转运体,介导包括谷氨酰胺在内的中性氨基酸的摄取[12],谷氨酰胺的转运和代谢可以促进脂质过氧化,进而导致细胞铁死亡[13]。SLC7A11在人类肿瘤中高表达,在异种移植模型中,它的过表达抑制了活性氧(ROS)诱导的铁死亡[14]。在本研究中,这些基因的高表达均与不良的预后相关。但是上述基因是否通过影响肿瘤细胞铁死亡过程来影响肝细胞癌患者的预后尚未明确。
尽管在过去的几年里,肿瘤细胞铁死亡的机制一直是研究的热点,但肿瘤免疫和铁死亡之间的潜在调节机制仍然是未知的。我们对TCGA队列中所有肝细胞癌患者进行单样本基因富集分析(ssGSEA)来计算每个患者28种免疫细胞的浸润评分。结果显示,高风险组患者的髓系抑制性细胞(MDSC)浸润程度显著高于低风险组,MDSC在肝细胞癌中能够促进免疫逃逸,减弱抗肿瘤T细胞的表达[15]。与之相反的是,嗜酸性粒细胞在低风险组的浸润程度显著高于高风险组,目前的研究表明,嗜酸性粒细胞在肝细胞癌中具有抗肿瘤活性[16]。此外,本研究显示调节性T细胞(Tregs)在高风险组中的浸润程度要显著高于低风险组,而目前已证明Treg在肝细胞癌中富集,并抑制γ干扰素的分泌和CD8+T细胞的细胞毒性[17]。
本研究还存在一些局限性,首先,我们利用TCGA数据集构建模型,并使用ICGC数据集验证该模型,但仍需要更多的独立外部数据集对该模型做出验证。此外,本研究还对肿瘤细胞铁死亡与免疫之间的关系进行了初步的探讨,但两者之间的相互作用机制并未阐述,需要更多的基础研究来明确。