基于生物信息学的肝细胞癌铁死亡预后模型的构建
2022-04-28于洋洋
于洋洋, 韩 超, 李 光
(中国医科大学附属第一医院放疗科, 辽宁 沈阳 110000)
肝细胞癌(hepatocellular carcioma,HCC)是原发性肝癌中最常见的一种组织学亚型,约占所有病例的90%[1]。HCC的恶性率极高,在全世界每年造成约70万人的死亡,是目前世界上排名第四的癌症死亡原因。现有的治疗方案包括手术切除、局部消融、肝移植、化疗、分子靶向治疗和免疫治疗。但由于HCC早期诊断困难,肿瘤侵袭、复发率高,患者的总生存率和预后一直不佳,平均中位生存期约为1年[2]。铁死亡(ferroptosis)是近年来公认的一种新发现的细胞死亡方式。铁是人体必需的金属,参与关键生化过程。当铁在细胞中过度存在时,会破坏氧化还原,催化活性氧(ROS)的形成,产生氧化应激反应。氧化应激和组织的损伤和疾病有关,在细胞水平上,会导致铁死亡和铁依赖性细胞的死亡。然而目前对于铁死亡的机制尚未明确,相关研究表明,铁死亡主要通过胱氨酸/谷氨酸逆向转运系统(System XC-)和谷胱甘肽过氧化物酶(Gpx4)调节。System XC-通过影响细胞内半胱氨酸的丰度决定细胞抗脂质ROS的能力,而GPX4的活性则决定了细胞能否将脂质ROS转化为无毒的脂质醇。有研究表明,铁死亡在HCC的发生、发展起重要作用,一些化疗药,如索拉菲尼,也被证实能够通过诱导铁死亡而抑制HCC的进展[3]。有研究显示不同的组织对铁死亡的敏感性不同,不同的个体对于铁死亡诱导剂的敏感性也存在异质性。因此,找到HCC的铁死亡相关性的生物标志物,建立HCC的铁死亡预后分析模型,能够为临床预测HCC的复发、转移及预后提供潜在的靶点。
1 材料与方法
1.1TCGA-LIHC转录组数据和临床数据的下载与处理:从TCGA数据库中,下载了TCGA-LIHC的转录组数据,数据格式为FPKM;从TCGA数据库中,下载了TCGA-LIHC的clinical数据,数据格式为bcr xml。使用human.gtf对TCHA-LUAD的转录组数据进行了基因的注释,使用Perl语言对TCGA-LIHC中的铁死亡基因表达谱数据进行提取。其中,铁死亡基因来源于对PubMed数据库下载了784篇关于铁死亡的文章,从中提取铁死亡的调控因子和标志物。
1.2TCGA-LIHC铁死亡基因的差异分析:使用了R语言的limma包,对TCGA-LIHC铁死亡基因表达谱数据进行分组,然后对正常组和肿瘤组进行差异分析,设置P<0.05,IlogFCI>1,以筛选出差异的铁死亡基因,用于后续的分析。
1.3TCGA-LIHC铁死亡差异基因的GO和KEGG功能富集分析:为了了解TCGA-LIHC铁死亡差异基因参与的生物学信息,使用了R语言的org.Hs.eg.db包对差异基因进行id注释,而后,使用colorspace,stringi和ggplot2包对差异基因进行GO和KEGG富集分析,设置标准为P<0.05。
1.4TCGA-LIHC铁死亡预后模型的构建:使用了Perl语言将差异的铁死亡基因与TCGA-LIHC患者的生存时间,生存状态数据进行了整合,使用R语言对整合数据进行单因素cox分析,筛选出与患者生存相关的铁死亡基因,然后进一步使用多因素cox分析构建铁死亡预后模型,风险评分以:(coe x 铁死亡基因的表达量)+ …… +(coe x 铁死亡基因的表达量)展示。
1.5TCGA-LIHC铁死亡预后模型的生存评估:使用R语言的survival包对铁死亡预后模型进行分组,然后对高表达组和低表达组进行KM生存分析,以鉴别高低表达模型是否具备生存差异。并且使用了R语言的pheatmap包,对以生存时间为自变量的患者的生存数据进行可视化处理,以清晰展示患者的生存信息与模型高低组的关系。
1.6TCGA-LIHC铁死亡模型的独立预后分析与ROC评价:为了进一步挖掘TCGA-LIHC铁死亡模型的相关独立预后因子,使用了单因素和多因素cox对患者的年龄,性别,临床分期,TNM分期,模型进行了分析。并且使用了R语言对预后模型以及相关因子进行了ROC曲线的绘制,以评估其诊断的准确性。
2 结 果
2.1TCGA-LIHC差异表达的铁死亡基因的鉴定:从TCGA数据库下载了TCGA-LIHC的转录组数据,包含了50个正常样本和374个肿瘤样本,从PubMed数据库下载了784篇关于铁死亡的文章,从中提取铁死亡的调控因子和标志物,包含了258个铁死亡相关基因。通过设置过滤标准为P<0.05,IlogFCI>1,共鉴定了TCGA-LIHC相关铁死亡差异基因83个(见图1),其中上调基因70个,下调基因13个。用于进一步分析。
图1 差异表达的铁死亡基因
2.2TCGA-LIHC差异表达的铁死亡基因的GO和KEGG富集分析:通过R语言的colorspace,stringi和ggplot2包,设置过滤标准P<0.05,筛选出与差异表达的铁死亡基因的相关GO功能和KEGG通路。GO功能富集分析显示,response to oxidative stress和cellular response to oxidative stress是主要的铁死亡相关生物过程;KEGG功能富集分析显示,Ferroptosis和Central carbon metabolism in cancer是主要的生物通路。见图2、图3。
图2 GO富集分析
图3 KEGG富集分析
2.3TCGA-LIHC铁死亡预后模型的构建:对83个铁死亡的差异基因和患者的生存时间,生存状态进行了整合,单因素cox分析显示了31个生存相关的铁死亡基因(TFR2,CYBB,FANCD,OXSR1,ZEB1,BLOC1S5-TXNDC5,BACH1,HMOX1,SC22D3,ATG7,ATG16L1,GPT2,GABARAPL1,TFRC,ALB,FLT3,PEBP1,IDH1,PRKAA1,G6PD,DRD5,SLC1A4,VDAC2,ATG3,SLC2A1,SRC,MYB,FTH1,CISD1,SLC38A1,MAPK1),其中包括了7个保护基因,和24个危险基因。基于34个生存相关的铁死亡基因的多因素cox分析,构建了10个铁死亡基因的预后模型。(FANCD2,ZEB1,BLOC1S5-TXNDC5,HMOX1,GABARAPL1,FLT3,IDH1,G6PD,VDAC2,MYB)多因素cox回归中的系数如下:铁死亡基因风险评分=(-0.3774×FANCD2的表达)+(-0.3774×ZEB1的表达)+(-0.3774×BLOC1S5-TXNDC5的表达)+(-0.3774×HMOX1的表达)+(-0.3774×GABARAPL1的表达)+(-0.3774×FLT3的表达)+(-0.3774×IDH1的表达)+(-0.3774×G6PD的表达)+(-0.3774×VDAC2的表达)+(-0.3774×MYB的表达)。见图4、表1。
图4 单因素cox分析
表1 TCGA-LIHC铁死亡预后模型
2.4TCGA-LIHC铁死亡预后模型的生存评估:使用R语言的survival包对TCGA-LIHC铁死亡预后模型进行分组,然后对高表达组和低表达组进行KM生存分析,结果显示低表达的患者具备更好的生存预后,P=1.992e-08。(见图5)低表达组患者的风险评分相对高表达组的低,随着风险评分的上升,死亡的患者明显上升。见图6、图7。
图5 KM生存分析
图6 危险评分
图7 危险评分与生存分析
2.5TCGA-LIHC铁死亡模型的单/多因素cox分析和ROC评价:单因素和多因素cox分析分别显示了clinical stage的P<0.001和P=0.004,riskScore的P<0.001。ROC曲线评估了铁死亡模型的AUC为0.736,clinical stage临床分级为0.701,这说明了临床分期可以作为患者独立的预后因素,并且也证明了该模型的可靠性。见图8、图9。
图8 单因素和多因素cox
图9 ROC曲线
3 讨 论
全世界每年新发的肝癌患者有超过一半来自中国,目前我国的肝癌发病率仍在逐年上升。HCC被认为是肝癌中最致命的一种亚型,在我国主要发病人群集中在30~60岁,早期诊断率和5年生存率极低,80%以上患者在确诊时已属于中晚期。HCC给我国社会和经济都带来了极大的危害。因此,识别能够预测HCC临床转归的新的生物标志物以及研究参与肿瘤进展的分子对于患者治疗是非常重要的。
铁死亡是一种在形态学、生化和遗传水平上有别于其他细胞凋亡方式、以细胞内大量铁依赖性ROS蓄积为特点的调节性细胞死亡形式。铁和脂质ROS是铁死亡过程的重要参与者,通过调节铁代谢和影响ROS累积的基因,能够诱导或者抑制细胞铁死亡。相较于正常细胞,肿瘤细胞拥有较高的铁含量和相关肿瘤基因表达,使得其对铁死亡更加敏感,因而铁死亡近年来也成为肿瘤学领域的研究热点。
本研究对铁死亡基因进行了GO和KEGG富集分析。分析显示,氧化应激反应和细胞氧化应激反应是主要的铁死亡相关生物过程;而癌症中的铁死亡和中央碳代谢则是主要的生物通路。
“氧化应激”最早于1985年被提出,“应激”一词强调了可能发生在细胞内的抗氧化剂-促氧化剂之间的失衡状态。在一般情况下,细胞内ROS(包括O2·、H2O2和HO·)的生成及清除是平衡的,这一过程通过一系列小分子物调控[4]。铁因其易改变化学价的性质,是好氧生物中产生有害氧化应激产物,即活性自由基的主要催化剂。不稳定的、过量的铁可以诱导H2O2生成强氧化剂HO·,参与氧化细胞大分子(包括核酸、蛋白质、膜脂和碳水化合物等),是细胞发生铁死亡的重要机制。铁死亡与肿瘤密切相关,通过诱发肿瘤细胞铁死亡,可以抑制多种癌症的进展。近年来,亦有研究发现铁死亡是包括HCC在内的多种癌种在化疗过程中产生耐药的机制[5]。新陈代谢是支持细胞的重要过程,肿瘤高度增殖的特性需要特殊的新陈代谢支撑,糖酵解就是最典型的例子。有研究表明,由糖酵解的最终产物丙酮酸盐中生成乙酸的机制,对中心碳代谢产生重要影响,但其对肿瘤微环境所产生的作用在很大程度上仍然是未知的。
本研究用多因素cox分析构建了10个铁死亡相关基因的预后模型(FANCD2,ZEB1,BLOC1S5-TXNDC5,HMOX1,GABARAPL1,FLT3,IDH1,G6PD,VDAC2,MYB)。本研究发现了新的基因BLOC1S5-TXNDC5,基础研究尚缺乏相关性报告。其余9个铁死亡相关基因均有证据表明可能与HCC的发生、发展相关,它们的作用机制如下。
肝脏是人体的储铁器官,铁代谢与HCC的发生和进展息息相关,在我们的预后模型中,FANCD2、HMOX1以及VDAC2正是通过影响肿瘤细胞的铁死亡,从而减少HCC细胞程序性死亡的机率,导致了病情的进展。FANCD2是一种参与DNA损伤修复的核蛋白,调节与铁代谢(如FTH1、TFR、TFRC、HAMP、HSPB1、SLC40A1和STEAP3)和脂质过氧化(如GPX4)有关的蛋白质的表达。通过转录依赖和非依赖机制,FANCD2能够抑制铁死亡时的铁积累和脂质过氧化,这也解释了KOMATSU等[6]的发现,即肝癌组织中FANCD2表达增高可能是预后不良的一个新的生物标志物。HMOX1亦是细胞利用铁的关键基因,其编码的的血红素加氧酶1将血红素降解为铁、一氧化碳和胆绿素,据shen等报道,与癌旁组织相比,肝癌组织中铁代谢-受体特异性抗原和蛋白表达水平存在差异,HMOX1在肝癌细胞中的表达降低,使得肿瘤细胞内铁含量降低,铁死亡的几率下降[7]。类似的,VDAC2是通过调节BAX和BAK来驱动细胞的程序性死亡的。同时,它也发挥了神经酰胺介导的细胞死亡的直接效应器的作用。第一个被发现的铁死亡激活剂Erastin,就是通过直接与VDAC2结合改变线粒体外膜的通透性,从而降低NADH氧化速率,导致了铁死亡的发生[8]。
另外一些基因与促进HCC细胞的增殖和肿瘤转移有关,包括了ZEB1、MYB、GABARAPL1和FLT3。多个研究显示,ZEB1参与了HCC的生长和转移,常常与较差的癌症预后相关,其机制可能是该基因触发上皮间充质转化(EMT),参与了癌细胞浸润前沿关键因子的调控,赋予癌细胞具有前侵袭性和干细胞样表型。MYB与HCC进展的联系则是通过SNHG10和SCARNA13这两个HCC驱动基因实现的。LIU等发现GABARAPL1低表达与HCC细胞分化不良和肿瘤包膜缺失有显著相关性,可用于预测HCC患者的预后[9]。相反的,有研究认为FLT3可能通过降低HCC患者ERK磷酸化从而阻止癌细胞的增殖。
IDH1和G6PD除了是铁死亡相关基因,也与肿瘤细胞代谢密切相关。研究者在多个癌症研究中发现,特异性IDH1突变导致一种新形态的异柠檬酸脱氢酶,产生一种可以改变细胞表观遗传程序并阻止正常分化的肿瘤代谢物。已有许多证据表明表明具有IDH样基因表达特征的HCC是一种预后差的HCC亚型。值得注意的是,考虑到IDH1突变在肝内胆管癌(CCA)中比在HCC中更为频繁,Ally等认为肝癌中IDH1突变的存在可能与向胆道表型转移有关[10]。G6PD是磷酸戊糖途径(PPP)的限速酶,在人类恶性肿瘤中常被激活,产生核苷酸和脂质合成的前体,使其即使在有氧的情况下,肿瘤细胞也能保持高的糖酵解率,Barajas等发现G6PD的上调与肿瘤分级、肿瘤复发率增加和患者生存率差有关,其原因可能是低分化肿瘤细胞对PPP的依赖性增加,以期快速产生生物量[11]。
综上,我们的研究构建了一个包含了10基因的铁死亡预后模型,它们主要通过铁死亡和癌细胞的中央碳代谢这两个生物通路影响HCC的预后。其中FANCD2、HMOX1和VDAC2通过铁死亡通路降低了肿瘤细胞的程序性死亡机率。而IDH1和G6PD也影响肿瘤细胞代谢。以上5个基因都与HCC的不良结果相关。除此之外,还有4个基因与HCC的增殖和转移有关,其中ZEB1、MYB的高表达和GABARAPL1低表达可能促进HCC患者肿瘤增殖和转移,FLT3则可以降低肿瘤细胞的增殖。最后,BLOC1S5-TXNDC5对于HCC的预测机制不明,需要进一步的研究和探讨。