APP下载

生物信息学在肝细胞癌风险预测中的应用

2022-02-12方国旭张清华黄永迎王建民刘景丰

临床肝胆病杂志 2022年1期
关键词:肝癌因子评分

方国旭, 张清华, 黄永迎, 王建民, 刘景丰

1 福建医科大学孟超肝胆医院 a.肝胆胰外科, b.东南肝胆健康大数据研究所, 福州 350025;2 福建医科大学 研究生院, 福州 350108; 3 福建省肿瘤医院 a.流行病研究室, b.肿瘤医学创新中心,c.肝胆胰肿瘤外科, 福州 350014

肝细胞癌(HCC)是世界范围内最常见的消化道恶性肿瘤之一。根据国际癌症研究机构的最新数据[1],每年约有841 080例新发病例和781 631例死亡病例,HCC在所有恶性肿瘤的发病率和死亡率中分别排名第7和第3。目前HCC的预后预测取决于组织病理学参数和肿瘤分期系统。然而,这种传统的方法均不足以准确预测HCC患者的临床结果。目前迫切需要改善肝癌患者的早期检测和预后,以及帮助临床医生优化治疗策略[2]。近年来,基因组学测序技术及生物信息学分析已经广泛应用于不同类型的肿瘤研究,发挥越来越大的作用[3]。随着研究的不断深入,已经产生了多个生物信息数据库。目前常见的公共数据库有 The Cancer Genome Atlas(TCGA)数据库和Gene Expression Omnibus(GEO)数据库。生物信息数据库为研究者们提供了大量的生物学数据[4-5]。研究者可以通过对肝癌组织和癌旁组织中的差异基因进行分析,筛选出与肝癌预后的相关特征基因,利用TCGA数据库构建风险预测模型,利用GEO数据库验证模型的有效性。本文主要归纳总结基于免疫基因特征、代谢基因特征、铁死亡基因特征、细胞自噬基因特征、m6A RNA甲基化调控因子构建的肝癌风险预测模型,为肝癌的早期检测、预后和治疗方案的优化提供新观点。

1 基于免疫特征基因的风险预测模型

肿瘤免疫及免疫治疗是近年来肿瘤学及免疫学研究中受到极大关注的领域。肿瘤免疫治疗,尤其是肿瘤微环境中免疫细胞的浸润与免疫检查点阻断疗法等,在肿瘤治疗中取得了令人瞩目的效果,为重新审视并发掘免疫系统在肿瘤发生发展中的作用提供了极好的机遇[6-7]。Chen等[8]鉴定出9个与肝癌预后相关的免疫相关基因对(immune-related gene pair,IRGP)。结合临床特征和病理因素进行多因素分析,发现基于9个IRGP(CISH_vs_PIAS3、CISH_vs_HSPA14、SOCS2_vs_TYRO3、ACAP1_vs_CD180、MAP3K3_vs_ BTN3A3、TRIB3_vs_RORC、AGER_vs_TYRO3 、SDC4_vs_HSPD1、PLAUR_vs_CD8A)的风险评分是一个有效的独立预后指标。9种IRGP的预后价值通过森林图和nomogram列线图进一步验证,显示其预测准确率优于肿瘤TNM分期和病理分级。Feng等[9]鉴定出17个与肝癌预后相关的IRGP。在TCGA队列和国际癌症基因组联盟队列中,患者根据IRGP特征分为高危组与低危组,低危组患者的总生存时间较高危患者长。在结合临床特征和病理因素后,多因素分析显示IRGP特征是一个肝癌预后的独立危险因素。ROC曲线验证了IRGP特征的准确性。基因集富集分析表明该特征与免疫生物学过程有关,不同风险患者的免疫微环境状态存在差异。基于17个IRGP的特征可有效评估HCC的总生存期,并预测免疫检查点治疗反应和靶向药物敏感性。Hu等[10]基于93个免疫相关基因(immune-related gene,IRG)对肝癌进行分子分型,一共得到5个亚组。这5组患者有不同的预后、免疫状态和免疫检查点的表达。随后,在TCGA数据库中,筛选出11个与预后相关的IRG(LCN2、S100A10、FABP6、PLXNA1、KITLG、OXTR、S100A1、CCL26、CMTM4、IL1RN、RARG),并利用国际癌症基因组联盟数据库进行验证,结果显示,低危组与高危组患者免疫细胞浸润水平存在差异。研究结果表明,基于IRG的HCC分类有助于解释HCC的异质性,这可能有助于促进HCC的个体化精准治疗。Huang等[11]在TCGA数据库中采用单变量Cox回归分析、LASSO回归和多变量Cox回归鉴定出5个IRG(EZH2、FTL、CFHR3、ISM2、CDK5)。基于5个IRG生成风险评分。根据风险评分的中位数进行分层,结果显示,风险评分高的患者在1、2、3和5年后的总生存率(OS)较低,这一结果在建模组和验证组中是一致的。此外,IRG与免疫细胞的浸润情况相关。根据IRG和临床特征构建的风险预测模型,能够预测患者1、3和5年的OS,AUC高达0.8。这些结果表明,用于基于IRG的风险预测模型可用于监测治疗策略的有效性和预后预测。Wang等[12]构建基于13个IRG(SPP1、STC2、HSPA8、IL15RA、BLNK、TRAF3、NOD2、GRB2、ACTG1、HDAC1、S100A9、PSMD1、EPO)的风险预测模型,研究显示,高危组和低危组患者的OS差异与免疫浸润、肿瘤免疫微环境和多种信号通路的相互作用有关。

2 基于能量代谢特征基因的风险预测模型

越来越多的证据表明,能量代谢重编程在HCC的发生和发展中起重要作用,特别是有氧糖酵解。有氧糖酵解能迅速产生足够的三磷酸腺苷,满足肿瘤在缺氧条件下生长和增殖的能量需求,有氧糖酵解在肿瘤的增殖、生长、侵袭和治疗中起着重要作用[13-14]。Chen等[15]鉴定出与肝癌预后相关的4个糖酵解相关基因(CDCA8、RAB5IF、SAP30和UCK2)。Wang等[16]鉴定出与肝癌预后相关的8个糖酵解相关基因(PAM、NUP155、GOT2、KDELR3、PKM、NSDHL、ENO1和SRD5A3)。Zhou等[17]鉴定出与肝癌预后相关的17个糖酵解相关基因对 (HMMR_PFKFB1、CHST1_GYS2、MERTK_GYS2、GPC1_GYS2、LDHA_GOT2、IDUA_GNPDA1、IDUA_ME2、IDUA_G6PD、IDUA_GPC1、MPI_GPC1、SDC2_LDHA、PRPS1_PLOD2、GALK1_IER3、MET_PLOD2、GUSB_IGFBP3、IL13RA1_IGFBP3和CYB5A_IGFBP3)。基于上述糖酵解相关基因,构建肝癌预后风险预测模型,KM曲线表明低风险组患者的OS比高危组患者OS更长。ROC曲线显示了该模型具有较好的预测效果。通过单因素和多因素Cox分析,证明该风险评分是一个独立的预后因素,与TNM临床特征结合,能够进一步提高模型的预测准确性。

脂肪酸合成、β-氧化和细胞脂质组成的改变有助于HCC的发生和发展[18]。Wang等[19]鉴定出3个具有肝癌预后价值的脂质代谢相关基因(ME1、MED10、MED22),并基于该基因计算每个肝癌患者的风险评分,结果显示,高危组HCC患者的生存率明显低于低危组患者,多因素Cox回归分析显示该风险评分是肝癌的独立预后因素。此外,这一特征还能对HCC患者的预后提供高度准确的预测。研究结果阐述了脂质代谢和HCC之间的密切联系,并促进基于代谢治疗HCC的发展。

氨基酸作为中间代谢物影响脂类、谷胱甘肽、核苷酸、葡萄糖胺和多胺的生物合成,以及细胞增殖和三羧酸循环碳[20-22]。肝脏是蛋白质合成、降解和解毒的重要器官,也是氨基酸代谢的重要器官[23]。Zhao等[24]基于9个氨基酸代谢相关基因(B3GAT3、B4GALT2、CYB5R3、GNPDA1、GOT2、HEXB、HMGCS2、PLOD2和SEPHS1)构建肝癌预后风险预测模型,根据风险评分将患者分为高危组和低危组,结果显示,低危组患者风险评分较低,生存时间较长。单因素和多因素Cox回归证实该评分是HCC的独立风险因素。ROC曲线显示,该评分可预测HCC患者1、2、3和5年生存率的AUC分别为0.813、0.770、0.744、0.702 。

3 基于铁死亡特征基因的风险预测模型

铁死亡是一种新的铁依赖细胞死亡形式,其特征是铁过度积累和脂质过氧化,与其他众所周知的细胞死亡在形态学、遗传学和生化上均不同。由于肝脏易受氧化损伤,铁过度积累是大多数肝脏疾病的主要特征。近年来,铁死亡在肝脏疾病领域迅速受到关注[25]。Lian等[26]鉴定出10个铁死亡相关基因(SLC7A11、G6PD、CISD1、CARS、SLC1A5、ACACA、ACSL3、NQO1、NFS1、GPX4),结果显示,与低危组相比,高危组患者OS明显降低。在多因素Cox回归分析中,该评分是OS的独立预测因子。AUC证实了该模型的预测能力。研究表明,铁死亡特征基因可以用于HCC的预后预测,提示以铁死亡特征基因为靶点可能是HCC的一种新的治疗选择。Wan等[27]在TCGA队列中,从70个差异表达的基因(DEG)中鉴定出5个铁死亡特征基因(G6PD、HMOX1、LOX、SLC7A11、STMN1),构建HCC风险预测模型,Kaplan-Meier 曲线生存分析显示,低危组的OS显著高于高危组。来自GSE14520队列的数据证实了这一结果。KEGG和GO功能富集分析表明,风险组间的OS差异与免疫相关通路密切相关。进一步分析表明,肿瘤微环境可能是导致风险组间预后差异的原因。Chen等[28]基于2个铁死亡相关mRNA(SLC1A5、SLC7A11)和8个铁死亡相关长链非编码RNA(lncRNA)(AC245297.3、MYLK-AS1、NRAV、SREBF2AS1、AL031985.3、ZFPM2-AS1、AC015908.3和MSC-AS1),并在此基础上构建肝癌风险预测模型,训练组和验证组的AUC分别为0.830和0.806。决策曲线分析显示,基于铁死亡基因的风险评分的预测能力优于所有病理特征。多因素Cox回归分析显示,基于铁死亡基因的风险评分是一个独立的预后因素。通过Kaplan-Meier 曲线,可以明确区分低、高危患者的生存概率。Liang等[29]鉴定出3个与HCC预后相关的铁死亡相关lncRNA(RHPN1-AS1、 MAPKAPK5AS1、PART1),结果显示,与低风险组相比,高危组HCC患者的OS更短。这一特征可作为HCC预后的独立预测因子,并在GEO队列中得到了验证。同时,铁死亡相关lncRNA评分的预测准确性高于基于性别、年龄、年级、分期和病因等评分的工具。这一特征与免疫细胞浸润(如巨噬细胞、髓样树突状细胞和中性粒细胞等)和免疫检查点(PD-1、CTLA-4和TIM-3)有关。Xu等[30]基于9个铁死亡相关lncRNA (CTD-2033A16.3、CTD-2116N20.1、CTD-2510F5.4、DDX11-AS1、LINC00942、LINC01224、LINC01231、LINC01508和ZFPM2-AS1)构建肝癌的风险预测模型,基因集富集分析表明,这些lncRNA介导的信号通路可能通过干扰肿瘤坏死因子a/核因子κB、IL-2/信号转导因子和转录激活因子5、细胞因子/细胞因子受体调控肝癌免疫微环境。Spearman相关分析表明,静息记忆CD4+T淋巴细胞、卵泡辅助T淋巴细胞、调节性T淋巴细胞、M0巨噬细胞等浸润性免疫细胞亚型在高危组和低风险组之间存在显著差异。研究结果为肝癌中与铁死亡相关的lncRNA提供了一个有前景的见解,并为患者的预后和免疫治疗提供了一个个性化的预测工具。

4 基于细胞自噬特征基因的风险预测模型

细胞自噬是真核生物中进化保守的对细胞内物质进行周转的重要过程。该过程中一些损坏的蛋白或细胞器被双层膜结构的自噬小泡包裹后,送入溶酶体或液泡中进行降解并得以循环利用。在肿瘤中,自噬可能在肿瘤发生的早期阶段发挥抑制作用。然而,越来越多的证据[31-32]表明,在已经形成的肿瘤中,自噬可以帮助应对细胞内环境压力的变化,如缺氧、营养缺乏等恶习环境,从而促进肿瘤的存活。Huo等[33]在HCC患者中共发现62个差异表达的自噬相关基因(autophagy-related gene,ARG)。单因素和多因素回归确定了5种与肝癌患者OS相关的ARG(HDAC1、RHEB、ATIC、SPNS1和SQSTM1)。重要的是,基于ARG的风险评分是肝癌预后的独立风险因素。此外,预后风险模型的AUC为0.747,表明该模型在预测HCC预后方面具有较高的准确性。有趣的是,在HCC细胞系中,风险相关的ARG与化疗药物敏感性相关。Yang等[34]共鉴定出27个差异表达ARG,通过Cox回归和LASSO回归分析,鉴定出3种OS相关ARG (SQSTM1、HSPB8和BIRC5)。基于这3种ARG建立预后预测模型,在TCGA队列和GEO验证队列中,风险评分高的HCC患者预后较差,风险评分曲线的AUC分别为0.756和0.672。此外,校正曲线和C指数表明,基于ARG的风险预测模型的预测能力较好,可能是预测HCC患者预后的一种有前景的工具。Cao等[35]鉴定出与细胞自噬相关的13个基因对(PRKCD/TP53、BAX/GABARAPL1、ATIC/PARP1、CDKN2A/ERBB2、BIRC6/FOXO1、BAK1/DAPK1、PINK1/RAB24、GDAC6/HGS、CX3CL1/HSPB8、DLC1/HSPB8、APOL1/EIF4EBP1、ARNT/HIF1A、CX3CL1/NPC1)。Kaplan-Meier曲线分析表明,高危组患者的OS明显差于低危组,并发现自噬相关的风险评分与免疫细胞的浸润有关。Wu等[36]筛选出78个差异表达的自噬相关lncRNA,并使用4个与肝癌预后相关lncRNA(LUCAT1、AC099850.3、ZFPM2-AS1和AC009005.1)建立预后模型,可作为HCC患者的独立预后因素,并且1、3、5年生存率的预测效率高于其他临床病理因素(AUC分别为0.764、0.738、0.717)。此外,生物信息学分析结果显示,LUCAT1和ZFPM2-AS1可能分别通过HSA-Mir-495-3p/DLC1和HSA-Mir-515-5P/DAPK2轴影响HCC的自噬活性。 Yang等[37]筛选出7个自噬相关lncRNA(PRRT3-AS1、RP11-479G22.8、RP11-73M18.8、LINC01138、CTD-2510F5.4、CTC-297N7.9、RP11-324I22.4),Kaplan-Meier分析表明,风险评分低的患者预后明显优于风险评分高的患者 ,该风险评分的预后预测准确度(AUC=0.786)显著高于ALBI, Child-Pugh, AFP和AJCC_stage。

5 基于N6-甲基腺苷(N6-methyladenosine, m6A)RNA甲基化调控因子的风险预测模型

表观遗传是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传变化。甲基化修饰占所有RNA修饰的60%以上,而m6A是信使RNA、microRNA和长链非编码RNA中最常见的内部修饰,在转录、加工和代谢中起着关键的调节作用。m6A修饰与肿瘤增殖、分化、肿瘤发生、增殖、侵袭和转移有关,在恶性肿瘤中起癌基因或抑癌基因的作用[38]。Zhang等[39]基于13个 m6A RNA甲基化调控因子的表达水平,通过共识聚类分析,识别出两个亚群(聚类1和2)。与聚类1相比,聚类2预后较差,且与较高的组织学分级和病理分期显著相关。此外,聚类2在癌症相关通路中显著富集。研究人员进一步构建基于5个m6A RNA甲基化调控因子(ZC3H13、KIAA1429、METTL3、YTHDF1、YTHDF2)的肝癌预后风险预测模型,并在GEO数据集中得到成功验证。最后,建立了基于年龄、性别、组织学分级、病理分期和风险评分的综合预测模型,能够提高模型的预测能力。Xu等[40]筛选出19个m6A调控因子,根据m6A调控因子的共识聚类,被分为2组(聚类1和聚类2)。研究发现m6A调控因子在聚类1中表达上调。与聚类2相比,聚类1与较高的程序性死亡配体1表达水平、较低的免疫评分、较差的预后和免疫细胞浸润有关。基于单变量Cox和LASSO回归分析,识别出5个m6A调控因子(WTAP、METTL3、HNRNPC、YTHDF1、YTHDF2),研究发现高危组与较高的程序性死亡配体1表达水平、较高的分级和较差的OS密切相关。在训练数据集中,1、3、5年的AUC分别达到0.77、0.67和0.68。在验证数据集中,1、3、5年的AUC分别为0.7、0.63和0.55。基因集富集分析显示MTOR信号通路和WNT信号通路与聚类1和高危组相关。

综上所述,研究表明m6A调控因子与HCC的肿瘤免疫微环境显著相关。基于m6A调控因子的风险评分可以预测HCC患者的预后,为提高免疫治疗疗效提供新的治疗靶点。

6 小结

TCGA和GEO数据库相关研究尚有一定的局限性。首先,这些研究仅仅是回顾性研究,缺乏前瞻性研究。第二,目前大多数研究基于免疫基因特征基因、代谢基因特征基因、铁死亡基因特征基因、细胞自噬基因特征基因、m6A RNA甲基化调控因子等方面,还有很多在HCC中起重要作用的预后基因尚有待进一步挖掘。第三,目前筛选出的基因缺乏基础实验的进一步验证。因此,有必要进一步探索更多的肝癌早期检测分子标志物和影响肝癌预后的分子标志物,以提高早期肝癌检测率和鉴别出肝癌预后高危人群;有必要进一步开展严格的前瞻性和多中心临床试验,验证风险预测模型的准确性和有效性;有必要进一步通过基础实验对筛选出的分子标志物进行验证,寻找肝癌的潜在治疗靶点。目前,处于大数据快速发展的时代,对大数据进行挖掘和分析有助于探索重要的生物学规律。因此,生物信息学对于医学和生物学的发展极其重要,在生物医学领域中具有广阔的应用前景。

利益冲突声明:所有作者均声明不存在利益冲突。

作者贡献声明:方国旭负责撰写论文;张清华、黄永迎和王建民负责修改论文;刘景丰负责拟定写作思路,指导撰写文章并最后定稿。

猜你喜欢

肝癌因子评分
车联网系统驾驶行为评分功能开发
“互联网+医疗健康系统”对脑卒中患者HAMA、HAMD、SCHFI评分及SF-36评分的影响分析
APACHEⅡ评分在制定ICU患者护理干预措施中的应用研究
舒适护理在肝癌介入护理中的应用
北京少儿散打比赛采用评分赛制刍议
山药被称“长寿因子”
直径不超过2的无爪图的2—因子
巧解难题二则
扮靓爱车拒绝潜伏危险因子
TACE术联合手术治疗中晚期肝癌患者65例临床观察