APP下载

基于TCGA数据库的肝细胞癌自噬相关基因预后风险模型的建立

2021-03-03

青岛大学学报(医学版) 2021年1期
关键词:病人基因因素

(青岛大学基础医学院,山东 青岛 266071)

肝细胞癌(HCC)是癌症死亡的主要原因,其发病率逐年递增[1]。HCC的治疗主要包括手术切除、分子靶向治疗和肝移植等[2]。然而,由于其具有恶性程度高以及术后易复发等特点,许多国家HCC的发病率和死亡率还在持续上升[3]。尽管多项研究提出了包括病人的基本特征(如年龄和性别)和肿瘤相关因素(如肿瘤分级)等在内的预后因素,可用于预测HCC病人的生存状态[4-5],但是仍然缺乏有效的预后因素。自噬是一种高度保守的溶酶体降解途径[6],由一系列高度协同的信号通路调控,发生在所有细胞的基础水平,在维持细胞内环境稳定方面起着重要作用[7-8]。研究结果显示,自噬在多种疾病如癌症、心血管和神经系统疾病等病理过程中起关键作用[9]。自噬参与调控HCC的进程[10-11]。癌症基因组图谱(TCGA)计划是通过大规模测序的基因组分析技术来绘制人类肿瘤的基因组图谱[12],其中包含33种癌症[13-14]。本研究基于TCGA公共数据库中HCC转录组数据和临床信息进行分析,构建预后风险模型并将其应用于HCC的预后预测。现将结果报告如下。

1 资料和方法

1.1 数据资料收集及处理

研究涉及的数据资源下载于TCGA(https://portal.gdc.cancer.gov/),其中包括所有HCC病人RNA-seq数据及相关的临床数据。从人类自噬数据库(HADb,http://www.autophagy.lu/)下载232个自噬相关基因(ATGs)。根据病人的ID号码将转录组数据与病人的临床信息进行匹配,最终从TCGA数据库中获得了365例病人完整的生存信息和基因表达谱数据。

1.2 差异表达的ATGs(DEATGs)的鉴定

利用edgeR函数包对数据进行分析,以FDR<0.05和|fold change(FC)|>1为条件,筛选HCC组织和正常组织样本中的差异表达基因(DEGs)以及DEATGs。

1.3 预后风险模型的构建

1.4 统计学方法

使用R3.6.1软件(https://www.R-project.org/)进行统计学分析及图形绘制。采用Cox回归分析风险比(HR)及其95%可信区间(CI)评价ATGs表达与预后的关联。使用Cox回归分析和LASSO回归分析降维筛选模型相关风险ATGs,构建多基因预后风险模型。利用ROC曲线和AUC评估预后风险模型的预测能力。采用单因素和多因素Cox回归分析确定具有独立预后价值的因素。利用Wilcoxon-signedrank检验和Kruskal检验分析临床变量与ATGs的关系。以P<0.05为差异有统计学意义。

2 结 果

2.1 DEATGs的筛选和富集分析

共筛选出12 471个DEGs(图1A),并进一步从中筛选出62个DEATGs(图1B)。对DEATGs进行Gene Ontology(GO)分析,包括生物过程(BP)、细胞成分(CC)和分子功能(MF)。DEATGs在BP组中自噬和利用自噬机制的过程等方面显著富集、CC组中空泡膜和膜区域等方面显著富集、MF组中蛋白激酶调节活性和激酶调节活性等方面显著富集(图1C)。此外,KEGG通路分析显示,DEATGs主要富集于自噬、细胞凋亡和人乳头瘤病毒感染等方面(图1D)。

2.2 预后风险模型风险ATGs的构建

对62个DEATGs进行单因素Cox回归分析,共有40个与HCC预后显著相关的ATGs纳入后续的分析。经过LASSO回归分析降维,再使用多因素Cox回归分析,最终得到了7个与HCC预后相关的风险ATGs(RAB7A、GAPDH、ATG9A、HSPA8、PRKN、TUSC1和FOS),风险ATGs与HCC预后的关联见图2。利用风险评分函数构建预后风险模型,风险评分=(RAB7A表达量×0.445 444 289)+(FOS表达量×0.217 687 513)+(ATG9A的表达量×0.542 642 682)+(HSPA8的表达量×0.218 555 915)+(PRKN的表达量×-0.727 657 489)+(TUSC1表达量×0.337 901 906)+(GAPDH表达量×0.246 856 663)。

2.3 预后风险模型的评价

基于上述风险评分函数生成每个病人的风险评分,高风险组 182例,低风险组183例。随着风险评分的升高,病人的生存期缩短且死亡例数增加(图3A)。Kaplan-Meier分析显示,高风险组病人的总体生存期较低(χ2=36.972,P<0.05)。ROC曲线分析显示,风险评分模型对HCC病人1~9年总生存期预测的AUC值分别为0.733、0.696、0.726、0.692、0.692、0.669、0.742、0.737和0.729(图3B、C)。

A为12 471个DEGs热图,N为正常肝组织,T为HCC组织;B为62个DEATGs热图,N为正常肝组织,T为HCC组织;C为DEATGs GO分析;D为DEATGs KEGG分析。

A为LASSO回归模型中采用10折交叉验证方法筛选出的14个ATGs;B为40个ATGs在LASSO模型中的回归系数图谱;C为多因素Cox分析筛选出来的7个风险ATGs。

2.4 ATGs预后风险模型的独立预后价值

单因素Cox回归分析显示,病人的肿瘤分期(HR=1.865,95%CI=1.456~2.388,P<0.05)、肿瘤浸润深度(HR=1.804,95%CI=1.434~2.270,P<0.05)、肿瘤远处转移(HR=3.850,95%CI=1.207~12.281,P<0.05)和风险评分模型(HR=3.029,95%CI=2.160~4.248,P<0.05)为预后预测因素。多因素Cox回归分析显示,风险评分是HCC病人的独立预后因素(HR=2.574,95%CI=1.801~3.677,P<0.05)。见表1。

A为HCC高风险组、低风险组生存时间及7个风险ATGs表达分布图;B为HCC高风险组、低风险组Kaplan-Meier分析;C为应用ROC曲线对预后风险模型进行1~9年生存期的预测性能评价。

表1 Cox回归分析评估ATGs和其他临床变量在HCC病人中的预后价值

2.5 预后风险模型的临床应用

为了检验预后风险模型预测HCC进展的能力,分析了风险因素(风险评分和风险基因)与临床变量(生存状态、年龄、性别、病理组织分级和病理TNM分期)之间的关系。结果显示,随着RAB7A、TUSC1和风险评分因素的增加,HCC病人生存状态变差(t=-5.265~-2.175,P<0.05),肿瘤浸润深度增加(t=-3.613~-2.644,P<0.05)(图4A~F);随着RAB7A、ATG9A、TUSC1和风险评分的增加,HCC病人的病理分期增加(t=-3.737~-1.992,P<0.05)(图4H~J)。高风险组病人自噬基因RAB7A、FOS、ATG9A、HSPA8、TUSC1和表达高于低风险组(t=3.848~7.467,P<0.05)(图4L~Q),PRKN基因表达低于低风险组(t=-3.741,P<0.05)(图4R)。随着FOS基因表达的增加,HCC病人病理组织分级明显降低(t=3.542,P<0.05)(图4K)。

A~C为RAB7A表达、TUSC1表达、风险评分与生存状态关系;D~F为RAB7A表达、TUSC1表达、风险评分与浸润深度关系;G~I为ATG9A表达、RAB7A表达、TUSC1表达与肿瘤分期、风险评分与肿瘤分期关系;K为FOS表达与组织学分级关系;L~R为ATG9A表达、GAPDH表达、HSPA8表达、RAB7A表达、TUSC1表达、FOS表达、PRKN表达与风险模型关系。

3 讨 论

HCC病人术后高复发率和化疗药物耐药性的产生是肝癌病人病死率高的主要因素。因此,预测HCC预后的可靠分子标志物对于指导病人的预后具有重要意义。业已证实,ATGs参与多种肿瘤的进展和预后,例如结直肠癌、膀胱癌和小细胞性肺癌等[15-17]。本研究结果显示,ATGs与HCC的临床病理特征和预后密切相关。本文通过对HCC肿瘤组织和正常组织DEGs表达的分析,筛选出62个DEATGs。GO分析显示,DEATGs在BP组中自噬和利用自噬机制的过程等方面显著富集、CC组中空泡膜和膜区域等方面显著富集、MF组中蛋白激酶调节活性和激酶调节活性等方面显著富集。KEGG富集分析显示,DEATGs主要富集在自噬、细胞凋亡和人乳头瘤病毒感染等方面。本文应用单因素Cox回归、LASSO回归分析和多因素Cox回归分析,确定7个风险ATGs(RAB7A、GAPDH、ATG9A、HSPA8、PRKN、TUSC1和FOS)构建的预后风险模型;Kaplan-Meier分析显示,高风险组的生存期明显低于低风险组。本文还分析了风险评分模型中的因素与某些临床特征的关系,研究结果显示模型中的一些因素(如基因RAB7A、FOS、ATG9A、HSPA8、TUSC1和GAPDH表达)的增加与HCC的病情进展呈正相关。提示本文构建的模型在预测HCC发展、演化等方面具有较高的临床适用性,并为ATGs在HCC发生发展中的作用机制研究提供了信息。

FOS是一种核原癌基因,编码c-Fos,参与细胞增殖和凋亡的调控。有研究显示,HCC组织中c-Fos高表达[18]。免疫组化研究显示,HCC肿瘤组织中c-Fos的表达明显高于非肿瘤组织[19]。本文研究结果表明,FOS与HCC病人预后相关,并随着病理组织分级的增高,其表达量下降,提示FOS在HCC的进展中可能发挥保护性作用,为进一步研究提供了更多的信息。ATG9A是一种跨膜蛋白,可以促进自噬体的形成[20],有研究表明ATG9A在HepG2细胞中高表达[21],而ATG9A基因的沉默则抑制胶质瘤生长[22]。本文研究结果显示,ATG9A与HCC病人预后相关,并随着肿瘤分期的增加,其表达量升高,提示ATG9A是HCC发生发展的一个危险因素。HSPA8是应激蛋白,也是肝癌的早期生物标志物,HSPA8高表达提示HCC复发[23]。本文研究结果显示,HSPA8在高危组中的表达高于低危组,提示HSPA8是HCC发展过程中的危险因素。SHIMIZU等[24]研究显示,TUSC1基因内高甲基化病人的疾病特异性生存期明显短于未发生基因内高甲基化者。本文研究结果显示,TUSC1与HCC病人预后有关,随着TUSC1表达的增加,HCC肿瘤分期升高、肿瘤浸润深度增加,该结果提示TUSC1是HCC进程中的一个危险因素。另外有研究显示,GAPDH在HCC病人中表达上调,GAPDH通过与3-BrPA或GAPDH shRNA的分子靶点作用阻断肿瘤的进展[25]。本文研究显示,GAPDH在高危组中表达高于低危组,多因素Cox回归分析显示GAPDH是HCC的危险因素。XIE等[26]研究发现,RAB7A影响体内乳癌细胞增殖和迁移。PRKN通过抑制线粒体铁介导的慢性炎症和免疫功能障碍,显著抑制KRAS驱动的胰腺肿瘤的发生[27]。DUAN等[28]研究发现,PRKN通过EGFR/AKT/mTOR通路抑制肺癌的生长和转移。但RAB7A和PRKN在HCC中的作用机制研究较少。本文研究单因素、多因素Cox回归分析显示,RAB7A和PRKN对于HCC病人的预后具有一定的预测作用,提示RAB7A和PRKN可能是HCC治疗的潜在靶点,但这一结论需要大规模、多中心的基础实验以及临床试验进一步验证。

综上,本研究通过ATGs表达谱分析,筛选出了7个(RAB7A、FOS、ATG9A、HSPA8、PRKN、TUSC1、GAPDH)与HCC病人的预后显著相关的风险ATGs。基于这7个风险ATGs组成的风险模型能够很好地识别预后不良高风险的HCC病人,并且可以作为一个独立的预后因素预测HCC病人的预后。基于此建立的预后风险模型对判断HCC预后显示出较高的准确率。

猜你喜欢

病人基因因素
腹部胀气的饮食因素
谁是病人
Frog whisperer
四大因素致牛肉价小幅回落
修改基因吉凶未卜
创新基因让招行赢在未来
病人膏育
基因
短道速滑运动员非智力因素的培养
还能活多久