基于生物信息学分析NOP56基因在肝细胞癌中的表达及意义
2023-08-15汤劲松
李 芹 汤劲松
1 扬州市职业大学,江苏省扬州市 225000; 2 江苏省苏北人民医院
肝癌是一种常见的恶性肿瘤,其死亡率极高。大约85%的肝恶性肿瘤为肝细胞癌,且非常容易恶化及转移,肝细胞癌患者的5年生存率很低,预后极差[1]。因此迫切需要进一步深层次了解肝细胞癌的发生发展机制,发现新的肝细胞癌治疗靶点,为肝癌的诊疗提供新的方向。NOP56是一种核仁蛋白,在肿瘤细胞中对snoRNA的生成和snoRNA的稳定性维持中起着至关重要的作用[2]。研究表明,在某种情况下snoRNA的失调是癌变的必要条件[3-4]。因此可以推测NOP56可能在肿瘤的发生发展过程中起到至关重要的作用。本研究通过生物信息学探讨NOP56的临床意义及潜在的分子机制,为肝细胞癌的诊断与治疗提供理论依据。
1 材料与方法
1.1 NOP56在肝细胞癌的总体表达情况 利用Oncomine数据库及HCCDB数据库分析肝细胞癌组织中NOP56基因在肝癌及正常或癌旁组织的表达水平,P<0.01被认为具有统计学意义。
1.2 临床相关分析 TCGA数据库下载在转录组数据及对应的临床信息,并排除了临床信息不完整的样本。
1.3 生存分析 通过Kaplan-Meier plotter(http://kmplot.com/)评估NOP56对于肝癌患者及其各个亚组的预后价值。利用多因素Cox回归模型评估NOP56是否为影响肝癌患者总生存期的独立危险因素。
1.4 NOP56互相作用基因筛选和功能及药物富集分析 利用GeneMANIA(https://genemania.org/)建立NOP56互作蛋白网络,并且对此网络进行了富集分析。此外,通过使用WebGestalt(http://www.webgestalt.org/)对该网络进行了靶向药物的预测。
1.5 GSEA富集分析 利用R软件通过Spearman检验将肝细胞癌mRNA表达谱分成NOP56的正相关组及负相关组。使用基因集富集分析(GSEA)对NOP56正负相关的基因进行基于京都基因与基因组百科全书(KEGG)注释。
1.6 统计学方法 采用非配得t检验对两组满足正态分布的连续性变量进行统计学检查。两组以上正态分布的连续性变量,采用方差分析。利用多因素Cox回归模型评估NOP56是否为影响肝癌患者总生存期的独立危险因素。P<0.05时差异具有统计学意义。
2 结果
2.1 NOP56在肝细胞癌中高表达 笔者利用HCCDB数据库中发现,与邻近的正常组织相比,HCC中NOP56 mRNA表达更高(P<0.01)。Oncomine数据库中得出类似的结果(P<0.01 &logFC>2)。此外,值得注意的是,肝硬化中NOP56 mRNA水平高于正常组织(P<0.01 &logFC=1.3)。因此,这些结果表明NOP56可能是正常肝组织发展至肝硬化、肝癌的关键分子。
2.2 NOP56与临床相关性 通过下载TCGA的肝细胞癌数据进行分析,进一步证明了NOP56 mRNA在HCC组织的高表达。NOP56的表达与肝细胞癌分级正相关(P<0.01),无肝细胞癌家族史患者NOP56的表达高于有肝细胞癌家族史患者(P<0.01),有邻近肝组织验证患者NOP56的表达高于无邻近肝组织验证患者(P<0.01)。
2.3 NOP56高表达的患者具有相对差的预后 为了进一步评估NOP56评估肝细胞癌的预后价值,笔者使用了KMPLOT对肝细胞患者进行生存分析。这些结果表明,在NOP56 mRNA高表达组中,肝细胞癌患者的OS(总体生存期)(log-rank test,P<0.05)、PFS(无进展生存期)(log-rank test,P<0.05)、RFS(无复发生存期)(log-rank test,P<0.05)和DSS(疾病特异性生存期)(log-rank test,P<0.05)相对于NOP56低表达组显著减少。此外,笔者对370个肝细胞癌患者进行了亚组生存分析并发现除女性肝癌患者、肝癌Ⅱ期患者和饮酒的肝癌患者以外,所有肝癌亚组中NOP56 mRNA高表达的患者均与较差的OS及PFS相关(P<0.05)。此外NOP56 mRNA高表达的女性肝癌患者及饮酒肝癌患者与较短的OS相关。多因素COX回归分析提示NOP56是OS的独立危险因素。
2.4 NOP56的基因网络 通过GeneMAINA数据库构建基于NOP56的蛋白互作网络,这些分子富集于核糖体生物发生和rRNA代谢过程,表明NOP56可能通过这些生物学过程促进肿瘤的发生发展。 通过WebGestalt数据库分析上述网络,笔者发现放射菌素D可能是影响NOP56蛋白分子的关键药物(见表1)。
表1 靶向基因药物
2.5 NOP56 表达的生物学功能分析 为了进一步探索NOP56潜在的生物学机制,通过Spearman检验将肝细胞癌mRNA表达谱分为正相关组(cor>0)和负相关组(cor<0),然后进行以KEGG注释的GSEA。如图1所示,正相关组主要富集于核糖体、DNA复制、细胞周期。此外,负相关组富集于脂肪酸、氨基酸和丁酸等的代谢。
图1 NOP56的KEGG富集分析
3 讨论
笔者使用了不同的数据库评估了NOP56在肝细胞癌中的表达,这些结果都表明肝细胞癌NOP56 mRNA的表达显著高于正常组织。此外,NOP56高表达组的OS、PFS、RFS和DSS明显少于NOP56的低表达组。然而, Ⅱ期肝细胞癌患者NOP56高低表达组的OS无明显差异(P>0.05),考虑到Ⅰ、Ⅱ、Ⅳ肝癌患者的高低表达组存在显著差异(P<0.05)。笔者认为Ⅱ期肝细胞癌患者NOP56高低表达组无明显差异的原因可能是抽样误差。因此,这些结果强烈表明NOP56的表达可能有助于肝癌患者的诊断和预后评估。然而TCGA数据库中的Ⅳ期肝癌患者相对较少,但这些患者刚发现肝癌已经就是肝癌晚期,预后极差。因此,有必要通过足够的不同阶段的样本来进一步证明笔者的结论。
基因的调控就像多米诺骨牌,只要存在单个基因的错误调控就会导致下游基因的失调,这是导致癌症发生发展的根本原因之一。笔者对以NOP56为核心的蛋白互作网络进行富集分析,发现这些基因主要参与核糖体生物发生和rRNA代谢,这些功能与目前的研究一致[5-6],笔者接着使用了WebGestalt数据库分析NOP56网络,发现了放射菌素D是影响NOP56发挥致癌作用的关键药物。事实上,放射菌素D是临床上常见的抗肿瘤药物,目前主要应用于一些小儿肿瘤,如肌肉瘤、肾母细胞瘤、尤文氏肉瘤等[7-8]。多项研究表明,低浓度的放射菌素D可以破坏核糖体的生物学过程,最终导致细胞周期停滞和凋亡[9]。最新研究表明,放射菌素D通过调控CD133显著抑制肝癌干细胞(LCSCs),并且不损伤正常的肝细胞[10]。根据这些研究笔者可以推测放射菌素D对肝细胞癌的治疗作用也可以通过靶向NOP56来实现,有待进一步的实验证据。为了进一步揭示NOP56的潜在功能,笔者对NOP56正负相关组进行可富集分析。结果表明,正相关组富集于DNA复制、核糖体、细胞周期,负相关组富集于脂肪酸、氨基酸和丁酸等的代谢。结合对以NOP56为中心的基因网络的功能分析,笔者的研究进一步证明NOP56可能通过调节核糖体影响癌症的发展。一项研究表明,在NOP56基因敲除后,乳腺癌细胞G0/G1细胞周期明显停滞[11]。另一项研究表明,在促进NOP56过度表达后,HEK293细胞凋亡或S期数量减少,而G2/M期细胞数量增加2倍[12]。因此,NOP56可能通过影响细胞周期通路促进肝细胞癌的发生发展。
本研究通过多个队列研究证明了NOP56在肝细胞癌的高表达,并通过KM法及构建多因素COX回归证明的NOP56在肝细胞癌的预后价值。此外,构建了以NOP56为核心的基因网络,并预测了靶向该网络的药物。最后通过GSEA计算了NOP56在肝细胞癌所影响的潜在通路。综上所述,NOP56是评估肝细胞癌患者的一种新型的预后指标,可能为潜在的治疗靶标。