APP下载

利用生物信息分析挖掘与肝细胞癌预后相关枢纽基因

2023-06-17庄伟霞郑冰王谋锋

中国现代医药杂志 2023年5期
关键词:信息学枢纽细胞周期

庄伟霞 郑冰 王谋锋

随着医学信息学的发展,其分支生物信息学在临床各种疾病尤其是肿瘤方面的应用优势日益凸显。利用各类基因数据库资源和各种计算机分析技术从微观层面帮助解决临床医疗问题已成为普遍趋势。癌症的治疗及预后是临床最关注的问题。而肝细胞癌(Hepatocellular carcinoma,HCC)是全球癌症死亡的第二大原因,且由于HCC 早期缺乏典型临床症状和有效的诊断方法,大多数HCC 患者被诊断时已为晚期,再加上HCC 遗传异质性强、疾病发展迅速等,常导致患者治疗效果不佳,预后较差[1]。目前已有研究关注与HCC 预后相关的基因。尽管基因芯片数量庞大、数据面广,但信息混杂、实验基础有限,精准性有待验证。本研究在此背景下通过生物信息技术对HCC 基因芯片筛选得出差异表达基因,通过各种分析进一步发现与HCC 预后相关的枢纽基因,以期为HCC 的精准治疗提供有价值的参考。

1 材料与方法

1.1 筛选差异表达基因从GEO 数据库(https://www.ncbi.nlm.nih.gov/geo/)中获得GSE101685 和GSE 14520 的基因表达谱,GSE101685 基因表达谱纳入24 份HCC 样本和16 份正常肝组织,GSE14520 基因表达谱纳入22 份HCC 样本和14 份正常肝组织,以校正后的P<0.05 和|log2FC|>1 为依据,使用limma R包(http://www.bioconductor.org/)识别每个数据集中的差异表达基因。然后,利用Venn 在线工具获取两个数据集之间的重叠基因。

1.2 通过GO 和KEGG 进行功能和通路富集分析使用聚类分析器R 包对DEGs 进行GO 的功能分析和KEGG 的通路分析。它们参与生物过程(BP)、分子功能(MF)、细胞成分(CC)和通路的相关信息可以通过P<0.05 来识别。

1.3 DEGs 的蛋白质相互作用分析与枢纽基因的鉴定为研究DEGs 在蛋白质水平上的相互作用,使用STRING 数据库构建了DEGs(https://string-db.org/)的PPI 网络。只有与置信度评分>0.4 的交互作用被认为是显著性的。Cytoscape 软件可将PPI网络可视化,节点间的程度是使用Cytoscape 的插件Cytohubba 来确定的。采用3 种拓扑方法筛选Cytoscape 的细胞插件中的重叠基因,即为枢纽基因。最后通过Venn 在线工具确定重叠的枢纽基因。

1.4 枢纽基因与HCC 预后相关的分析GEPEA 在线工具(http://gepia.cancer-pku.cn/)可以检测枢纽基因的mRNA 水平及其与疾病分期的关系;HPA(https://www.proteinatlas.org/)可以评估HCC 和正常肝组织中枢纽基因的蛋白水平,Kaplan-Meier 绘图仪数据库(https://kmplot.com/analysis/)可以分析枢纽基因与HCC 预后的关系。

2 结果

2.1 GSE101685 与GSE14520 的DEGs 的鉴定从GEO 数据库中获得了2 个HCC 基因表达谱(GSE101685、GSE14520)。然后,将基因表达数据归一化,用limmaR 包(调整后的P<0.05 和|log2FC|>1)。GSE101685 和GSE14520 的结果分别显示在火山图中(图1A、1B)。分别从GSE101685 和GSE14520 中筛选出了994 个和826 个DEGs。两个数据集之间重叠的DEGs 包含443 个基因,如Venn 图(图1C)所示。

图1 GSE101685 和GSE14520 的火山图及韦恩图

2.2 GO 和KEGG 分析结果为进一步阐明DEGs的功能及其与通路的关系,使用聚类分析器R 包对443 个DEGs 进行了GO 功能分析和KEGG 通路分析。结果表明,进行富集分析后的DEGs 在参与生物工程中与小分子分解代谢过程、羧酸分解代谢过程、有机酸代谢过程、脂肪酸代谢过程等显著相关(图2A)。在基因分子功能上DEGs 与辅助因子结合、辅酶结合、单加氧酶活性和双吡咯结合显著相关(图2B)。除CC 外,DEGs 还特别富集于含胶原的细胞外基质、纺锤体、血液微粒和MCM 复合物中(图2C)。此外,KEGG 通路分析结果显示,DEGs 在细胞周期、化学致癌、脂肪酸降解、药物代谢-细胞色素P450 和DNA 复制等方面富集(图2D)。

2.3 PPI 网络的构建及枢纽基因的鉴定利用STRING 数据库,通过构建组合评分>0.4 的PPI 网络,在蛋白质水平上分析重叠的DEGs 之间的相互作用。利用Cytoscape 软件构建DEGs 的PPI 网络,包括408 个节点和3 586 条边(图3A)。根据最大团中心性、程度和中间性3 种拓扑分析方法,利用上述PPI 网络中的 Cytoscape 插件鉴定了枢纽基因。用不同方法列出了前30 个枢纽基因的排序,见表1。通过在线Venn 工具检测4 个重叠的枢纽基因CCNB1、CDK1、MAD2L1 和NCD80 并进一步分析(图3B)。

表1 前30 个枢纽基因的排序

图3 共同DEGs 的PPI 网络构建图

2.4 对选定的4 个枢纽基因进行再分析使用GEPIA 在线工具进一步验证4 个枢纽基因的表达。HCC 样本中CCNB1、CDK1、MAD2L1 和NCD80 的表达水平显著高于正常组织(图4A)。此外,发现4 个枢纽基因在不同的HCC 阶段均存在显著差异(图4B),说 明CCNB1、CDK1、MAD2L1 和NCD80可能具有作为HCC 治疗生物靶点的潜力。此外,在HPA 数据库中验证了除NCD80 外的4 个枢纽基因中的3 个。免疫组化结果显示,HCC 样本中CCNB1、CDK1 和MAD2L1 蛋白水平高于正常组织(图5)。利用Kaplan-Meier 在线绘图仪工具,发现选定的枢纽基因与HCC 患者的预后相关。CCNB1、CDK1、MAD2L1 和NCD80 的高表达水平与较差的总生存期显著相关(图6)。

图4 枢纽基因mRNA 表达水平及不同临床阶段表达分析图

图5 HPA 在线工具验证枢纽基因的蛋白表达水平图

图6 4 个枢纽基因在患者中的预后分析图

3 讨论

HCC 是一种常见的恶性肿瘤,但由于存在诊断较晚、易复发和治疗耐药性高等复杂问题,HCC 患者的无进展生存率、总生存率仍不理想。因此,迫切需要探索有效的HCC 诊断生物标志物和其治疗靶点。生物信息学的发展为从数千个基因中筛选出参与HCC 发生和发展的几个关键基因提供了一种有效途径。这些基因可能作为HCC 潜在的生物标志物和治疗靶点。

本研究选择GSE101685 和GSE14520 来鉴定HCC 与正常肝组织之间的DEGs。依据P<0.05 和|logF2C|>1 共鉴定出443 个DEGs,GO 功能分析和KEGG 富集分析结果表明,DEGs 与MCM 复合物、脂肪酸降解、细胞周期和DNA 复制有关。先前的研究表明,脂肪酸降解的紊乱与肿瘤的发生或进展有关。游离脂肪酸的代谢重编程可以加速肿瘤的转移[2,3]。细胞周期和DNA 复制与细胞增殖和凋亡有关,它们的失调与包括HCC 在内的多种癌症有关[4,5]。

利用PPI 网络对DEGs 进一步分析,筛选出4 个重叠的枢纽基因CCNB1、CDK1、MAD2L1 和NDC80,这些基因与正常肝组织相比,在HCC 组织中均明显不受调控。此外,我们还应用GEPIA 进一步验证了这些关键基因在HCC 中的表达水平。GEPIA 数据库的结果表明,这些枢纽基因不仅具有与生物信息学分析相同的表达趋势,而且与HCC分期相关。此外,我们注意到,KM 法显示CCNB1、CDK1、MAD2L1 和NDC80 高表达的HCC 患者的生存结果更差。这些结果提示这4 个枢纽基因可能在HCC 的发生发展中发挥重要作用。

参与有丝分裂的CCNB1 是细胞周期G2/M 过渡阶段的一个转换器。敲除CCNB1 可抑制HCC细胞的增殖、迁移和侵袭[6],而CCNB1 的激活促进了HCC 的增殖[7]。细胞周期和物质代谢相关基因表达的失调有助于HCC 的发生[8]。有研究发现,HCC 中CCNB1 的上调预示着更差的总生存期和无病生存期[9]。Lnc00312 可以通过靶向CCNB1 诱导G2/M 细胞周期阻滞来抑制HCC 细胞的增殖,说明CCNB1 具有作为HCC 治疗靶点的潜力。其他一些研究也证实,CCNB1 可能是术后HBV 相关HCC 复发的候选生物标志物和潜在的治疗靶点[10]。因此,靶向CCNB1 可能是HCC 治疗的另一种选择。

CDK1 作为丝氨酸/苏氨酸蛋白激酶家族的一员,在细胞周期中发挥重要作用,并已被报道与包括HCC 在内的多种癌症的起始和进展有关[11]。既往文献显示,与正常肝组织相比,CDK1 在HCC 中显著上调,且CDK1 的高表达与HCC 的不良预后相关[10,12]。乙肝病毒X 蛋白[13]和热休克蛋白90 的抑制[14]可通过cdk1 介导的G2/M 细胞周期阻滞和凋亡来抑制HCC 的生长。通过miR378 下调CDK1可以通过诱导G2/M 细胞周期阻滞来抑制HCC 的增殖[15],提示CDK1 可能是HCC 的潜在治疗靶点。此外,一些研究人员证实,CDK1 抑制剂RO3306 可以提高索拉非尼治疗在肝癌临床前模型中的疗效[16]。

MAD2L1 作为有丝分裂纺锤体组装检查点的一个组成部分,维持染色体的稳定性并参与细胞周期。MAD2L1 的失调导致染色体不稳定,从而可能导致癌症的发生和发展[17]。根据以往的报道,MAD2L1 在包括胃癌在内的多种癌症中均高表达,并与肿瘤分期有关[18]。MAD2L1 对部分肿瘤具有重要的预后价值,而MAD2L1 的高表达提示预后较差。MAD2L1 的异常表达与HCC 的肿瘤分期、邻近器官浸润及预后相关。过表达miR-200c-5p 通过抑制HCC 的增殖和转移产生抗肿瘤作用,过表达MAD2L1 可以抵消miR-200c-5p 过表达的抗肿瘤作用,这意味着miR-200c-5p 通过靶向MAD2L1发挥抗肿瘤作用[19,20],而MAD2L1 可能是治疗HCC的关键靶基因。

NDC80 是外着丝点的核心组成部分,是有丝分裂调节因子,介导染色体对齐,是染色体分离所必需的[21]。既往文献报道,NDC80 在包括肾细胞癌在内的多种类型的癌组织中均表达上调[22],恶性胶质母细胞瘤[23]、小细胞肺癌[24]、肾上腺皮质癌[25]和HCC[26]NDC80 的高表达预示着包括HCC 在内的不良预后。Liu 等[24]研究表明,NDC80 在HBV 相关的HCC 组织中的表达水平显著上调,而NDC80 的高表达水平预示着不良预后。NDC80 通过减少细胞凋亡和克服细胞周期的阻滞来促进HCC 的进展,敲除NDC80 可以抑制HCC 的增殖[25]。因此,NDC80也可能成为一种新的生物标志物和治疗靶点。

以往的研究也确定了参与HCC 的DEGs,并通过生物信息学分析筛选出了一些枢纽基因作为候选的生物标记物和治疗靶点。然而,由于选择的数据集和生物信息学分析方法不同,不同的组筛选出了不同的枢纽基因。本研究筛选出了CCNB1、CDK1、MAD2L1 和NDC80 这4 个枢纽基因,并进一步证实了这些枢纽基因可能作为HCC 的新的诊断生物标志物和治疗靶点。然而,这项研究仍存在一些局限性,例如,需要进行实验来证实这些发现,这4 个枢纽基因如何影响HCC 发生和发展的机制有待进一步探索。尽管存在这些缺陷,我们筛选出的枢纽基因仍可能是HCC 诊断和HCC 治疗靶点的潜在生物标志物。

猜你喜欢

信息学枢纽细胞周期
鸡NRF1基因启动子区生物信息学分析
枢纽的力量
淮安的高铁枢纽梦
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
初论博物馆信息学的形成
枢纽经济的“三维构建”
NSCLC survivin表达特点及其与细胞周期的关系研究
X线照射剂量率对A549肺癌细胞周期的影响
熊果酸对肺癌细胞株A549及SPCA1细胞周期的抑制作用
miRNA-148a在膀胱癌组织中的表达及生物信息学分析