尿苷二磷酸-葡萄糖6-脱氢酶在胰腺癌组织中表达及其意义的生物信息学分析
2020-04-27李文军任龙飞赵素月王乾合朱克祥
李文军,任龙飞,赵素月,王乾合,朱克祥
(兰州大学第一医院 普外二科,甘肃 兰州 730000)
胰腺癌是一种高病死率疾病,其恶性程度高,早期诊断困难,手术切除率低,对放化疗不敏感,容易复发和远处转移[1]。因此,探索胰腺癌发生发展相关机制,寻找诊治新靶标,具有重要意义。
尿苷二磷酸-葡萄糖6-脱氢酶(UDP-glucose 6-dehydrogenase,UGDH)编码的蛋白将UDP-葡萄糖转化为UDP-葡萄糖醛酸。UDP-葡萄糖醛酸是糖胺聚糖(GAG)包括透明质酸(HA)、硫酸软骨素(CS)和硫酸肝素(HS)葡萄糖醛酸化和合成的底物。这些糖基化化合物是细胞外基质的常见成分,可能在信号转导、细胞迁移、癌症生长中发挥作用[2]。目前已经有越来越多证据表明UGDH参与肺腺癌、胶质母细胞瘤、结直肠癌、前列腺癌、乳腺癌等多种癌症的发生和发展。Wang等[3]发现了UDP-葡萄糖在肺癌转移中的肿瘤抑制作用,UGDH通过增加SNAI1mRNA的稳定性促进肿瘤转移。Oyinlade等[4]发现类Krüppel因子4(KLF4)通过与甲基化DNA结合,使基因表达活化来促进胶质母细胞瘤细胞的迁移,UDGH是KLF4-mCpG结合活性的下游靶点之一,开发UGDH拮抗剂以减少细胞外基质成分的合成是治疗胶质母细胞瘤的有效策略。Wang等[5]发现UGDH的下调影响HCT-8结直肠癌细胞中GAG的合成和运动,该酶可能是结直肠癌治疗干预的潜在靶点。Huang等[6]的研究也表明UGDH是一种新型的前列腺癌特异性生物标志物。Arnold等[7]研究发现UGDH调节HA的产生并促进乳腺癌的进展,上皮-间质转化(EMT)可以促进代谢重编程,从而通过氨基糖和核苷酸糖通路增加葡萄糖向HA的通量。Theocharis等[8]在一项研究中发现,相比于人的正常胰腺组织,胰腺癌组织的总GAG含量增加4倍,HA增加12倍,CS增加22倍;HA是肿瘤浸润性生长的关键分子之一,高水平的HA与某些肿瘤较差分化和低存活率相关;CS在各种间质和上皮肿瘤中显著增高,其积累可能与肿瘤生长和进展相关。HA与其细胞表面受体CD44和RHAMM的相互作用,促进肿瘤细胞生长、存活和迁移,从而增加转移扩散[9]。因此,UGDH可能通过参与GAG在肿瘤组织中的生物合成来影响肿瘤的侵袭能力和耐药性[10]。
目前尚无胰腺癌中关于UGDH基因的研究。本研究通过生物信息学方法分析UGDH与胰腺癌的生存预后,及其与相关基因的共表达分析,并利用GSEA分析及单基因PPI预测等方法,以期揭示UGDH在胰腺癌发生发展中的作用。
1 材料与方法
1.1 UGDH 基因在正常胰腺组织和胰腺癌组织中的表达差异
基于Oncomine[11]数据库,分析UGDH基因在不同数据集中,在胰腺癌样本和正常样本中的差异表达情况。
1.2 UGDH 表达与胰腺癌患者预后之间的关系
首先在UALCAN[12]数据库中直接查看UGDH基因的高低表达与胰腺癌预后之间的关系,然后使用R语言和从UCSC Xena下载得到的TCGA中胰腺癌基因表达谱和生存数据进行生存分析。首先从生存时间的样本中,将正常样本去除;然后将生存状态为0(存活)且随访时间<30 d的样本视为随访失败去除。经以上处理后得样本,提取其基因表达量,使用R语言的Survminer[13]包计算最佳截断值(optimal cut-point),然后以该值作为阈值,高于该值作为高表达,低于该值作为低表达,与生存时间和生存状态一起进行生存分析。
1.3 UGDH 基因与其他基因的共表达分析及在胰腺癌中可能参与、调控的生物学功能分析
基于UALCAN 数据库,分析TCGA 中胰腺癌UGDH 基因与其他基因的表达相关性,使用Pearson系数法,获得其显著正相关与负相关的基因,分别进行KEGG通路和GO(BP、CC、MF)的富集分析,富集分析采用R语言ClusterProfiler[14]包进行。
1.4 基因集富集分析(gene set enrichment analysis,GSEA)
基于HGNC数据库提供的人类所有基因的注释,提取胰腺癌中所有mRNA的表达谱,然后基于GSEA分析软件,进行UGDH基因在胰腺癌中的基因基富集分析,获得UGDH基因的正向和负向调控通路,以结果中P<0.05的结果作为显著富集结果,表达谱已经过Log2(count+1)的标准化转化,以消除量纲差异。
1.5 UGDH 与其他基因的作用关系预测
基于HGNC 数据库提供的人类所有基因的注释,提取胰腺癌中所有m RNA 的表达谱基于GeneMANIA[15]对UGDH基因进行单基因蛋白互作(PPI)预测分析,进一步对网络中出现的基因使用Metascape[16]进行功能富集分析;使用Cytoscape的MCODE插件对网络进行关键子网络分析。
2 结 果
2.1 UGDH 基因在正常胰腺组织和胰腺癌组织中的表达差异
通过Oncomine数据库的4个胰腺癌数据集,发现胰腺癌样本和正常样本中,UGDH基因的表达出现显著差异,且在胰腺癌中UGDH呈高表达(均P<0.05)(图1)。
图1 不同数据集中UGDH 在胰腺癌样本和正常组织中的表达Figure1 UGDH expressions in pancreatic cancer samples and normal tissues in different data sets
2.2 UGDH 表达与胰腺癌患者预后之间的关系
生存分析结果发现,UGDH基因的表达水平对胰腺癌患者的总生存率有明显影响。与UGDH高表达组相比,UGDH低表达组的胰腺癌患者其总生存率明显升高,生存期更长(均P<0.05)(图2)。
2.3 UGDH 基因与其他基因的共表达及在胰腺癌中可能参与、调控的生物学功能分析
基于UALCAN 数据库,分析TCGA 中胰腺癌UGDH 基因与其他基因的表达相关性,使用Pearson系数法,获得其显著正相关与负相关的基因,部分结果如表1所示。通过GO富集分析了解差异基因UGDH富集于内膜系统、RNA定位、蛋白酶体蛋白分解代谢过程、核质转运、核酸运输等与癌症相关生物学过程;KEGG通路富集分析可见差异基因显著富集于内质网蛋白加工、自噬、泛素介导的蛋白水解、蛋白质输出、剪接体、RNA转运、mRNA监测通路、病毒致癌作用、长期抑制作用、结直肠癌、N-聚糖的生物合成、胰腺癌通路、鞘脂信号通路、癌症中的蛋白聚糖、肾细胞癌、人类巨细胞病毒感染、乙肝等与癌症相关通路(均P<0.05)。相关研究表明,核质转运、核酸运输、高尔基体和外周囊泡及侵袭性GTPase信号传导、自噬作用、mRNA监测通路(如无义介导的mRNA衰变)、N-聚糖的生物合成、胰腺癌通路、鞘脂信号通路在胰腺癌的发生发展中均有显著意义[17-23]。结果表明,与UGDH显著共表达的基因,富集到多条癌症相关生物学功能及信号通路,其中包含胰腺癌通路,这说明UGDH基因在胰腺癌中发挥重要作用(图3)。
图2 胰腺癌中UGDH 表达与预后的关系 A:UALCAN 数据库中胰腺癌UGDH 表达对预后作用的生存分析;B:Survminer包计算得到的最佳截断值;C:基于最佳截断值进行的TCGA 中UGDH 与胰腺癌关系的生存分析Figure 2 Relationship between UGDH expression in pancreatic cancer and the prognosis A: Survival analysis of the effect of UGDH expression on prognosis in UALCAN database; B: The optimal cut point obtained by using Survminer package; C: Survival analysis of the relationship between UGDH and pancreatic cancer in TCGA database
表1 TCGA 数据库胰腺癌UGDH 基因与其他基因的共表达关系Table 1 Coexpression relationship between UGDH gene and other genes in pancreatic cancer in TCGA database
图3 胰腺癌中与UGDH 基因显著共表达的基因的功能和通路富集条形图Figure 3 Function and pathway enrichment bar graph of genes significantly co-expressed with UGDH gene in pancreatic cancer
2.4 GSEA 分析
GSEA分析是一种针对全基因组表达谱芯片数据的分析方法,用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。如表2与图4所示,U G D H 在胰腺癌中的G S E A 分析富集到以下与癌症相关通路:泛素介导的蛋白水解作用、氨基糖和核苷酸糖代谢、氨酰生物合成、卵母细胞减数分裂、肾细胞癌、基础转录因子、鞘脂类代谢、ErbB信号通路、黏附连接、慢性粒细胞白血病、RIG-I样受体信号传导通路、促性腺激素释放激素信号通路、胰岛素信号通路、子宫内膜癌、神经胶质瘤、神经营养蛋白信号通路、内吞作用、MAPK信号通路、胰腺癌等(均P<0.05)。有多项研究表明促性腺激素释放激素、神经营养蛋白及MAPK信号通路在胰腺癌发生发展中起重要作用[24-26]。结果显示,UGDH基因GSEA与共表达分析均富集到多条癌症相关通路,并且均包含胰腺癌通路,进一步确定了UGDH在胰腺癌中的作用(表2)(图4)。
表2 GSEA 分析结果中明显富集的通路Table 2 Significantly enriched pathways from GSEA analysis results
图4 GSEA 富集分析得到的胰腺癌通路Figure 4 The pancreatic cancer pathway enriched by GSEA analysis
2.5 UGDH 与其他基因的作用关系预测
单基因PPI预测分析,使用Cytoscape进行关键子网络分析,其中HGS、Ube2v1、MAT2A、SUMO1 在互作网络中有重要作用,其表达与U G D H 基因表达呈明显正相关。Ube2v1 在表观遗传学上抑制结直肠癌中的自噬基因表达,促进转移[27]。MAT2A在肝癌[28]、结直肠癌[29]、耐他莫昔芬的乳腺癌[30]细胞中的基本表达水平上调。lncRNAs SUMO1P3可能通过EMT信号通路促进胰腺癌的细胞增殖,迁移和侵袭[31]。通过Metascape对网络中的基因进行的功能和通路富集分析,发现这些基因富集于蛋白质在膜中的定位、碳水化合物衍生物生物合成过程、蛋白质分解代谢过程的调控、肽基赖氨酸修饰等生物学过程及第二阶段-化合物的结合通路(图5-6)。细胞内蛋白的调节和降解主要是由泛素-蛋白酶体系统结合分子伴侣、自噬和溶酶体蛋白水解进行的[32]。一项研究表明,赖氨酰氧化同源物2(LOXL2)在AsPC-1和BxPC-3细胞中的过表达增强了EMT样过程,并增加了迁移和侵袭活性,且80例胰腺癌患者样本的免疫组织化学分析显示,81.2%患者胰腺癌组织中LOXL2高表达[33]。因此,UGDH有可能通过影响上述关键因子调控胰腺癌的发生发展。
图5 UGDH 与其他基因相互作用关系分析 A:GeneMANIA 对UGDH 与其他基因的PPI 分析结果;B:Cytoscape 的MCODE 插件对网络进行关键子网络分析得到的关键子网络;C:Metascape 对网络中的基因进行的功能和通路富集分析结果Figure 5 Analysis of the interactions of UGDH with other genes A: Results of PPI analysis of UGDH and other genes constructed by GeneMANIA; B: The key subnetworks identified in the PPI network by using Cytoscape MCODE plugin; C: Function and pathway enrichment analysis of genes in the network by using Metascape
图6 PPI 分析关键子网络与UGDH 基因共表达关系Figure 6 Co-expression relationship between the key subnetworks of PPI analysis and UGDH gene
3 讨 论
UGDH基因在肿瘤发生发展过程中起重要作用,通过UGDH靶向透明质酸的生成可以抑制多种癌症病理过程,尤其是通过限制UDP-葡萄糖醛酸的生成抑制肿瘤生长[7]。UGDH基因高表达与化疗耐药性有关[34]。需要认识到,现有的实验证据远远不足以揭开UGDH的谜底,诸如胰腺癌等癌症与UGDH之间的关系尚未阐明。siUGDH是阐明人类UGDH功能的有效工具[5],有必要进一步分析UGDH参与的Akt相关通路中的上下游分子[35]及对核UGDH进行功能研究[3]。UGDH抑制剂的开发仍处于起步阶段。未来针对UDGH的小分子抑制剂的研究将检验UGDH是否可以单独作为治疗靶点[4]。除了结合功效和抑制效力外,UGDH抑制剂的未来设计方向应集中于选择性(例如UGDH-I与UGDH-II)和细胞靶向方面。
本文利用已有的生物信息学资源和工具进行数据处理和分析,结果显示,胰腺癌样本和正常样本中,UGDH基因的表达出现显著差异,在胰腺癌组织中UGDH显著高表达;且与UGDH高表达组相比,UGDH低表达组的胰腺癌患者其总生存率显著升高,生存期更长;UGDH基因GSEA与共表达分析均富集到多条胰腺癌相关通路,进一步确定了UGDH在胰腺癌中的作用;单基因PPI预测分析显示 SUMO1等在互作网络中有重要作用,并且lncRNAs SUMO1P3可能通过EMT信号通路促进胰腺癌的细胞增殖,迁移和侵袭[31]。有研究[26]表明,钙网蛋白通过整合素/EGFR-ERK/MAPK信号通路促进胰腺癌细胞中表皮生长因子诱导的EMT。GSEA分析富集到的氨基糖和核苷酸糖代谢通路在UGDH与乳腺癌的作用机制中起重要作用,富集到的MAPK信号通路在胰腺癌中起重要作用;综上,SUMO1及EMT信号通路、MAPK信号通路、氨基糖和核苷酸糖代谢通路与UGDH之间的作用机制值得我们进一步研究。
生物信息学分析为UGDH在胰腺癌发生发展中的作用提供了全新的视角,不仅可以获得关于基因功能研究的重要线索,更为下一步实验策略提供指导。当然这种完全基于计算机的基因虚拟数字化表达研究方法也存在一定局限性。首先,它是依托于数据库,其数据的准确性决定了结果的准确性。其次,本研究缺少基础实验的验证,后续研究将继续从mRNA及蛋白质层面完善。