APP下载

基于生物信息学鉴定黏液样脂肪肉瘤中甲基化调控的差异表达基因▲

2020-12-01李倩茹张海俊刘春霞

广西医学 2020年19期
关键词:核糖体肉瘤甲基化

李倩茹 张海俊 孟 莲 刘春霞

(1 石河子大学医学院病理学系,新疆地方病与民族疾病重点实验室,石河子市 832002,电子邮箱:1509094295@qq.com;2 石河子大学医学院第一附属医院病理科,新疆石河子市832002)

脂肪肉瘤包括去分化脂肪肉瘤、黏液样脂肪肉瘤(myxoid liposarcoma,MLPS)及多形性脂肪肉瘤等多种组织学亚型,而MLPS约占脂肪肉瘤的30%[1-2]。虽然治疗后MLPS患者的生存率得到很大提高,但目前的化疗方案对复发或转移性患者的治疗效果仍不佳[3-4]。目前MLPS发生的确切机制尚不清楚[4]。因此,探索MLPS遗传和表观遗传变化相关的特定生物标志物和治疗靶点,可为患者的预后判断提供依据。大量研究表明,甲基化是表观遗传的关键修饰因子之一,其不仅是肿瘤发生的重要表观遗传学机制,还可为寻找人类疾病相关生物标志物和治疗靶点提供方向[5-7]。在CpG岛中,异常甲基化可影响癌基因和抑癌基因的功能,然而目前关于DNA甲基化对单个基因影响的研究仍然不充分。因此,本研究基于数据库鉴定MLPS中甲基化调节的差异表达基因(methylation-regulated differentially expressed genes,MeDEGs),利用一系列分析工具筛选出异常甲基化基因,为MLPS的发生、诊断及预后判断提供参考。

1 材料和方法

1.1 样本来源 本研究从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中筛选出基因系列集GSE59568[8]和DNA甲基化系列集GSE52391[3]。GSE59568包含6个MLPS组织样本(MLPS组)和3个正常脂肪组织样本(对照组);GSE52391包含10个MLPS组织样本(MLPS组)和2个正常脂肪组织样本(对照组)。对上述2个数据集中的样本进行后续分析。

1.2 鉴定MeDEGs 采用GEO 自带的GEO2R分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r/),对GSE59568和GSE52391系列集进行分析,以P<0.05、|log(FC)| >1和P<0.05、|t| >2为标准,分别筛选差异表达基因(differentially expressed genes,DEGs)和差异甲基化基因(differentially methylated genes,DMGs)。随后使用Venny 2.1.0在线工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html)分别重叠上调(下调)的DEGs和甲基化过低(高)的DMGs,得到上调(下调)的低(高)甲基化的MeDEGs。

1.3 MeDEGs的富集分析 采用DAVID软件(http://david.abcc.ncifcrf.gov/)对MeDEGs分别进行基因本体(Gene Ontology,GO)功能和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析,以P<0.05为有效。

1.4 蛋白质相互作用网络构建和功能模块分析 通过STRING在线分析工具(https://string-db.org/)得到MeDEGs的蛋白质相互作用(protein-protein interaction,PPI)网络,中信度分数> 0.4时被认为重要。以TSV格式输出,并导入Cytoscape软件(http://www.cytoscape.org/download.php;版本3.5.1)。在Cytoscape软件引入插件cytoHubba筛选PPI网络的Hub基因,同时使用插件MCODE构建 PPI 网络的功能模块。

1.5 Hub基因的甲基化表达水平和基因表达水平与生存分析 UALCAN(http://ualcan.path.uab.edu/index.html)是基于TCGA数据库中的相关癌症数据进行的分析网站,使用此工具分析肉瘤与正常组织样本之间的DNA甲基化和基因表达水平差异,最终生成用于关系可视化的箱线图。使用Kaplan-Meier法评估MeDEGs中Hub基因与肉瘤患者总生存率的关系,进而了解异常甲基化基因与MLPS患者的预后关系。

2 结 果

2.1 MLPS的MeDEGs 从GSE59568数据集的MLPS组织和正常脂肪组织中鉴定出1 007个上调和1 298个下调的DEGs(见图1A)。从GSE52391数据集的MLPS组织和正常脂肪组织中筛选出597个甲基化过高的DMGs和3 577个甲基化过低的DMGs。(见图1B)。为了获得DEGs与DMSs呈负相关异常甲基化调控的差异基因;重叠了597个高甲基化DMGs和1 298个下调的DEGs,获得78个下调的MeDEGs(图2A);重叠了3 577个低甲基化DMGs与1 007个上调的DEGs,获得143个上调的MeDEGs(图2B)。

图1 DEGs的火山图和DMGs的热图

图2 获得的MeDEGs

2.2 MeDEGs的GO功能和KEGG通路富集分析 使用DAVID对全部MeDEGs进行GO功能和KEGG富集分析。结果显示,MLPS的MeDEGs主要参与细胞增殖的正负调控、凋亡、核糖体结构成分和蛋白结合等生物学过程,见表1;MLPS的MeDEGs富集在核糖体、癌症、RAS相关蛋白1(RAS-associated protein,Rap1)、AMP依赖的蛋白激酶(AMP-activated protein kinase,AMPK)和Ras 等信号通路,见表2。

表1 MLPS中MeDEGs的GO富集分析结果

表2 MLPS中MeDEGs的KEGG通路富集分析结果

2.3 PPI网络和Hub基因 通过STRING和Cytoscape绘制MeDEGs的PPI网络并进行图像可视化,使用MCODE插件筛选PPI功能模块,其中顶级模块主要富集在核糖体,见图3。使用插件cytoHubba筛选出前20个Hub基因,包含核糖体蛋白质家族成员核糖体蛋白(ribosomal protein,RP)L9、RPL31、RPL36、RPS2、RPS21、RPL39L、RPL15、RPS23、NHP2、细胞质多聚(A)结合蛋白1[poly(A)binding protein,cytoplasmic 1,PABPC1]、细胞分裂周期相关蛋白(cell division cycle-associated protein,CDCA)5、非SMC凝缩素Ⅰ复合亚基G(non-SMC condensin Ⅰ complex,subunit G,NCAPG)、甲状腺激素受体相互作用物13(thyroid hormone receptor interactor 13,TRIP13)、无齿的E3泛素蛋白连接酶同源(denticleless E3 ubiquitin protein ligase homolog,DTL)、无缺口同源物1(notchless homolog 1,NLE1)、Geminin DNA复制抑制剂(Geminin,DNA replication inhibitor,GMNN)、胸苷酸合成酶(thymidylate synthetase,TYMS)、CDC7、小核糖核蛋白D2多肽(small nuclear ribonucleoprotein polypeptide D2,SNRPD2)和BYSL基因,这20个Hub基因皆为上调的MeDEGs,见表3。

图3 MeDEGs的PPI网络和顶级模块

表3 MeDEGs中前20个Hub基因

2.4 Hub基因在肉瘤中的甲基化和基因表达水平及其与预后的关系 根据UALCAN工具的分析结果,在肉瘤组织中发现RPL36、RPS2、CDCA5、NCAPG、NLE1、TYMS、SNRPD2和BYSL的甲基化和基因表达与MLPS中的表达相同,见图4A。泛癌分析结果还显示这些基因在大部分肿瘤中显著上调,见图4B。采用Kaplan-Meier法评估这些上调基因与肉瘤患者的预后关系,结果显示RPS2(P=0.008)、CDCA5(P=0.017)、NCAPG(P=0.013)、NLE1(P=0.001)、TYMS(P=0.002)和BYSL(P<0.001)的mRNA表达升高与肉瘤患者不良预后相关(见图5)。由此推断,RPS2、CDCA5、NCAPG、NLE1、TYMS和BYSL基因可能是MLPS患者预后的潜在独立预测因子。

图4 各基因在不同肿瘤中的甲基化及基因表达水平

图5 RPS2、CDCA5、NCAPG、NLE1、TYMS和BYSL基因表达水平与肉瘤患者预后的关系

3 讨 论

分子病理流行病学是使用肿瘤标志物替代疾病病理学的一种新兴学科,它将分子病理学和数据科学相结合以帮助精准医学的开展。目前,利用分子病理流行病学可深入探索肿瘤的病因、发展、预后和结局[9-11]。在分子病理流行病学中,异常甲基化基因作为肿瘤有关的生物标志物和潜在的治疗靶点,已受到广泛关注[12-13]。以往的研究主要集中在MLPS单个基因与甲基化之间的相关性,缺乏对DNA甲基化的系统分析。因此,迫切需要在MLPS患者中鉴定和分析MeDEGs,为后续探索肿瘤的预后标记物以及治疗靶点提供可行的参考。

本研究结果显示,RPS2、CDCA5、NCAPG、NLE1、TYMS和BYSL基因是MLPS中上调的MeDEGs,且这些基因的过表达与肉瘤患者预后差有关(均P<0.05)。RPS2是一种核糖体蛋白,其高表达与细胞增殖有关,并且可促进前列腺癌、结直肠癌以及星形细胞瘤的形成[14-16],可作为结直肠癌[15]和前列腺癌[14]的潜在治疗靶点。CDCA5在控制细胞周期进程中起重要作用[17-18],其表达过高与肺癌[19]、口腔鳞状细胞癌[18]、肝癌[20]等多种癌症患者预后差有关。NCAPG参与细胞分裂期间染色体的浓缩和稳定化,其与肝癌的多发有关,而低表达可抑制体内肝癌的肿瘤生长,该基因可能为未来治疗肝癌提供了新型生物标志物和治疗靶点[21-22]。NLE1编码一种新的含WD40重复序列的蛋白质,可调节Notch信号传导活性,但其作用机制仍未明确[23]。TYMS是一种基础的代谢酶,抑制TYMS已被证明是一种有效的人类癌症治疗方法。已有研究报告,TYMS在结肠癌对5-氟尿嘧啶耐药性以及晚期乳腺癌患者对培美曲塞的耐药性中起关键作用[24-25]。除了与耐药性有关外,TYMS高表达还与肿瘤的不良预后相关[26-27]。BYSL存在于人类滋养细胞中,虽然BYSL在肿瘤发生中的具体生物学作用仍有待确定,但有学者发现其在肝细胞癌中上调,并且是癌细胞增殖中细胞核生成所必需的[28]。还有学者基于BYSL的黏附和侵入功能发现,其在神经性癌中发挥作用,且是神经性癌的一种重要治疗靶标[29]。虽然RPS2、CDCA5、NCAPG、NLE1、TYMS和BYSL基因对MLPS的作用尚不明确,但综合以上研究和本研究结果推测,基因的异常甲基化有可能是MLPS发生的关键因素之一。

本研究进一步进行了功能富集分析,以阐明甲基化在MLPS中的作用。GO分析显示,MeDEGs主要富集在细胞增殖的正负调节和凋亡等生物学过程。与正常细胞相比,异常细胞增殖或凋亡被认为是癌细胞的显著特征,这意味着多个癌基因或抑癌基因呈高或低甲基化。此外,Wnt信号通路的负调节被富集。研究显示,Wnt信号通路的突变经常发生在人类癌症中,且其扮演不同的角色[30-31]。GO功能和KEGG通路分析结果均涉及核糖体,表明富集在核糖体的多个基因受异常甲基化的高度调控。近来已有研究证实核糖体是结肠癌发展的重要机制[32]。除了核糖体外,KEGG也富集在癌症、Rap1信号、AMPK信号和Ras信号等通路。Rap1被认为是一种可以逆转Ras转化的蛋白质,是控制整合素激活的关键介质[33]。最近有研究表明,Rap1通过调节转化生长因子β1的Ras同源家族A活性来调节肝星状细胞迁移[34]。Ras蛋白是多种癌症的重要调节因子,主要调控活性鸟苷三磷酸和无活性鸟苷二磷酸两者之间的转换[35]。AMPK主要在能量平衡和能量代谢中起作用,是代谢疾病的潜在治疗靶标[36]。上述研究结果表明核糖体、Rap1信号通路、AMPK信号通路和Ras信号通路都可能是阐明MLPS机制的重要研究靶点。

综上所述,RPS2、CDCA5、NCAPG、NLE1、TYMS和BYSL等基因的异常甲基化可能与MLPS的发病及预后密切相关,这或可为进一步研究MLPS的发生和发展、筛选预后标记物以及治疗靶点等提供新的方向。

猜你喜欢

核糖体肉瘤甲基化
核糖体成熟因子RimP、Era和RimJ的研究进展
核糖体生物合成与肿瘤的研究进展
例析翻译过程中核糖体移动方向的判断
原发性肾上腺平滑肌肉瘤1例
氟斑牙患儿ERα启动子区甲基化率与血钙和尿氟的相关性
滑膜肉瘤的研究进展
侧脑室内罕见胶质肉瘤一例
咽旁巨大平滑肌肉瘤一例MRI表现
SOX30基因在结直肠癌中的表达与甲基化分析
鼻咽癌组织中SYK基因启动子区的甲基化分析