去分化脂肪肉瘤潜在核心基因的生物信息学预测及分析
2021-03-17胡美娟周燕燕周永杰杨李波
胡美娟,周燕燕,彭 冉,邱 琰,周永杰,杨李波,包 骥,步 宏
去分化脂肪肉瘤作为恶性间叶组织肿瘤的一员,临床表现具有侵袭性,局部复发率达80%[1]。该病发生远处转移较少,转移率约20%。原发于腹膜后的肿瘤相比其它部位预后明显较差[1],且易与腹膜后脂肪肉瘤相关多原发恶性肿瘤(multiple primary malignant neoplasms, MPMN)混淆[2]。目前治疗主要依赖手术切除,因为其对放、化疗均不敏感,所以需要寻找有效的分子标志物作为诊断标志物和潜在的治疗靶点。目前关于分子标志物和治疗靶点在低分化脂肪肉瘤中的报道较少。本文通过获取基因表达数据库(gene expression omnibus,GEO)的去分化脂肪肉瘤和正常脂肪组织的芯片数据,基于生物信息学分析筛选差异表达基因,对探究潜在核心基因在去分化脂肪肉瘤的恶性生物学行为中的作用提供理论依据,为分析去分化脂肪肉瘤的分子机制和治疗靶点奠定基础。
1 材料与方法
1.1 材料通过GEO数据库(https:www.ncbi.nlm.nih.gov/geo/)获得GSE21122和GSE52390的芯片数据,GSE21122数据集中包括9例正常脂肪样本(样本编号GSM528425-528433),46例去分化脂肪肉瘤样本(样本编号GSM528276-528321);GSE52390数据集中包括2例正常脂肪样本(样本编号GSM1264449-1264450),12例去分化脂肪肉瘤样本(样本编号GSM1264437-1264448)。
1.2 差异表达基因的筛选通过GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)分析,对去分化脂肪肉瘤和正常脂肪组织之间的差异表达基因进行筛选,筛选条件:矫正后P<0.05和|LogFC|≥2,用R包进行差异表达基因的火山图绘制。分别输入GSE21122和GSE52390中上调和下调的差异表达基因到https://bioinfogp.cnb.csic.es/tools/venny/index.html,对差异表达基因取交集。
1.3 差异表达基因的基因本体(gene ontology, GO)功能富集分析GO主要包括以下三个部分:分子功能(molecular function, MF)、细胞成分(cellular component, CC)、生物过程(biological process)。提交差异表达基因到Funrich 3.1.3软件(http://funrich.org/)中进行GO功能富集分析。
1.4 差异表达基因的京东基因和基因组百科全书(Kyoto Encyclopedia of genes and genomes, KEGG)通路富集分析KEGG是一个从分子水平注释基因功能的数据库。将差异表达基因输入KOBAS 3.0数据库(http://kobas.cbi.pku.edu.cn/kobas3)进行KEGG通路富集分析,筛选条件为P<0.01,FDR<0.01。
1.5 差异表达基因的蛋白互作分析将差异表达基因输入String11.0在线网站(https://string-db.org/cgi/input.pl)进行蛋白互作分析,参数设置为:互作分值低度可信(low confidence:0.15),隐藏网络中的不相关节点。
1.6 潜在核心基因的筛选将蛋白互作分析中的数据导入到Cytoscape 3.8.0软件(https://cytoscape.org/)中,用cytoHubba插件按照节点数筛选出前10个基因作为潜在核心基因。
2 结果
2.1 差异表达基因的筛选通过对差异表达基因进行筛选,分别得到GSE21122的差异表达基因220个,64个基因表达上调,156个基因表达下调;GSE52390的差异表达基因173个,28个基因表达上调,145个基因表达下调。通过韦恩图取交集,最后得到差异表达基因68个,10个共上调基因,58个共下调基因(图1、2)。
图1 差异表达基因的韦恩图:10个共上调差异表达基因,58个共下调差异表达基因
图2 A.GSE21122的差异表达基因火山图;B.GSE52360的差异表达基因火山图;红色代表上调基因,绿色代表下调基因,黑色代表基因变化不显著
2.2 GO功能富集分析GO功能富集分析结果表明,差异表达基因显著富集:(1)代谢和能量通路的生物过程,分别有23个和22个基因参与;(2)细胞外基质和线粒体的细胞组分,分别有7个和12个基因参与;(3)细胞外基质结构成分和催化活性的分子功能,分别有6个和8个基因参与(图3)。
图3 差异表达基因的GO功能富集分析:A.生物过程;B.细胞组分;C.分子功能
表1 差异表达基因的KEGG通路富集分析
2.3 KEGG通路富集分析KEGG富集分析结果表明上调差异表达基因显著富集在蛋白消化、吸收信号通路和AGE-RAGE信号通路,参与的基因主要有COL1A1、COL1A2和COL3A1;下调差异表达基因显著富集在脂肪细胞因子、AMPK信号通路、PPAR信号通路和调控脂肪分解信号通路,参与的基因主要有PNPLA2、LIPE、ADIPOQ、SCD、PLIN1和LEP(表1)。
2.4 蛋白互作分析输入68个差异表达基因到String11.0在线网站后,合计得到68个节点,445条连线,去除不相关的节点后构建蛋白互作网络。
2.5 潜在核心基因的筛选用Cytoscape 3.8.0软件将蛋白互作分析中的数据可视化,分别用红色和绿色代表上调和下调的差异表达基因(图4A)。通过CytoHubba插件筛选出前10个潜在核心基因分别为LEP、ADIPOQ、SCD、PLIN1、LPL、CAV1、PNPLA2、LIPE、CEBPA和CIDEA,且均在去分化脂肪肉瘤中表达下调,其中ADIPOQ、PNPLA2和LIPE富集的信号通路较多,包括脂肪细胞因子、AMPK信号通路、代谢、PPAR信号通路和调控脂肪分解信号通路(图4B)。
3 讨论
去分化脂肪肉瘤是成人脂肪肉瘤中较常见的亚型之一,局部复发率较高。目前关于去分化脂肪肉瘤的研究为在12q13-15区域上发现MDM2、CDK4等[3]基因的高水平扩增及在1p32、6q23区域上[4]发现JUN、ASK1等基因的共同扩增[5]。但已有研究表明MDM2的扩增并非仅见于去分化脂肪肉瘤,MDM2的抑制剂Nutlin-3也只能有限抑制去分化脂肪肉瘤的生长,因此需要进一步分析去分化脂肪肉瘤发生过程中的其它关键基因。从GEO数据库(www.ncbi.nlm.nih.gov/geo/)中下载GSE21122和GSE52390的表达谱芯片数据,使用GEO在线分析工具GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r/)将样本分为正常脂肪组和去分化脂肪肉瘤组,按照矫正后P<0.05和|LogFC|≥2的条件进行筛选,得到220个GSE21122的差异表达基因和173个GSE52390的差异表达基因,用在线网站VENNY2.1(https://bioinfogp.cnb.csic.es/tools/venny/index.html)取交集后得到共差异表达基因68个,然后对差异表达基因进行GO功能、KEGG通路富集分析和蛋白互作分析,结果发现在筛选的10个潜在核心基因中,PNPLA2、LIPE、ADIPOQ、SCD、PLIN1和LEP基因的富集通路较多,可以在去分化脂肪肉瘤的下游通路机制研究中重点关注。
图4 A.Cytoscape中的可视化蛋白互作网络图:红色代表上调差异表达基因对应的蛋白质,绿色代表下调差异表达基因对应的蛋白质;B.筛选的前10个潜在核心基因:颜色越深,代表评分越高
筛选出的68个差异表达基因中,按照矫正后P排名上调最显著的是COL1A2,下调最显著的是LEP。有研究发现COL1A2和COL1A1这两条I型胶原在多种类型的肿瘤中均表达异常,可以作为肿瘤治疗的新型分子标志物[6-7]。Omar等[6]研究表明TBX3结合并激活COL1A2启动子,分别在软骨肉瘤和纤维肉瘤细胞中介导TBX3的促迁移和抗迁移作用。Fang等[7]研究提示COL1A1和COL1A2在肺癌和食管癌中的mRNA表达水平高于正常组织,但与肿瘤结节转移无关,I型胶原的低表达与总生存期差和癌细胞分化显著相关。Italiano等[8]研究通过人类基因组芯片和实时荧光定量PCR发现LEP是乳腺癌的显著差异表达基因之一,可以作为肿瘤的新型治疗靶点。Kroll等[9]研究表明脂肪蛋白(ADIPOQ)和瘦素(LEP)基因变异与能量摄入存在关联,表明LEP-rs7799039多态性与能量摄入之间存在正相关。但是关于COL1A2和LEP在去分化脂肪肉瘤中的功能缺乏报道,仍需进一步探讨。
将差异表达基因进行GO功能富集分析及KEGG通路富集分析,结果发现这些基因主要参与代谢和细胞通讯等生物学过程,并且主要涉及脂肪细胞因子通路、AMPK信号通路、PPAR信号通路和调控脂肪细胞分解信号通路。有研究发现AMPK-mTOR通路是平衡细胞代谢过程和调节细胞生长的重要开关,通过激活AMPK可以抑制mTOR通路[10]。Kikuchi等[11]研究发现SCD通过单不饱和脂肪酸调控AMPK信号通路,促进了癌症中的代谢重编程,可作为癌症的潜在治疗靶点。Samovski等[12]研究发现CD36的表达会抑制AMPK信号通路,但同时CD36与脂肪酸的结合会激活AMPK信号通路。在去分化脂肪肉瘤组织中,AMPK通路对于其促进或抑制肿瘤的双重功能需要结合肿瘤的不同发展阶段来考虑。Zhao等[13]研究表明AMPK信号通路的磷酸化底物ULK1是自噬的核心基因之一,可以诱导细胞自噬而发挥抗肿瘤作用。有研究发现铁死亡在多数肿瘤的病理生理过程中发挥着重要作用[14],通过激活AMPK可降低多不饱和脂肪酸的合成,从而抑制铁死亡,促进肿瘤发生[15]。Sultan等[16]研究表明在PPAR-γ信号通路中显著富集的基因PLIN1在乳腺癌中低表达,可以作为乳腺癌早期诊断的新靶点。Lu等[17]研究发现奥利多宁在体外和体内通过激活PPAR-γ通路和抑制Nrf2通路来促进骨肉瘤细胞凋亡,可以作为骨肉瘤的靶向药物。在去分化脂肪肉瘤中,Horvai等[18]研究表明PPAR-γ的免疫表型再结合其他标志物可以方便诊断去分化脂肪肉瘤和其它分化良好的脂肪肉瘤。Kim等[19]研究发现ADIPOQ通过激活AMPK来增加PPAR-α的表达,进而激活PPAR-γ核受体共激活因子PGC-1α,从而调节脂肪代谢和诱导抗癌作用。以上研究结果表明AMPK、PPAR和脂肪细胞因子等信号通路在去分化脂肪肉瘤的发生中可能存在相互作用,仍需要进一步探究。
利用String对差异表达基因构建蛋白互作网络,再通过Cytoscape筛选的10个潜在核心基因,均在去分化脂肪肉瘤中下调表达。Codenotti等[20]研究发现通过一致的脂肪生成分化特征,可将CAV1作为脂肪肉瘤的分子标志物。Taylor等[21]研究发现通过去甲基化能恢复去分化脂肪肉瘤细胞中的CEBPA表达,发挥体外抗增殖、促凋亡及体内抑制肿瘤生长的作用。Straub等[22]研究发现PLIN1可作为脂肪肉瘤与其他软组织肉瘤诊断的潜在治疗靶点。Cytoscape软件预测的潜在核心基因与上述研究中报道的基因比较一致,结果表明这些基因可能是去分化脂肪肉瘤恶性生物学行为中的潜在核心基因。
综上所述,本实验发现了去分化脂肪肉瘤的潜在核心基因均表达下调,并初步分析其相关的生物过程和信号通路,为未来去分化脂肪肉瘤的发病机制和靶向研究提供理论依据。