基于生物信息学筛选染料木素抗骨肉瘤靶基因
2021-05-06郭良煜陈敬腾龚长天施玉博郭卫春
郭良煜,余 铃,陈敬腾,龚长天,施玉博,郭卫春
(武汉大学人民医院 骨科, 武汉 430060)
骨肉瘤(Osteosarcoma,OS)是来源于骨组织的恶性肿瘤,多见于青少年和儿童,发生部位在长骨远端,在早期就容易产生远处转移和侵袭[1-2]。大约15%~20%的患者在早期就诊时可发现转移。肺是最常见的转移部位,占转移疾病的85%以上,而骨骼是远处转移的第二常见部位。近几年来化疗药物的使用虽然提高了骨肉瘤患者的生存率和生活质量,但患者对化疗药物产生的耐药性和较高的毒副作用仍然是难解决的问题[3]。 因此,急需新的药物进行治疗。
染料木素(Genistein)是一种天然存在于水果、坚果和大豆中的物质,前期的许多研究表明了它能有效的抑制乳腺癌、前列腺癌、肝癌、卵巢癌、膀胱癌、胃癌,脑癌以及神经母细胞瘤和慢性淋巴细胞白血病的活性[4]。同时染料木素也能够通过抑制炎症、促进细胞凋亡、调节类固醇激素受体和代谢途径等方面来降低肿瘤细胞的活性和数量[5]。染料木素的抗肿瘤能力在许多癌症中都得等到了体现,但在骨肉瘤的研究中却很少见。
近几年来开始使用生物信息学的方法来筛选药物可能作用的靶基因,在通过靶基因与肿瘤之间的关系来评价药物对肿瘤是否有作用,例如利用生物信息学预测白黎芦醇作用于前列腺癌的靶基因[6];用生物信息学方法来筛选对乳腺癌治疗有用的药物和它们的靶基因[7]。本研究在DrugBank 数据库筛选染料木素作用的靶基因。经过一系列方法筛选出CXCL8,CXCL12,LPAR1和CNR1;hsa-miR-23b-3p,hsa-miR-23a-3p,hsa-miR-141-3p和hsa-miR-200a-3p作为染料木素在骨肉瘤中最重要的靶基因,对于靶向治疗的前景具有重要价值。
1 材料与方法
1.1 选择药物相关的靶基因
DrugBank数据库(https://www.drugbank.ca/)是一个全面的、可以免费访问的、包含药物和药物靶基因的在线数据库。它是生物信息学和化学信息学的详细来源,它将药物数据和药物靶标的信息相结合,它总共包含13 494种药物,其中包括2 638种已经批准的小分子药物,1 367种批准的生物制剂(蛋白质,多肽,疫苗和能引起过敏的过敏原),131种营养药品和至少6 347种正进行实验的药物[8]。用DrugBank用于搜索与染料木素相关的靶基因。
1.2 构建PPI网络和筛选关键基因
String数据库(https://string-db.org/cgi/input.pl)是构建蛋白质和蛋白质相互作用网络(PPI)的常用数据库,同时可以预测蛋白质与蛋白质之间的关系,将基因上传至String数据库,从而构建蛋白质与蛋白质的互作网络图[9]。Cytoscape软件是一款可以将PPI可视化的软件,并且具有多种功能强大的插件,可以继续对PPI进行后续的分析和编辑。将与染料木素有关的基因导入到string数据库中,单个基因连接数不超过35个同时基因与基因之间的关联最低为0.7。随后将string数据库中得到的数据导入到Cytoscape(http://www.cytoscape.org/)中得到PPI图。随后用插件CytoHubba来对PPI网路进行相互作用分析,筛选出排名前25的关键基因。
1.3 Kyoto encyclopedia of genes and genomes (KEGG)分析
WebGestalt (http://www.webgestalt.org)和DAVID数据库相似,是一个全面的进行GO和KEGG功能分析的网站[10],更新比DAVID及时。将25个关键基因导入到WebGestalt数据库中,以P<0.05为基准筛选信号通路,最终选出10个基因信号通路。
1.4 数据库验证关键靶基因
HCMDB (Human Cancer Database)是一个用于存储和分析肿瘤的数据库。从GEO和TCGA中收集了124个以前发表的转录组数据集。它包含了29种癌症类型。将得到的关键靶基因输入HCMDB中进行验证。
1.5 预测靶基因的miRNA和验证
将验证后的靶基因输入到miRDB数据库中,miRDB数据库是可以进行mRNA和miRNA预测的数据库,筛选条件为target score≥80。随后将得到的miRNA在GSE65071数据库中进行验证。
2 结果分析
2.1 与染料木素相关的靶基因
表1详细展示了染料木素在DrugBank里的信息,是属于小分子物质,分子量为270.236 9,同时它可以抑制蛋白酪氨酸激酶和拓扑异构酶-II(DNA拓扑异构酶,II型)的活性,所以可以作为抗肿瘤的药物。在实验上,它已经显示出在人和鼠细胞系中可以诱导G2期停滞,而阻滞细胞周期也是诱导凋亡的一个重要途径,目前正在进行前列腺癌的研究,表2展现出了与染料木素有关的13个基因,分别是ESR2,TOP2A,PTK2B,NCOA1,ESR1,NCOA2,ESRRA,ESRRB,NR1I2,AKT1,GPER1,CYP1B1和SHBG,在其中选择对基因作用仍不是很明确的靶基因,因此,最终选出11个与染料木素有关的靶基因。
2.2 染料苏木靶基因PPI图和相关基因
将所选取的11个靶基因导入string数据库中,随后删除重复的蛋白,得到了284个与11个靶基因有关的基因(见图1a),用Cytoscape插件中的CytoHubba来分析,得出在PPI网络图中排名前25的基因,这25个基因就是关键基因(见图1b),分别为CXCL8,GRM4,GPER1,OPRK1,GRM7,OPRD1,SST,GRM3,LPAR1,CXCL12,GRM8,CASR,GPR37,GPR17,GPR18,GRM6,CNR1,DRD2,APP,BDKRB2,KNG1,OPRL1,PNOC,DRD3,AGT。
表1 染料木素在DrugBank里的信息Table 1 Information on genistein in DrugBank
图1 PPI图和25个关键基因Fig. 1 PPI network and 25 key genes
表2 染料木素的靶基因信息Table 2 Target gene information of genistein
2.3 KEGG分析
将25个关键基因导入到WebGestalt中,以P<0.05为基准筛选出信号通路,最终得到了10个与关键基因有关的信号通路(见图2),分别为神经活性配体-受体相互作用(Pvalue为7.016 609 515 630 98×10-14);磷脂酶D信号通路(Pvalue为1.259 889 412 796 86×10-7);谷氨酸能突触(Pvalue为1.623 606 752 154 67×10-5);可卡因成瘾(Pvalue为8.957 925 689 391 24×10-3);Rap1信号通路(Pvalue为2.163 675 640 824 39×10-2);补体途径(Pvalue为2.225 309 023 143 79×10-2);肌动蛋白细胞骨架的调节(Pvalue为2.361 391 695 821 74×10-2);细胞间隙连接(Pvalue为2.721 187 625 285 12×10-2);类风湿性关节炎(Pvalue为2.836 966 674 350 58×10-2);NF-kappa B信号通路(Pvalue为3.135 002 865 670 41×10-2)(见表3)。在这些通路中,NF-kappa B和Rap1信号通路在骨肉瘤中研究较多,例如骨肉瘤差异基因的分析也证实了差异基因主要存在于Rap1信号通路[12],同时也有文献证实了类黄酮B可以通过抑制NF-kappa B信号通路从而使得骨肉瘤细胞对阿霉素的敏感性提高[13]。因此,选取这两个信息通路所在的基因,进行下一步的分析。
图2 KEGG富集分析结果Fig.2 Results of KEGG enrichment analysis
2.4 验证靶基因
将最后得到的5个靶基因输入HCMDB数据库中进行验证,最后发现4个基因在骨肉瘤中具有统计学差异,分别是CXCL8,CXCL12,LPAR1和CNR1(见图3)。
表3 KEGG富集分析结果Table 3 Results of KEGG enrichment analysis
图3 CXCL8, CXCL12, LPAR1和CNR1数据库验证(*P<0.05)Fig. 3 Verification of CXCL8, CXCL12, LPAR1, and CNR1 in database(*P<0.05)
2.5 预测靶基因的miRNA和数据库验证
将验证后的4个靶基因利用miRDB进行miRNA预测,筛选标准为与靶基因的target score≥80,得到了mRNA-miRNA调控网络图(见图4)。其中选取与4个靶基因关联程度高的5个miRNA:hsa-miR-23b-3p,hsa-miR-23a-3p,hsa-miR-141-3p,hsa-miR-200a-3p和has-miR-4524a-3p。随后将5个miRNA用GSE65071进行验证,最后得到4个miRNA:hsa-miR-23b-3p,hsa-miR-23a-3p,hsa-miR-141-3p,hsa-miR-200a-3p(见图5)。
图4 mRNA-miRNA调控网络图Fig. 4 Regulation network diagram of mRNA-miRNA
图5 hsa-miR-23b-3p,hsa-miR-23a-3p,hsa-miR-141-3p,hsa-miR-200a-3p在GSE65071验证(*P<0.05)Fig. 5 Verification of hsa-miR-23b-3p, hsa-miR-23a-3p, and hsa-miR-141-3p, hsa-miR-200a-3p in GSE65071(*P<0.05)
3 讨 论
骨肉瘤恶性程度较高,发病率较低但死亡率较高。当前的治疗主要以手术切除加术前术后放化疗为金标准,但治疗效果往往不佳,主要是因为患者的耐受和化疗药物严重的毒副作用[3]。染料木素是一种天然的小分子物质,在前期的研究中已经发现染料木素可以抑制多种肿瘤的活性,诱导肿瘤细胞的凋亡。通过生物信息学的方法来分析染料木素调控骨肉瘤可能的信号通路和可能的靶基因,为后续的基础实验提供理论依据。
首先在DrugBank数据库中选取与染料苏木有关的靶基因,后将与染料苏木有关的靶基因导入到string数据库中进行分析,用Cytoscape中的插件Cytohubb进行分析,获得排名前25的关键基因。随后将这个25个基因导入到WebGestalt数据库中筛选与骨肉瘤相关的通路,将通路中的基因导入HCMDB数据库中进行验证,确认了4个靶基因:CXCL8,CXCL12,LPAR1,CNR1。最后预测4个靶基因的miRNA并进行验证,得到4个miRNA:hsa-miR-23b-3p,hsa-miR-23a-3p,hsa-miR-141-3p,hsa-miR-200a-3p。
以上4个靶基因都与骨肉瘤之间有关,前期研究报道了CXCL8通过调节PI3K / Akt信号通路促进人骨肉瘤细胞的侵袭和转移[14];而 CXCL12/ CXCR4轴在骨肉瘤原发性肿瘤的生长和转移中存在重要的作用,特别是肺转移[15]。研究发现单酰基甘油脂肪酶抑制剂JZL184可以抑制骨肉瘤所造成的骨溶解现象,可能是通过调控CNR1进行的[16]。而用顺铂处理后的骨肉瘤MG63细胞中发现LPAR1的表达明显减低,证实LAPR1也和骨肉瘤的发生发展有关[17]。miR-23b-3p可以通过抑制PGC1α从而促进骨肉瘤增殖从[18];miR-141-3p是骨肉瘤中 EGFR通路的关键负调控因子,影响骨肉瘤的发生发展[19];另外两种miRNA虽与骨肉瘤无直接相关,但这两种miRNA在骨肉瘤中表达均有统计学差异,且两种miRNA可调节肿瘤的发展[20-21]。因此,以上分析中所得到的4个靶基因和4个miRNA都与骨肿瘤有着联系,可以作为骨肉瘤潜在的靶基因。为以后对骨肉瘤的基础实验提供了理论依据,同时也为染料木素治疗骨肉瘤增加了靶基因并且提供了理论支持。
4 结 论
通过对染料木素中11个靶基因有关的基因进行生物信息学分析,探讨染料木素对骨肉瘤潜在的作用靶基因。运用STRING、WebGestalt,cytoscape和HCDMB以及miRDB数据库进行分析,发现CXCL8,CXCL12,LPAR1,CNR1以及hsa-miR-23b-3p,hsa-miR-23a-3p,hsa-miR-141-3p,hsa-miR-200a-3p基因可能是骨肉瘤的潜在靶基因。不仅能促进骨肉瘤研究的进展,也可以老药新用,提供新的药物治疗靶点,进而扩大药物的适用范围。