hsa-miR-92a-3p靶基因预测及生物信息学分析
2022-11-17翁雪婷廖温靖蔡艺煌
翁雪婷,陈 莹,林 双,廖温靖,黄 婕,蔡艺煌
(1.厦门医学院,福建 厦门 361023;2.口腔生物材料福建省高校工程研究中心,福建 厦门 361023)
MicroRNAs(miRNA)是长度约为22个碱基的内源性非编码小RNA分子,可以通过靶向作用抑制或者降解靶mRNA的翻译水平来调节特定靶基因的表达[1]。人类miR-92a(hsa-miR-92a)的编码基因位于13号染色体的长臂上,属于miR-25基因家族。越来越多的研究表明,has-miR-92a-3p参与到多种癌症及疾病的发生发展过程中,如前列腺癌[2]、乳腺癌[3]、肺部内皮细胞损伤和炎性反应[4]以及肺纤维化[5]、过度肥胖[6]、凝血功能障碍[7]等。hsa-miR-92a-3p 参与了多种人类疾病的发生发展过程,对hsa-miR-92a-3p 进行靶基因相关生物信息学分析,为今后进一步深入探索 hsa-miR-92a-3p 功能和作用具有十分重要的指导意义。本研究通过对miR-92a-3p的生物信息学预测分析,筛选出192个hsa-miR-92a-3p的靶基因,并通过构建靶基因集合编码蛋白质间的相互关系网络,获取关键节点靶基因,为进一步深入探究hsa-miR-92a-3p相关分子功能及作为临床诊断和检测靶标提供理论研究基础。
1 材料与方法
利用miRBase(http://www.mirbase.org/)、NCBI(https://www.ncbi.nlm.nih.gov/)、UCSC (http://genome.ucsc.edu/)等在线数据库查找miR-92a-3p的染色体定位、碱基序列、物种保守性等基础信息。然后使用miRGator(http://mirgator.kobic.re.kr/)查看miR-92a-3p在不同疾病中的表达丰富度。再通过miRDB(http://mirdb.org/)、TargetScan(http://www.targetscan.org/)、Clip-seq(http://mirtarclip.mbc.nctu.edu.tw/)和miRWalk(http://mirwalk.umm.uni-heidelberg.de/)四种在线软件预测miR-92a-3p的靶基因。利用venny2.0在线软件取交集,最终确定miR-92a-3p的靶基因集合范围。利用在线数据库string11.5(http://string-db.org/)查询获得所预测靶基因集合编码蛋白质之间的相互关系网络,并将所得数据导入Cytoscape_3.9.0软件进行蛋白质互作网络图的制作。
将前期韦恩图集合交集得到的靶基因及其分析数据整理格式后导入在线数据库DAVID[DAVID:Functional Annotation Result Summary (ncifcrf.gov)]对靶基因数据进行功能富集GO分析,得到的功能注释相对于背景具有统计意义(P<0.05)。再使用KOBAS3.0(http://kobas.cbi.pku.edu.cn/kobas3)对4个数据库预测的靶基因交集(共192个基因)进行KEGG信号转导通路富集分析,以P<0.01作为差异有统计学意义的标准。
2 结果与分析
2.1miR-92a-3p 定位及序列保守性分析:通过在线检索miRBase、UCSC数据库,确定hsa-miR-92a-3p基因序列号为MIMAT0000092,位于13q31.3的染色体区域内(见图1),基因位点在 chr13:91 351 314~91 351 391。通过miRBase在线数据库检索miR-92a-3p的成熟序列,结果显示,在33 个不同物种中存在高度保守的成熟序列。在对不同物种的miR-92a-3p序列进行比对分析,发现 miR-92a-3p 的成熟序列“UAUUGCACUUGUCCCGGCCU”在人、猕猴、小鼠、山羊、眼镜王蛇、绿海胆等多物种之间具有高度的保守性(见表1)。
图1 miR-92a-3p 在人类基因组中所处的位置
表1 不同物种miR-922-3p成熟序列
2.2hsa-miR-92a-3p在人类各组织的表达分析:利用miRGator 3.0在线数据库查找miR-92a-3p在不同人体疾病中的表达情况,其中在乳腺顶浆分泌癌、乳腺癌、乳腺导管原位癌、乳腺化生、淋巴瘤、鼻咽肿瘤、牛皮癣、黑色素瘤中表达丰富(见图2)。
图2 miR-92a-3p 在人类基因组中所处的位置
2.3miR-92a-3p 的靶基因预测:通过TargetScan、miRDB、Clip -Seq、miRWalk 4种公共数据库分别预测出了1 041、985、2 019、50 420个靶向调控基因,利用venny2.0取交集后最终确定192个预测交集靶基因,占各软件预测到的靶基因总数的 1.3%(见图3)。
图3 miR-92a-3p的预测靶基因
2.4靶基因编码蛋白质间的互相作用预测:将4个数据库预测到的靶基因取交集后,将数据导入到String11.5公共数据库在线分析靶基因编码蛋白质间的相互关系,然后再把String11.5分析结果导入Cytoscape_v3.9.0软件绘制PPI图,结果显示,miR-92a-3p的靶基因编码蛋白质之间具有复杂的蛋白质互作关系,尤其是靶基因PTEN、ITPR1、MAPK8、FBXW7、KAT2B、SMAD7的编码蛋白质在Cytoscape_v3.9.0中利用算法分析相关度高且在整个网络中处于关键节点位置(见图4)。
图4 miR-92a-3p 预测靶基因所编码蛋白质间的相互作用分析
2.5miR-92a-3p靶基因KEGG分析:对4个数据库都预测到的192个靶基因进行KEGG信号转导通路富集性分析,发现miR-92a-3p的靶基因显著富集在PI3K-Akt signaling path way、FoxO signaling pathway、Cellular senescence等信号通路中(P<0.01,见表2)。
表2 miR-92a-3p预测靶基因的KEGG分析结果
2.6miR-92a-3p靶基因GO分析:对4个在线数据库所预测到的192个靶基因进行GO功能富集分析,发现miR-92a-3p的靶基因显著富集在细胞质、细胞核、核质、内质网等10个细胞组件(P<0.05),参与细胞增殖、细胞分化、细胞周期蛋白质的合成等生物过程(P<0.05)(见图5)。
图5 miR-92a-3p 预测靶基因的GO功能注释结果
3 讨论
本研究通过对不同物种的has-miR-92a-3p的序列对比发现,序列 UAUUGCACUUGUCCCGGCCU 在16个物种中保持高度保守性,说明has-miR-92a-3p在进化过程中具备稳定性,保守性[8],以此提示has-miR-92a-3p可能在参与机体正常生理和病理的生物学功能过程中发挥重要的作用。
本研究推测PTEN、MAPK8、KAT2B、ITPR1为此蛋白质互作网络的中心节点蛋白质,因此我们推测这4个中心节点基因可能在has-miR-92a-3p调控的生物学效应中发挥着重要的作用。进一步对这些中心节点基因进行生物学功能分析,发现中心节点基因所参与的分子生物功能过程包括转移酶的合成、细胞周期、生物节律、配体结合、细胞凋亡、核苷酸合成过程等。大量研究发现has-miR-92a-3p在多种肿瘤中异常表达,表明其在肿瘤的发生发展过程中发挥的重要的作用。has-miR-92a-3p在乳腺癌[9]、胃癌[10]和食道癌[11]中表达上调,从而促进了癌细胞的增殖、迁移和侵袭。另有研究表明,has-miR-92a-3p在前列腺癌中被IncRNA FER1L4结合,从而上调FBXW7,抑制前列腺癌细胞的增殖和存活[12]。has-miR-92a-3p还被证实可通过作用PTEN而调节其下游PTEN/AKT通道来促进癌细胞转移和上皮间充质转化[13]。
近年来,许多研究发现has-miR-92a-3p能够通过PI3K-Akt信号通路影响肿瘤发生发展。杨槟伊研究[14]表明has-miR-92a-3p可以通过将PTEN作为靶目标调节其表达,进而调控PI3K-Akt信号通路来促进神经母细胞瘤的增殖、浸润和转移等的恶性发展;刘宇等对比正常胰腺导管上皮细胞和胰腺癌细胞发现,has-miR-92a-3p通过靶向抑制PTEN的表达,进而促进胰腺癌细胞的增殖和迁移[15];Hang等人揭示has-miR-92a-3p可以靶向调控CDH1和Notch-1影响β-catenin和Akt信号通路,进而在胶质瘤发生发展中有着重要作用,并通过体外下调has-miR-92a-3p证实其下调可抑制胶质瘤细胞恶性肿瘤[16]。特别是Yang等通过对高转移肝癌细胞进行外泌体测序,确定has-miR-92a-3p是肝癌进展的潜在标志物,并发现has-miR-92a-3p能够抑制PTEN激活Akt/Snail信号通路,促进受体癌细胞EMT和肝细胞癌的转移[13]。揭示has-miR-92a-3p可以作为恶性肿瘤发生发展过程中潜在的生物标志物,未来有望应用于临床早期诊断和预后判断。
综上所述,本研究采用生物信息学数据库方法获取了hsa-miR-92a-3p在部分疾病中通过靶基因调控疾病发生发展的生物学功能、基本序列信息、靶向调控基因、靶基因编码蛋白质的相互关系网络图、GO 分析和 KEGG 信号通路分析等的结果,为探究hsa-miR-92a-3p在肿瘤中潜在的分子调控机制提供理论依据,然而本文章预测结果也有待实验的研究来进一步证实。