人类miR-146a-5p靶基因预测及生物信息学分析
2021-03-05朱洪怡
王 道,朱洪怡,楚 毅*
(中南大学湘雅二医院 a. 妇产科;b. 消化内科,长沙 410011)
微小RNA(microRNA,miRNA)是一类由18到22个核苷酸组成的短RNA分子[1],可以调节转录后基因的表达并且促进个体发育、细胞分化、机体炎症、免疫反应和癌变[2-6]等过程。这些分子通过与相应的mRNA相互作用从而形成沉默复合体(RNA-induced silencing complex,RISC),能够结合到3'非翻译区(3'-untranslated region,3'-UTR)的互补序列,引起表达失调进而破坏信号传导途径增加人类患疾病的风险[7]。此外,许多研究报告表明miRNA是基因表达的关键调节剂,将可能成为生物标记物的候选者[8]。
人类miR-146a-5p(hsa-miR-146a-5p)自2006年被David Baltimore实验室在小鼠中鉴定发现后,其功能被一些研究证实在多种类型的癌症中起抑制基因的作用[9-10]。但是,还有研究表明miR-146a-5p在多种类型的癌症中起癌基因作用[11-12]。目前研究人员仍然对miR-146a-5p引起肿瘤的分子机制非常感兴趣,如Li等[13]对miR-146a-5p在各种恶性肿瘤中的预后价值进行全面荟萃分析,提出miRNA可能是早期预测癌症的突破口。
本研究中我们采用多种生物信息数据库提取hsa-miR-146a-5p的靶基因数据交集,并对其进行全面的基因本体(gene ontology,GO)注释分析和京都基因与基因组百科全书(Kyoto Encyclopedia of genes and genome,KEGG)通路富集分析,为未来对miR-146a-5p的靶基因分类鉴定及其在疾病中扮演的角色提供新的研究线索。
1 材料与方法
1.1 hsa-miR-146a-5p的定位和序列保守性的预测分析
利用UCSC(http://genome.ucsc.ed)等在线数据库查找hsa-miR-146a-5p的碱基序列、染色体定位、物种保守性等基本信息;miRbase(http://www.miR-base.org/)在线数据库搜寻hsa-miR-146a-5p在染色体的分布位置;使用Clustal Omega软件分析16个不同物种如智人(Homo sapiens)、黑猩猩(Pan troglodytes)、小家鼠(Mus musculus)、褐家鼠(Rattus norvegicus)、青鳉(Oryzias latipes)、家兔(Oryctolagus cuniculus)等的成熟序列的碱基信息并预测其保守性(表1)。
1.2 hsa-miR-146a-5p在人类不同组织中的表达分析
运用miGator v3.0数据库(http://mirgator.obic.re.kr/)检索hsa-miR-146a-5p在人类不同组织器官中的表达量,并且进行预测分析。该数据库的测序数据均来自已发布的肿瘤基因图谱(The Cancer Genome Atlas,TCGA)等的多个人类miRNA数据集。
1.3 hsa-miR-146a-5p靶基因以及编码蛋白质间的相互作用分析
通过最新版PubMed(https://pubmed.ncbi.nlm.nih.gov/)检索近年来发表文献得出,hsa-miR-146a-5p在转录后水平上介导调控相应的靶基因,涉及参与了一系列疾病的发展和预后疗效的评价(表2)。采用 Targetscan7.1(http://www.targetscan.org /vert71/)、miRDB(http://www.mirdb.org/)、mirDIP(http://ophid.utoronto.ca /mirDIP /index confirm.jsp)和DIANA TOOLS(http://diana. Imis. athena-innovation.gr/Diana-Tools/index.php)4个在线靶基因预测工具预测靶基因,并用Venny 2.1(http://bioinfogp.cnb.csic.es/tools/venny /index.html)绘制4个数据库预测靶基因的韦恩图,取交集作为下一步靶基因数据集。将此数据集导入String 11.0数据库(http://www.string-db.org)进行蛋白互作预测分析,然后结合Cytoscape-v3.6软件构建靶基因编码的蛋白间相互作用(protein-protein interaction,PPI)网络图。
1.4 hsa-miR-146a-5p靶基因的GO注释分析和KEGG富集分析
运用Omicshare平台工具(http://www.omicshare.com/)对韦恩图的交集靶基因进行GO注释分析。基于超几何分布计算原理,从基因功能的3个方面:细胞组分(cellular component,CC)、分子功能(molecular function,MF)、生物学过程(biological process,BP),得到具有统计学意义的GO注释显著性分析(P<0.05)。同时,利用KOBAS数据库(http://kobas.cbi.pku.edu.cn)对交集靶基因进行KEGG通路相关的具有统计学意义的富集分析(P<0.05为显著性阈值)。
2 结果与分析
2.1 hsa-miR-146a-5p的定位和序列保守性分析
在线检索miRBase、UCSC数据库发现hsa-miR-146a-5p基因序列号为MIMAT0000449,定位于人类基因组chr5q33.3染色体(图1),其基因位点在chr5:160 485 373~160 485 393之间。通过miR-Base 在线数据库检索miR-146a-5p成熟序列,结果显示,已知的22个不同物种中存在成熟序列。我们下载了智人、小家鼠、褐家鼠、青鳉、家兔等16个不同物种的成熟序列(图2)。Clustal Omega软件预测结果表明,hsa-miR-146a-5p成熟序列“UGAGAACUGAAUUCCAUGGGUU”在16个物种之间具有高度的保守性(表1),提示hsa-miR-146a-5p可能具有潜在的生物学功能。
图1 hsa-miR-146a-5p在人类基因组中所处的位置Fig. 1 The location of hsa-miR-146a-5p in the human genome
图2 不同物种miR-146a-5p的成熟序列Fig. 2 Mature sequence of miR-146a-5p in different species
2.2 hsa-miR-146a-5p在人类各组织的表达分析
hsa-miR-146a-5p在人体部分组织器官的表达情况见图3,其中在淋巴细胞表达丰富程度最高,但是在其他组织中的表达量很低。
2.3 hsa-miR-146a-5p的靶基因预测结果
利用新版PubMed、EBSCO快速全面检索相关文献,纳入结果的文献表明hsa-miR-146a-5p调控相应的靶基因参与了多种疾病以及多条信号通路(表2)。选用TargetScan、miRDB、mirDIP和DIANA TOOLS 4个在线数据库预测的靶基因个数分别为283、488、828和853。最后通过在线软件Venny2.1对上述4个数据集合绘制韦恩图推导靶基因交集(图4),以备后续数据分析,具体见表3。
表1 不同物种miR-146a-5p成熟序列Tab. 1 Mature sequence of miR-146a-5p in different species
表2 hsa-miR-146a-5p调控的靶基因参与人类疾病Tab. 2 hsa-miR-146a-5p target genes involved in human disease
图3 hsa-miR-146a-5p 在各个组织器官中的表达情况Fig. 3 Expression analysis of hsa-miR-146a-5p in organs
表3 hsa-miR-146a-5p调控的靶基因数据集Tab. 3 Target gene data sets regulated by hsa-miR-146a-5p
2.4 靶基因编码蛋白质间的相互作用预测
将4个数据库预测到的靶基因交集导入String 11.0,分析靶基因编码蛋白质间的相互作用。然后,将String11.0分析结果结合Cytoscape_v3.8.0软件构建PPI图。PPI结果显示,hsa-miR-146a-5p的靶基因编码蛋白质间形成了复杂的网络互作图。红色连线代表比绿色打分相对较高,说明蛋白相互作用更强;蓝色圆圈代表靶基因编码的蛋白节点(图5)。
2.5 hsa-miR-146a-5p的GO注释分析
将韦恩图交集得到的73个靶基因格式整理后提交到Omicshare Tools平台。GO注释分析结果表明:hsa-miR-146a-5p靶基因主要富集于细胞,包括细胞器、细胞膜及附近区域等14个细胞组分;涉及到22个生物学过程,包括细胞合成及代谢、应激反应、信号通路、正或负调控发育等;显著富集于染色质结合、转录活性激活、结构分子活性激活、催化活性激活、转录因子活性配体激活等9个分子功能(图6)。
图4 hsa-miR-146a-5p的预测靶基因个数Fig. 4 Predicted number of target genes of hsa-miR-146a-5p
图5 hsa-miR-146a-5p 预测靶基因所编码蛋白质间的相互作用分析Fig. 5 Protein-protein interaction network of the target genes of hsa-miR-146a-5p
2.6 hsa-miR-146a-5p预测靶基因的KEGG通路分析
以人类全基因组为背景基因,利用KOBAS数据库进行KEGG信号通路富集分析。Top 10 KEGG结果表明,hsa-miR-146a-5p 靶基因主要富集在Toll样受体(Toll-like receptors,TLRs)信号通路、核转录因子-κB(nuclear factor-κB,NF-κB)信号通路、视黄酸诱导基因I样受体(retinoic acid-inducible gene I like receptors,RLRs)信号通路中,以及包括病毒性乙肝、丙肝、疟疾等疾病的相关通路中(P<0.05)(图7)。
图6 hsa-miR-146a-5p 靶基因的GO注释分析Fig. 6 GO function analysis of hsa-miR-146a-5p target gene
图7 hsa-miR-146a-5p靶基因的KEGG通路富集分析Fig. 7 KEGG pathway enrichment analysis of hsa-miR-146a-5p target gene
3 讨论
近年来,hsa-miR-146a-5p在癌症、炎症中的差异表达已经得到广泛的研究[14-19],它是一种多效调节因子,但在一系列癌症、炎症反应中的作用尚未完全被人们了解[20-21]。目前,也缺乏对hsa-miR-146a-5p 潜在靶点和相关功能通路的全面分析。生物信息学能够快速预测miRNA靶基因,同时将数据库预测的靶基因取交集,具有更好的可靠性。在本研究中,我们不仅探讨了hsa-miR-146a-5p的预期靶标集,还对其相关的富集功能进行了分析研究。
本研究分析发现miR-146a-5p的成熟序列在16个不同物种之间高度保守,推测hsa-miR-146a-5p可能具有重要的生物学功能,在机体中进行相关基本生理活动。同时,韦恩图交集得到总共73个hsa-miR-146a-5p的靶基因,靶基因富集于细胞,包括细胞器、细胞膜及附近区域等14个细胞组分中。hsa-miR-146a-5p的靶基因显著富集在机体代谢、炎症刺激的免疫系统反应、信号传导、发育过程以及正向或负向调控生物学等过程;同时,其也显著富集在TLRs信号通路、NF-κB信号通路、RLPs信号通路等通路中。TLRs和RLPs是关键的先天免疫模式识别受体,一些研究发现miR-146a-5p能通过TLRs通路途径诱导炎症反应。例如Xu等[22]发现宿主细胞的miR-146a-5p能够通过TLR7-MyD88介导细胞因子的产生;Feng等[23]运用miRNA芯片证实miR-146a促使白细胞的迁移;Hou等[24]揭示miR-146a在病毒感染过程中被上调,通过靶向TRAF6和IRAK1/2抑制视黄酸诱导基因I(retinoic acidinducible gene I,RIG-I)依赖性抗病毒信号途径;Zhu等[25]和Meng等[26]在口腔癌、胰腺癌等临床研究中证实了miR-146a-5p/NF-κB轴的重要调节机制。此外,miR-146a-5p对促进乙型肝炎病毒(hepatitis B virus, HBV)和丙型肝炎病毒(hepatitis C virus,HCV)的复制有积极影响,具有诱导肝损伤和癌变的发生风险[27-28]。特别是Van Loon等[29]报道miRNA-146a参与了针对疟疾的先天免疫,推测它具有可能成为药物靶标的潜力。
然而,hsa-miR-146a在不同类型肿瘤中异常表达的功能机制仍然不清楚。尽管Forloni等[30]揭示了miR-146a在黑色素瘤中高度上调可以促进肿瘤发生 ;Zhang等[31]报道miR-146a-5p在肝细胞癌中被下调并起抑癌的作用;而Huang等[32]在非小细胞肺癌研究中称miR-146a-5p过表达能够抑制癌血管生成和肿瘤的发生。另几项研究还表明[33-34],miR-146a能够通过NF-κB信号途径抑制肿瘤扩散。但迄今为止,学者对hsa-miR-146a-5p的功能仍知晓甚少,因为人类中存在超过30%的基因受miRNA调控,其中miR-146a可以靶向数百个miRNA,并且能够影响参与功能相互作用途径的许多基因的表达,这种影响机制还有待进一步研究。
综上所述,本文综合运用生物信息学数据库,预测和分析hsa-miR-146a-5p的保守性、GO注释分析以及KEGG通路富集分析等方面,从而进一步探讨hsa-miR-146a-5p在肿瘤发生、免疫应答及炎症等中的潜在分子机制,为治疗慢性炎症、疟疾、恶性肿瘤等疾病开辟了新的前景,对临床治疗的新疗法提供了理论基础。