hsa-miR-146a-5p的靶基因预测及生物信息学分析*
2023-09-08李珍珍朱厅厅
李珍珍 张 瑞 刘 霜 伍 磊 朱厅厅 李 兵
贵州大学医学院,贵州省贵阳市 550025
microRNA (miRNA) 是一类高度保守的非编码小分子RNA,越来越多的证据表明,miRNA参与了多种疾病的发生发展过程[1]。miRNA可以通过转录后降解或翻译抑制来调节靶基因表达,主要通过RNA诱导直接降解靶miRNA分子来调控靶基因miRNA的转录,或通过碱基互补配对与靶基因miRNA的3’末端非翻译区(3’-untranslatedregion,3’-UTR) 结合来抑制其翻译表达等方式起调控作用[2]。hsa-miR-146a-5p位于第5号染色体的LOC28628基因中的第二个外显子区。既往研究表明,在多种肿瘤与炎症的发病机制过程中,hsa-miR-146a-5p可能发挥着重要作用[3-4]。本研究拟通过运用生物信息学技术预测hsa-miR-146a-5p的相关靶基因,获取其关键节点靶基因,探索hsa-miR-146a-5p在肿瘤及炎症中发挥的作用,以期为探索hsa-miR-146a-5p在肿瘤和炎症中相关分子功能及作为临床诊断提供一定的理论依据。
1 材料与方法
1.1 hsa-miR-146a-5p的保守性分析 利用UCSC (http://genome.ucsc.edu/)、miRBase (http://www.mirbase.org) 等在线数据库获取hsa-miR-146a-5p的染色体定位、碱基序列、物种保守性等基础信息。使用在线数据库miR-Gator (http://mirgator.kobic.re.kr) 获取hsa-miR-146a-5p在不同人类疾病中的表达丰度。
1.2 hsa-miR-146a-5p的靶基因预测 通过mirDIP (http://ophid.utoronto.ca/)、TargetScan (http://www.targetscan.org)和miRDB (http://mirdb.org) 三种在线数据库预测hsa-miR-146a-5p的潜在靶基因。利用Venny在线软件取交集。再利用miRTarBase (http://mirtarbase.mbc.nctu.edu.tw) 数据库获取已经过实验验证的hsa-miR-146a-5p的靶基因,将预测得到的潜在靶基因和实验证实的靶基因进行合并,最终得到hsa-miR-146a-5p的潜在靶基因用于进行后续的分析研究。
1.3 hsa-miR-146a-5p的靶基因蛋白质互作网络(PPI)分析 利用在线数据库String(https://string-db.org)得到所预测靶基因集合编码蛋白质之间的相互关系网络数据,然后将所得数据整理格式后导入Cytoscape 3.9.0软件进行PPI分析。
1.4 hsa-miR-146a-5p的靶基因KEGG信号通路分析及GO功能注释 将前期预测得到的靶基因及其分析数据导入在线数据库DAVID (https://david.ncifcrf.gov) 对靶基因数据进行KEGG信号转导通路富集分析和GO分析,以P<0.05作为差异有统计学意义的标准,获取有差异的GO生物学过程及KEGG信号通路。
2 结果
2.1 各物种成熟miR-146a-5p序列保守性及染色体定位分析 UCSC数据库查询结果显示,hsa-miR-146a-5p的基因序列号为MIMAT0000449,位于5q33.3染色体区域内 (见图1),利用miRBase数据库获取人(Homo sapiens)、小鼠(Mus musculus)、大鼠(Rattus norvegicus)、黑猩猩(Pan troglodytes)、家犬(Canis familiaris)等十个物种的miR-146a-5p成熟序列。通过对比分析发现miR-146a-5p成熟碱基序列中“UGAGAACUGAAUUCCAUGGGUU”22个碱基在各物种间高度保守,结果见表1。
表1 miR-146a-5p在不同物种中的成熟序列
图1 hsa-miR-146a-5p在人类基因组中的位置
2.2 hsa-miR-146a-5p在人类不同疾病中的表达分析 利用miR-Gator在线数据库查询获得hsa-miR-146a-5p的表达情况:hsa-miR-146a-5p在乳腺侵袭性导管瘤、子宫颈腺鳞癌、急性早幼粒细胞白血病及皮肤肿瘤等疾病中呈现高表达 (见图2)。
图2 hsa-miR-146a-5p在人类各组织的表达分析
2.3 hsa-miR-146a-5p靶基因预测 利用mirDIP、miRDB和TargetScan三个在线数据库得到靶基因个数分别为1 108、488、242个,利用Venny在线软件取交集得到77个靶基因(见图3a)。此外,在miRTarBase数据库中获取已经过荧光素酶报告实验、Western blotting以及RT-qPCR等实验进行验证的靶基因共80个,其中有7个靶基因与上述交集重合 (图3b),由此最终得到150个潜在靶基因集合,用于后续生物信息学分析。
图3 has-miR-146a-5p预测靶基因个数
2.4 hsa-miR-146a-5p靶基因编码蛋白质间的PPI预测 将前述150个潜在靶基因数据导入到String在线数据库分析靶基因编码蛋白质间的相互关系,将分析结果整理格式后导入Cytoscape 3.9.0软件绘制PPI图。结果显示,hsa-miR-146a-5p的靶基因编码蛋白质之间蛋白质互作关系密切,尤其是TLR4、TRAF6、IL6、NFKB1和EGFR等在整个网络中处于关键节点位置 (见图4)。
图4 hsa-miR-146a-5p预测靶基因所编码蛋白质间的互相作用分析
2.5 hsa-miR-146a-5p的靶基因KEGG分析 对前述150个潜在靶基因进行KEGG富集分析,结果发现,hsa-miR-146a-5p的靶基因显著富集在Toll样受体信号通路、乙型肝炎、肿瘤通路、恰加斯病、NF-κB等信号通路、致病性大肠杆菌感染、EB病毒感染、脂质与动脉粥样硬化、利什曼病、耶尔森菌感染、麻疹、酒精性肝病、弓形虫病、人巨细胞病毒感染、沙门氏菌感染、人类免疫缺陷病毒1型感染、百日咳、胰腺癌症、肺结核和TNF信号通路上 (见图5)。
图5 hsa-miR-146a-5p预测靶基因KEGG分析结果
2.6 hsa-miR-146a-5p的靶基因GO分析 对前述150个潜在靶基因从生物过程(Biological process,BP)、细胞组分(Cellular component,CC)、分子功能 (Molecular function,MF) 3个方面进行GO分析。结果显示,这些靶基因主要富集的生物过程包括平滑肌细胞增殖的正调控、MyD88依赖性Toll样受体信号通路、NF-κB转录因子活性的正调节、炎症反应、白细胞介素介导的信号通路、脂多糖介导的信号通路、DNA模板化的转录正调控、I-κB激酶/NF-κB信号传导的正调节、RNA聚合酶Ⅱ启动子转录的正调控和细胞对机械刺激的反应等(见图6)。主要富集的细胞组分为内体膜、细胞核、细胞溶胶、细胞质核周区、细胞质、细胞表面、核质、高分子复合物、CD95死亡诱导信号复合物和染色质等(见图7)。主要富集的分子功能为蛋白质结合、DNA结合、同一蛋白结合、转录辅压子活性、NAD+核苷酸酶,环状ADP核糖生成、NAD(P)+核苷酶活性、锌离子结合、肿瘤坏死因子受体结合、酶结合和染色质结合等(见图8)。
图6 hsa-miR-146a-5p靶基因的生物过程富集分析
图7 hsa-miR-146a-5p靶基因的细胞组分富集分析
图8 hsa-miR-146a-5p靶基因的分子功能富集分析
3 讨论
近年来大量研究发现,miRNA在各种疾病的发生发展中均起着重要的调控作用,在多种疾病的诊断、治疗和预后中发挥了潜在的价值[5]。hsa-miR-146a-5p作为近年来的研究热点,大量研究表明其与肿瘤及炎症存在密切关联[6-8]。目前针对hsa-miR-146a-5p的研究中,涉及的生物学过程、分析功能、信号转导通路等尚不完全清楚。生物信息学方法能通过针对各种网络数据库的获取,达到快速预测miRNA的潜在靶基因及潜在生物学功能的目的,目前已广泛运用于基因功能预测研究[9]。本研究通过利用生物信息学的研究方法,对hsa-miR-146a-5p的潜在作用靶点及其相关功能和信号通路进行全面分析。
本次研究首先通过对不同物种hsa-miR-146a-5p的序列对比发现,miR-146a-5p在多个物种中保持高度保守性,该结果表明hsa-miR-146a-5p可能在调控肿瘤和炎症生物学过程中发挥着重要的作用。接下来,利用目前国内外各种研究中常用的miRNA靶基因预测工具对hsa-miR-146a-5p潜在靶基因进行预测。因miRNA靶基因预测数据库较多,为了提高预测结果的准确性和可靠性,使用最常用的TargetScan、miRDB、mirDIP数据库分析hsa-miR-146a-5p的潜在靶基因,并通过取交集的方式获取在三大数据库中均存在的潜在靶基因。同时,也获取了miRTarBase数据库已经过荧光素酶报告实验、Western blotting以及RT-qPCR实验验证过的hsa-miR-146a-5p靶基因,二者取并集后,便获得了无重复的150个潜在靶基因。
本研究通过预测hsa-miR-146a-5p的潜在靶基因得到其靶基因蛋白质互作网络的中心节点蛋白质为TLR4、TRAF6、EGFR、NFKBI、IL6,由此推测在hsa-miR-146a-5p调控的生物学效应中上述五个中心节点基因发挥重要作用。其中,对于TLR4、TRAF6和EGFR,目前研究已经通过荧光素酶报告实验、Western blotting以及RT-qPCR实验验证其为hsa-miR-146a-5p直接结合的靶基因。在大鼠腰椎间盘突出症模型中过表达miR-146a-5p可以降低TLR4信号通路的活性和促炎因子的释放,这可能是治疗腰椎间盘突出症的潜在策略[10]。在系统性红斑狼疮的研究中发现,hsa-miR-146a-5p下调后TRAF6的表达增高,促进狼疮性肾炎的发生[11]。还有研究表明,隐丹参酮可以通过has-miR-146a-5p/EGFR轴,从而抑制非小细胞癌的增殖[12]。这些研究均表明,hsa-miR-146a-5p很可能通过多靶点的方式在肿瘤和炎症中发挥着重要的生物学效应。对于NFKB1和IL6,目前国内外尚缺乏相应的研究直接明确证实其为has-miR-146a-5p的直接靶向调控基因,需要后期通过细胞或动物实验进行证实。
据本次对hsa-miR-146a-5p靶基因的KEGG分析发现,hsa-miR-146a-5p下游靶基因富集的前20条KEGG通路均与肿瘤及炎症相关。其中,肿瘤相关通路有2条,即肿瘤通路、胰腺癌;炎症中尤以感染类炎症最为显著,感染类炎症相关通路有14条,即乙型肝炎、EB病毒感染、致病性大肠杆菌感染、利什曼病、鼠疫感染、人巨细胞病毒感染、人类免疫缺陷病毒1型感染、沙门氏菌感染、恰加斯病、麻疹、酒精性肝病、肺结核、百日咳、弓形体病信号通路;其余炎症相关通路有4条,即Toll样受体信号通路、NF-κB信号通路、TNF信号通路、脂质与动脉粥样硬化。
在对hsa-miR-146a-5p靶基因的GO富集分析的结果中,前20条生物过程里面有13条与炎症反应相关,分别是MyD88依赖性Toll样受体信号通路、NF-κB转录因子活性的正调节、炎症反应、白细胞介素介导的信号通路、脂多糖介导的信号通路、I-κB激酶/NF-κB信号传导的正调节、细胞对机械刺激的反应、JNK级联、细胞对缺氧的反应、白细胞介素-6产生的正调节、白细胞介素-8产生的正调节、白细胞黏附血管内皮细胞的正调节、NF-κB诱导激酶活性的激活等。
既往发现hsa-miR-146a-5p在多种肿瘤及炎症中发挥作用[13]。在肿瘤方面,hsa-miR-146a-5p可以通过靶向TRAF6的3’-UTR抑制胰腺导管腺癌细胞增殖并使其对吉西他滨化疗敏感[14]。hsa-miR-146a-5p可抑制结直肠癌细胞增殖,诱导结直肠癌细胞凋亡,抑制细胞迁移,降低p-ERK表达[15]。在炎症方面,有研究表明源自人脐带间充质干细胞产生的外泌体中的hsa-miR-146a-5p可以减轻小胶质细胞介导的神经炎症反应[16]。同时研究证实,骨髓间充质干细胞的外泌体中的miR-146a-5p可通过下调NFAT1和IRAK1的表达,进而减少神经元凋亡以及与抑制小胶质细胞M1极化相关的炎症,从而在脑出血后提供神经保护和功能改善[17]。hsa-miR-146a-5p还可通过调节TXNIP的表达,抑制骨关节炎软骨损伤中的细胞增殖,促进细胞凋亡和炎症反应[18]。研究还表明hsa-miR-146a-5p可能通过抑制TRAF6/NF-κB信号通路影响子痫前期母胎界面的炎症反应[19]。这些研究和本文结果共同表明,hsa-miR-146a-5p很可能在肿瘤及炎症的发生发展中起着重要的作用。
综上所述,本文通过综合运用生物信息学的方法,预测和分析hsa-miR-146a-5p的物种保守性、hsa-miR-146a-5p的潜在靶基因、靶基因的蛋白质互作分析、靶基因的KEGG通路富集分析以及GO注释分析等方面,从而进一步探索hsa-miR-146a-5p在肿瘤、炎症等中的潜在作用靶点及通路。本研究为将来探索hsa-miR-146a-5p与肿瘤和炎症发展进程关系提供了初步的理论依据,但本研究所得的结果还需进行体外及体内的实验研究来进一步证明。