hsa-miR-200c-3p的靶基因预测及生物信息学分析*
2022-12-23王栋洋
苏 倩 郑 宏 王 娟 王栋洋,2
1 湘南学院临床学院,湖南省郴州市 423000; 2 湘南学院附属医院
MicroRNA(miRNA)是一类内源性的非编码单链小分子RNA,通过与靶基因mRNA的3’端非编码区结合降解靶基因mRNA或者阻碍其翻译。近年来miRNA在人类疾病中的作用不断被揭示,尤其是恶性肿瘤[1]。miR-200c-3p是miR-200家族的重要成员,现有文献资料多支持它与肿瘤密切相关[2]。研究显示, miR-200c-3p在肾癌[3]、甲状腺癌[4]、胃癌[5]等肿瘤中表达异常,并参与肿瘤进展,有望成为这些肿瘤的治疗靶点及预后生物标志物。然而,目前对miR-200c-3p的研究尚浅,涉及的生物学过程和信号通路不完全清楚,针对其功能和作用机制研究具有重大现实意义。因此,本研究通过生物信息学方法对miR-200c-3p的靶基因集合进行功能注释和信号通路分析,为后续验证靶基因及其作用机制研究提供思路。
1 资料与方法
1.1 保守性分析 miRBase数据库(http://www.mirbase.org/)是一个可供检索的已发表的miRNA序列和注释数据库。从数据库中获取miR-200c-3p的染色体定位、碱基序列等信息,进行保守性分析。
1.2 hsa-miR-200c-3p在组织器官和疾病中的表达分析 miRGator 3.0数据库(http://www.mirgator.kobic.re.kr/)是深度测序时代的microRNA门户,包括microRNA多样性、表达谱、靶关系和各种支持工具,收集了73个人类样本的深度测序数据集,包含41亿条短序列和25亿条匹配过的序列。通过miRGator v3.0数据库,获取hsa-miR-200c-3p在不同组织器官和疾病中的表达数据。
1.3 预测靶基因 选择miRDB(http://mirdb.org)和TargetScan 7.2 (http://www.targetscan.org/ vert _72/)在线软件预测hsa-miR-200c-3p靶基因,取其交集。从miRTarBase数据库(https://mirtarbase.cuhk.edu.cn/)提取已通过荧光素酶报告基因检测、Western blot和qPCR等强有力证据验证的靶基因。将预测的靶基因数据交集与实验已证实的靶基因合并,最终确定的靶基因集合用于后续分析。
1.4 GO和KEGG通路富集分析 利用DAVID 6.8(https://david.ncifcrf.gov/)数据库对靶基因集合进行功能富集分析和信号转导通路富集分析。借助数据库软件附带的Fisher Exact Test计算P值,以P<0.05 为显著性阈值得到具有统计学意义的生物学过程和信号转导通路。
2 结果
2.1 miR-200c-3p的定位及保守性分析 miRbase数据库查询结果显示,miR-200c-3p位于人染色体12p13.31区域。人类miR-200c-3p与褐家鼠、家鼠、家兔、猕猴、斑马鱼等10个物种的miR-200c-3p在碱基序列“AAUACUGCCGGGUAAUGAUG”区域具有高度相似性,表明miR-200c-3p在不同物种间高度保守。见表1。
表1 不同物种miR-200c-3p的成熟序列
2.2 hsa-miR-200c-3p的表达情况 结果显示hsa-miR-200c-3p在不同器官中存在表达差异,其中在膀胱、胃肠道、脑、四肢、肺、前列腺等组织中表达丰度较高(见图1)。与正常组织相比,hsa-miR-200c-3p在膀胱癌、卵巢癌、肺癌、前列腺癌等疾病表达水平较高(见图2)。
图1 hsa-miR-200c-3p在器官中的表达情况
2.3 靶基因的筛选 miRDB和Targetscan 7.2软件预测hsa-miR-200c-3p靶基因分别为1 244个和44个,取其交集共获得27个基因。结合miRTarBase数据库查询的已通过双荧光素酶报告基因、Western blot、qPCR方法中至少经两种实验证实的靶基因共53个,其中有1个靶基因(KDR)与上述预测靶基因重合,最终获得79个无重复候选靶基因,用于后续分析。
图2 hsa-miR-200c-3p在疾病中的表达情况
2.4 GO和KEGG通路富集分析 GO和KEGG通路富集分析显示,这些靶基因主要参与了细胞形态调控、RNA聚合酶Ⅱ启动子转录调控、基因表达调控、细胞内信号传导、细胞增殖、血管生成、血管内皮细胞迁移调节、转录调控等生物学过程(见表2) ,涉及PI3K-Akt、Ras、Rap1、黏着斑、MAPK、VEGF等信号通路,以及前列腺癌、小细胞肺癌、胰腺癌、肾癌、乳腺癌、胃癌、结肠癌等疾病相关通路(见表3)。
表2 hsa-miR-200c-3p 靶基因的 GO 功能分析(生物学过程)
3 讨论
miRNA作为转录后的基因调控因子,参与人类多种生理病理过程,包括肿瘤的发生、分化、增殖、凋亡和侵袭,在恶性肿瘤中具有潜在的诊断、治疗和预后价值[6]。近年来研究人员普遍关注miRNA异常表达与癌症的关系,有报道称miR-200c-3p参与了癌症的发生发展[7]。本研究通过对多个物种miR-200c-3p碱基序列进行比对分析,发现miR-200c-3p在人、褐家鼠、家鼠及家兔等物种在基因位置上保守, 序列上也呈现出高度同源性。miR-200c-3p高度的保守性,表明它在生物体内可能编码一些重要蛋白。文献资料证实miR-200c-3p在甲状腺癌[4]、胃癌[5]、膀胱癌[8]、卵巢癌[2]等多种肿瘤中表达上调。miRGator数据库查询显示,miR-200c-3p在膀胱、胃肠道、肺、前列腺、甲状腺等器官表达丰度较高;与正常组织相比,在膀胱癌、卵巢癌、肺癌、前列腺癌等表达水平较高。本研究发现与已知文献资料基本一致,进一步证明了本实验研究过程和分析的正确性与可靠性。
在实验中利用靶基因预测软件共获得79个候选靶基因,GO功能和信号通路富集分析发现miR-200c-3p靶基因主要参与细胞形态调控、RNA聚合酶Ⅱ启动子转录、基因表达、细胞增殖、血管生成、血管内皮细胞迁移调节等生物学过程;miR-200c-3p存在于前列腺癌、小细胞肺癌、肾癌、乳腺癌、胃癌、结肠癌等多种癌症相关信号通路中,提示miR-200c-3p与多种癌症存在密切关联。从生物信息学分析结果而言,miR-200c-3p在肿瘤形成、进展过程中扮演着重要角色。而现有的关于其调控作用的研究报道,亦证实了这一观点。在甲状腺癌中miR-200c-3p负向调节ATP2A2促进肿瘤进展[4];miR-200c-3p下调后可抑制胃癌细胞增殖、迁移和侵袭[5]。在肾细胞癌中miR-200c-3p过表达后通过调控wnt/β-catenin信号通路靶向SOX2抑制细胞增殖、迁移与侵袭[3]。Li等[9]发现miR-200c-3p在肾母细胞瘤呈低表达,靶向调节FRS2抑制细胞增殖、迁移和侵袭。文献资料提示了miR-200c-3p可靶向调控一些关键基因从而影响肿瘤的增殖、侵袭和转移等生物学行为。
本研究靶基因预测结果显示,miR-200c-3p可能调控 IKBKB、E2F3基因。IKBKB是组成IKK复合物重要的催化亚基之一,其对核转录因子NF-κB的激活起到重要调控作用,此前已被证明对细胞凋亡、耐药等有重要影响。本研究发现IKBKB基因可能参与了PI3K-Akt、Ras、mTOR、NF-κB多条信号通路及前列腺癌、小细胞肺癌、胰腺癌等癌症相关通路,表明IKBKB与肿瘤发生发展关系密切。最近该领域的研究进展也揭示了IKBKB与癌症生物学行为的发生相关。在肾癌中miR-21抑制PDCD4的表达,激活Akt-IKBKB轴,从而促进迁移和侵袭[10]。而IKBKB/NF-κB参与了双酚A诱导的宫颈癌细胞迁移[11];IKBKB过表达可恢复miR-503抑制的非小细胞肺癌的恶性特性[12]。文献提示其与肿瘤关系密切,但miR-200c-3p是否直接靶向调控IKBKB发挥抑癌或促癌作用,有待进一步的科学实验验证。另外,E2F3作为一种转录因子,研究发现E2F3在乳腺癌中促进上皮细胞向间充质细胞转化、细胞侵袭和转移[13]。在结肠癌中,E2F3的表达与肿瘤分期显著相关,E2F3高表达的患者具有较低生存率[14]。在肺癌组织中E2F3亦呈高表达,E2F3过表达与抗凋亡因子Bcl-2的上调相关[15]。资料表明E2F3在恶性肿瘤中可能具有临床意义,可作为判断预后不良的潜在生物标志物。本研究通过生物信息学方法发现IKBKB、E2F3等可能是miR-200c-3p的潜在靶向调控基因,而miR-200c-3p可能通过调控这些重要基因影响肿瘤的发生和发展。鉴于目前国内外尚缺乏明确且直接的研究证据证实两者为miR-200c-3p的靶向调控基因,需要后期补充实验加以证实。
表3 hsa-miR-200c-3p 靶基因集合的KEGG通路富集分析结果
本研究从生物信息学角度证实了miR-200c-3p功能广泛,可能通过调控IKBKB、E2F3等一些重要基因参与人类生命活动和疾病过程,在肿瘤发生发展中的作用不容忽视,为进一步研究其在肿瘤的作用和发生机制提供了有效的生物信息学基础。