APP下载

Hsa-miR-210-5p靶基因预测及其相关信号通路的生物信息学分析

2020-07-08蔡丹平龙鼎新

生物信息学 2020年2期
关键词:绘制编码蛋白质

蔡丹平,龙鼎新

(南华大学 船山学院, 湖南 衡阳 421001)

microRNAs(MiRNAs)是一类长约18-25个核苷酸的非编码RNA,与mRNA转录本的3’非翻译区(3’-UTR)结合,可以对靶基因的表达进行调控[1]。它们对各种重要的生物学过程具有调控作用,如细胞发育、细胞增殖、细胞分化及细胞凋亡等有关[2],因此准确预测miRNA的靶基因并对其靶基因进行系统的生物学分析是研究其作用机制的重要环节。本研究前期为了探讨miRNAs在三邻甲苯基磷酸酯(Tri-o-cresyl phosphate,TOCP)诱发神经细胞自噬中的作用机制,以人神经母细胞瘤细胞SK-N-SH细胞为体外细胞自噬模型,应用miRNA基因芯片、RT-PCR等实验技术检测了自噬相关miRNA表达情况。综合芯片和荧光实时定量PCR的结果,筛选出了miR-210-5p显著性差异表达的自噬基因。

Hsa-miR-210-5p属于miR-210基因家族,定位于人11号染色体568 150-568 171。研究表明低氧诱导的miR-210参与细胞循环、细胞分化、DNA修复、细胞凋亡、膜转运、氧化应激/糖酵解等调控信号通路,可作为非小细胞癌、乳腺癌、胰腺癌、肺细胞癌、食管鳞状细胞癌等癌症的诊断参考指标和预后指标[3],其过表达与昼夜节律过程、神经元发育、GTP酶信号转导和光感受相关的途径有关[4],但目前国内外对miR-210-5p的报道较少。本研究运用生物信息学分析,预测hsa-miR-210-5p的靶基因,绘制韦恩图得靶基因集合,并对其靶基因集合进行蛋白质互作网络分析、GO(Gene Ontology)分析和KEGG Pathway(Kyoto encyclopedia of genes and genomes)分析预测结果中的靶基因集合作用机制,并注释其靶基因的生物学功能,为展开miR-210-5p的靶基因鉴定及生物学功能研究提供理论基础。

1 材料与方法

1.1 miR-210-5p序列的保守性分析

使用miRbase[5](http://www.mirbase.org/)、RNAcentral(https://rnacentral.org/)数据库在线查找各物种已知成熟miR-210-5p碱基序列,对比分析miR-210-5p序列在各物种间的保守性。

1.2 miR-210-5p靶基因的预测

利用miRDB[5](www.mirdb.org/),TargetSc-an[5](http://www.targetscan.org/)和DIANA TO-OLS[5](http://diana.imis.athena-innovation.gr/) 3个在线数据库预测miR-210-5p的靶基因,用在线软件Veney 2.1.0 (http//bioinfogp.cnb.csic.es/tools/Venny/index.html)画韦恩图,得到3个数据库预测结果的交集,该交集为靶基因集合,以降低假阳性率。

1.3 预测靶基因集合编码蛋白质之间的相互作用

将该靶基因集合使用String 11.0(Search Tool for the retrieval of interacting genes)在线数据库(https://string-db.org/)分析,绘制互作网络邻接编码蛋白数目柱状图,再利用Cytoscape_v3.6.1绘制靶基因集合编码蛋白质之间相互作用(protein-protein interaction, PPI)网络图。

1.4 miR-210-5p靶基因的GO分析

使用DAVID(https: //david. ncifcrf. gov/)数据库对预测到的miR-210-5p靶基因集合进行GO功能注释,以人的所有基因为背景基因,显著性阈值取P< 0.05,获得相对hsa-miR-210-5p具有统计学意义的GO分析。GO分析由细胞组分(Cellular component)、分子功能(Molecular function)、生物调节(Biological process)3个部分组成。用R软件绘制miR-210-5p靶基因交集的GO功能注释图。

1.5 miR-210-5p靶基因的KEGG Pathway分析

使用DAVID(https://david.ncifcrf.gov/)数据库对预测到的miR-210-5p靶基因集合进行KEGG Pathway富集分析,以人的所有基因为背景基因,显著性阈值取P< 0.05,获得相对于hsa-miR-210-5p具有统计学意义的基因集合信号转导通路。用R软件绘制miR-210-5p靶基因交集的KEGG Pathway富集通路图。

2 结果分析

2.1 miR-210-5p参与的疾病

miR-210-5p在骨质疏松[6]、骨关节炎[7]、自闭症障碍[8],心血管疾病[9]中起上调作用(见表1)。

表1 miR-210-5p调控靶基因参与人类的部分疾病Table 1 miR-210-5p target genes involved in parts of human diseases

*注:该靶基因是小鼠模型试验获得,尚无人类试验验证。

Note:The target genes was were obtained by mouse model test and have not been verified by human test.

2.2 各物种成熟miR-210-5p序列的保守性分析

使用RNAcentral和miRBase数据库进行对比分析,可知其基因序列号为MIMAT002475,定位于11号染色体568 150-568 171。对猕猴(mml)、小鼠(mmu)、褐家鼠(rno)等8个物种对比分析,可知hsa-miR-210-5p的成熟碱基序列“agccccugcccaccgcacacug”在各物种间高度保守(见表2)。

表2 各物种miR-210-5p的成熟碱基序列Table 2 Mature base sequences of miR-210-5p of various species

2.3 预测靶基因集合编码蛋白质之间的相互作用使用数据库miRDB,TargetScan和DIANA TOOLS预测miR-210-5p的靶基因,预测的个数分别为401、4 048和87,然后用在线软件Veney 2.1.0可得三个数据库预测靶基因的交集23个,占各预测软件预测靶基因总和的0.6%(见图1)。

图1 miR-210-5p的预测靶基因个数Fig.1 Prediction of the number of target genes for miR-210-5p

2.4 预测靶基因集合编码蛋白质之间的相互作用

将三个数据库得到的靶基因集合使用String 11.0数据库分析,绘制出互作网络邻接编码蛋白数目柱状图(见图2)。结果显示,靶基因CDK8、MED18、MED13、MED12、CCNC、MED14、MED23、CDK19、MED1、MED15和MED13L的编码蛋白质所占比重较大。运用Cytoscape_ v 3.6.1软件,绘制出PPI网络图(见图3)。结果表明,miR-210-5p的靶基因集合编码蛋白质之间的相互作用关系较复杂,有10个编码蛋白质之间的互作关系较稳定。

2.5 miR-210-5p靶基因的GO功能注释

使用DAVID数据库对预测到的miR-210-5p靶基因集合进行GO功能注释,以人的所有基因为背景基因(P< 0.05),可得其主要富集的细胞组分是细胞质、细胞浆和突触前活动区;分子功能是参与鸟苷酸合成;参与突触小泡胞吐的调控、鸟苷酸蛋白介导的信号转导、钙离子调节的神经递质胞吐和膜电位调节等生物学过程(见表3),用R软件绘制miR-210-5p靶基因交集的GO功能注释图(见图4)。

图2 互作网络邻接编码蛋白数目柱状图Fig.2 Adjacency coding protein number histogram of interaction networks

图3 miR-210-5p预测靶基因集合所编码蛋白质之间的相互作用Fig.3 Protein-protein interaction network of the target genes of miR-210-5p

表3 miR-210-5p靶基因交集的GO功能注释
Table 3 GO functional annotation for intersection of miR-210-5p target genes

GO IDTermP-valueNumberGenesCellular ComponentGO:0005737cytoplasm0.02812UDT16, RAB3B, PLA2G4F, OSBP, DCAF7, ARHGAP35, STK35, POU2F2, MFAP3L, SRF, BICD2, AKT3GO:0048786presynaptic active zone0.0342RIMS4, RIMS3Molecular FunctionGO:0005525GTP binding0.0104NUDT16, RASL11B,AB3B, ARHGAP35Biological ProcessGO:2000300regulation of synaptic vesicle exocytosis0.0122RIMS4, RIMS3GO:0007264small GTPase mediated signal transduction0.0343RASL11B, RAB3B, ARHGAP35GO:0048791Calciumion regulated exocytosisof neurotransmitter0.0452RIMS4, RIMS3GO:0042391regulation of membrane potential0.0862RIMS4, RIMS3

图4 miR-210-5p靶基因交集GO功能注释Fig.4 GO functional annotation for intersection of miR-210-5p target gene

2.6 miR-210-5p靶基因的KEGG Pathway分析

使用DAVID数据库对预测到的miR-210-5p靶基因集合进行KEGG Pathway分析,以人的所有基因为背景基因(P< 0.05),可得miR-210-5p的靶基因集合参与血小板活化、MAPK信号通路、VEGF信号通路、癌症通路、甲状腺激素信号通路等(见表4),用R软件绘制miR-210-5p靶基因交集的KEGG pathway通路图(见图5)。

表4 miR-210-5p靶基因交集的KEGG Pathway分析Table 4 KEGG pathway analysis for intersection of miR-210-5p target genes

图5 miR-210-5p靶基因交集的KEGG Pathway分析Fig.5 KEGG pathway analysis for intersection of miR-210-5p target genes

3 讨 论

miR-210在肿瘤、心血管系统,神经系统疾病中起发挥重要作用。miR-210能上调Kaposi肉瘤相关的疱疹病毒和感染[11]、慢性鼻-鼻窦炎鼻息肉患者黏膜黏蛋白0型聚糖生物合成途径[12]、人骨肉瘤[13],小鼠感觉轴突再生[14]和脊髓再生[15],可通过在动脉粥样硬化的情况下直接靶向PDK1诱导内皮细胞凋亡有下调作用[16],能抑制滋养层细胞侵袭,是先兆子痫的血清生物标志物[17]。hsa-miR-210-5p属于miR-210基因家族,miRNA-210-5p在神经功能调节中报道较少。

考虑到靶基因预测过程中miRNA与靶基因结合位点的序列匹配、mRNA与miRNA双链特异结合的热稳定性及序列的保守性等因素,采用miRDB、TargetScan,DIANA TOOLS三个数据库对miR-210-5p靶基因进行预测,得到了可信度较高的靶基因集合,进行编码蛋白质互作分析,GO分析和KEGG pathway分析。研究发现miR-210-5p能促进成骨细胞的分化[6]、成骨细胞胞外体的表达[7]、调节钙通道[8]、促进细胞缺氧凋亡[9]、能结合位点突变,降低荧光酶活性[10]、参与细胞的免疫反应[18]、阻断胚状体细胞扩增[19]、对孕妇发生先兆子痫[20]、肾细胞癌[21],在副溶血性孤菌感染的文昌鱼的免疫反应中起着重要调节作用[22]。提示miR-210-5p可能调控癌症的发生与转归、钙离子信号通路、血小板活化,免疫系统和神经系统等生物学过程。miR-210-5p靶向TNS1和STC1调节缺氧时心肌细胞发生的变化,进而调控心血管疾病[9]。在TargetScan Human 7.2可查到基因TNS1与miR-210-5p种子区域的配对类型为7mer-m8、7mer-A1和8mer,基因STC1与miR-210-5p种子区域的配对类型为7mer-m8,并且它们与miR-210-5p非种子区域3'端存在不同长度的互补位型(见表5)。miR-210-5p种子区域与TNS1 和STC1基因的3’UTR完全匹配可以增强miR-210-5p对TNS1和STC1基因的沉默效果,故可用miR-210-5p与TNS1和STC1基因的高特异性来研究miR-210-5p对TNS1和STC1基因富集的疾病通路如心血管疾病的治疗是具有发展意义的。

表5TNS1 和STC1基因3'UTR结合miR-210-5p的位点
Table 5 3’UTR sequences ofTNS1 andSTC1 targeted by miR-210-5p

4 结 论

选用三种数据库预测miR-210-5p靶基因,取其交集分析,不能避免预测结果的假阳性,需通过实验验证该靶基因集合里23个靶基因为miR-210-5p的靶基因,进一步探讨目标靶基因3’UTR结合miR-210-5p的位点及其具体分子机制来降低假阳性率。运用生物信息学分析方法,较全面的分析了hsa-miR-210-5p所参与的生物学过程,为后续研究提供了方向。

猜你喜欢

绘制编码蛋白质
蛋白质自由
人工智能与蛋白质结构
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
超萌小鹿课程表
Genome and healthcare
放学后
在转变中绘制新蓝图
VBA在宗地图绘制中的应用