牛miR-144靶基因预测与组织表达分析
2022-03-28丁燕玲王鹏飞杨朝云周小南赵志艳张岩峰史远刚康晓龙
丁燕玲,王鹏飞,杨朝云,周小南,赵志艳,张岩峰,史远刚,康晓龙
(宁夏大学 农学院,宁夏 银川 750021)
miRNA是一类非编码小RNA,长度约为18~22个核苷酸,其主要通过种子序列与靶基因的3′UTR区特定序列互补结合,抑制靶基因的表达或诱导使其降解,进而调控机体的生物学过程。肌肉的生长发育直接影响肉牛的产肉量和肉品质,肌细胞的增殖分化是肌肉组织正常发育的指标,而miRNA是成肌细胞、骨骼肌卫星细胞增殖分化过程的重要调控因子。研究表明,-1、-133和-206是肌肉中特异性表达的miRNAs,-133可以促进成肌细胞的增殖,而-1和-206可以促进成肌细胞的分化,且-133表达量的上调与巴什拜羊骨骼肌卫星细胞增殖分化状态的转换有关联;-378、-143能够分别靶向2和5基因,调节牛骨骼肌卫星细胞增殖和分化;-204通过靶向1基因,在免疫炎症相关的组织中发挥重要作用;在大鼠软骨分化诱导的骨髓间充质干细胞中,过表达-615-3后相关基因的mRNA表达显著降低,促进软骨形成的转录因子9表达也显著降低,从而抑制大鼠的软骨分化,而敲除-615-3p则得到相反的结果,这表明-615-3抑制软骨细胞特异性基因的表达,并可能抑制软骨细胞分化;陈雯等研究表明,牛-423-5基因在骨骼肌细胞分化时表达量最高,推测其促进骨骼肌细胞的分化。尽管越来越多的研究表明miRNAs在调节细胞生长、增殖分化等生物学过程中起重要的作用,也有研究表明-144在肝癌、胃癌等癌症中对细胞增殖迁移具有调控作用,前期数据中筛选到-144可能参与机体营养物质吸收或能量利用等过程,但-144具体作用于何种组织并发挥作用,尚未明确。本研究对-144在各物种间的保守性进行分析,通过在线软件预测靶基因,并通过qRT-PCR技术检测牛不同组织中-144的表达,初步了解-144可能参与的生物学调控途径与潜在功能,结果将为后续开展-144在牛主要组织中的调控机制研究提供理论依据。
1 材料与方法
1.1 miR-144在牛基因组中的位置与序列信息
通过miRBase数据库查询牛-144成熟体与前体序列,通过在线软件TargetScan查询-144可能的靶基因,所用数据库见表1。
表1 数据库名称与网址Table 1 Name of database and website
1.2 miR-144保守性分析
利用NCBI和miRBase数据库检索牛()、马()、猪()、狗()、鸡()、小鼠()、沟鼠()、人()、黑猩猩()和斑马鱼()10个物种的-144成熟体序列,分析其在进化过程中的保守性。
1.3 miR-144靶基因预测与功能富集分析
为了降低-144靶基因预测结果的假阳性,采用TargetScan、miRWalk和miRDB在线软件预测-144的靶基因,用软件Veney绘制韦恩图,得到3个数据库预测结果的交集,然后集合miRTarbase数据库中经实验验证的牛-144靶基因,共同组成下一步分析的靶基因集合。利用DAVID生物信息学资源数据库对-144预测所得靶基因集合进行基于生物学过程(biological process,BP)、细胞组分(cellular component,CC)和分子功能(molecular function,MF)3个层面的GO注释分类和KEGG信号通路富集分析,以<0.05为显著性阈值得到基因集合相对于背景具有统计学意义的GO条目与信号传导通路。
1.4 miR-144组织表达分析
1.4.1 试验材料
从宁夏某养殖场采集出生24 h之内的秦川小犊牛的心、肝、肺、瘤胃、背最长肌、腿肌与皮下脂肪,同时采集成年秦川牛(36月龄左右)的心、背最长肌、皮下脂肪,PBS缓冲液冲洗干净后带回实验室,置-80 ℃冰箱保存备用。
采用Trizol提取各组织RNA,分光光度计检测RNA浓度和纯度,凝胶电泳检测RNA完整性,检测合格后保存备用。Trizol试剂盒、反转录试剂盒(PrimeScript RT reagent Kit with gDNA Eraser),以及荧光定量试剂盒(2 × SYBR Green Reesis Kitaltime PCR Master Mix)均购自TaKaRa公司。采用BIO-RAD型荧光定量PCR仪进行qRT-PCR验证。
1.4.2 总RNA提取和cDNA合成
用Trizol提取总RNA,用反转录试剂盒进行-144的cDNA反转录,反应总体系20 μL:第一部反应为5×gDNA Eraser Buffer 2 μL,gDNA Eraser 1 μL,总RNA 2 μL,RNase Free ddHO 5 μL,42 ℃水浴2 min;第二步反应为上一步混合物10 μL,PrimeScript RT Enzyme Mix I 1 μL,-144茎环引物1 μL,5×PrimeScript Buffer2 4 μL,RNase Free ddHO 4 μL,反应程序为42 ℃ 15 min,85 ℃ 5 s;反应结束后,所得cDNA保存在-20 ℃备用。
1.4.3 引物设计与合成
从miRBase数据库中获取-144成熟体序列,设计上、下游与茎环引物,以18S RNA为内参基因;引物由生工生物工程(上海)股份有限公司合成,引物详细信息见表2。
表2 miR-144定量引物信息Table 2 Information of quantitative primer of miR-144
1.4.4 qRT-PCR反应
采用qRT-PCR法检测-144在出生24 h之内犊牛的心、肝、肺、瘤胃、背最长肌、腿肌、皮下脂肪,以及36月龄左右成年牛心、背最长肌和皮下脂肪中的表达量。反应体系为:2×ChamQ Universal SYBR qPCR Master Mix 10 μL,上下游引物(10 μmol·L)各0.8 μL,cDNA模板2 μL,RNase Free ddHO 6.4 μL;反应条件:95 ℃预变性30 s,95 ℃变性10 s,55.7 ℃退火30 s,共40个循环。每个样品3个重复,用2法计算相对表达量,数据用SAS8.2软件进行分析。
2 结果与分析
2.1 miR-144在牛基因组中的位置与序列信息
根据NCBI和miRbase网站公布的牛-144信息可知,-144位于牛基因组19号染色体的20 233 836~20 274 484 bp处,成熟序列为UACAGUAUAGAUGAUGUACUAG(长度为22 bp),前体序列(pre-miR-144)为GTCGTATCCAGTGCAGGGTCCGAGGTATTCGCACTGGATACGACCTAGTA(长度为50 bp)(图1)。
图1 miR-144在牛基因组中的位置与序列信息Fig.1 Location and sequence information of miR-144 in bovine genome
2.2 miR-144保守性分析
用miRBase数据库检索出人、牛、马、小鼠、斑马鱼等10个物种的-144成熟序列,并与牛-144序列进行比对分析,发现-144的成熟体序列“UACAGUAUAGAUGAUGUACUAG”在各物种之间保守性较高(表3)。
表3 多个物种miR-144成熟体序列Table 3 Mature sequence of miR-144 from multiple species
2.3 miR-144靶基因预测结果
利用TargetScan、miRWalk和miRDB软件预测牛-144的靶基因,分别预测到977、1 422、1 493个靶基因,取三者交集共得到78个靶基因(图2),合并miRTarBase数据库中经试验验证的265个-144靶基因,去除1个重复靶基因,共获得342个靶基因作为后续GO注释条目和KEGG富集分析的靶基因集合。
蓝色表示采用miRWalk软件预测的miR-144靶基因,黄色表示采用TargetScan软件预测的miR-144靶基因,绿色表示采用miRDB软件预测的miR-144靶基因。Blue indicated miR-144 target genes predicted by miRWalk software,yellow indicated miR-144 target genes predicted by TargetScan software,and green indicated miR-144 target gene predicted by miRDB software.图2 miR-144靶基因交集预测Fig.2 Intersection prediction of miR-144 target genes
2.4 GO注释分类与富集分析
针对342个靶基因进行GO分析,结果发现共有22个GO条目。其中,12个GO条目属于BP,靶基因富集程度最高的GO条目有细胞内信号转导、序列特异性DNA结合转录因子活性的正调控、胚胎发育等;6个GO条目分布在CC,其中,在细胞膜和细胞核富集的基因最多;4个GO条目为MF,靶基因显著(<0.05)富集在受体激活剂的活性、阴离子跨膜转运蛋白活性、DNA结合等条目中(图3)。
图3 miR-144潜在靶基因的GO注释Fig.3 GO annotations of miR-144 predicted target genes
2.5 KEGG富集分析
为了全面探索预测结果,本研究在GO注释分类的基础上,利用KEGG数据库对预测所得靶基因集合中的342个基因进行信号通路富集分析。结果显示(图4),-144的靶基因显著(<0.05)富集于血管平滑肌收缩、cGMP-PKG、cAMP信号通路中,以上通路在肌肉生长发育、脂肪沉积、能量代谢过程中发挥重要的调控作用;其他富集通路尽管未达到显著水平,但也多与肌肉发育、能量代谢等过程密切关联,如MAPK信号通路由细胞外信号调节蛋白激酶(ERK)、c-Jun N-末端激酶(JNK)和p38丝裂原激活蛋白激酶(p38-MAPK)3个家族成员组成,参与MAPK信号通路的基因主要包括35、23和22。研究表明,敲除35基因后,HO诱导的JNK活性受到抑制,进而抑制JNK和p38-MAPK激酶,触发凋亡激酶级联反应,使细胞分化、胃排空和食物利用效率显著下降,即脂肪代谢效率下降,脂肪在机体内储存,最终导致人和家畜的肥胖;而肌肉中脂肪含量与肉的风味、嫩度和多汁性存在密切联系,因此,推测MAPK信号通路可能在牛肌肉生长发育过程中发挥重要作用。
图4 miR-144靶基因集合KEGG通路富集分析Fig.4 KEGG pathway enrichment results of miR-144 target genes
2.6 qRT-PCR分析结果
采用qRT-PCR方法检测出生24 h之内犊牛不同组织中-144的表达量,结果见图5-A。-144在肝中的表达量最高,其次是心、腿肌,在瘤胃、皮下脂肪中的表达量最低;-144在腿肌和心中的表达量差异不显著(>0.05),但在肝中的表达显著高于腿肌和心(<0.05);-144在背最长肌中的表达显著高于瘤胃和皮下脂肪,而瘤胃和皮下脂肪中表达量差异不显著(>0.05)。如图5-B所示,在成年牛和初生犊牛中,-144在心中的表达量最高,且在心和背最长肌中的表达均显著(<0.05)高于皮下脂肪,而在成年牛和出生24 h内犊牛同一组织中的表达量差异不显著(>0.05)。上述结果提示,牛-144可能通过机体肌肉生长发育过程发挥重要生物学功能,但详细机制需进一步的试验进行佐证。
A,miR-144在牛主要部位的表达;B,miR-144在牛不同发育时期主要部位的表达。柱上无相同字母表示差异显著(P<0.05)A,Expression of miR-144 in main tissues of cattle;B,Expression of miR-144 in main tissues of cattle at different developmental stages.Data marked without the same lowercase letters indicated significant differences at P<0.05.图5 miR-144在牛主要部位的表达量Fig.5 Expression of miR-144 in bovine parts
3 讨论
本研究通过对-144靶基因预测与qRT-PCR验证,初步筛选出1基因是-144的靶基因。大量研究证明,1基因在肌肉生长发育中起着重要的作用,它可以与肌肉发育相关的转录因子作用从而调控其过程。经NCBI查询,牛1基因定位于24号染色体,由33个外显子组成。1属于RhoA相关激酶,包含3个结构域:位于N末端的激酶结构域、在中间与Rho结合的卷曲结构域和位于C末端的血小板-白细胞激酶同源结构域。研究发现,1在癌症方面对细胞迁移、细胞增殖具有促进作用;该基因也能够阻碍成肌细胞退出细胞周期,从而抑制分化;Zhou等通过生物信息学分析和双荧光素酶报告实验验证1与-217的靶向关系时,将-217模拟物和-217抑制剂转染到血管平滑肌细胞中,通过qRT-PCR和WesternBlot检测-217和1的表达,结果发现,-217模拟物显著降低1基因的mRNA和蛋白质表达水平,而-217抑制剂显著增强1表达,由此得出转染-217模拟物可显著诱导血管平滑肌细胞周期阻滞、增殖抑制、迁移减少和凋亡增强。本文所得结果中1是-144的靶基因之一,但牛-144是否通过1基因调控肌肉的生长发育目前仍不明确,1也将是我们后续开展试验验证的关键候选靶基因之一。
对-144靶基因集合进行KEGG富集分析发现,靶基因显著富集于血管平滑肌收缩、cGMP-PKG、cAMP等与肌肉生长发育相关的信号通路。cGMP-PKG信号通路即一氧化氮激活的可溶性鸟苷酸环化酶和利钠肽激活的微粒,均可使GTP转化成cGMP,而cGMP可激活Ⅰ基因,导致Ⅰ调节的大量目的蛋白磷酸化,进而发挥广泛的下游效应,例如通过作用于肌联蛋白N2B,减弱心肌细胞僵硬度;作用于肌钙蛋白Ⅰ,减弱肌丝敏感性。大量研究表明,cGMP信号转导参与肌肉收缩机制,cAMP信号传导影响骨骼肌肥大、代谢和再生。前列腺素E2(prostaglandin E2,PGE2)是一种抗增殖分子,也是多种细胞凋亡的诱导因子之一,研究表明,2对软骨细胞DNA合成和硫酸盐掺入产生显著影响,提示2在软骨代谢中起重要作用;如Miwa等在关节软骨细胞中加入外源性PGE2,观察到DNA断裂增加,而DNA断裂的增加是细胞凋亡的标志;使用二丁酰cAMP时发现cAMP水平增加:因此,提示PGE2通过提高细胞内cAMP浓度,进而激活蛋白激酶A(protein kinase A,PKA)第二信使系统,诱导关节软骨细胞凋亡。胚胎细胞中cAMP水平的调节与脂质沉积的减少有关,利钠肽C(natriuretic peptide C,NPPC)是细胞内cAMP浓度的潜在调节剂,由哺乳动物的颗粒细胞产生并与卵丘细胞中的肽钠尿受体2(peptide natriuretic receptor 2,NPR2)结合,NPR2激活诱导cGMP的合成。研究发现,在牛胚胎体外培养过程中添加NPPC,可提高牛囊胚的孵化率,降低胆固醇衍生物和三酰甘油酯亚类的含量,说明NPPC在牛胚胎体外培养过程中对cGMP胞内脂类浓度具有调节作用,可通过cAMP通路刺激脂肪分解和减少脂质沉积。4属于一个由4个4基因组成的基因家族,它能够编码磷酸二酯酶,进而水解第二信使cAMP结合。据报道cAMP依赖性蛋白激酶PKA可促进4基因的磷酸化和活性。如Silva等发现,在牛脂肪细胞中,4基因下调可以增加细胞内cAMP浓度,进而通过cAMP信号通路影响早期脂肪细胞分化。
4 结论
本研究分析了-144成熟体序列在不同动物间的保守性,鉴定了-144在牛主要组织中的表达特征。牛-144可能靶向调控1、1、等基因,其预测靶基因主要参与血管平滑肌的收缩、cGMP-PKG与cAMP等信号通路。