APP下载

基因可变剪接的调控机制及其研究进展

2018-02-15*

畜牧兽医科学 2018年3期
关键词:内含子前体外显子

*

(1.西北农林科技大学动物科技学院, 陕西 杨凌 712100;2.贵州工程应用技术学院毕节试验区研究院, 贵州 毕节 551700;3.西北农林科技大学动物医学学院, 陕西 杨凌 712100)

0 引言

早在19世纪80年代就有关于基因可变剪接的记录[1],而随着测序技术的成熟,越来越多的基因被发现可以进行可变剪接,这使得人们不得不重新认识基因的表达的蛋白质的多样性的关联。随着越来越多的生物物种中可变剪接被发现,它的作用也越来越重要,弄清它的调控机制成了至关重要的一步,这也是对可变剪接进行利用的前提。研究发现顺式作用元件(Cisacting element)和反式作用因子(Trans-acting element)的相互作用调控着可变剪接的发生,而随着研究的深入,越来越多的因素被牵扯其中。

1 基因可变剪接定义及其类型

1.1 基因可变剪接定义

可变剪接是在转录后水平调控基因表达的一种重要机制,它是指由一个共同的RNA前体在剪接体和其他剪接因子的作用下,通过不同的剪接位点产生不同的成熟RNA的过程。基因的可变剪接丰富了基因的表达产物,每个剪接后成熟的RNA在特定的时期、特定的组织器官中表达并发挥其功能,这对于生物体个体的生长发育和细胞的一系列生理过程有着重要意义,同时可变剪接对于蛋白质的多样化和时空的基因表达调控都具有重要意义[2-3]。

1.2 基因可变剪接类型

可变剪接在植物和动物细胞中都有发生,剪接的方式也比较丰富,目前主要的方式有以下几种:内含子保留(Intron retention),主要发生在植物细胞中;外显子跳跃(Skipped exon ),这种方式主要在动物细胞中有所发现;5’末端可变剪切和3’末端可变剪切(Alternative donor;Alternative acceptor),互斥外显子剪切(Mutually exclusive exons)等等,在一次可变剪接中,这些方式有时并不是单独发生,而是几种方式的组合,经过这些不同的剪接方式的组合可以产生多种具有不同功能的成熟RNA。

2 基因可变剪接的调控机制

2.1 剪接体的组成及对前体RNA的加工过程

剪接体是由5个小核糖核蛋白复合体(snRNAs)U1,U2,U4,U5和U6和50~100种左右非snRNP蛋白组成的一种复合体。它的形成过程是U1和蛋白质相互作用形成一个复合体,然后再结合U2形成剪接体的前体,最后结合上U4、U5和U6就形成了剪接体[4]。前体RNA的剪接过程包括剪接体的组装、紧连在一起的两步转酯反应以及内含子的降解构成。组装好的剪接体在分支位点处的腺苷酸羟基发生亲核攻击,使剪接位点的磷酸二酯键断裂从而形成两个剪接的中间体,一个是5’外显子,一个是包含内含子和3’外显子的套索状分子,然后前一种中间体攻击套索状分子,使其中的内含子被去除并降解,进而将两个外显子连接起来,完成剪接过程[4]。

2.2 顺式作用元件和反式作用因子的调控作用

在前体RNA上存在着特异性的顺式作用元件序列,如果能增强剪接的发生,则称为剪接增强子(Splicing enhancer),反之则称为剪接沉默子(Splicing silencer),由于它既可以存在于外显子中,亦可存在于内含子中,所以将它们细分为外显子剪接增强子和沉默子(Exonic splicing enhancers,ESEs;Exonic splicing silencer,ESSs),内含子剪接增强子和沉默子(Intronic splicing enhancers,ISEs;Intronic splicing silencer,ESSs)。反式作用因子是一类可以和顺式作用元件发生特异性的结合来调控剪接发生的强度的蛋白质,目前发现的主要有SR蛋白质家族和hnRNP蛋白质家族以及一些特异性因子。

2.2.1 SR蛋白的调控作用

SR蛋白是一类富含丝氨酸(S)和精氨酸(R)的剪接因子,它包括氨基末端的RNA结合结构域(RNA Binding Domain,RBD)和位于羧基末端的RS结构域(RS domain),目前发现的SR蛋白有SC35、SF2/ASF、SRp20、SRp30等。SR蛋白识别特异的前体mRNA并与之结合的能力取决于它的RBD,RS结构域则通过自身的磷酸化参与了SR蛋白在细胞内的定位以及SR蛋白之间或与其他因子之间的相互作用[5]。SR蛋白通过这两个结构域与前体RNA特异性序列结合来协助其它的剪接因子与剪接位点的正确结合[6]。

2.2.2 hnRNP蛋白质家族的调控作用

hnRNP又称解链蛋白,目前,发现了A1、A2/B1和D0等家族成员,它们通常也含有不止一个的RBD,其中A1是在真核生物细胞中存在较为丰富的一种,它能通过自身含有的多个RBD与前体RNA特异性结合形成复合物,然后在SR蛋白的帮助在以球状调节因子的形式来完成选择性的跨过外显子,实现调节基因的可变剪接的功能[7-8]。

2.2.3 KH-domain剪接因子的调控作用

KH-domain也是一种蛋白质家族,包括了能与高密度脂蛋白(HDL)结合的vigilin等,目前研究较为透彻的KH-domain剪接因子为FMR1(fragile X mental retardation 1),它含有2个KH结构域,在人类的脆性X染色体综合征的发生中起作用,它依靠自身α螺旋和β折叠形成的loop结构来识别单链的RNA,参与RNA 的可变剪接[9]。

2.3 RNA对可变剪接的调控作用

2.3.1 内含子序列的调控

有很多内含子和外显子的剪接是由内含子RNA序列催化的,根据剪接机制的差异,可以将这些内含子分为I型内含子、II型内含子、核mRNA内含子以及tRNA内含子[10],其中前3种内含子的剪接反应是跟RNA的结构紧密相关的, 特别的I型内含子和II型内含子的剪接是自身催化调控的,所以它们又称为核酶。

I型内含子催化的前体RNA内含子的切除和外显子的连接是通过两步连续的转酯反应来实现的,第一步是识别剪接位点,第二步反应在镁离子的协助下导致内含子被剪除并将外显子连接起来[11]。

II型内含子和核mRNA内含子的剪接反应也是通过两步转酯反应完成的,其中核mRNA内含子的两步转酯反应是由剪接体完成的,通过U1、U2、U4、U5和U6的一系列反应来达到释放内含子和连接外显子的目的[11]。

2.3.2 长链非编码RNA(long noncoding RNA,lncRNAs)的调控作用

lncRNAs属于非编码RNA的一种,研究发现它可以和SR蛋白相互作用来参与可变剪接的调控,它会影响SR蛋白的磷酸化位点,同时它也可以为特定的剪接因子提供结合位点,从而有利于可变剪接的进行[12]。

2.4 snRNP的调控作用

snRNPs中与前体RNA剪接有关的有U1、U2、U4、U5和U6等,其中U1A的结构研究的较为透彻,它可以通过自身的RBD识别RNA形成的茎环结构并与之相结合而形成复合物,这种识别具有序列特异性和空间立体化学特异性。另一种比较重要的snRNP是进化上有很强保守性的U5,这种特异性的蛋白在分子结构上的某些改变可以为其他剪接因子和RNA提供结合位点,可以和其他剪接因子形剪接复合物,在前体RNA的可变剪接中发挥重要作用[13]。

2.5 核小体定位对剪接作用的影响

一定长度的特定DNA片段在组蛋白八聚体上的缠绕方式就被称为核小体定位,它保证了庞大的基因组能够储存在空间有限的细胞内,并且在复制,转录等生物活动中起到重要作用。研究表明,外显子附近的DNA序列更倾向于形成核小体而内含子以及剪接位点附近则排斥核小体的形成,显然核小体因为其相对致密的结构不利于剪接的发生,所以排斥核小体形成对该区域剪接复合体的形成更为有利,通过这种方式可以抑制或增强剪接的发生[14]。

2.6 表观遗传方面对剪接的调控

表观遗传是指DNA序列不发生变化而基因表达却发生了可遗传变化的现象,而其中所涉及的DNA甲基化和组蛋白修饰可能与基因的可变剪接的调控有一定关联。DNA的甲基化的程度在外显子和内含子区域是不同的,这可能影响基因的可变剪接。有研究表明可以通过特定的组蛋白修饰来募集剪接因子从而改变RNA聚合酶的延伸速率进而调控可变剪接[15]。

2.7 基因突变对可变剪接的调控

基因突变可以改变可变剪接的顺式作用元件的结构,从而影响剪接因子与它的结合,进而调节基因的可变剪接。突变导致影响可变剪接的类型有以下几种[16]:核心调控元件缺失,像内含子开头的GT和结尾的AG这些碱基若发生变化则会导致内含子保留或者外显子跳跃这2种类型的剪接;产生新的接头序列,这会导致出现新的剪接位点而使RNA剪接发生错误;剪接的调控序列的改变,如增强子和沉默子,一旦它们发生改变,剪接的效率会受到影响。

另外基因的可变剪接和基因的转录过程是紧密联系在一起的,影响基基因转录的因素很多也都会波及到基因的可变剪接,所以在可变剪接的调控方面依然有很多需要去继续研究。

3 可变剪接在不同生物中的研究

3.1 猪

猪的脂肪与肥胖相关基因(Fat mass and obesity associated,FTO)与猪的肌内脂肪( Intramuscular fat ,IMF)含量呈现出显著相关,而肌内脂肪是评价猪肉品质的重要指标,它反映了肉的口感和多汁性[17],因此研究FTO基因的可变剪接具有实际的经济意义。黄的团队[18]通过对藏猪和大白猪的阉割和非阉割公猪FTO基因的研究,在它们的腹脂和背膘中发现了4种新的FTO可变剪接形式。

组织蛋白酶B(Cathepsin B,CTSB)对肌肉中的蛋白质有广泛的水解作用,产生小的多肽和游离的氨基酸,调节肉制品尤其是腌制火腿的风味[19]。陈等[20]人通过猪的EST序列分析发现了CTSB基因的新的剪接变异体CTSB2,并通过反转录PCR和序列分析等实验技术对其进行了验证。

这2个基因的可变形式的发现,就可以通过对FTO基因的表达调控来有目的地创造肉质更为鲜美,口感更为优越的肉猪个体作为优良的种畜进行使用,从而有利于肉猪品种的改良。

3.2 羊

脂肪细胞的研究不仅在人的肥胖症中有重要意义,在畜牧生产中的作用同样也不可忽略,如提高胴体的瘦肉率和增加IMF含量,而这其中对脂肪细胞中的基因可变剪接的研究显得尤为重要。杜等[21]通过对绒山羊的肌内脂肪细胞转录组测序(RNASeq)数据的研究,发现了除了互斥外显子剪接的其他四种方式,这些发现为研究可变剪接的机制和生物学功能打下了基础。

绵羊促卵泡激素受体(Follicle stimulating hormone receptor FSHR)是特异性结合FSH从而调控个体繁殖功能的一种蛋白,由FSHR基因编码。吴等[22]以绵羊卵泡颗粒细胞为材料,克隆 FSHR基因的cDNA片段,并测序分析该基因可变剪接体的种类及序列特征,鉴定出了FSHR基因的除了经典的编码695个氨基酸的以外的其它6种FSHR,但有趣的是,能表达出蛋白质分子的只有经典的FSHR剪接形式,至于其它剪接形式的生物学功能则有待研究。

可通过基因表达的调控,可以使其定向表达出特定形式,从而提高胴体的瘦肉率和增加肌间脂肪的含量,同时也可培育出繁殖性能更为优越的绵羊品种,为绵羊的育种提供便利。

3.3 牛

信号转导淋巴细胞激活分子家族7(Signaling lymphocytic activation molecule family member7,SLAMFM7)具有调节自然杀伤力细胞((Natural killer cell,NK)的功能,SLAMFM7基因可能通过基因的可变剪接来在奶牛的乳腺炎的抗性反应中发挥功能。鞠等[23]采样健康和患有乳腺炎的奶牛组织,运用RT-PCR以及测序技术进行研究,通过序列比较在乳腺细胞中发现了3个新的可变剪接形式,它们编码不同数目氨基酸的蛋白,本实验中的一种转录本在健康和患病乳腺细胞中的表达量与其它研究的结果不一致,可以推测出SLAMFM7基因的可变剪接具有乳腺炎病原菌特异性。

通过对牛不同组织的研究,利用电子克隆和PCR方法成功验证并发现了NFIX基因存在5种不同转录本,并且在不同组织中显示出表达多样化的差异,这说明同一基因的不同亚型可能会具有不同功能[24]。他们还研究了3个脂肪沉积相关基因的可变剪接模式,发现3种基因的亚型在细胞中分布不同且有一定区域性,这显示可变剪接可能影响基因在细胞质中的分布。

牛的乳腺炎一直是产奶业中危害较大的一种疾病,通过对SLAMFM7基因的诱导调控,可以增强奶牛对于乳腺炎的抗性反应,减少奶的损失,而NFIX基因可在脂肪的沉积上起作用,可通过调控表达,使得牛肉含有更多的肌间脂肪,增加其适口性。

3.4 鸭

鸭是一种重要的经济型水禽,同时也是实验研究的一种模式动物。陈等[25]以北京鸭腹部的脂肪组织为材料,通过RNA-seq序列比较等技术手段发现了18464个基因中有15070个发生了35913次可变剪接,82%的可变剪接率低于人类的95%而高于果蝇的60%。

鸭肉的消费也是禽类中重要的组成部分,而鸭肉的适口性决定了它的受欢迎程度,通过对鸭肉脂肪组织中基因的调控,可以使得鸭肉的肉质更为符合目前消费者的要求。

3.5 鸡

Lipin1基因的表达显著影响脂肪的沉积,它的正常表达、微表达和超表达都会引起脂肪沉积量的变化。王的团队[26]通过对乌鸡的不同组织lipin1基因表达的研究发现了2种剪接形式:lipin1-α和lipin1-β。

鸡肉中脂肪的含量显著影响鸡肉的品质和口感,因此通过调控lipin1-α和lipin1-β2种形式的相对表达量可以生产出符合消费者需求的鸡肉产品。

4 展望

基因可变剪接连接着基因组与蛋白组,是基因表达调控的重要机制,成为了功能基因组时代研究的重点之一。通过对转录本和基因组进行测序比较可以发现可变剪接的形式,但随着研究的样本越来越多,数据分析的量越来越大,高通量的实验技术的发展就显得尤为重要,同时对于调控机制的研究要结合着其它生物过程以一个整体的思路来进行。

在动物的遗传育种上,上面那些发现的基因的可变形式,有些类型可以促进某种性状的发生,而通过对基因可变剪接调控机制的使用,可以定向的剪接出人类生产需要的表达类型,这就为品种的改良提供了一条更为高效的方法。无论是在繁殖性能方面,还是生长肥育方面,亦或是抗病力方面,都可以通过基因的可变剪接来提高相应的经济性状,使个体具备更为优良的性状,为品种的改良和提高奠定基础。如何利用基因的可变剪接来调控基因的表达从而提高畜产品的质量和数量成为一个可行的方案。

[1]Early,P,et al.Two mRNA can be produced from a single immunoglobulin μ gene by alternative RNA processing pathways.Cell,1980,20(2):313-319.

[2]Barmak M,Christopher L.A genomic view of alternative splicing.Nature Genetics,2002,30(1):13-19.

[3]Christopher L'Qi W.Bioinformaticsa nalysis of alternative splicine.Briefings in Bioinformatics,2005,6(1):23-33.

[4]申杰华.酿酒酵母与拟南芥Pre-mRNA剪接位点的比较[J].科技经济市场,2005(5):14-15.

[5]TACKE R,CHEN Y,MANLEY J L.Sequence-specic RNA binding by an SR protein required RS domain phosphorylation:creation of an SRp40-specic splicing enhancers.Proc Natl Acad Sci USA,1997,94(4):1148-1153.

[6]ELDRIDGE A G,LI Y,SHAROP P A.The SRm160/300 splicing coactivator is required for exon-enhancer function.Proc Natl Acad Sci USA,1999,96(11):6125-6130.

[7]Xu R M,Jokhan L,Cheng X,et al.crystal structure of human UP1,the domain of hnRNP A1 that contains two RNA-recognition motifs.Structure,1997,5(4):559-570 .

[8]Shamoo Y,Krueger U,Rice L M,et al.crystal structure of the two RNA binding domains of human hnRNP A1 at 1.75Å resolution.Nat Struct Biol,1997,4(3):215-222.

[9]Walke S,Bragado-Nilsson E,Seraphin B,et al.Stoichiometry of the Sm proteins in yeast spliceosomal snRNPs supports the heptamer ring model of the core domain.J Mol Biol,2001,308(1):49-58.

[10]Cech TR.Self-splicing of group introns.Ann Rev Biochem,1990,59:543-68.

[11]张翼.RNA在RNA剪接中的功能:从催化到调控.生命科学[J],2008,2(20):202-206.

[12]樊摇波,徐昌水,梁尚栋.长非编码RNA与人类疾病调控机制的研究进展[J].中国药理学通报,2013,20(12):1629-1633.

[13]吴瑛,赫荣乔.RNA剪接因子结构与功能研究进展[J].生物化学与生物物理进展,2003,30(4):503-508.

[14]陈伟,罗辽复,张利绒,等.核小体定位与 RNA 剪接[J].生物化学与生物物理进展,2006,36(8):1035-1040.

[15]Laurent L,Wong E,Li G,et al.Dynamic changes in the human methylome during differentiation.Genome Research,2010,20(3):320-331.

[16]邹永新,龚瑶琴.影响RNA剪接的基因变异[J].遗传,2017,39(3):200-207.

[17]黄金明,刘刚,刘月平,等.猪肥胖相关基因(FTO)剪切体鉴定及其在阉割与非阉割公猪中的表达分析.第十五次全国动物遗传育种学术讨论会论文集,杨凌,2009.北京:中国畜牧兽医学会,250.

[18]WOOD J D,ENSER M,FISHER A V,et a1.Fat deposition,fatty acid composition and meat quality:A review[J].Meat Sci,2008,78(4):343-358.

[19]Zwicky,R,et al.Exploring the role of 5’alternative splicing and of the 3’-untransiated region of Cathepsin B mRNA.Biol Chem,2003,384(7):1007-1008.

[20]陈主平,陈磊.猪Cathepsin B基因一种新转录变异体的发现.第四届中国畜牧科技论坛论文集,重庆,2009.中国畜牧兽医学会.241-244.

[21]杜琛,付绍印,高鸿雁,等.绒山羊肌内脂肪细胞成熟前后比较转录组分析[J].畜牧兽医学报,2014,45(5):714-721.

[22]吴阳升,林嘉鹏,蒋香菊,等.绵羊FSHR基因可变剪接体的克隆、鉴定及表达分析[J].江苏农业学报,2017,33(3):630-637.

[23]鞫志花,王长法,李秋玲,等.奶牛SLAMF7基因在健康牛和乳腺炎牛中可变剪切体的鉴定与表达研究.第十六次全国动物遗传育种学术讨论会论文集,扬州,北京:中国畜牧兽医学会,2011.

[24]周扬.秦川牛脂肪沉积相关基因筛选及可变剪接对基因表达和细胞定位的影响研究[D].西安:西北农林科技大学,2017:92-98.

[25]陈黎,李国勤,田勇,等.北京鸭腹部脂肪组织的转录组特征分析[J].浙江农业学报,2016,28(5):743-747.

[26]王晓可.鸡Lipin1基因在不同能量水平饲粮间的表达差异及其mRNA可变剪接形式研究[D].郑州:河南农业大学,2009.

猜你喜欢

内含子前体外显子
外显子跳跃模式中组蛋白修饰的组合模式分析
N-末端脑钠肽前体与糖尿病及糖尿病相关并发症呈负相关
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
外显子组测序助力产前诊断胎儿骨骼发育不良
促胃泌素释放肽前体对小细胞肺癌的诊断价值
亚麻籽油前体脂质体稳定性及释放性能研究
不同方向内含子对重组CHO细胞中神经生长因子表达的影响
更 正
外显子组测序助力产前诊断胎儿骨骼发育不良
陆地棉GhDHN1基因结构及内含子生物信息学分析