Poly(A)尾长度和异质性在转录后调控中的研究进展
2020-12-14崔建伟刘雪艳李成萍周国利
崔建伟 崔 潇 刘雪艳 李成萍 郭 彦 周国利
(聊城大学 生命科学学院,山东 聊城 252059)
0 引言
在1970s早期,首次在RNA上发现重复的poly(A)尾.当时对RNA是如何或为什么会有poly(A)尾知之甚少,但已经推测它是一种可能与翻译或mRNA的形成和运输有关的信号序列[1].在接下来的几年里,这些预测得到了验证,并且poly(A)尾的动态调节过程变得更加清晰,大量调节poly(A)尾长度的聚合酶和脱腺苷酸化酶已经被鉴定[2-4].Poly(A)尾在真核生物mRNA转录后调控中具有关键的功能,是mRNA稳定性和翻译的重要决定元件.尽管poly(A)尾如此重要,但被发现后的几十年里,其序列竟然极少被精确解读过.主要原因在于,扩增简单串联的单核苷酸序列会导致聚合酶滑动,从而造成测序结果的移码和乱码.近几年,针对poly(A)尾的高通量测序技术的建立和快速发展,使poly(A)尾的精确测序得以实现,poly(A)尾在mRNA转录后调控中关键作用正的逐渐被揭示.
1 Poly(A)尾是RNA的一种重要的动态修饰
几乎所有真核生物的mRNA都包含一个多聚腺苷酸信号(polyadenylation signal,PAS)序列.PAS和其下游富含GU或U的碱基序列通过招募多个参与3′ 端加工的蛋白复合物来指导poly(A)尾的形成[5].多聚腺苷酸化发生的位置不是由RNA聚合酶终止pre-mRNA的合成决定的;相反,RNA的剪切是在PAS下游10-30 nt范围内发生的,poly(A)聚合酶(poly(A) polymerase,PAP)随后在其3′末端加入poly(A)尾.一旦11-14个腺苷酸被加入,细胞核poly(A)结合蛋白(nuclear poly(A) binding protein,PABPN)能够结合正在延伸的poly(A)尾[6].然后PAP能够快速合成一个全长poly(A)尾,poly(A)长度一般认为是200-250 nt[7],但是否所有转录本在所有组织中都“完全”加250个左右的腺苷酸并不完全清楚.例如,一些基因被发现含有一个poly(A)限制元件(a poly(A) limiting element,PLE),它的作用是将pre-mRNA上poly(A)尾的初始长度限制在20 nt以下[8].在一些长链非编码RNA(long non-coding RNAs,lncRNAs)和一些小非编码RNA也被发现含有poly(A)尾[9].
剪切和多聚腺苷酸化的过程被认为是mRNA从细胞核正确地输出到细胞质中所必要的.一旦进入细胞质,poly(A)尾主要被胞质poly(A)结合蛋白(cytoplasmic poly(A)-binding protein,PABPC)结合,但关于PABPN和PABPC在poly(A)尾上的转换知之甚少.虽然两者可以在细胞质和细胞核之间穿梭的蛋白质,但它们之间是如何及何时完成的交换还不清楚.新合成转录本上所需要的蛋白质与细胞质中正在转译的mRNA上所需的蛋白质种类有很大的不同,其中许多蛋白质必须发生重构才能使各自过程顺利进行[10].研究发现,PABPN缺乏任何重复的足迹图谱,但PABPC可重复地结合到poly(A)尾20-30个腺苷核苷酸序列上[11].PABPC通过与其它反式作用因子的相互作用,进而在mRNA的稳定性和翻译中发挥重要的作用.它通过与5' 帽子结合复合物中的真核翻译起始因子4F(eukaryotic translation initiation factor 4F,eIF4F)和真核翻译释放因子3(eukaryotic translation release factor,eRF3)的结合[12],通过这些相互作用,PABPC和poly(A)尾协同促进翻译.尽管PABPC与mRNA的保护和稳定性有关,但它还能招募脱腺苷酸化酶,PABPC这个看似矛盾的角色说明它在poly(A)尾转录后调控中具有双重作用,具体的作用机制还需要进一步的阐明.由于还存在其他因子与poly(A)尾结合,如La蛋白可以与poly(A)尾结合,并同时与PABPC结合可能对翻译具有调节作用,这此因子的结合使poly(A)尾所结合的相互作用因子更加复杂[13].从poly(A)尾合成到降解的过程中,poly(A)尾和各种蛋白质因子之间存在着多方面的关系,从而在转录后调控中发挥着不同的作用.
2 Poly(A)尾长度与基因表达、翻译的关系
Poly(A)尾是保护mRNA的“看门人”,因为降解mRNA的酶必须从3' 端开始降解整个poly(A)尾,才能影响到蛋白质编码区,这将使poly(A)尾的长度必须处在一个关键阈值范围内才能保护mRNA不被降解.几十年来的传统观点认为,较长的poly(A)尾对其mRNA稳定性和翻译具有积极的影响[2,14].但是与大多数poly(A)尾很长的想法相反,发现一些转录本poly(A)尾的长度比预期的短很多,一些非常稳定的转录本(如编码β-actin的转录本)具有短的poly(A)尾,长度小于30 nt[15,16].总之,发现短poly(A)尾的转录本比之前预期的要多,那么,Poly(A)尾长度与转录本稳定性和翻译的关系及其生物学意义是什么?
随着针对poly(A)尾的新测序方法的出现,poly(A)尾长度的转录组动态变化图谱变得逐渐清晰.研究发现不仅有许多短poly(A)尾的物种存在,而且所研究物种(人、果蝇、小鼠和线虫等)的mRNA poly(A)尾长度的中值都在50-100 nt的长度范围内[17-19].唯一的例外是酵母,其poly(A)尾长度的中值约为33 nt,但酵母poly(A)尾的初始长度约为90 nt左右[20],这实际上与前面的物种相比并没有什么不同.研究发现短poly(A)尾与表达水平和翻译效率高的基因相关,更长的poly(A)尾与表达水平和翻译效率低的转录本有关,还发现poly(A)尾的长度与转录本的半衰期呈负相关.而且这些缩短的poly(A)尾看起来并没有降解的趋势,因为它们在稳定状态下以离散长度积累,而不是以连续长度方式积累[19],这个重大发现反驳了长poly(A)尾更有利于保护mRNA和翻译的观点.这与早期的报道一致,发现短poly(A)尾与正在生长的盘基网柄菌(Dictyosteliumdiscoideum)细胞中的mRNA稳定性相关[21].发现的另一个有趣的特征是poly(A)尾的长度存在一个相位模式,其中预期与PABPC(cytoplasmic poly(A)-binding protein)串行结合的poly(A)尾会得到更大富集[19, 22].这些与PABPC串行结合的poly(A)尾的富集表明,不受保护的腺苷酸可能很快被移除.有趣的是,这种相位模式的分布只在mRNA的poly(A)尾上发现,而在其他含有poly(A)尾但不能翻译的RNA上没有发现,如lncRNAs(long noncoding RNAs),而且发现表达水平和翻译效率高的转录本相位模式最为明显,表明poly(A)尾缩短到离散长度(称为修剪)是一个与翻译活动相关的过程[19].
而在卵母细胞成熟和早期胚胎发育期间,胞质内选择性地多聚腺苷酸化延长了特定mRNA的poly(A)尾,而且这个延长的结果确实增加了翻译,从而重新激活沉默的转录本[18, 23-25].胞质内多聚腺苷酸化也被发现可以激活一些神经元转录本[26].最近研究也发现poly(A)尾长度与GV(germinal vesicle)期卵母细胞内的蛋白表达水平呈正相关,表明较长的poly(A)尾会促进卵母细胞中的翻译过程[27].另外,利用TED-Seq(tail-end displacement sequencing)技术对人类细胞内质网应激的研究结果显示,内质网应激导致某些mRNA poly(A)尾的长度增加,包括内质网应激调节因子XBP1(X-box binding protein 1)、DDIT3(DNA-damage inducible transcript 3)和HSPA5(heat shock protein 5).重要的是,poly(A)尾长度增加的mRNA在翻译上是去抑制和稳定的[28].总之,TED-Seq揭示了poly(A)长度是随着内质网应激变化而发生动态变化的,这对翻译和mRNA转换都有潜在的影响.研究也发现3'UTR(3' untranslated region)长度与poly(A)尾长度相关,相同基因的选择性多聚腺苷酸化(alternative polyadenylation,APA)位点及选择性启动子与不同的poly(A)尾长度相关[29].这些研究结果提示,poly(A)尾的长度变化在转录后调控中具有重要作用,而且在不同的生物学过程中的作用方式和结果也是多样的、复杂的.
3 Poly(A)尾异质性的发现及其在转录后调控中的作用
mRNA的poly(A)尾曾被认为是纯A的,且除了长度变化外几乎没有什么其他信息内容.但近几年的研究表明,poly(A)尾的碱基组成也是可变的.对HeLa和NIH3T3细胞系进行TAIL-Seq,发现poly(A)尾内存在非A碱基的异质性,G主要在大于40 nt的poly(A) 尾中发现,而U通常发现, 在小于25 nt的poly(A)尾上[17].而且在人、小鼠、青蛙和鱼类等物种中,发现它们都有一定比例的异质性poly(A)尾存在[17-19, 34].通过PAIso-Seq(poly(A) inclusive RNA isoform sequencing)也揭示了在小鼠GV期卵母细胞中有超过17%的mRNA poly(A)尾中广泛存在U、G和C碱基的掺入,除单个出现外,非A碱基也会呈2-4个连续出现的情况.与Chang等(2014)[17]的发现一致,U碱基更多出现在poly(A)尾较短的转录本中,G和C碱基较多出现在poly(A)尾较长的转录本中[27].这些发现提示,poly(A)尾内非A碱基的异质性可能对mRNAs稳定性和翻译具有不同的功能及调控机制.
在mRNA加尾时,TENT4A/B(terminal nucleotidyltransferase 4A/B)核苷酸转移酶能间歇性地添加G.有趣的是,G主要位于poly(A)尾部末端,或者与末端相邻的位置.通过对非A碱基功能的研究发现,一个G就足以阻止脱腺苷酸化酶CCR4-NOT(carbon catabolite repression 4-negative on TATA-less)复合体对poly(A)尾部的修剪,因为修剪到3'端暴露G时会阻止该酶复合体的继续修剪.TENT4A和TENT4B的缺失会导致细胞中mRNA半衰期和丰度降低[30].因此,TENT4A和TENT4B产生一个异质性的poly(A)尾,保护相应mRNA的poly(A)免受快速的脱腺苷酸化,揭示了一种全新的mRNA保护作用和机制,扩大了转录后调控的复杂性.在拟南芥的poly(A)尾中也存在非A碱基,而且也是G的比例最高,10%的poly(A)尾内含有至少一个G,其G含量分布范围为0.8-28%.通过进一步联合CLIP-Seq、Ribo-Seq和mRNA稳定性实验等进行研究,发现在poly(A)尾中G含量的差别可导致AtPAB(Arabidopsis thaliana poly(A)-binding proteins)对不同mRNA结合的差异,且G可通过对AtPAB结合的抑制效应下调mRNA翻译效率,而与mRNA稳定性无关.当特定AtPAB缺失时,具有更强AtPAB结合的基因表现出更低的翻译效率.该研究提供了一种新的机制,即基因的翻译效率可以通过G含量依赖的PAB结合来调节[31].其他的研究发现与poly(A)尾结合的PABPC抑制尿苷酸化,而miRNA靶向诱导尿苷化的发生[32-34].在poly(A)尾上虽然也发现了C的加入,但其生物学功能尚未明确[17,30].
4 PABPC在poly(A)转录后调控中的双重作用
Poly(A)尾促进了mRNA和许多蛋白质之间的相互作用,多种蛋白的相互作用是通过与高亲和力的poly(A)尾结合的PABPs发生的[35].由于PABPC在基因表达中所起的作用似乎是相互矛盾的,因此其确切作用至今仍不清楚.一方面,它可以通过直接与脱腺苷酸化酶复合物PAN2-PAN3(poly(A) specific ribonuclease subunit2、3)和CCR4-NOT结合来促进脱腺苷酸化[36, 37].但它也是公认的一种直接与poly(A)尾结合并保护其不降解的蛋白质[38].另外,PABPC通过与5' 帽子结合因子和eRF3相互作用,被认为可以促进翻译.作为一种可以招募脱腺苷酸化酶的蛋白质,它也参与了基因转录本的降解和下调,PABPC的这种双重效应的作用机制需要在不同的生理过程中进一步的研究.
一个重大的突破是确定了在PABPC存在下CCR4(CCR4-NOT transcription complex subunit 6)和CAF1(CCR4-NOT transcription complex subunit 7)酶的脱腺苷酸化酶活性,这两种酶是CCR4-NOT复合物的组成部分.研究酵母菌和人的脱腺苷酸化酶的两个不同小组同时发现,结合在poly(A)尾上的PABPC(酵母中为Pab1)不阻碍CCR4的活性,因为CCR4可以把PABPC从poly(A)尾上释放后继续进行脱腺苷酸化,而CAF1(CCR4-NOT transcription complex, subunit 7)只能去除PABPC保护范围外的腺苷酸[22,37].PAN2/3只是选择性修剪大于150 nt的poly(A)尾,对转录组的影响很小;而PARN(poly(A) specific ribonuclease)不影响poly(A)尾的脱腺苷酸化[22].但PABPC仍在招募中起着中心作用,因为Pab1的消耗导致CCR4-NOT复合体的脱腺苷酸化速率大大降低[37].这些不同的功能角色暗示了poly(A)尾部的PABPC可能导致尾部长度的动态变化.
研究发现CCR4和CAF1脱腺苷酸化也受密码子优化的影响,而密码子优化是与翻译状态紧密相关的.使用报告基因系统,密码子优化程度较低的转录本比优化较高的转录本脱腺苷酸化速度更快.此外,抑制CAF1的表达,优先影响密码子优化程度较低的报告基因的脱腺苷酸化速率,可能表明其poly(A)尾部的PABPC结合可能更少,这表明相对于高水平翻译的转录本,CAF1在低水平翻译时显得更活跃[37, 39].这些研究再次将翻译和poly(A)尾长度紧密联系在一起,而PABPC是调节这种关系的主要参与者.关于一些翻译效率高的转录本是如何比其他转录本在其尾部结合更多的PABPC,目前还不清楚.对PABPC作用机制的研究表明,它的四个RNA结合域的作用不完全相同,并提示PABPC在poly(A)尾上的排列可能会为了响应脱腺苷酸化而改变[37].目前尚不清楚PABPC在poly(A)尾上排列的变化是否影响翻译或降解,进一步研究PABPC在基因表达中的多重作用将为这一领域提供答案.
5 结语
考虑到基因表达在生物学各个领域的重要性,poly(A)尾在基因的转录后调控中也不是一个被动的旁观者,从mRNAs最初的生物发生到细胞质中的动态控制,直至最终的降解,poly(A)尾的长度在mRNA稳定性和翻译等过程中扮演着重要的角色.随着新技术的建立和快速的发展,可以更准确地对poly(A)尾的长度和异质性进行读取,对poly(A)尾的功能和作用机制的探索已经逐渐成为基因转录后调控研究的一个热点领域,将来会逐渐揭示在绝大多数真核生物mRNA上的这个附加成分poly(A)尾是如何被动态调控,进而对基因表达产生影响的.Poly(A)尾长度及异质性的变化在许多生理和病理过程中的作用也将会逐渐被阐明.