APP下载

酵母Ty1和Ty3转座调控机制研究进展

2020-06-16刘秀丽汤定钦周明兵

微生物学杂志 2020年2期
关键词:逆转录宿主结构域

刘秀丽, 汤定钦, 周明兵, 2*

(1. 浙江农林大学 亚热带森林培育国家重点实验室,浙江 杭州 311300; 2. 浙江农林大学 浙江省竹资源与高效利用协同创新中心,浙江 杭州 311300)

反转录转座子是逆转录病毒进化的祖先[1]。反转录转座子在RNA介导下,通过“复制粘贴”的方式进行转座,它们广泛存在于真核生物界,在许多真核生物基因组中占很大一部分[2]。反转录转座子在宿主基因组的重组和进化中发挥着有益的作用,但也会导致基因突变和插入失活,从而产生多种遗传病[3]。依据蛋白酶结构域排列的顺序不同, LTR反转录转座子分为Ty1-copia和Ty3-gypsy两个超家族。在酿酒酵母基因组中发现有5种酵母长末端重复转座子(Transpon yeast,Ty),分别命名为Ty1-5[2],其中Ty1[4]在Ty1/Copia家族中酵母基因组内含量最丰富,然而Ty3/Gypsy家族仅有Ty3一类转座子,Ty3[5]在编码的蛋白序列上与反转录病毒接近。近年来国内外已经对酵母Ty1与Ty3分子机制进行广泛而深入的研究,本文对Ty1和Ty3反转录转座子最新研究进展进行了系统、全面的综述,系统地归纳了Ty1和Ty3的结构和表达特性、LTR转座子复制周期、Ty1和Ty3与宿主共生的精细调控机制以及影响逆转录转座的宿主因子,为深入研究酵母Ty1和Ty3转座和调控机制做一定的铺垫作用。

1 酵母Ty1和Ty3结构特征和转座机制

Ty1和Ty3具有许多相似的结构和功能特征[4-5]。完整的Ty1有5.9 kb,Ty3有5.4 kb。在Ty1和Ty3LTR末端都具有二核苷酸反向重复序列5′-TG …… CA-3′,并且都由3个结构域U3、R和U5组成。反转录转座子两端的LTRs不编码蛋白质,但包含转录的起始信号和终止信号。中间部分是编码两个部分重叠开放阅读框(Open Reading Frame, ORF)的功能序列:特异抗原蛋白(groupspecificantigen,gag)基因和聚合酶(polymerase,pol)基因。gagORF编码具有衣壳和核酸分子伴侣功能的蛋白,而polORF编码具有催化功能的蛋白酶(Protease, PR),逆转录酶RNase H(Reverse transcriptase RNase H, RT-RH)和整合酶(Integrase, IN)。

Ty1与Ty3元件的结构与简单的逆转录病毒相比,除了Ty1与Ty3中不存在逆转录病毒包膜基因,它们都含有5′端和3′端LTRs、gag基因和pol基因(图1A)。Ty1与Ty3元件在结构上gag和pol基因编码的蛋白结构序列不同,Ty1中pol编码的蛋白酶顺序为PR-IN-RT[4],而编码Ty3POL中的的PR-RT-IN蛋白序列以及GAG中的CApsid (CA),SPacer (SP)和NucleoCapsid (NC)蛋白结构域[5](图1B)都与逆转录病毒较相似。

在RNA聚合酶II(RNA polymerase II, Pol II)的催化作用下,Ty1和Ty3元件转录产生原始mRNA,该转录本在5′端加帽(CAP)和3′端加poly(A)结构,形成成熟的Ty1和Ty3mRNA后,从细胞核输出到细胞质中[6]。Ty1和Ty3mRNA的转录本都是从5′LTR R区端上游开始,终止于5′LTR R区端的下游,长度分别为5.7 kb和5.2 kb。它们的转录本中间都具有编码两个部分重叠的GAG和POL序列,5′和3′LTR含非编码区(Untranslated regions, UTR),5′UTR具有R和U5,3′UTR具有 U3和R,多个引物结合位点(Primer Binding Site, PBS)和一个多嘌呤序列(Polypurine tract,PPT)[6-8](图1B)。当成熟的mRNA被输出到细胞质后,既可以作为反转录所需的模板,又作为翻译成GAG和GAG-POL蛋白的模板。作为反转录模板的gRNA(genomic RNA)被包裹在GAG结构蛋白里面,形成病毒样颗粒(Virus Like Particles, VLPs)。Ty RNA的翻译产生GAG和GAG-POL两种蛋白(图1C),后者是从gag到polORF程序性移码翻译的产物,GAG-POL蛋白水平约为GAG的5%[9]。

图1 Ty1和Ty3结构和复制周期图Fig.1 Structure and replication cycle of the Ty1 and Ty3 A:Ty1、 Ty3和禽白血病病毒(ALV)结构图(修改自参考文献[2]);B:Ty1和 Ty3元件、RNA和蛋白质的结构(修改自参考文献[6]);C:复制周期图(修改自参考文献[7]) A: Structure of the Ty1 and Ty3 element and the simple retrovirus, avian leukemia virus (ALV) (Adapted from the reference[2]);B: Structure of the Ty1 and Ty3 elements, their RNAs, and their proteins (Adapted from the reference[6]);C: Ty1 replication cycle (Adapted from the reference[7])

逆转录病毒颗粒通常聚集在称为核衣壳装配位点或“病毒工厂”的亚细胞结构域中。Ty1和Ty3VLP组装的位点类似于逆转录病毒中的细胞质灶,称为T体或后体[10](图1C)。gRNA与Gag或Gag-Pol蛋白的组合促进了Ty1和Ty3VLP的组装在Ty1和Ty3VLP内,蛋白酶PR在GAG-POL蛋白中自我催化切割后,并催化GAG和GAG-POL蛋白序列切割,以产生成熟的蛋白GAG、PR、IN和RT/RH。在装配过程中tRNAmet也被包装在VLP内。随后以tRNA起始蛋氨酸(tRNAmet)作为引物与Ty1和Ty3mRNA中PBS引物序列互补,Ty1PBS位于Gag ORF中,而Ty3PBS位于基因组的3′端U3区(图1B),gRNA作为反转录的模板逆转录为负链DNA。在正链DNA合成后,得到完整的Ty1和Ty3cDNA,它们与整合酶(IN)互作形成蛋白预整合复合物(preintegration complex, PIC)后,被输入到核中[11]。随后在IN与宿主因子协助下,cDNA靶向整合到宿主基因组的特定区域。一些促进RNA POLⅢ活性的宿主因子协助调控Ty1和Ty3靶向到由RNA POLⅢ转录的基因(tRNA基因)上游区域[12-14]。Qi等[12]发现Ty3IN与TFIIIC和TFIIIB之间的相互作用促进Ty3靶向整合到tRNA基因上游区域,而Cheung等[13]研究表明转录起始因子TFIIIC和TFIIIB对于协助Ty1IN靶向tRNA基因上游区域是不必要的。

2 酵母Ty1和Ty3转座调控机制研究

综上所述,Ty1和Ty3的转座包括转录、翻译、mRNA包装、蛋白组装与VLP形成、逆转录、核输入、整合宿主基因组等过程,这些过程均受到宿主因子精细的调控。宿主因子大致可由促进(Host activators (RHF genes))或拮抗(Host restrictors(RTT genes))逆转录转座的两类基因编码。

2.1 Ty1 和Ty3 的表达调节

在Ty1和Ty3转座子转录过程中,Ty1和Ty3转录起始于5′LTR R区的第一个核苷酸,并在3′ LTR R区域的最后一个核苷酸处结束,经加帽和聚腺苷酸化修饰产生成熟mRNA,宿主的转录因子调控着Ty1和Ty3转录,通过调节启动子区顺式作用序列,促进或抑制其转录。Ty1元件5′LTR区的两个起始序列TATA box,3′LTR区的两个终止序列以及上游区的多个转录因子作用位点,其中包括Ty1和Ty3都受细胞类型调控响应的a/α2阻遏位[15]和Ste12/Tec1[16]激活位点。

另外,不同于Ty3,Ty1除了利用宿主因子还通过内部机制限制转座。Ty1可以转录产生5.7 kbTy1mRNA和5.0 kb截短的Ty1RNA(Ty1internal RNA,Ty1iRNA)[7])。在S288C酿酒酵母菌株中,Ty1元件的反义方向可以转录出三种反义非编码干扰RNA(AntisenseTy1RNA,Ty1AS RNA)(图2)。这些干扰RNA的转录起始在Gag中有不同的位点,在5′LTR中有两个终止位点,Pol II转录后的Ty1AS RNA进行加帽和聚腺苷酸化修饰后成熟。Ty1AS RNA是一个不稳定的小干扰RNA[17]。研究发现把Dicer 和 Argonaute蛋白导入缺乏干扰RNA的酵母后,会强烈抑制Ty1正义链RNA的表达和逆转录[31],表明可能是由于Ty1AS RNA和Ty1RNA形成双链RNA后被降解,导致用于转座的Ty1mRNA水平的降低。

图2 Ty1 干扰RNA和Ty1 mRNA (修改自参考文献[8])Fig.2 Sense and antisense RNAs transcribed from Ty1 and Ty1 transcription (Adapted from the reference[8])

2.2 Ty1 和Ty3 mRNA的包装调节

Gag既是Ty1和Ty3VLP的壳蛋白结构成分,也具有核酸伴侣功能(图1B)。研究发现,翻译后的Gag经内质网修饰后移位至反转体处进行gRNA的包装[18],研究表明gRNA包装在Ty1Gag[19]的C端以及Ty3Gag3[20]的NC结构域,NC结构域中存在保守的锌指关节结构域(CX2CX4HX4C),其周围的保守残基中的碱基参与gRNA的包装和逆转录转座。Ty1-H3正链mRNA的5′端的380 bp和3′端370 bp是逆转录所必须的顺式作用序列[21]。利用相同的方法,鉴定了Ty3mRNA的顺式作用序列也位于5′和3′末端,而中间翻译蛋白的mRNA序列对于Ty3逆转录不是必需的[22]。然而Ty1AS RNA与Ty1RNA一样,具有与GAG包装所需要的顺式作用序列,所以Ty1AS RNA会影响逆转录的正常包装。

研究发现Ty1gRNA以二级结构的形式包装在VLP内,使用引物延伸数据分析(SHAPE)构建了Ty1gRNA的二级结构模型[23](图3)。Ty1mRNA的5′末端不仅含有翻译的起始序列和包装所需要的顺式作用序列,还含有逆转录所需要的PBS序列。最新研究表明,13~32和272~318 bp两个环状结构中的7 bp互补序列促进了Ty1gRNA的二级结构的形成和包装[24]。

图3 Ty1 RNA 5′末端的二级结构模型(引用自参考文献[23])Fig.3 Secondary structure model of the 5′ end of Ty1 RNA (Quoted from the reference[23])

2.3 Ty1 和Ty3蛋白组装与VLP形成调节

TyVLPs是由Gag和Gag-Pol蛋白组成的多孔球状蛋白质的外壳,VLP内含有的Gag蛋白、pol基因编码的PR、 IN和RT/RH、 gRNA,宿主的tRNAmet和gRNA逆转录成cDNA所必需的脱氧核苷酸三磷酸物质。同时在VLP内,Ty1和Ty3都需要mRNA加工体(P-body, PB)蛋白才能有效完成组装和逆转录。真核细胞PB蛋白因子是细胞质核糖核蛋白颗粒,主要包括5′-3′核糖核酸外切酶Xrn1(Kem1),翻译抑制因子Lsm1、去活激活因子Pat1,死亡盒螺旋酶Dhh1/DDX6和Ded1/DDX3[25-27]。研究发现Ty1Gag和Xrn1、Lsm1或Pat1蛋白因子之间或Ty1RNA和Lsm1也没有直接相互作用。Xrn1蛋白因子协助VLPs中的Ty1RNA包装。在xrn1Δ、lsm1Δ和pat1Δ突变体中,Ty1AS RNA水平升高抑制了逆转录酶的形成和逆转录过程[26]。进一步研究发现,Dh1/DDX6是维持Ty3RNA正常水平所必需的,且Lsm1和Xrn1是将Ty3RNA结合到IN中形成PIC的必需因子[27]。总之,PB成分在Ty1和Ty3翻译后过程中促进了gRNA包装、VLPs的形成和反转录。

另外,许多调控机制通过抑制反转录过程,来降低Ty1转座子对宿主基因组的影响。Garfinke等[7]发现,当基因组中存在较多的Ty1RNA元件时,转座会受到抑制的现象称之为Ty1拷贝数控制机制(copy number control, CNC)[28-30]。Nishida等[28]发现调节因子复合物调控Ty1转录产生Ty1mRNA和截短形式的Ty1iRNA(图2),一方面Ty1iRNA作为逆转录的模板,会阻碍Ty1gRNA反转录以及cDNA的合成(图4)。另一方面蛋白质因子(P18和p22)参与调节CNC。由内部启动Ty1iRNA(图2)编码N端截短形式的GAG蛋白(P18和p22),P18和p22是由GAG中两个相近的翻译起始位点和相同的终止位点表达的,并且都有与GAG相同的核酸伴侣活性,它们会竞争性结合在Ty1RNA包装位点,从而产生有缺陷的VLPs[42]。同时研究发现核糖体发生因子LOC1也影响调控CNC,在loc1突变株中,Ty1iRNA的转录量升高,翻译产生的p22的水平也升高[8],阻碍了Ty1gRNA反转录以及cDNA的合成。

图4 p22 和 AS RNA抑制Ty1 VLPFig.4 Ty1 VLP functions inhibited by p22 and AS RNA

2.4 Ty1和Ty3逆转录调节

与逆转录病毒相似,Ty1和Ty3前体Gag和Gag-Pol蛋白通过Gag-Gag相互作用,形成未成熟的VLP,由Ty PR处理后形成成熟的VLP,才可以进行逆转录。在野生型酵母细胞内,Ty表达成熟的VLP是非均质,而Ty PR缺陷的突变体表达出相对均匀且大致为球形的未成熟VLP[10]。

tRNAmet作为启动逆转录的引物,被包装到Ty1和Ty3VLP内[6]。3′末端tRNAmet与Ty1和Ty3PBS 有10 bp的互补序列,同时Ty1和Ty3在gRNA末端序列的相互作用下才能启动反转录,如Ty15′RNA CYC5和3′CYC3相互作用,位于PBS下游 CYC5序列也与tRNAmet DHU臂互补(图3)。tRNAmet TΨC和DHU臂与Ty1RNA序列的互补不仅可以启动反转录,也可以促进包装[23]。然而Ty1AS RNA可在反转录过程中,阻断PR切割POL前体蛋白,破坏IN和RT的稳定或阻止tRNAmet退火等[31](图4)。

在逆转录酶的结构与功能鉴定中发现,与逆转录病毒RT类似,Ty1和Ty3RT末端结构域具有RNA或DNA依赖性DNA聚合酶活性,而且末端RNaseH结构域还具有降解RNA∶DNA双链体中RNA链羧基的功能。这种双重活性使得单链Ty RNA逆转录成全长的双链Ty cDNA。Jason等[30]发现Ty3RT同源二聚体中亚基的不对称结构激活了RNaseH酶的活性。

2.5 Ty1和Ty3 核输入转运调节

Ty1和Ty3IN与逆转录病毒整合酶具有相同的三级结构域。N端结构域含有保守的锌结合基序,中心区域保守的催化结构域DDE基序切割并协助cDNA整合。Ty1和Ty3IN C端结构域都有一个由两个相同的基序(KKR)组成的二分核定位信号(nuclear localization signal, NLS),NLS可被输入蛋白α受体识别。并且IN NLS协助TycDNA的核输入和整合定位[32],可能还参与PIC调控cDNA的核进入路径。

成熟的Ty VLP在细胞质中聚集,为完成核内整合过程必须进行核输入过程。核孔复合物(nuclear pore complexs, NPCs)是核孔多分子的通道复合物,它调控基因组Ty1转录、核输入和转座整合的动态调控过程[14,34]。因为Ty VLPs[33]超过了穿越孔隙通道所容纳的最大直径,在VLPs脱壳后,cDNA才能入核。核孔复合物NPC的重复结构域Phe-Gly(FG)参与Ty3核运输过程,体外研究发现在Ty3核运输时,Ty3VLPs外壳SP结构域与核重复结构域FG互作,核衣壳结构域和整合酶NLS促进了VLPs的脱壳过程[33]。

2.6 Ty1和Ty3 靶向整合机制过程调节

Ty1和Ty3cDNA入核后,在体内多种细胞辅助因子协助下整合到宿主染色体上。大多数转座事件由IN协助Ty cDNA进行整合。体外研究发现,与逆转录病毒IN类似,Ty1IN二聚化后与cDNA组装成四聚体以形成PIC[35]。另外,IN催化活性决定了Ty插入位点5 bp靶位点重复(Target site duplication, TSD)和靶向位点偏好性。Ty1和Ty3末端都具有保守的末端颠倒重复序列(Terminal Inverted Repeat, TIR),Ty1cDNA TIR二核苷酸5′-TG ... CA-3′与Ty3cDNA 8 bp保守的TIR(5′-TGTTGTAT / ATACAACA-3′)对于Ty3整合识别都是必要的。在整合过程中,基因组靶序列经Ty IN催化后两端暴露了3′OH和核苷酸间隙,每条cDNA链TIR与5 bp的基因组靶序列3′OH部分进行自由基交换,这种链转移的酯交换反应[36]导致在每间隙的修复产生了一个5 bp的TSD,这是Ty1整合的标志。Ty1IN不能修复缺口,由Ty1RT或细胞内DNA修复蛋白修复。

经过比较逆转录转座子和逆转录病毒整合到特定基因偏好性,发现逆转录转座子整合通过避开ORF或者偏爱靶向整合到异染色质来避免宿主功能基因被破坏,而逆转录病毒偏爱整合到基因表达阅读框从而破坏宿主基因组稳定性。最近采用深度测序方法鉴定了Ty1和Ty3都具有偏爱整合到由Pol III转录的tRNA基因[12-14]上游区。Ty3插入tRNA基因转录起始位点上游的1至4 bp[26],而Ty1偏爱整合到tRNA基因转录位点上游700 bp区域。最新Manhas[13]研究发现RNA Pol III亚基Rpc31, Rpc34和Rpc53直接与Ty1IN相互作用,且Rpc53/37亚基复合物在促进Ty1元件整合到tDNA上游具有重要的作用。研究也发现核孔蛋白NPC核篮参与调控Ty1表达及对核小体的靶向作用,NPC核篮组分的缺失会使Ty1元件整合在染色体末端[14]。

总之,宿主对Ty1和Ty3转座过程的调控机制是生物学中重要的研究发现。过去20年间,不同于逆转录病毒的传染性,酵母Ty1和Ty3作为良性载体都是广泛用于研究逆转录的最佳模型,在逆转录转座子中鉴定了数百个宿主因子[37-41],汇总了最新研究鉴定的宿主因子(见表1),这些因子促进或抑制酵母逆转录转座子逆转移的速率。

表1 Ty1或Ty3 共宿主因子鉴定

3 展 望

自1985年反转录转座子被发现以来,反转录转座子特别是酵母反转录转座子Ty元件一直处于研究的前沿,本文系统详细的阐述了LTR反转录转座子转座的机制以及宿主对酵母Ty1和Ty3转座子精细调控机制方面的最新研究进展。研究发现酵母Ty1和Ty3转座过程都类似于逆转录病毒,Ty3在结构特征上更接近于逆转录病毒,而酵母Ty1在翻译、包装及逆转录等调控过程与Ty3不同,干扰小RNA和蛋白因子(p18和p22)参与调控Ty1转座过程。

转座过程中的转录受到外界胁迫环境的调控,最新研究侧重于衰老与转座的相关关系[40],可进一步探索翻译过程结构蛋白GAG与融合蛋白GAG-POL的表达相关控制机制、反转录模板gRNA与翻译模板mRNA的功能如何区分应用、GAG翻译后如何定位到gRNA而进行的包装过程、鉴定更多核糖体因子与PB蛋白因子及其调控机制、衰老与转座插入相关机制以及更多核孔复合物与相关蛋白因子如何调控Ty1和Ty3在转录、核输入及转座的研究。

Ty1与Ty3转座子作为良性载体,可用于探索与反转录病毒相关的宿主因子,更多关键共宿主因子的发现,有助于掌控Ty1与Ty3转座子在宿主机体内的运转机制及可能与逆转录病毒,最近研究发现酵母中Tya融合蛋白技术的应用显著提高了代谢产物的合成效率[42],表明了这一方法可能有助于提高酵母代谢工程中多酶复合物的产生,同时酵母作为模式细胞生物已普遍适用于研究动植物基因的表达与功能验证,本课题组利用酵母LTR辅助体系[4]已经研究了异源双转化的活性转座子在酵母中的转座调节机制[43-44]。本文系统地介绍了Ty1与Ty3转座和调节机制,为后续进一步研究LTR转座子提供必要的参考。

猜你喜欢

逆转录宿主结构域
猪肺炎支原体膜蛋白Mhp271 与宿主UPR-GRP78相互作用促进其感染的分子机制研究
细菌四类胞外感觉结构域的概述
抗逆转录病毒治疗对艾滋病患者脑灰质体积的影响
UBR5突变与淋巴瘤B细胞成熟
龟鳖类不可能是新冠病毒的中间宿主
鲤春病毒血症病毒逆转录环介导等温扩增(RT—LAMP)检测方法的建立
抓住自然宿主
高中生物教材中几个疑难点的解读
人乳头瘤病毒感染与宿主免疫机制
DEP结构域的功能研究进展