上海交通大学农业与生物学院单细胞生物学联合研究中心,上海 200240
细胞核是细胞遗传与代谢的调控中心,遗传物质DNA有序且密集地分布其中。人类细胞核基因组的物理长度约102 cm,即使基因组较小的拟南芥(),其细胞核基因组也有3.8 cm,而这些DNA通过折叠浓缩后储存在仅有几微米的细胞核内。染色体经过折叠形成有序的三维结构,这一过程很大程度上依赖染色体结构维持蛋白(structural maintenance of chromosomes, SMC)的调控[1~3]。SMC复合体从真菌、植物到人类都非常保守,包括cohesin、condensin和SMC5/6三大类。Condensin的功能主要与染色体内部的凝聚相关,当人类细胞敲除condensin后,导致染色体不能凝聚,不能形成正常姐妹染色单体,在分裂后期姐妹染色单体也不能正常分离。SMC5/6功能主要与DNA的损伤修复相关。关于cohesin的功能,早期人们研究发现其在酵母细胞有丝分裂和减数分裂过程中都发挥重要功能。在分裂过程中,cohesin可以维持染色体的正常形态,保证姐妹染色单体及同源染色体在细胞的不同分裂时期正确分布[4~6]。而在间期,cohesin维持染色质形成不同的空间结构,调控基因表达,还与DNA复制、DNA损伤修复相关[5,7~9]。最近的研究还发现cohesin介导的染色质环挤出动态过程对RAG (recombination-activating gene)扫描损伤位点起到促进作用,并在数量众多的V(D)J (variable- diversity-joining)重排和交错转化重组(cross switch recombination, CSR)过程中发挥重要作用[10]。
1 Cohesin结构
1.1 SMC蛋白复合体的结构特点
真核生物的SMC复合体都是在两个SMC蛋白组成的异源二聚体基础上形成的[11~13]。每个SMC 蛋白由1000~1500个氨基酸组成,中间是球状的铰链(hinge)结构域,铰链结构域两侧延伸形成卷曲螺旋(coiled-coils)结构域[14],卷曲螺旋结构域终端分别为Walker A和Walker B结构域,即SMC蛋白N端的Walker A和C端的Walker B结构域。Walker A含有核苷酸结合结构域(nucleotide-binding domain, NBD),Walker B含有与典型ATP酶同源的ATP结合结构域(ATP-binding cassette, ABC)。单个SMC蛋白以hinge结构为中心,两侧的coiled-coils结构域反向平行相互作用在一起,这使得SMC的N端Walker A和C端Walker B结构域相互靠近在一起,形成有功能ATP酶(ATPase)结构域(图1,A和B)[15~17]。SMC的ATPase位点对于整个SMC蛋白复合体在DNA上的结合和解离至关重要[18]。
1.2 Cohesin主要亚基
Cohesin是SMC复合体中的一类,由SMC1、SMC3和SCC3 (在动物中是Rad21)以及kleisin亚基组成的环状套索结构[14,19]。其中,SMC1与SMC3是典型的SMC 蛋白,SMC1和SMC3的hinge结构域相互作用形成V形的异源二聚体,底部由kleisin亚基将两个SMC蛋白的ATP酶结构域连接形成闭合环状V形复合体(图1B)[20,21]。Kleisin亚基与SCC3亚基相互作用,进而招募SCC3形成完整的cohesin蛋白复合体[22]。酵母中发现SCC3 (SA2)的C端与kleisin相结合。蛋白结构分析发现,SCC3内部凹面可以与kleisin (Rad21/Scc1-M)亚基中间很大一段相互作用[23]。目前在植物中还没有关于cohesin各亚基间相互作用的报道。
拟南芥cohesin的AtSMC1和AtSMC3亚基与酵母和哺乳动物SMC家族相比蛋白同源性很高。拟南芥和单突纯合突变体种子在发育过程中胚和胚乳都存在严重缺陷[24~26],胚胎发育早期就死亡,由此可见cohesin在胚胎发育早期即已经发挥着重要作用。拟南芥中AtSCC3不存在基因冗余现象,与酵母中SCC3蛋白有40%的同源性。动物中SCC3亚基含有HEAT-repeat (Huntingtin, elongation factor 3, protein phosphatase 2A)结构域[27],而拟南芥中AtSCC3却不含有HEAT-repeat结构域。拟南芥纯合突变体在胚胎发育早期缺陷致死,Chelysheva等[28]发现Ws(Wassileskija)拟南芥弱的突变体植株与野生型相比表现出矮小、晚花、育性降低、有丝分裂及减数分裂均发生异常。
图1 SMC类蛋白及cohesin的结构示意图
Kleisin亚基在拟南芥、水稻(L.)和玉米(L.)中均有研究。在拟南芥和水稻中kleisin 亚基的4个同源蛋白相对保守,玉米中仅有AFD1一个同源蛋白,酿酒酵母()及脊椎动物中kleisin 亚基有RAD21和REC8两个同源蛋白(表1)[29]。拟南芥中Kleisin亚基的4个同源蛋白分别为:AtSYN1、AtSYN2、AtSYN3和AtSYN4[30~33]。突变体雌雄配子不育,但其营养生长等生长发育过程均正常[34,35],表明AtSYN1蛋白主要在减数分裂形成配子过程中发挥重要功能[34,36]。最近研究发现,拟南芥第一次减数分裂过程中cohesin维持在着丝粒区域依赖两个蛋白磷酸化酶对AtSYN1的去磷酸化作用[37,38]。AtSYN3主要定位在核仁,与rDNA结构维持及rRNA转录和加工成熟有关[33]。AtSYN2和AtSYN4在有丝分裂中发挥重要功能。AtSYN2与种子萌发过程中DNA损伤后修复相关[35],而AtSYN4与苗期体细胞DNA损伤修复相关[39]。酵母双杂交实验证明,AtSYN4 也可以与磷酸化酶PP2A B'α、PP2AB'β和PP2AB'ζ相互作用,磷酸化酶与AtSYN4的相互作用可能与有丝分裂过程中cohesin在着丝粒上的维持相关[37,38]。
玉米AFD1是REC8的同源蛋白,其功能与同源染色体配对、联会复合体的形成及RAD51在染色体上的分布有关。AFD1会影响染色体在细线期及偶线期的分布。突变体中染色体在偶线期不能呈“花束”形态(bouquet formation)分布,减数分裂发生异常[44]。
2 调节cohesin在染色质上动态变化的因子
Cohesin在细胞分裂过程中重要的功能是维持姐妹染色单体有序地分布。在显微镜下可以观察到,在细胞分裂前期到中期cohesin都结合在染色体臂以及着丝粒区域,维持两条姐妹染色单体粘连在一起,在分裂中后期cohesin从染色体臂上解离下来,末期着丝粒上的cohesin也解离下来,姐妹染色单体得以正常分离。在转录过程中cohesin也随着RNA聚合酶及转录因子从转录起始位点向转录终止位点移动[45,46]。可见cohesin在染色质上的结合是动态变化的。Cohesin在染色质上的动态变化在拟南芥,酵母,线虫()和人类()中均有相关研究[4~6,47,48]。Cohesin的动态变化依赖很多蛋白,如:SCC2负责在DNA上招募cohesin,而cohesin在染色质上的维持依赖CTF7/ECO1 (chromosome transmission fidelity/establishment of cohesion 1)。另外,WAPL (wings apart-like protein)和PDS5 (precocious dissociation of sisters protein 5)因子与cohesin从DNA上解离有关(表1)。
2.1 Cohesin在染色质上的加载
表1 Cohesin亚基及相关调控因子
拟南芥中cohesin加载因子的同源蛋白为AtSCC2和AtSCC4。AtSCC2与动物中同源蛋白有20%的同源性,除了有动物中共有的HEAT-repeat结构域外,AtSCC2还有植物中特有的植物同源结构域(plant homeodomain, PHD)。PHD结构域与组蛋白表观修饰以及基因表达调控相关[62,63]。在植物中,SCC2也是非常重要的蛋白。拟南芥纯合突变体在种子形成过程中胚乳过度增生分裂、发育异常、胚胎早期致死[62]。拟南芥纯合突变体胚胎在心形胚形成阶段不能对称分裂,胚柄处过度增生[64]。拟南芥植株中可观察到减数分裂过程中染色体分离紊乱,同时结合在染色质上的AtSCC3蛋白也减少,并出现姐妹染色单体黏连,染色体桥及分裂后细胞中染色体数目异常的现象[62]。在双突变体背景下,生长素报告基因被限制在胚柄底部细胞中表达,而野生型中报告基因在胚柄顶部细胞中表达。这表明AtSCC2和AtSCC4的缺失会导致胚胎发育过程中胚柄细胞胚胎潜能的改变。植物和酵母中都发现,SCC4可以与SCC2的N端稳定地相互作用在一起,但植物AtSCC4与AtSCC2之间的相互作用不会影响AtSCC4的定位。拟南芥AtSCC2的突变并没有改变植物体细胞核中AtSCC4的定位[54]。此外,有丝分裂间期AtSCC4与kleisin亚基AtSYN4共定位[54],而AtSCC2的主要功能被认为在减数分裂过程中影响cohesin的定位[62],这表明在拟南芥中AtSCC4与AtSCC2功能存在特异性。最近研究发现,玉米中DEK15是SCC4的同源蛋白。在突变体中,姐妹染色单体形态异常,非整倍数细胞增多,且种子胚乳发育异常,胚胎早期死亡率增加。玉米DEK15对于染色体精确的分离非常重要,且可以协同染色质重塑因子促进cohesin在染色质上的结合[65]。
2.2 Cohesin在染色质上的维持
在有丝分裂S期前,cohesin在SCC2和SCC4的招募下与DNA结合。从S期到分裂中期,cohesin一直结合在染色体臂及着丝粒上,维持姐妹染色单体连接在一起,直至后期cohesin从染色体上解离下来。在这个过程中,cohesin复合体在染色质上的维持依赖几个关键蛋白:ECO1 (establishment of cohesion 1)又称为CTF7 (chromosome transmission fidelity 7),以及sororin因子。
酵母中CTF7/ECO1是乙酰转移酶,在S期可以对SMC3的head结构域的两个赖氨酸残基进行乙酰化修饰[66~69]。SMC3的ATPase位点K112和K113位被乙酰化后,ATPase结构域关闭,使kleisin亚基与SMC亚基结合紧密,进而使cohesin环状结构稳定[68~70]。SMC3的这两个赖氨酸残基位点在多种生物中都是非常保守的,在人体细胞中,ESCO1 (establishment of sister chromatid cohesion N-acetyltransferase 1)和ESCO2两个乙酰化酶同样可以乙酰化SMC3[69,70]。酵母CTF7缺失会造成染色质状态混乱,导致cohesin在染色体臂及着丝粒上分布异常,以及细胞周期异常[71,72]。酵母CTF7/ECO1与增值细胞核抗原(proliferating cell nuclear antigen, PCNA)和复制因子C (replication factor C, RFC)复合体直接相互作用,这表明在姐妹染色单体形成过程中,DNA的复制和cohesin作用下的姐妹染色单体粘连是同时进行的[73,74]。
在脊椎动物中,还存在另外一个对cohesin与染色质的稳定结合起到重要作用的sororin因子。由于一些解离因子的存在,仅仅乙酰化的SMC3不足以让cohesin在复制过程中稳定地结合在染色质上,还需要乙酰化结合蛋白sororin来维持整个复合体的稳定。Sororin含有FGF结合序列,可以结合在PDS5 (precocious dissociation of sisters 5)蛋白上,进而起到稳定cohesin-DNA的作用[75~77]。在裂殖酵母()中,PDS5可以加强SMC3的乙酰化[78]。PDS5在间期与sororin相互作用,有协助cohesin结合DNA,并有维持cohesin与DNA稳定结合的功能。在后期,PDS5与解离因子相互作用,促进cohesin从DNA上解离下来,可见PDS5与不同因子相互作用发挥的功能也不同[79~81]。
拟南芥可以互补酵母突变体表型[82~84],这表明cohesin在细胞分裂过程中的功能在拟南芥和酵母中是非常保守的。AtCTF7包含PIP-BOX (PCNA-interacting protein BOX)、一个C2H2锌指蛋白结构域和一个乙酰转移酶结构域[82]。与其他生物相同,AtCTF7功能也有剂量效应,atctf7杂合体雄配子异常,小孢子母细胞发育正常,植物营养生长无明显异常,但育性降低。完全缺失的突变体拟南芥表现出严重的生长缺陷表型:胚胎在发育到球形胚阶段就严重畸形,仅能获得少数纯合植株,表现出极矮小、不育的表型,同时cohesin在染色质上的结合明显减少[82,83]。过表达CTF7也会导致拟南芥胚珠在发育早期死亡[85]。
2.3 Cohesin从染色质上解离
WAPL是调控cohesin从染色质上的解离下来的关键因子。有丝分裂中后期,cohesin开始逐渐从 染色体臂上解离下来,仅保留在着丝粒区域。起始cohesin从染色体臂上解离下来的过程与SCC3亚基的磷酸化相关,这个磷酸化过程依赖于WAPL解离因子[86]。有丝分裂后期,SCC3与sororin被磷酸化,磷酸化后的sororin不再与PDS5相互作用,PDS5与解离因子WAPL相互作用,PDS5-WAPL复合体促进cohesin从染色体壁上解离下来。Cohesin从着丝粒上解离下来的过程依赖蛋白酶对kleisin亚基的水解,整个过程WAPL-PDS5-SCC3协同发挥作用[79,87,88]。
拟南芥中有5个同源基因,在不同器官中检测表达量,发现在种子成熟过程中其表达量明显下降。当植株被γ射线照射后,表达上升。敲除后,减数分裂只轻微受到影响,但是DNA的同源重组修复能力明显减弱[89]。拟南芥中有两个同源基因和[90],而仅有一个拷贝[82],分子及遗传学实验证明AtWAPL和AtCTF7二者功能拮抗[91]。和T-DNA插入突变体在植物生长发育以及育性方面都没有异常[90],纯合双突变体在营养生长阶段与野生型相比没有差异,但雌配子雄配子活性下降,植株育性降低。在减数分裂方面,双突变体的同源染色体配对异常,纺锤体形成异常,且cohesin在染色体臂上滞留,出现黏连在一起的姐妹染色单体,在后期不能正常分离[90]。WAPL在许多生物有丝分裂过程中发挥重要功能,减数分裂中的研究较少。对拟南芥AtWAPL的研究发现,其在植物减数分裂中同样发挥重要功能。拟南芥atctf7杂合子突变体植株育性降低,纯合突变体植株生长发育严重缺陷,并且不育[83]。Kuntal De等[91]在研究AtCTF7和AtWAPL功能时发现,将纯合突变体与atctf7突变体杂交,获得三突纯合突变体,其生长发育与野生型无明显差异,但育性比和atctf7低,可见AtWAPL蛋白缺失可以抵消突变体在有丝分裂过程中cohesin不能结合到染色体上的缺陷。同时表明作为调控cohesin动态变化的因子,AtWAPL和AtCTF7在功能上相互拮抗。
3 Cohesin功能
3.1 Cohesin在细胞分裂中的功能
体细胞进行有丝分裂的过程中,G1期SCC2和SCC4招募cohesin与DNA结合,这个过程也依赖SMC蛋白ATP水解酶活性。SMC1和SMC3形成的hinge结构是DNA链进入cohesin环的“入口”[60]。Cohesin与DNA结合后,从间期到中期,在染色体上的维持依赖于ECO1/CTF7这个乙酰转移酶对SMC3亚基的乙酰化作用,以及sororin-PDS5蛋白的结合抑制了WAPL蛋白打开cohesin环的作用[77,100,101]。在S期,cohesin在DNA上的加载与DNA的复制过程协同进行[102]。在前期–中期转换的阶段,染色体臂上的cohesin开始解离下来,这个过程依赖一些有丝分裂激酶的作用。以哺乳动物为例,cohesin的SA (SCC3)亚基被Plk1磷酸化以及sororin蛋白被Cdk1和Aurora B磷酸化都与cohesin从染色体臂上的解离相关,其中WAPL也发挥重要作用[103,104]。但在有丝分裂后期姐妹染色单体分离之前,cohesin会一直结合在着丝粒上,此时SGO1以及PP2A会保护SA及sororin不被磷酸化,从而使cohesin维持在着丝粒上[103,105]。中后期纺锤体上的微管向细胞两极牵引,此时着丝粒上的cohesin产生的内聚力可以抵消掉部分纺锤体的牵引力。在中期赤道板上的姐妹染色单体有了分别向两极移动的重新定向,确保染色体可以正常移动到两极后,才进行后期着丝粒解凝聚。这时cohesin的kleisin亚基在蛋白水解酶作用下水解,致使cohesin从着丝粒上解离下来,姐妹染色单体向两极移动[12,106]。
表2 Cohesin亚基在有丝分裂及减数分裂中的比较
3.2 Cohesin在维持染色质构像及基因表达调控中的功能
最早是在果蝇()中发现cohesin具有转录调控的功能。Cohesin的加载因子 Nipped-B(SCC2)发生突变后,基因的表达受到抑制,Nipped-B可以介导基因区域增强子–启动子的相互作用。如果cohesin不能结合到基因上,启动子不能与增强子互作,基因转录水平降低[120]。同样,当人缺失了cohesin 加载因子CdLS(SCC2)会造成科妮莉亚·德·兰格发育综合征(Cornelia de Lange syndrome),这是一种引起上肢发育畸形、智力缺陷的疾病,其致病原因是由于CdLS的缺失导致下游基因转录调控异常[121,122]。
CTCF(CCCTC-binding factor)是协同cohesin维持染色质三维结构及调控转录的关键因子。染色质在细胞核内相互作用形成拓扑异构相关结构域(topologically associating domain, TAD),TADs是与染色质三维结构功能相关的重要区域,TADs内部染色质交互密集,TADs之间染色质交互频率低[123]。有研究提出TAD的主要作用是限制启动子和增强子间的相互作用[124,125]。不同TAD之间被边界区域(boundary)隔开,边界区域富集CTCF和cohesin(图2)[126],且多富集转录相对活跃的管家基因[127~130]。边界区域基因表达相对活跃,与染色质结构相对松散,以及富集着一些与活跃染色质相关的组蛋白修饰标记(H3K4me3和H3K36me3)相关。
拟南芥中,染色体组织形态上没有明显的TAD。同时,拟南芥中也缺少动物中经典的CTCF绝缘蛋白,这与拟南芥中缺少典型的TAD存在相关性。仅有很少的可信证据表明在拟南芥中存在类似于绝缘元件的DNA (insulator-like DNA)序列。然而,在对拟南芥进行高分辨率的全基因组染色质构象捕获(Hi-C)后发现超过1000个类似TAD(TAD-like)的区域[131]。拟南芥中这些区域和动物中的TAD有着相似的特性:在TAD内部,染色质交互密集;在TAD之间,染色质的交互受到限制。同样它们在染色体松散的地方以及基因表达活跃的地方富集[131,132]。但植物中还没有关于cohesin与三维基因组的相关报道。
研究发现cohesin加载因子、SMC和kleisin不同亚基在全基因组上的结合位点与CTCF有显著重叠,并且cohesin与CTCF共同对这些基因转录起到抑制的作用。尽管CTCF和cohesin在很多环状DNA结构处共同结合,但是它们在维持染色质构象上的功能不尽相同。CTCF与转录抑制相关,而cohesin除了与CTCF共同作用的位点外,还在很多基因位点与转录激活相关[127]。根据染色质包装紧密程度可以将cohesin的结合位点分类:在包装紧密的DNA结合位点,通常是cohesin与CTCF共同结合的位点;染色质包装松散的DNA结合位点,通常没有CTCF结合,这些区域大多为启动子或增强子区[133~139]。Cohesin还和一些其它的调控因子如调控蛋白复合体(mediator complex)相互作用发挥转录激活作用[133~137]。可见cohesin作为分子间桥梁,通过影响长距离范围内DNA上调控元件如:绝缘子/增强子-启动子(insulator/enhancer-promoter)之间的染色质交互来调控转录。Cohesin将增强子-启动子拉近在一起时,可以起到转录激活作用,此时cohesin多与转录因子或mediator共同起作用;当cohesin将绝缘子–启动子拉近在一起时,可以起到转录抑制功能(图3)[18,140],此时cohesin多与CTCF共同发挥作用。
图2 拓扑异构结构域的二维结构示意图
图3 Cohesin在基因表达调控中的功能
4 结语与展望
Progresses on the structure and function of cohesin
Yu Zhang, Yuda Fang
Cohesin is an evolutionarily conserved protein complex in eukaryotes. The four subunits of cohesin form a ring structure that plays an important role in maintaining the orderly arrangement of chromatin during cell division. In addition, metazoan cohesin was found to act as an intermolecular linker, which regulates insulator/enhancer–promoter interactions, leading to either enhancement or inhibition of gene expressions. However, little is known about the role of cohesin in the transcriptional regulation in plants. In the review, we introduce the structure and core subunits of cohesin, and summarize the factors that regulate its dynamic changes on chromatin. Based on the functional study of plant cohesin in recent years and researches in animals about the roles of cohesin in the three-dimensional genome organization and transcriptional regulation, we prospect the potential functions of plant cohesin in regulating transcription.
SMC; cohesin; cell cycle; three-dimensional genome; transcriptional regulation
