HOXD基因簇内一系列CTCF位点反转揭示绝缘子功能
2021-08-25何象龙李金环吴强
何象龙,李金环,吴强
研究报告
基因簇内一系列CTCF位点反转揭示绝缘子功能
何象龙,李金环,吴强
上海交通大学系统生物医学研究院比较生物医学研究中心,系统生物医学教育部重点实验室,上海 200240
CTCF (CCCTC-binding factor)是一种重要的染色质架构蛋白,其与绝缘子的方向性结合在哺乳动物基因组三维空间结构形成和维持中起着至关重要的作用。正向–反向相对方向的CTCF结合位点(简称CTCF位点)可以在染色质黏连蛋白(cohesin)的协助下,形成染色质环,介导远距离DNA元件之间的相互作用;而在染色质拓扑结构域边界区域的CTCF位点呈现反向–正向相背方向分布,发挥绝缘子的功能。为进一步研究CTCF介导染色质环的形成与其绝缘功能之间的关系,本研究采用DNA片段编辑方法通过设计成对sgRNA (dual sgRNA)构建了一系列基因簇区域CTCF位点反转的单细胞克隆。定量高分辨率染色质构象捕获实验显示边界区域CTCF位点反转会改变原有的染色质环方向,通过环挤出模型(loop extrusion)形成新的染色质环,引起染色质拓扑结构域边界漂移至新形成的一对反向–正向CTCF位点处。此外,串联排列的CTCF位点可以通过阻碍反方向渗透的黏连蛋白继续滑动发挥绝缘子的功能。RNA-seq实验发现CTCF位点反转引起的局部基因组空间结构变化会进一步影响基因的表达。上述研究表明相邻两个染色质拓扑结构域边界区域的反向-正向CTCF位点可以通过与各自所在拓扑结构域内相向的CTCF位点形成染色质环,阻碍黏连蛋白滑动,该发现为进一步研究CTCF的绝缘功能和其对基因组拓扑结构的影响提供了参考。
CTCF;染色质环;;绝缘子;CTCF位点反转
大约2 m长的人类基因组通过多次盘曲折叠,最终被包裹在直径约5 μm的细胞核中,形成了复杂的染色质三维空间结构[1~3]。特定的染色质空间结构对于DNA复制[4]、基因转录调控[5,6]和DNA修复[7,8]等生物学过程有着重要作用。早期通过光学显微镜研究发现,有丝分裂间期染色体有规律的分布在细胞核的不同区域,被称为染色质领地(chromosome territories)[9];随着染色质构象捕获(chromosome conformation capture, 3C)[10]、环状染色质构象捕获(circular chromosome conformation capture, 4C)[11]、Hi-C[12]和配对末端标签测序分析染色质相互作用(chromatin interaction analysis by paired-end tag sequencing, ChIA-PET)[13]等技术的发展,A/B隔室(compartment)、拓扑相关结构域(topologically associated domain, TAD)和染色质环(chromatin loop)等概念被相继提出[2,12,14~18],促进人类从多个层次对染色质高级结构的认识。基于Hi-C数据,基因组上平均大小约为1 Mb、内部DNA相互作用紧密的区域,被定义为TAD[13,14]。在人的不同细胞系中,TAD表现出较好的保守性[15]。通常认为在TAD内部,增强子(enhancer)、绝缘子(insulator)与沉默子(silencer)等顺式作用元件可以通过CTCF(CCCTC-binding factor)和YY1等染色质架构蛋白介导的染色质环与基因的启动子(promoter)发生相互作用[5,19~22],来调控基因的表达。
CTCF蛋白是一种参与染色质折叠的重要架构蛋白。CTCF蛋白最早发现于对鸡()基因的研究,由于其与DNA结合的序列含有高度保守的CCCTC序列,因而被称为CCCTC结合因子[23]。CTCF蛋白通过11个串联的锌指结构与人类基因组上成千上万的绝缘子调控元件结合[19,24~27]。在哺乳动物中,CTCF结合位点(CTCF-binding site, CBS)是最主要的绝缘子调控元件,包含4个模块(module),即module 1~4,其具有方向性,module 1~4的方向是正向,module 4~1的方向则为反向[5]。CTCF在黏连蛋白的协助下,通过环挤出模型介导远距离的DNA相互作用[16,18]。在TAD边界处分布着大量反向-正向的CBS,通过阻断cohesin的滑动,起到绝缘子的功能[2,5,28~30]。删除CBS导致CTCF无法结合,会破坏原有DNA之间的染色质环,引起局部基因组构象的改变[28,31~33]。反之,插入异位CBS会形成新的染色质环,同时作为绝缘子阻碍原有染色质环的形成[34,35]。在基因簇的增强子和启动子之间插入正向或者反向的CBS,都可以起到绝缘子的作用,显示绝缘子没有方向性[34]。在原钙粘蛋白(protocadherin,)、免疫球蛋白 (immunoglobulin,)、等基因簇存在着成串同向的CBS,这些CBS均有机会形成染色质环[5,36,37],显示正向-反向CBS对cohesin的阻碍作用是有渗透性的,这可能是由于CTCF与DNA的动态结合[34,38]。然而,当前对于成串CBS绝缘子功能的研究主要侧重于启动子与增强子的相互作用,在染色质拓扑结构域边界处的成串CBS的绝缘子功能还缺少系统性的研究。
基因簇是控制四肢发育时空顺序的重要基因簇,被广泛应用于对基因组三维空间结构的研究[19,39]。基因簇区域存在一系列的CBS,与两侧调控区域内的CBS通过环挤压模型分别形成两个TAD[19,39~42]。基因有序的表达受到两侧TAD内增强子簇的调控,其表达分为两个阶段;在四肢发育早期,3′端粒侧TAD (telomeric domain, T-DOM)内由CS38-41 (conserved sequence elements 38-41)和CS65 (conserved sequence element 65)组成的下游增强子簇或超级增强子(downstream enhancer cluster or super-enhancer)共同调节的表达,并在四肢近端维持这种表达模式;在肢端发育后期,5′中心粒侧TAD (centromeric domain, C-DOM)内由Island 1-5、GCR和Prox组成的上游增强子簇或超级增强子(downstream enhancer cluster or super-enhancer)协同调节四肢远端的表达[19,42,43]。基因簇区域大范围的片段反转破坏原来的基因组三维结构,影响基因簇的正常表达[39,41,44],但这些大范围的片段反转主要针对增强子调控元件,针对绝缘子CTCF位点的DNA片段反转研究较少。
成簇规律间隔短回文重复系统(clustered regularly interspaced short palindromic repeats/CRISPR-associated nuclease 9, CRISPR/Cas9)源于古菌和细菌中的一种适应性免疫系统,近年来被广泛应用于DNA片段反转、DNA片段删除和染色体异位等编辑实验[22,45~52]。HEK293T细胞系是一种常用的模式细胞系,常被用于对染色质三维空间结构的研究[5,53,54]。本实验室之前通过对HEK293T细胞系以及HEC-1B等细胞系中CBS位点反转的研究发现,CBS方向性是哺乳动物细胞中普遍存在的规律[5]。本研究利用CRISPR DNA片段编辑技术在HEK293T细胞系中对基因簇所在区域中串联排列的CBS元件进行一系列组合性的反转,利用定量高分辨率染色质构象捕获(quantitative high-resolution chromosome conformation capture copy, QHR-4C)技术[34]研究CBS反转后染色质空间构象的变化,发现CBS反转会改变该CBS原有的远距离DNA相互作用,引起染色质拓扑结构域边界漂移至新形成的一对反向–正向的CBS处;同时,相邻两个染色质拓扑结构域边界区域的反向-正向CBS可以通过与各自所在拓扑结构域内的相向CBS形成染色质环,发挥绝缘子功能,这种绝缘子的作用有助于稳定基因组三维空间构象。
1 材料与方法
1.1 实验材料
人胚肾细胞系HEK293T细胞从中国科学院细胞库购买;pcDNA3.1-Cas9-WT质粒由北京大学席建忠教授惠赠;pGL3-U6-sgRNA质粒由上海科技大学黄行许教授惠赠;DMEM培养基从美国Hyclone公司购买;胎牛血清购自上海ExCell公司;Ⅰ内切酶、Ⅱ内切酶、T4 DNA连接酶、蛋白酶K和ChIP-Seq建库试剂盒均购自美国NEB公司;DNA凝胶回收试剂盒和质粒DNA小量试剂盒购自美国AXYGEN公司;嘌呤霉素、NP-40、Triton X-100、DMSO、Tris base、SDS、醋酸钠购自美国SIGMA公司;Lipofectamine 3000、RNaseA、糖原、16%甲醛溶液购自美国Thermo Fisher Scientific公司;胰酶和青链霉素购自美国Gibco公司;Streptavidin Magnetic Beads购自美国Invitrogen公司;RNA-seq试剂盒和Phanta酶购自南京诺维赞生物科技有限公司;TRIzol购自美国Ambion公司;AMPure XP beads购自美国Beckman Coulter公司;CTCF抗体从英国Abcam公司购买;三氯甲烷、硼酸和乙醇购自上海沪试实验室器材股份有限公司;异丙醇和氯化钠购自上海凌峰化学试剂有限公司;引物均由上海生物工程股份有限公司和北京擎科新业生物技术有限公司提供。
1.2 HOXD基因簇TAD分析
从SRA数据库下载HEK293细胞的Hi-C数据[54]:SRR710075、SRR710076、SRR710077,以hg19为参考基因组,利用HiC-Pro[55]软件进行分析,获得标准化矩阵;截取chr2:175,760,000~178,200,000范围的矩阵,利用TADtool绘制热图[56]。
1.3 CTCF结合序列分析
分析CTCF蛋白ChIP-seq数据,确定基因簇区域CBS位点分布情况;利用MEME[57]软件分析获得CTCF的结合基序(motif),以此基序作为参考,使用FIMO[57]软件查找基因簇区域CTCF结合序列,并确定CBS方向。
1.4 细胞培养
HEK293T细胞用89% DMEM、10%胎牛血清和1%青链霉素双抗配制的完全培养基培养,在5% CO2浓度、37℃恒温培养箱中培养。
1.5 构建sgRNA质粒
使用I酶将pGL3-U6-sgRNA质粒线性化,并用琼脂糖凝胶进行分离纯化。将购买的sgRNA正反脱氧核苷酸单链溶解并稀释到20 μmol/L (表1),配制引物退火溶液,体系如下:正反单链sgRNA各2 μL,2 μL NEB buffer2,14 μL ddH2O,并置于水浴锅中95℃ 5 min,然后自然冷却至室温。带有悬挂端的双链sgRNA与获得的线性化载体连接,然后用感受态细胞转化摇菌。利用质粒小量试剂盒提取质粒,并用桑格测序(Sanger sequencing)确认质粒是否正确连接。
表1 引物序列
续表
续表
sgRNA中下划线标示小写字母部分为构建质粒所需的粘性末端,P7 index中下划线标示部分为index。
1.6 筛选CTCF位点反转的单细胞克隆
待到12孔板中HEK293T细胞长到约60%时,利用Lipofectamine 3000试剂将Cas9质粒、sgRNA质粒一起转染到细胞中。2天后,用含有2 ng/μL嘌呤霉素的DMEM培养基培养4天。换用普通DMEM完全培养基培养2天后,进行单克隆铺板。
约10天后,用胰酶消化单克隆细胞,取部分细胞使用碱裂法裂解获得基因组。使用特异性引物进行PCR鉴定,鉴定各单细胞克隆类型,鉴定引物如表1所示。PCR产物经TA克隆后,进行桑格测序,确定单细胞克隆基因型。
1.7 定量高分辨率染色质构象捕获实验QHR-4C
QHR-4C实验方法参考本实验室之前的研究[34],步骤如下:培养鉴定好的单细胞克隆,收取处于对数生长期的细胞500万个左右,用4C裂解液(配方为:50 mmol/L Tris-HCl, 150 mmol/L NaCl, 5 mmol/L EDTA, 0.5% NP-40, 1% Triton X-100)裂解细胞两次。获得的细胞核沉淀经Ⅱ内切酶过夜酶切后,用T4 DNA连接酶在16℃过夜连接,之后利用超声将DNA片段打断为200~1000 bp长度范围。超声后的DNA片段利用酚氯仿进行纯化,后使用带有biotin的引物进行线性扩增。扩增产物加上接头后进行PCR扩增和产物纯化,获得QHR-4C文库。文库用Illumina HiSeq测序获得原始数据,根据index和barcode拆分数据。用fastuniq去重,通过bowtie2比对到hg19参考基因组。比对文件经过samtools排序,用r3Cseq进行计数和标准化,获得每个酶切片段的RPKM值。每个单细胞克隆株至少做两个重复实验,共计99个QHR-4C文库,每个文库测序约800万条序列。所用index见表1。
1.8 RNA-seq实验
待细胞长到12孔板约80%~90%时,使用TRIzol处理细胞,并提取细胞总RNA。随后用诺维赞RNA-seq建库试剂盒进行RNA-seq文库构建。步骤如下:用beads捕获mRNA,热打断至150~200 bp,使用随机引物逆转录获得cDNA,加A和加接头,最后进行PCR扩增。文库用Illumina HiSeq进行测序,数据经index拆分后,利用trim_galore去除低质量reads,使用STAR比对到hg19参考基因组,利用cufflinks对转录本进行计数和标准化,得到每个基因的FPKM值。每个单细胞克隆株做三个重复实验,共计33个RNA-seq文库,每个文库测序约1000万条序列。
1.9 ChIP-seq实验
待细胞汇合度达到10 cm培养皿约80%~90%时收取细胞,用甲醛交联固定,用超声将基因组DNA打断为100~1000 bp,孵育protein G凝胶珠。4℃过夜孵育一抗后,再次加入protein G凝胶珠孵育,经洗脱DNA和用酚氯仿纯化DNA后,利用DNA建库试剂盒进行建库,包括末端修复、末端加A、加接头和PCR扩增等步骤,获得ChIP-seq文库。文库用Illumina HiSeq进行测序,测序数据经过index拆分获得双端测序序列,使用trim_galore进行数据过滤,bowtie2比对到hg19参考基因组。之后用samtools对比对结果进行排序,使用macs2成峰。实验做两个重复,每个重复测序约2000万条序列。
1.10 高通量测序数据信息
该研究的相关结果数据已收录在国家基因库生命大数据平台(CNGBdb)[58]的国家基因库序列归档系统(CNSA)[59],项目编号:CNP0001772。
2 结果与分析
2.1 HOXD基因簇区域CTCF位点序列分析
为了研究TAD边界处成串CBS的绝缘子作用,本研究选定基因簇为研究对象。Hi-C数据显示基因簇位于两个TAD边界处,CTCF ChIP-seq数据证实基因簇以及两侧的C-DOM和T-DOM分布着大量CTCF结合位点(图1A)。为了判断CBS的方向性,对每一个CTCF结合峰进行序列分析(图1B)。这些CBS基序共包括4个module,其中module 2~4包含最为保守的20 bp核心基序,少部分在核心基序上游含有module 1,正向CBS方向为module 1到module 4 (图1B)。在module 2~3中最为保守的C20、G25和G28是判断CBS存在的重要参考,而module 1和位于24位的碱基是否为A则可以用于判断CBS方向性;这些CBS序列特性也与之前发表文章相符[2,5]。在HEK293T细胞中,基因簇分布着5个反向CBS和2个正向CBS,分别命名为CBS a-e和f-g (图1A)。在C-DOM中大部分是正向CBS,只有3个反向CBS (图1B);T-DOM中CBS呈反向串联排布(图1B)。
2.2 构建HOXD基因簇一系列CTCF位点反转的单细胞克隆株
利用CRISPR/Cas9 DNA片段编辑技术,针对预反转的DNA片段设计一对sgRNA,将Cas9和sgRNA质粒转染到HEK293T细胞中,Cas9核酸酶在成对sgRNA的介导下对目的DNA片段进行切割。断裂的双链DNA在细胞DNA修复系统的作用下,可以产生DNA片段原位反转,反转后的DNA片段具有两个不同的接口(上游接口和下游接口)(图1C)。利用此策略,我们对基因簇内CBS a-e进行组合反转(图1D)。共获得5种CBS反转单细胞克隆株,分别为e反转、b-e反转、a-e反转、a-c反转和a-b反转(图1D),由于不同sgRNA具有不同的编辑效率,单克隆筛选数相差较大(图2A),其中a-b反转共筛选1307个单细胞克隆只获得了一个预期反转克隆。最后,e反转获得5个纯合子克隆株,b-e反转、a-e反转、a-c各获得2个纯合子克隆株,a-b反转获得1个纯合子克隆株(图2A)。全部单细胞克隆株通过PCR进行鉴定,DNA片段反转的接口还进行TA克隆和桑格测序确定其具体的基因型,大部分接口为两种基因型,除了在PAM位点上游3 bp处精确切割后的连接产物外,单碱基插入占据相当的比例(图2,B~J),推测Cas9核酸酶在PAM位点上游4 bp处切割导致[48,60]。在b-e#127单细胞克隆株的一个等位基因下游接口存在518 bp的碱基删除,但删除区域不包括CBS核心基序(图2G);在a-c#81单细胞克隆株的一个等位基因上游接口存在258 bp的碱基插入,经比对发现插入序列为质粒序列(图2I),因此这两个细胞株仍是纯合的CBS反转单细胞克隆株。
2.3 CTCF位点反转引起染色质拓扑结构域边界漂移
为了研究CBS的绝缘子作用,对获得的CBS反转单细胞克隆株进行QHR-4C实验。在野生型细胞中,位于T-DOM中的增强子CS38主要与正向CBS f-g有较强的DNA相互作用(图3A),而位于C-DOM中的增强子Island5主要与反向的CBS a-e具有DNA相互作用(图3B),与Hi-C结果一致(图1A)。CBS e反转后,CBS e与CS38的远距离DNA相互作用增强(图3A),显示反转后CBS e可以作为绝缘子阻碍CBS f-g渗透的cohesin继续滑动;与之相反,CBS e与Island5的远距离DNA相互作用减弱(图3B)。CBS d和反转后的CBS e呈反向-正向分布,形成了一个新的染色质拓扑结构域边界。
图1 人类HOXD基因簇区域CTCF位点序列分析
A:基因簇区域基因组三维空间结构示意图。基因簇位于C-DOM和T-DOM两个TAD边界处,位于基因簇附近的CBS a-e与C-DOM中的正向CBS形成染色质环,CBS f-g与T-DOM中的成串反向CBS形成染色质环。B:基因簇区域CBS序列比对图。正向CBS的方向为module 1~4,其中module 1与module 2之间相隔5 bp或者6 bp。DNA序列中的“−”表示该CBS的module 1与module 2间隔为5 bp,故用“−”补齐。右侧CBS方向列,“+”表示CBS为正向,“−”表示该CBS为反向且显示DNA序列是反向互补序列。C:利用CRISPR/Cas9系统进行DNA片段反转示意图。针对预反转片段设计一对sgRNA进行片段编辑,会产生上游接口和下游接口;在切割点附近设计引物,用引物F1+F2、R1+R2进行PCR鉴定,若出现目的条带且F1+R1、F2+R2和F1+R2无目的条带,则为纯合反转单细胞克隆。D:基因簇内CBS组合性反转示意图,共构建五种反转单细胞克隆株。
CBS b-e反转后,CBS a与CBS e形成一对反向-正向的CBS (图1D),CBS b-e与Island5的远距离DNA相互作用下降(图3B),与CS38形成新的远距离DNA相互作用(图3A),阻碍从CBS f-g方向渗透的cohesin继续滑动。CBS a和反转后的CBS e形成了新的染色质拓扑结构域边界,与CBS e反转结果相似,即边界CBS反转引起染色质拓扑结构域边界的漂移。CBS a-e全部反转后,CBS a-e与Island5的DNA相互作用明显减弱(图3B),与CS38形成新的DNA相互作用(图3A),由于缺乏成对反向-正向CBS,破坏了区域的染色质拓扑边界。
为了进一步确定这些染色质空间构象的改变,选用CBS a和CBS e附近的DNA片段作为观测点(upstream-a和downstream-e,upstream-a观测点位于CBS a的上游,downstream-e观测点位于CBS e的下游),为了保证观测点不随CBS反转而改变,观测点的位置不在反转片段内。在CBS e反转的细胞中,CS38与CBS a的远距离DNA相互作用没有变化(图4A);而CBS b-e反转后,CS38与CBS a的远距离DNA相互作用有轻微增强(图4A);反转CBS a-e后CBS a主要与CS38形成较强的DNA相互作用(图4A)。从downstream-e为观测点来看,所有反转克隆均与CS38有较强的DNA相互作用(图4B),与上述结果相同。这些结果说明,反转CBS后,该CBS原有的远距离DNA相互作用被破坏,即CBS方向可以决定染色质环的形成,反转的CBS可以阻碍反方向渗透的cohesin继续滑动,发挥绝缘子的功能;同时,边界CBS元件反转会引起染色质拓扑结构域边界的漂移。
图2 反转单细胞克隆株基因型鉴定
A:获得纯合CBS反转单细胞克隆株个数以及筛选克隆总数目。B~J:每一个纯合反转单细胞克隆株的基因型鉴定(TA克隆桑格测序图)。序列中红色表示PAM所在位置,红色箭头指示PAM上游–3位。序列中“–”表示存在碱基删除,绿色表示存在碱基增加。
图3 从两侧增强子观察CBS反转后局部三维基因组构象变化
A:以CS38为观测点(viewpoint, VP)显示,CBS反转后与CS38的染色质相互作用显著增强。CBS反转单细胞克隆株数据分别与野生型(WT)进行log2转化,获得两者差异数据。B:以Island5为观测点显示,CBS反转后与Island5的原有染色质相互作用减弱。
图4 从反转位点附近观察CBS反转后局部三维基因组构象变化
A:以upstream-a为观测点,在CBS e反转细胞中观测点与两侧远距离DNA相互作用无明显变化,在CBS b-e反转细胞中观测点与CS38的远距离DNA相互作用增强,在CBS a-e反转细胞中观测点与CS38相互作用明显增强,伴随着与Island5的远距离DNA相互作用减弱。B:以downstream-e为观测点,在三种包含CBS e反转的细胞株中,观测点与CS38的染色质相互作用均增强,伴随着与Island5染色质相互作用减弱。
2.4 非边界CTCF位点也发挥绝缘子功能
本实验室之前的研究发现,位于基因簇启动子区域的正向CBS可以与位于远端的增强子HS5-1形成染色质环,阻碍更远处的启动子CBS与增强子HS5-1的远距离DNA相互作用,具有绝缘子功能[34]。为了研究基因簇区域CBS是否同样具有绝缘子功能,本研究进一步反转了CBS a-b和CBS a-c (图1D)。以Island5为观测点显示,反转CBS a-b或CBS a-c后,Island5与CBS e的远距离DNA相互作用增强(图5A),而以CS38为观测点显示CS38与CBS a-e的远距离DNA相互作用无明显变化(图5B)。相应地,upstream-a与上游的Island5的远距离DNA相互作用减弱(图5C),downstream-e与Island5的远距离DNA相互作用增强(图5D),与Island5为观测点的结果相同。但是,染色质拓扑结构域边界并没有发生变化。因此,CBS a-b或a-c可以作为绝缘子,通过与Island5形成染色质环,分别阻碍CBS c-e或d-e与Island5的远距离DNA相互作用。反转细胞株的RNA-seq实验显示基因簇区域局部染色质构象变化后,基因表达水平会发生改变(图6,A~D)。其中,在所有的CBS反转细胞株中,的表达水平均显著下降;除CBS b-e反转细胞株外,与的表达水平均下降;有趣的是,在CBS e反转和CBS a-e反转的细胞中,的表达水平显著上升(图6,A~D)。
图5 非边界的成串CTCF位点也能发挥绝缘子功能
A:在CBS a-b或CBS a-c反转细胞株中,Island5与被反转CBS原有的远距离DNA相互作用减弱,与CBS e的远距离DNA相互作用增强。B:以CS38为观测点显示,观测点与被反转CBS的染色质相互作用无明显变化。C:以upstream-a为观测点,在CBS a-b或CBS a-c反转细胞中,可见CBS a与Island5的染色质相互作用减弱。D:以downstream-e为观测点,在CBS a-b或CBS a-c反转细胞中,可见CBS e与Island5的染色质相互作用增强。
3 讨论
CTCF通过阻碍cohesin蛋白在染色质上滑动形成染色质环,介导远距离的DNA相互作用,对于基因组三维空间结构的形成与维持有重要作用[29,61,62]。多个位点的CBS反转和插入实验显示染色质环形成依赖于成对正向-反向CBS[5,28,29],而CBS的绝缘子功能是不依赖方向的[34]。研究CBS的方向性有助于理解CBS在染色质高级拓扑结构中的功能,但是在成串CBS中,理解CBS的功能则更加复杂。原钙粘蛋白基因簇的CBS研究显示,成串CBS可能通过环挤出模型,呈现类似于“葫芦”结构的平衡分布模式[34]。这显示成对正向-反向CBS对于cohesin的阻碍不是完全的,存在cohesin渗透出正向-反向CBS对(CBS pair)限制的染色质范围的情况,可能是由于CTCF与DNA结合是动态的[38],因而,在成串CBS中,CBS呈“葫芦”状分布[34]。但是,位于染色质拓扑结构域边界的成串CBS如何发挥绝缘子功能,目前仍缺少系统研究。
图6 CTCF位点反转改变HOXD基因表达
A:CBS e反转后,、和的表达水平明显降低,的表达水平升高;*:<0.05,**:<0.01,***:< 0.001;FPKM,fragments per kilobase of transcript per million mapped reads。B:CBS b-e反转后,表达水平显著降低。C:CBS a-e反转后,、和的表达水平降低,而的表达水平上升。D:CBS a-b或CBS a-c反转后,、和的表达水平降低。
图7 染色质拓扑结构域边界成串CTCF位点发挥绝缘子功能的模式图
A:在野生型细胞中,位于染色质拓扑结构域边界成串反向-正向排列的CBS分别与两侧拓扑结构域内的CBS形成染色质环。边界CBS反转后,可以阻碍反方向渗透的cohesin滑动,形成染色质环;染色质结构域边界也漂移至形成的一对反向-正向CBS处,而非边界CBS反转不引起染色质结构域边界漂移。非边界CBS反转后边界CBS与拓扑结构域内的相向CBS的远距离DNA相互作用增强,显示非边界CBS也能发挥绝缘子功能。
本研究通过对基因簇区域的CBS进行CRISPR组合反转,获得了五种纯合反转单细胞克隆株。QHR-4C实验显示,在CBS e、CBS b-e、CBS a-e反转细胞中,由于包含了TAD边界的CBS元件,反转的CBS引起了远距离DNA互作的巨大变化,证实了边界单个CBS反转可以改变染色质环形成方向[29]。在这三种反转细胞中,多个观测点的QHR-4C数据显示,反转后CBS可以阻碍渗透的cohesin继续滑动,发挥绝缘子功能,染色质拓扑结构域边界也漂移至新形成的一对反向-正向CBS处(图7)。其次,CBS a-b和CBS a-c反转结果显示,CBS a-b 或a-c可以作为绝缘子,分别阻碍CBS c-e或d-e与增强子Island5的远距离DNA相互作用,证实在成串CBS a-e中,非边界的CBS也可以作为绝缘子阻碍边界CBS与增强子的染色质环的形成;反转非边界CBS不改变染色质拓扑结构域边界(图7)。CBS反转引起的局部染色质构象变化会进一步影响基因簇的表达,但是对于不同的基因,引起的表达水平变化不尽相同,显示出基因簇存在复杂的表达调控机制。综上所述,本研究验证了环挤出模型,同时进一步完善了对CTCF绝缘功能的理解。
[1] Kumar Y, Sengupta D, Bickmore W. Recent advances in the spatial organization of the mammalian genome.,2020, 45: 18.
[2] Wu Q, Liu PF, Wang LY. Many facades of CTCF unified by its coding for three-dimensional genome architecture., 2020, 47(8): 407–424.
[3] Ning CY, He MN, Tang QZ, Zhu Q, Li MZ, Li DY. Advances in mammalian three-dimensional genome by using Hi-C technology approach., 2019, 41(3): 215–233.
宁椿游, 何梦楠, 唐茜子, 朱庆, 李明洲, 李地艳. 基于Hi-C技术哺乳动物三维基因组研究进展. 遗传, 2019, 41(3): 215–233.
[4] Marchal C, Sima J, Gilbert DM. Control of DNA replication timing in the 3D genome., 2019, 20(12): 721–737.
[5] Guo Y, Xu Q, Canzio D, Shou J, Li JH, Gorkin DU, Jung I, Wu HY, Zhai YN, Tang YX, Lu YC, Wu YH, Jia ZL, Li W, Zhang MQ, Ren B, Krainer AR, Maniatis T, Wu Q. CRISPR inversion of CTCF sites alters genome topology and enhancer/promoter function., 2015, 162(4): 900–910.
[6] de Laat W, Duboule D. Topology of mammalian developmental enhancers and their regulatory landscapes., 2013, 502(7472): 499–506.
[7] Sanders JT, Freeman TF, Xu Y, Golloshi R, Stallard MA, Hill AM, San Martin R, Balajee AS, McCord RP. Radiation-induced DNA damage and repair effects on 3D genome organization., 2020, 11(1): 6178.
[8] Arnould C, Rocher V, Finoux AL, Clouaire T, Li K, Zhou F, Caron P, Mangeot PE, Ricci EP, Mourad R, Haber JE, Noordermeer D, Legube G. Loop extrusion as a mechanism for formation of DNA damage repair foci., 2021, 590(7847): 660–665.
[9] Cremer T, Cremer M. Chromosome territories., 2010, 2(3): a003889.
[10] Dekker J, Rippe K, Dekker M, Kleckner N. Capturing chromosome conformation., 2002, 295(5558): 1306–1311.
[11] Zhao ZH, Tavoosidana G, Sjölinder M, Göndör A, Mariano P, Wang S, Kanduri C, Lezcano M, Sandhu KS, Singh U, Pant V, Tiwari V, Kurukuti S, Ohlsson R. Circular chromosome conformation capture (4C) uncovers extensive networks of epigenetically regulated intra- and interchromosomal interactions., 2006, 38(11): 1341–1347.
[12] Lieberman-Aiden E, van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, Amit I, Lajoie BR, Sabo PJ, Dorschner MO, Sandstrom R, Bernstein B, Bender MA, Groudine M, Gnirke A, Stamatoyannopoulos J, Mirny LA, Lander ES, Dekker J. Comprehensive mapping of long-range interactions reveals folding principles of the human genome., 2009, 326(5950): 289–293.
[13] Fullwood MJ, Liu MH, Pan YF, Liu J, Xu H, Mohamed YB, Orlov YL, Velkov S, Ho A, Mei PH, Chew EGY, Huang PYH, Welboren WJ, Han YY, Ooi HS, Ariyaratne PN, Vega VB, Luo YQ, Tan PY, Choy PY, Wansa KDSA, Zhao B, Lim KS, Leow SC, Yow JS, Joseph R, Li HX, Desai KV, Thomsen JS, Lee YK, Karuturi RKM, Herve T, Bourque G, Stunnenberg HG, Ruan XA, Cacheux- Rataboul V, Sung WK, Liu ET, Wei CL, Cheung E, Ruan YJ. An oestrogen-receptor-α-bound human chromatin interactome., 2009, 462(7269): 58–64.
[14] Nora EP, Lajoie BR, Schulz EG, Giorgetti L, Okamoto I, Servant N, Piolot T, van Berkum NL, Meisig J, Sedat J, Gribnau J, Barillot E, Bluthgen N, Dekker J, Heard E. Spatial partitioning of the regulatory landscape of the X-inactivation centre., 2012, 485(7398): 381–385.
[15] Dixon JR, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, Hu M, Liu JS, Ren B. Topological domains in mammalian genomes identified by analysis of chromatin interactions., 2012, 485(7398): 376–380.
[16] Rao SSP, Huntley MH, Durand NC, Stamenova EK, Bochkov ID, Robinson JT, Sanborn AL, Machol I, Omer AD, Lander ES, Aiden EL. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping., 2014, 159(7): 1665–1680.
[17] Guo Y, Monahan K, Wu HY, Gertz J, Varley KE, Li W, Myers RM, Maniatis T, Wu Q. CTCF/cohesin-mediated DNA looping is required for protocadherin α promoter choice., 2012, 109(51): 21081– 21086.
[18] Sanborn AL, Rao SSP, Huang SC, Durand NC, Huntley MH, Jewett AI, Bochkov ID, Chinnappan D, Cutkosky A, Li J, Geeting KP, Gnirke A, Melnikov A, McKenna D, Stamenova EK, Lander ES, Aiden EL. Chromatin extrusion explains key features of loop and domain formation in wild-type and engineered genomes., 2015, 112(47): E6456–E6465.
[19] Andrey G, Montavon T, Mascrez B, Gonzalez F, Noordermeer D, Leleu M, Trono D, Spitz F, Duboule D. A switch between topological domains underliesgenes collinearity in mouse limbs., 2013, 340(6137): 1234167.
[20] Dixon JR, Gorkin DU, Ren B. Chromatin domains: The unit of chromosome organization., 2016, 62(5): 668–680.
[21] Weintraub AS, Li CH, Zamudio AV, Sigova AA, Hannett NM, Day DS, Abraham BJ, Cohen MA, Nabet B, Buckley DL, Guo YE, Hnisz D, Jaenisch R, Bradner JE, Gray NS, Young RA. YY1 is a structural regulator of enhancer- promoter loops., 2017, 171(7): 1573–1588.e28.
[22] Guo Y, Wu Q. Inversion of CTCF binding sites by DNA fragment editing alters genome topology and enhancer/ promoter functions., 2015, 37(10): 1073–1074.
郭亚, 吴强. 采用DNA片段编辑技术反转CTCF结合位点改变基因组拓扑结构和增强子与启动子功能. 遗传, 2015, 37(10): 1073–1074.
[23] Lobanenkov VV, Nicolas RH, Adler VV, Paterson H, Klenova EM, Polotskaja AV, Goodwin GH. A novel sequence-specific DNA binding protein which interacts with three regularly spaced direct repeats of the CCCTC- motif in the 5'-flanking sequence of the chickengene., 1990, 5(12): 1743–1753.
[24] Yin ML, Wang JY, Wang M, Li XM, Zhang M, Wu Q, Wang YL. Molecular mechanism of directional CTCF recognition of a diverse range of genomic sites., 2017, 27(11): 1365–1377.
[25] Nanni L, Ceri S, Logie C. Spatial patterns of CTCF sites define the anatomy of TADs and their boundaries., 2020, 21(1): 197.
[26] Ghirlando R, Felsenfeld G. CTCF: Making the right connections., 2016, 30(8): 881–891.
[27] Phillips JE, Corces VG. CTCF: Master weaver of the genome., 2009, 137(7): 1194–1211.
[28] de Wit E, Vos ESM, Holwerda SJB, Valdes-Quezada C, Verstegen MJAM, Teunissen H, Splinter E, Wijchers PJ, Krijger PHL, de Laat W. CTCF binding polarity determines chromatin looping., 2015, 60(4): 676–684.
[29] Lu YJ, Shou J, Jia ZL, Wu YH, Li JH, Guo Y, Wu Q. Genetic evidence for asymmetric blocking of higher-order chromatin structure by CTCF/cohesin., 2019, 10(12): 914–920.
[30] Wu Q, Jia ZL. Wiring the brain by clustered protocadherin neural codes., 2021, 37(1): 117–131.
[31] Narendra V, Rocha PP, An DS, Raviram R, Skok JA, Mazzoni EO, Reinberg D. CTCF establishes discrete functional chromatin domains at theclusters during differentiation., 2015, 347(6225): 1017–1021.
[32] Ren G, Jin WF, Cui KR, Rodrigez J, Hu GQ, Zhang ZY, Larson DR, Zhao KJ. CTCF-mediated enhancer-promoter interaction is a critical regulator of cell-to-cell variation of gene expression., 2017, 67(6): 1049–1058.e6.
[33] Gómez-Marín C, Tena JJ, Acemel RD, López-Mayorga M, Naranjo S, de la Calle-Mustienes E, Maeso I, Beccari L, Aneas I, Vielmas E, Bovolenta P, Nobrega MA, Carvajal J, Gómez-Skarmeta JL. Evolutionary comparison reveals that diverging CTCF sites are signatures of ancestral topological associating domains borders., 2015, 112(24): 7542–7547.
[34] Jia ZL, Li JW, Ge X, Wu YH, Guo Y, Wu Q. Tandem CTCF sites function as insulators to balance spatial chromatin contacts and topological enhancer-promoter selection., 2020, 21(1): 75.
[35] Zhang D, Huang P, Sharma M, Keller CA, Giardine B, Zhang HY, Gilgenast TG, Phillips-Cremins JE, Hardison RC, Blobel GA. Alteration of genome folding via contact domain boundary insertion., 2020, 52(10): 1076–1087.
[36] Zhai YN, Xu Q, Guo Y, Wu Q. Characterization of a cluster of CTCF-binding sites in a protocadherin regulatory region., 2016, 38(4): 323–336.
翟亚男, 许泉, 郭亚, 吴强. 原钙粘蛋白基因簇调控区域中成簇的CTCF结合位点分析. 遗传, 2016, 38(4): 323–336.
[37] Zhang XF, Zhang Y, Ba ZQ, Kyritsis N, Casellas R, Alt FW. Fundamental roles of chromatin loop extrusion in antibody class switching., 2019, 575(7782): 385– 389.
[38] Xu DF, Ma RS, Zhang JH, Liu ZJ, Wu B, Peng JH, Zhai YN, Gong QG, Shi YY, Wu JH, Wu Q, Zhang ZY, Ruan K. Dynamic nature of CTCF tandem 11 zinc fingers in multivalent recognition of DNA as revealed by NMR spectroscopy., 2018, 9(14): 4020–4028.
[39] Amândio AR, Lopez-Delisle L, Bolt CC, Mascrez B, Duboule D. A complex regulatory landscape involved in the development of mammalian external genitals., 2020, 9: e52962.
[40] Bianco S, Annunziatella C, Andrey G, Chiariello AM, Esposito A, Fiorillo L, Prisco A, Conte M, Campanile R, Nicodemi M. Modeling single-molecule conformations of theregion in mouse embryonic stem and cortical neuronal cells., 2019, 28(6): 1574–1583.e4.
[41] Fabre PJ, Leleu M, Mormann BH, Lopez-Delisle L, Noordermeer D, Beccari L, Duboule D. Large scale genomic reorganization of topological domains at thelocus., 2017, 18(1): 149.
[42] Noordermeer D, Leleu M, Splinter E, Rougemont J, De Laat W, Duboule D. The dynamic architecture ofgene clusters., 2011, 334(6053): 222–225.
[43] Montavon T, Soshnikova N, Mascrez B, Joye E, Thevenet L, Splinter E, de Laat W, Spitz F, Duboule D. A regulatory archipelago controlsgenes transcription in digits., 2011, 147(5): 1132–1145.
[44] Rodríguez-Carballo E, Lopez-Delisle L, Willemin A, Beccari L, Gitto S, Mascrez B, Duboule D. Chromatin topology and the timing of enhancer function at thelocus., 2020, 117(49): 31231– 31241.
[45] Li JH, Shou J, Guo Y, Tang YX, Wu YH, Jia ZL, Zhai YN, Chen ZF, Xu Q, Wu Q. Efficient inversions and duplications of mammalian regulatory DNA elements and gene clusters by CRISPR/Cas9., 2015, 7(4): 284–298.
[46] Li JH, Shou J, Wu Q. DNA fragment editing of genomes by CRISPR/Cas9., 2015, 37(10): 992– 1002.
李金环, 寿佳, 吴强. CRISPR/Cas9系统在基因组DNA片段编辑中的应用. 遗传, 2015, 37(10): 992–1002.
[47] Liu PF, Wu Q. Probing 3D genome by CRISPR/Cas9., 2020, 42(1): 18–31.
刘沛峰, 吴强. CRISPR/Cas9基因编辑在三维基因组研究中的应用. 遗传, 2020, 42(1): 18–31.
[48] Shou J, Li JH, Liu YB, Wu Q. Precise and predictable CRISPR chromosomal rearrangements reveal principles of Cas9-mediated nucleotide insertion., 2018, 71(4): 498–509.e4.
[49] Wang LY, Huang HY, Wu Q. The diversity of DNA fragment editing by CRISPR/Cas9 in highly homologous or repetitive sequences., 2017, 39(4): 313–325.
汪乐洋, 黄海燕, 吴强. 利用CRISPR/Cas9对基因组中高度同源DNA片段编辑多样性的遗传学研究. 遗传, 2017, 39(4): 313–325.
[50] Cong L, Ran FA, Cox D, Lin SL, Barretto R, Habib N, Hsu PD, Wu XB, Jiang WY, Marraffini LA, Zhang F. Multiplex genome engineering using CRISPR/Cas9 systems., 2013, 339(6121): 819–823.
[51] Wu Q, Shou J. Toward precise CRISPR DNA fragment editing and predictable 3D genome engineering., 2021, 12(11): 828–856.
[52] Wang N, Jia ZL, Wu Q. RFX5 regulates gene expression of thecluster., 2020, 42(8): 760–774.
王娜, 甲芝莲, 吴强. RFX5调控原钙粘蛋白α基因簇的表达. 遗传, 2020, 42(8): 760–774.
[53] Wu YH, Jia ZL, Ge X, Wu Q. Three-dimensional genome architectural CCCTC-binding factor makes choice in duplicated enhancers atlocus., 2020, 63(6): 835–844.
[54] Zuin J, Dixon JR, van der Reijden MIJA, Ye Z, Kolovos P, Brouwer RWW, van de Corput MPC, van de Werken HJG, Knoch TA, van IJcken WFJ, Grosveld FG, Ren B, Wendt KS. Cohesin and CTCF differentially affect chromatin architecture and gene expression in human cells.2014, 111(3): 996–1001.
[55] Servant N, Varoquaux N, Lajoie BR, Viara E, Chen CJ, Vert JP, Heard E, Dekker J, Barillot E. HiC-Pro: An optimized and flexible pipeline for Hi-C data processing.2015, 16: 259.
[56] Kruse K, Hug CB, Hernández-Rodríguez B, Vaquerizas JM. TADtool: Visual parameter identification for TAD- calling algorithms., 2016, 32(20): 3190– 3192.
[57] Bailey TL, Johnson J, Grant CE, Noble WS. The meme suite., 2015, 43(W1): W39–W49.
[58] Chen FZ, You LJ, Yang F, Wang LN, Guo XQ, Gao F, Hua C, Tan C, Fang L, Shan RQ, Zeng WJ, Wang B, Wang R, Xu X, Wei XF. CNGBdb: China National GeneBank DataBase., 2020, 42(8): 799–809.
陈凤珍, 游丽金, 杨帆, 王丽娜, 郭学芹, 高飞, 华聪, 谈聪, 方林, 单日强, 曾文君, 王博, 王韧, 徐讯, 魏晓锋. CNGBdb: 国家基因库生命大数据平台. 遗传, 2020, 42(8): 799–809.
[59] Guo XQ, Chen FZ, Gao F, Li L, Liu K, You LJ, Hua C, Yang F, Liu WL, Peng CH, Wang LN, Yang XX, Zhou FY, Tong JW, Cai J, Li ZY, Wan B, Zhang L, Yang T, Zhang MW, Yang LL, Yang YW, Zeng WJ, Wang B, Wei XF, Xu X. CNSA: a data repository for archiving omics data., 2020, 2020: baaa055.
[60] Shi X, Shou J, Mehryar MM, Li JW, Wang LY, Zhang M, Huang HY, Sun XF, Wu Q. Cas9 has no exonuclease activity resulting in staggered cleavage with overhangs and predictable di- and tri-nucleotide CRISPR insertions without template donor., 2019, 5: 53.
[61] Gligoris TG, Scheinost JC, Burmann F, Petela N, Chan KL, Uluocak P, Beckouët F, Gruber S, Nasmyth K, Löwe J. Closing the cohesin ring: structure and function of its Smc3-kleisin interface., 2014, 346(6212): 963– 967.
[62] Nishiyama T. Cohesion and cohesin-dependent chromatin organization., 2019, 58: 8–14.
Combinatorial CRISPR inversions of CTCF sites incluster reveal complex insulator function
Xianglong He, Jinhuan Li, Qiang Wu
CTCF (CCCTC-binding factor) is a zinc-finger protein which plays a vital role in the three-dimensional (3D) genome architecture. A pair of forward-reverse convergent CTCF binding sites (CBS elements) mediates long-distance DNA interactions to form chromatin loops with the assistance of the cohesin complex, while CBS elements at the chromatin domain boundaries show reverse-forward divergent patterns and function as insulators to discriminate against DNA interaction between chromatin domains. However, there are still many unresolved problems regarding CTCF-mediated insulation function. In order to study the connections between chromatin loops and the insulation function of CBS elements, we combinatorically inverted CBS elements at thelocus by using CRISPR/Cas9 DNA-fragment editing methods in the HEK293T cell line and obtained five different kinds of single-cell CRISPR clones. By performing quantitative high-resolution chromosome conformation capture copy (QHR-4C) experiments, we found that boundary CBS inversions abolish original chromatin loops and establish new loops from the opposite direction, thus shifting the insulator boundary to the new divergent CTCF sites. Furthermore, tandem CBS elements block cohesin permeated from the opposite orientation to function as insulators. RNA-seq experiments showed that alterations of local three-dimensional genome architecture would further influence gene expression of thecluster. In conclusion, a pair of divergent CBS elements function as insulators by forming chromatin loops within chromatin domains to block cohesin sliding.
CTCF; chromatin loop;; insulator; CBS inversion
2021-04-11;
2021-05-12
国家自然科学基金项目(编号:31800636, 31630039, 91940303)和上海市科学技术委员会项目(编号:19JC1412500)资助[Supported by the National Nature Science Foundation of China (Nos. 31800636, 31630039, 91940303) and Science and Technology Commission of Shanghai Municipality program (No. 19JC1412500)]
何象龙,在读硕士研究生,专业方向:生物学。E-mail: esroom@163.com
吴强,博士,教授,研究方向:三维基因组架构与功能。E-mail: qwu123@gmail.com
10.16288/j.yczz.21-131
2021/7/7 08:47:52
URI: https://kns.cnki.net/kcms/detail/11.1913.r.20210706.1111.001.html
(责任编委: 谷峰)