染色质开放性与动物胚胎发育关系的研究进展
2022-03-30薛翔澜李晓波浦亚斌何晓红马月辉赵倩君
刘 悦,薛翔澜,李晓波,蒋 琳,浦亚斌,何晓红,马月辉*,赵倩君*
(1.中国农业科学院北京畜牧兽医研究所,北京 100193;2.云南农业大学动物科学技术学院,昆明 650000)
染色质开放性(chromatin accessibility)也被称为染色质可及性,可以广义的理解为与未被组蛋白或其他大分子封闭的DNA分子,这一特性能够反映转录活性。真核生物中,DNA与组蛋白组装为核小体,经过进一步折叠在细胞核中形成确定结构的染色质[1-2],高度压缩的染色质极大阻碍了DNA的复制、转录等功能。DNA转录依赖于染色质开放,转录是众多转录因子(transcription factors,TF)富集到染色质开放的增强子、上游激活子序列和近端启动子元件之间的动态相互作用的结果,染色质的开放性会影响DNA结合蛋白(如TF和RNA聚合酶)对转录的激活[3]。
染色质开放性变化是表观遗传调控的重要组成部分,在动物发育过程中发挥关键作用。多项研究表明,染色质开放性与基因表达密切相关,在胚胎发育、干细胞增殖分化等过程中具有重要的调控作用[4-5]。研究显示,哺乳动物胚胎发育过程中染色质开放性经历剧烈变化,并且染色质开放性不仅影响受精卵合子的基因组激活(zygotic genome activation,ZGA),还影响干细胞的增殖分化,决定细胞分化方向。
1 染色质开放性检测方法
开放性染色质相较于异染色质对酶的切割更为敏感,基于这种敏感性发展了多种染色质开放性位点的检测技术。随着染色质开放性检测手段及生物信息学分析方法的日臻完善,染色质开放区域的高效快速定位使得染色质开放性在生物生长发育研究领域的应用越来越广泛。
目前,在动物中建立的检测方法包括微球菌核酸酶测序(micrococcal nuclease sequencing,MNase-seq)、DnaseⅠ超敏感位点测序(DnaseⅠ hypersensitive sites sequencing,DNase-seq)、甲醛辅助的调控元件的分离测序(formaldehyde-assisted isolation of regulatory elements sequencing, FAIRE-seq)和染色质易开放区域测序(assay for transposase accessible chromatin with high-throughput sequencing,ATAC-seq)等(表1)。从检测区域、切割方法上看几种技术方法存在明显不同,如MNase-seq通过检测核小体保护的DNA片段序列,从而间接反映染色质的开放性[6],其他3种方法均为对染色质上的开放区域进行检测,直接反映染色质的开放性[7];然而,从切割方法上看,FAIRE-seq是利用超声裂解对特定位点进行切割[8],而其他3种均是利用酶进行切割。
表1 染色质开放性的主要研究方法
染色质开放性测定技术最初是通过测定被核小体保护的DNA序列,从而定位与染色质结合的蛋白[9-10]。MNase-seq方法能够直接定位核小体,但是需要耗费大量细胞而且有明显的偏好性,因此,发展初期染色质结构研究进展较为缓慢。近年来,随着全基因组高通量测序技术高速发展,以及各种微量高效DNA分析技术不断涌现,DNase-seq、ATAC-seq等这些技术被广泛应用于染色质开放性研究。DNase-seq直接测定DNase Ⅰ超敏感位点(DNase Ⅰ hypersensitive sites,DHSs),定位染色质开放性区域,获得转录调控元件和染色质状态的重要信息[11-12]。ATAC-seq方法利用转座酶Transposase不能进入核小体连接的致密区域,但能进入松散的区域对未结合核小体的DNA进行切割,进而定位染色质开放区域[13]。美国斯坦福大学的William Greenleaf教授团队2013年发现Tn5转座酶在DNA剪切方面的潜力后将其应用于构建测序文库并于2015年发展了ATAC-seq[14-15],近年来ATAC-seq飞速发展并在2018年建立了单细胞ATAC-seq[16]。DNase-seq与ATAC-seq都能够获得全基因组范围内处于开放状态的染色质区域,但是由于ATAC-seq所需细胞数量较少、灵敏度更高所以应用更为广泛。近年来,随着单细胞测序技术逐渐发展,单细胞ATAC-seq的优势更加明显,利用单细胞ATAC-seq能够在细胞水平揭示细胞核内染色质开放性差异并鉴定细胞类型特异性TF,这为表观遗传研究提供了便利条件。
2 染色质开放性的影响因素
研究证实,核小体占位、组蛋白修饰、DNA甲基化等与染色质开放性密切相关,是影响染色质开放性的重要因素;且染色质开放性与核小体占位、组蛋白修饰、DNA甲基化互相影响参与转录调控。
2.1 核小体占位
核小体是染色质复杂三维结构的基本单位,典型核小体由缠绕在含有一个H3/H4四聚体和两个H2A/H2B二聚体的八聚体及其包裹的146碱基组成[17-18]。核小体在基因组上的分布在DNA转录、复制和染色质开放等生物过程中发挥重要功能。核小体定位指核小体出现在基因组特定位置相对于其周边的概率,反映核小体对特定DNA序列选择的特性;核小体占位是指在基因组特定区域出现的核小体平均数目,体现了核小体密度[19-20]。核小体占位及定位是染色质开放性的主要决定因素,并受到序列特异性TF和染色质重塑因子的调节,这些因子通过调节核小体组装来改变核小体的占位情况[21]。
核小体在异染色质区域覆盖率高,形成了封闭的染色质结构;然而在增强子、绝缘子、启动子等调控区域常表现为核小体缺失,形成开放的染色质[22]。核小体的缺失可导致缺失位点区域染色质的开放性增加,利于众多反式作用因子结合进而发挥这些因子的调控作用[21]。根据染色质的开放性可将启动子分为两种类型:开放启动子(open promoter)和封闭启动子(covered promoter)[23]。开放启动子具有开放的染色质状态,在起始密码子上游200 bp 左右具有一段核小体缺失位点(nucleosome free region, NFR),NFR 内具有暴露的转录激活因子结合位点;而封闭启动子具有较高的核小体占位,转录激活因子需要在染色质重塑复合物的帮助下与核小体竞争结合位点才能促进开放染色质的形成从而激活转录[24]。最初认为,核小体会被排除在转录活性位点之外,然而,Clark和Felsenfeld[19]的早期工作否定了这一假设,他们发现核小体占据了活跃的转录本,并在转录延伸过程中被RNA聚合酶重新定位。此外,虽然转录起始位点(TSS)近端核小体经常抑制转录,但如果定位正确,核小体可以通过核糖核酸聚合酶促进转录[20]。染色质开放性还受到相关蛋白(特别是组蛋白)沿DNA分布密度以及停留时间的影响,研究证实,H2A/H2B二聚体的缺失能通过内切核酸酶和TF改变染色质的开放性[25-27]。
2.2 组蛋白修饰
组蛋白修饰作为一种重要的表观遗传调控机制,对染色质结构变化具有调控作用。组蛋白修饰是一个动态变化过程,研究证实,组蛋白的甲基化、乙酰化等修饰参与调控染色质开放性,进而能够影响基因的表达。
ENCODE计划中的注释表明H4K20 me1与染色质开放性相关,染色质免疫共沉淀技术(chromatin immunoprecipitationchromatin immunoprecipitation followed by sequencing,ChIP-seq)分析结果也表明,H4K20 me1在转录起始位点下游与转录活性呈高度正相关关系[28]。Zhu等[29]发现,HRP2-DPF3a-BAF协调甲基化的H3K36 me和染色质重编程,调节成肌分化过程中的染色质开放和基因转录。连接组蛋白H1及其变体有助于中和连接脱氧核糖核酸的电荷,将染色质折叠形成更紧密、更难接近的封闭染色质[30]。核心组蛋白乙酰化有助于染色质解螺旋,通常与开放的染色质状态有关[31],核心组蛋白乙酰化程度也代表染色质不同的活性状态,组蛋白乙酰化同时可募集染色质重塑复合体和TF,通过组蛋白修饰调控染色质结构域[32]。果蝇早期胚胎发育中先锋转录因子Zelad结合增强子促进早期胚胎组蛋白乙酰化,介导早期染色质开放性建立[33]。在人类CD34+细胞中通过shRNA 敲低HDAC5,然后进行红细胞培养,通过对培养的红细胞进行ATAC-SEQ和RNA-SEQ分析,结果显示,HDAC5 缺乏导致晚期红细胞中 H4(K12)的乙酰化增加,染色质开放性增加[34-35]。
2.3 DNA甲基化
染色质开放性与DNA甲基化相互影响,两者共同影响基因转录;启动子、增强子等关键作用元件的甲基化程度影响染色质开放性。
启动子以及增强子区域的DNA甲基化可能会导致甲基识别蛋白招募特异性重塑因子产生闭合的染色质结构,阻止TF的接近进而影响基因转录[36]。小鼠胚胎发育过程中,DNA甲基化通过调控启动子染色质开放性来影响转录活性[37];斑马鱼ZGA时期从配子遗传的未甲基化的CpG能促进启动子区域开放性建立[38]。通过整合分析小鼠DHS与DNA甲基化数据,结果发现染色质开放性区域主要富集于部分甲基化(partially methylated domains, PMDs)[39];而且DNase-seq和ATAC-seq两种不同检测方法获得的数据结果均显示,早期胚胎中高开放性启动子绝大部分处于CPG低密度区域,ZGA前检测到的ATAC-seq信号很大程度上与卵子的PMDs重合[40]。此外,DNA甲基化程度影响染色质开放性与染色质空间结构。染色质在细胞核内分层次组装形成两类特定的结构区室——活性和惰性(A/B-compartment)区室,研究发现此类区室与染色质开放性、DNA甲基化程度、基因表达活性密切相关。胚胎发育早期,基因组甲基化模式与区室高度相关[41],A-compartment基因表达水平较高、活跃表达修饰信号(如H3K36 me)强、甲基化程度低被注释为开放染色质。斑马鱼ZGA时期从配子遗传的未甲基化的CpG富集于A-compartment,小鼠早期胚胎DHSs位点也富集于A-compartment[42-44]。总体而言,A-compartment区域甲基化程度更低,染色质开放性程度更高,基因转录也就更活跃。
3 胚胎发育有关染色质开放性的研究进展
3.1 胚胎基因组激活与染色质开放性的关系
胚胎发育过程中染色质开放性发生剧烈变化,染色质开放性变化影响基因组激活。基因组激活包含两个过程,母体-合子过渡(maternal zygotic transition,MZT)和ZGA,MZT过程中染色质开放性位点显著增加[45-47],染色质开放则促进了ZGA的实现。果蝇胚胎发育过程中染色质开放性的建立早于MZT时期,直至MZT结束染色质开放性位点依然在缓慢变化[48],在此过程中启动子和增强子区域染色质开放性变化最为显著。染色质开放性建立过程中,果蝇MZT时期染色质开放性变化最为显著,特别是MZT后期染色质开放性会显著增加,大量增强子位于染色质开放性区域[49]。此外,Chetverina等[50]发现,Zelda、GAGA和Bicoid参与果蝇染色质开放性建立,Zelda和GAGA因子共同参与果蝇染色质开放性建立促进ZGA,GAGA因子促进启动子染色质开放,Zelda主要介导增强子染色质开放,高表达Bicoid可促进其靶标基因的染色质开放[49]。哺乳动物染色质开放性图谱在MZT时期的动态变化与果蝇有很多相似点,且早期胚胎中染色质开放性位点一旦建立便被维持。
ZGA对于胚胎发育是必需的,染色质开放有利于ZGA。胚胎时期人类和小鼠染色质开放性图谱的变化规律基本一致,特别是在ZGA时期均表现为显著增加,但介导机制有显著不同。小鼠ZGA时期(2细胞时期)胚胎中DHSs数量随着发育逐渐增加,尤其在8细胞时期增加最为显著,且DHSs分布区域由单一分布于胚胎启动子区逐渐分布于远端调控区[46]。通过TF片段富集分析发现,OCT4在人ZGA时期显著富集于DHSs区,但是在小鼠ZGA期很少富集,这一结果暗示OCT4可能在人ZGA时期相较于小鼠发挥更大的作用[51-52]。Dor和Cedar[39]首次在Cell发表文章证实了人类早期胚胎发育过程中染色质开放性逐步建立的过程,特别指出了人类胚胎ZGA过程中转录因子OCT4是必需的,而在小鼠中则是非必需。其他研究还发现,发育中的黑腹果蝇ZGA期间,染色质开放性和转录活性之间存在不一致性,在启动子和增强子区域开放性建立要早于转录活性,尽管在ZGA前的早期胚胎中观察到染色质开放性状态,但许多开放性基因在转录上是无活性的,直到发育后期才具有活性[50]。此外,TF也参与胚胎染色质开放性建立从而调控ZGA事件,染色质开放性区域的建立需要母体提供的TF,如Pou5f3、Sox19b、Nanog、OCT4等[4,52]。通过对斑马鱼ZGA过程中7个时期胚胎进行ATAC-seq测序,结果发现ZGA时期开放染色质活性与顺式调控因子活性同步增加,证实顺式调控元件与染色质开放性之间相互影响从而调节ZGA[53]。
3.2 胚胎发育过程中染色质开放性变化
多项研究证实,染色质开放性参与调控果蝇、人、小鼠、线虫等动物的胚胎发育[50,54-55],对于胚胎发育方向具有重要的作用。位于染色质开放区域的关键转录调控元件与细胞特异的TF共同决定细胞命运、调控胚胎发育。胚胎发育由基因调控网络(GRNs)控制,该网络定义和细化沿胚胎轴的位置信息决定细胞命运,并最终指导胚胎发育方向[56]。果蝇胚胎发生提供了这种模式化GRN的两个典型例子,它们指定了沿着前后(AP)和背腹(DV)轴的空间坐标[57],但是这种模式的稳定和基因的精确表达需要轴模式增强子介导的。研究显示,染色质开放性与果蝇体轴线的发育具有密切联系,ZGA后四分之一的开放性基因组在其ATAC序列信号中显示出显著的区域差异,轴模式增强子在变化最大的区间中富集,它们的开放性变化与其调节活性相关[58]。先锋转录因子Zelda在胚胎发育早期与增强子结合从而促进Bicoid因子与增强子结合[33,59],为果蝇体轴线建立提供位置信息[54]。
胚胎发育过程中染色质开放性会发生动态变化,在此过程中与发育相关的启动子、增强子染色质开放性逐渐建立。线虫胚胎期至个体成熟整个过程中都伴随着染色质开放性的变化,胚胎发育过程中超过75%启动子位点染色质开放性发生变化[60],个体成熟期与胚胎期相比远端非编码区超5 000多个位点染色质开放性发生变化[55],这一研究暗示,染色质开放性对于个体成熟具有一定的调控作用。通过DNase-seq和ATAC-seq绘制小鼠早期胚胎染色质动态图谱,2016年中国科学家分别用上述两种方法在Nature和Cell发表文章,揭示入植前后染色质开放性对小鼠胚胎发育的影响[46,61]。Lu等[46]发现,随着小鼠胚胎的发育染色质开放性位点逐渐增加,2细胞至8细胞阶段染色质开放性变化最为显著,在染色质开放建立过程中Oct4表达显著上调,因此认为Oct4的上调能促进胚胎染色质开放性建立。对线粒体DNA敲除小鼠进行全基因组ATAC-seq,绘制小鼠入植前胚胎全基因组染色质开放性图谱,发现CTCF、NR5A2、TEAD4等TF与染色质开放性位点结合,为发育的顺利进行提供保证[62]。
3.3 胚胎干细胞分化与染色质开放性变化的关系
染色质开放性不仅影响个体发育而且影响干细胞的分化,对胚胎干细胞(embryonic stem cell,ES)的影响尤为显著。染色质开放性在ES发育过程中通过建立特定的染色质开放性位点促进转录以及基因激活从而影响分化方向。干细胞发育受多种因子的调控,潜在基因调控和表观遗传变化都影响着细胞命运,解析细胞增殖分化过程中染色质开放性变化规律对于进一步探究胚胎发育具有重要意义。研究发现,ES发育相关基因的启动子被MLL2和Polycomb复合物修饰[63];通过对野生型和MLL2敲除型小鼠ES细胞的染色质开发性研究发现,MLL2的缺失会导致Polycomb占用率增加,启动子染色质开放性关闭,进而导致ES发育受阻。Stergachis等[64]在分析人ES转录因子Motif 特征和DNase时发现,Oct4、Sox2等在ES自我更新和分化中起关键作用的先锋TF位于染色质开放性区域,而且先锋TF的微小内源性波动可以影响细胞命运[65]。ES定向分化时高水平Sox2能促进神经外胚层的细胞形成,相比之下,Oct4水平升高会导致胚胎干细胞由无向分化向神经外胚层和中胚层分化。采用ATAC-seq方法检测不同内源性水平的ES染色质开放性水平,发现高水平Oct4增加了与分化相关增强子区域的染色质开放性[5]。
4 发展前景
染色质开放性对染色质结构功能至关重要,与诸多生物学过程密切相关。随着染色质开放性检测技术的发展,全基因组范围内定位染色质开放性区域日趋成熟。特别是单细胞测序技术如目前已经开发的scATAC-seq、scMNase-seq与scDNase-seq、scChIP-seq等技术,人们从单个细胞的核小体组织结构层面理解细胞间的染色质异质性。这些技术的开发和应用对于揭示动物发育过程中基因表达调控机制具有显著的意义。随着测序技术的飞速发展,对染色质开放性的研究越来越多,但是大多数的研究停留在染色质开放性区域的鉴定及其动态变化。现阶段关于染色质开放性动态变化潜在机制以及染色质开放性变化、TF、远程的增强子及启动子等如何相互作用调控基因转录等的研究十分有限。目前,通常基于表观组(如ATAC-seq)和转录组的联合分析初步探究表观组对基因表达的影响,然而染色质开放性变化如何影响基因表达其机理尚不清楚。为了系统深入解析染色质开放性对生物学过程的调控机理,有必要开展多组学联合分析,如可以将染色质开放性数据与GWAS联合分析,解释非编码和基因间区域SNPs对关键性状的影响。此外,将基因组、转录组、蛋白组、表观组、代谢组等组学信息整合分析,构建更加完整的调控网络及开发新的算法集成多组学数据进行深层次的挖掘,为解析染色质开放性变化机制研究提供依据。