APP下载

染色质DNaseⅠ超敏感位点的定位及其转录调控功能的研究进展

2015-02-11于文琪综述王雅梅审校

医学研究生学报 2015年6期
关键词:染色质高通量远端

于文琪综述,王雅梅审校

0 引 言

转录水平的调控是真核基因表达调控的关键环节,近年研究发现染色质对DNaseⅠ的敏感性与基因转录有关。基因活化时其染色质一般呈开放的疏松型构象,更易被DNaseⅠ降解,形成DNaseⅠ超敏感位点(DNaseⅠhypersensitive sites,DHSs)。Gross等[1]发现DHSs 不仅与染色质的开放度相关,还与启动子、增强子、绝缘子和沉默子等元件相偶联;并且染色质上具调控功能的DNA 序列、调控蛋白结合的区域也与DHSs 重叠。因此DHSs 的定位目前已经成为准确识别染色质上基因调控元件、确定调控蛋白结合区域的有效方法。DNA 元件百科全书(Encyclopedia of DNA Elements,ENCODE)计划利用新一代高通量技术,首次大范围绘制出人类DHSs图谱,有助于全面理解人类基因组调控机制[2]。文中主要就DHSs 的定位及其转录调控功能的研究进展作一综述。

1 DHSs 的分布

DHSs 是一段跨度为数百碱基对,甲基化程度较低,对DNaseⅠ具有高度敏感性的染色质区域,可富集转录因子和重要酶类,具有转录调控功能。Natarajan等[2]研究发现,DHSs 区域约占全基因组的2%,表明多数具有调控功能的顺式作用元件占基因组的比例较小。为系统寻找DNaseⅠ超敏位点,ENCODE 计划利用大规模并行测序技术首次大范围绘制出最详尽的人类DHSs 图谱[3-5];描绘了全基因组共125 种人体细胞和组织类型的DHSs[2]。

DHSs 具有细胞特异性,不同DHSs 的细胞特异性高低不同。ENCODE 计划通过分析所得数据,确定了2 890 742 个高可信度DHSs[2],每个均在一种或多种细胞类型中活化。在所确定的DHSs 中,970 100 个是单种细胞类型所特有的,1 920 542 个在两种或多种细胞类型中活化,3692 个在所有细胞中均能检测到。Natarajan 等[2]根据DHSs 在基因组中的位置不同,将其分为3 类:①转录起始位点(transcription start sites,TSS)DHSs,与基因的TSS 重叠;②基因DHSs,与外显子和内含子重叠;③基因间DHSs,不与任何基因重叠。而这3 类DHSs 也具有明显的细胞特异性。其中,基因间DHSs 细胞特异性最高,17%只在一种细胞中表现,而TSS DHSs 细胞特异性较小,仅<1%为单种细胞所特有。DHSs的分布具有细胞种类和基因组位置的特异性,了解DHSs 的分布对于分析基因的转录调控功能有着重要的意义。

2 DHSs 的高通量测序技术

1978 年,研究者发现蛋白质与DNA 结合后能够保护结合部位不被DNaseⅠ降解,而通过确定脱氧核糖酸酶I 降解后留下的DNA 片段就能确定蛋白与DNA 结合的区域,这个方法称为“脱氧核苷酸酶足迹法”。通过此种方法可精确鉴定转录因子的结合区域,优于传统的仅用染色质免疫共沉淀(Chromatin immunoprecipitation,CHIP)方法[6]。染色质免疫共沉淀-测序(Chromatin immunoprecipitation-sequencing,Chip-Seq)技术,可精确鉴定调控蛋白的结合位点。Chip-Seq 的不足之处在于如果被测序的片段在基因组多次重复,则无法对其是否为结合位点做出推断[7]。

Crawford 等[8]建立了新的DNase 测序技术,利用高通量测序技术对人CD4+T 淋巴细胞的DNase文库中的230000 个标签进行了高通量测序,确定了14 190 个序列簇。将其与实时定量聚合酶链反应(polymerase chain reaction,PCR)技术相结合,以鉴定有效的DHSs 位点,从而获得DHSs 图谱。主要的技术路线:将DNaseⅠ切割得到的长DNA 片段加Biotin 标记的接头,用超声法或限制性核酸内切酶打断长DNA 片段,利用Biotin 标记纯化DNA 片段,再经PCR 大量扩增构建文库,高通量测序检测。该技术在染色质高敏感位点区域的捕获研究中发挥了重要的作用。

活性染色质经适量DNaseⅠ酶切反应,可产生大量DNA 片段,长度分布在10 bp-100 kb 范围之间。高通量测序读取的碱基长度根据测序平台不同从25-450 bp,染色质DNaseⅠ产物中大量的长片段DNA 不能直接用于高通量测序,还需要进一步酶切或通过超声打断成短片段,再进行相应的PCR 扩增构建文库,在此过程中会产生大量的背景噪声。为能准确捕获更多的染色质DHSs,并突破现有技术的限制,建立了一种新的染色质高敏感位点区域的捕获方法:对DNaseⅠ酶切产物中的短DNA 片段(100-300 bp)直接构建文库,从而大量减少了DNaseⅠ非特异性切割造成的背景噪声,满足了高通量测序对待测DNA 样品长度的要求,简化了文库构建的程序,减少了文库构建过程中PCR 扩增偏向性产物的生成,直接利用高通量全基因组深度测序技术捕捉染色质高敏感位点区域,分析其分布特征[9]。利用实时PCR 技术对实验结果进行验证,发现该方法定位DHSs 相比于利用DNA 长片段进行高通量测序定位,测定的DHSs 数量更多,对DHSs的定位更精确。

目前DHSs 的高通量测序技术还在不断优化和完善[10-11]。在得到有效的DHSs 位点后,可通过荧光素酶检测进一步确定DHSs 位点与增强子、启动子等功能性元件的关系,从而获得DHSs 的转录调控功能,为更好地理解不同细胞类型、发展阶段、疾病和物种的基因表达调控提供了丰富的数据。

3 DHSs 的转录调控功能

3.1 远端DHSs 启动子模型增强基因表达 染色质上RNA 聚合酶结合位点附近或远端的一些转录调控元件,可与转录调节因子协同作用决定基因转录的起始与转录效率。在DHSs 的分布中提到的ENCODE 计划研究确定2 890 742 个高可信度DHSs中,约3%(75 575 个)的DHSs 分布在TSS 区,5%(135 735 个)位于TSS 区2.5 kb 内,95%DHSs 距离TSS 区较远,称其为远端DHSs[12]。ENCODE 计划观察:在各种细胞类型中,许多已知的增强子与目标基因的启动子DHSs 同步活化[9]。为解释这一现象,ENCODE 计划分析了1 454 901 个远端DHSs 并联系DHSs 上下游各500 kb 范围内的启动子。为验证远端DHSs 启动子之间的关系,研究人员利用5C技术评测染色质的相互作用[13]。根据分析结果,ENCODE 计划共确定了578 905 个远端DHSs 与至少一个的靶启动子高度相关,证实了不同细胞类型中远端DHSs 和特异启动子相结合的模型并绘制了远端DHSs 启动子模型图谱[9]。证实了远端DHSs与特定启动子结合从而使远端DHSs 起到增强子功能,增强基因的表达。

在分析远端DHSs 启动子模型图谱时,ENCODE计划还发现远端DHSs 启动子模型更易于调控因子的结合。在将人类所有基因按DHSs 与启动子组合的数量排列时,发现人类最复杂的调控基因显著富集于免疫系统的功能性元件[10]。而多数启动子并非只与一个远端DHSs 相关,而是与多个远端DHSs 有关[8]。这说明对多数基因而言,存在组合性的远端调控输入[14]。进一步说明人类基因顺式调控网络的复杂性。ENCODE 计划的研究人员猜测这种组合可能有助于加强细胞的转录程序的稳定性[12]。这种测定与特定的启动子相关远端DHSs 的思路,首次为定量测量基因整体调控复杂性提供了有效帮助。

3.2 DHSs 与转录因子结合控制基因转录活性转录因子通过与染色质上的转录调控元件结合发挥作用,而转录调控元件通常位于染色质DHSs 的内部或周围。研究显示TSS 附近DHSs 的GC 含量显著高于基因区域[2]。因此转录因子通过与DHSs 结合控制基因转录活性。如β-珠蛋白基因远端的基因座控制区(locus control region,LCR),位于珠蛋白基因上游,由一系列DHSs 组成[15]。LCR 含有多个转录调控元件,这些转录调控元件协同转录因子的结合,起到较强的增强子作用,从而提高珠蛋白基因的转录水平。

miRNA 作为基因表达调控分子,在抑制和沉默靶基因的表达中发挥了重要的作用[16]。Thurman等[12]分析了已被注释的329 个非重复的miRNA TSS区,发现91%的miRNA TSS 区 与DHSs 重叠或距离较近。DHSs 作为DNA 调控元件的标记,其富集的调控元件参与多种调控活动和碱基修饰,如转录因子、启动子、DNA 甲基化等[17-19]。因此,定位和分析全基因组DHSs,可有效鉴定转录因子的结合区域,有助于研究转录因子与转录调控元件协同作用的调节机制,也为功能基因组学的研究提供数据支持。

3.3 DHSs 与染色质开放性 核小体能够阻断转录因子与顺式作用元件的结合,核小体缺乏意味着染色质结构处于开链或松散状态,转录因子能够进入并与顺式作用元件结合,从而启动基因转录[20]。为量化染色质开放性与转录因子之间的关系,ENCODE项目组通过分析K562 细胞中转录因子的CHIP-seq 数据,发现CHIP-seq 信号与定量DNaseⅠ敏感性平行,说明少数调控因子所在的序列与染色质开放区密切相关,证明了这部分序列是调控染色质呈开放结构的主要驱动力[21]。作为转录因子结合位点的DHSs 通过结合转录因子发挥作用,增强染色质的开放性。

基于DNA 甲基化使得转录沉默从而抑制基因的转录表达的经典理论,Thurman 等[12]分析了19种细胞中位于34 376 个DHSs 内的243 037 个CpG岛的甲基化强弱与染色质开放程度之间的关系,其中20%DHSs 位于染色质开放程度降低的区域,甲基化程度增高,显示了甲基化与染色质结构有较强的关联性[16]。

Jacob 等[22]用DNaseⅠ测序技术检测了70 个约鲁巴人来源的淋巴细胞系细胞中的染色质开放区,确定了8902 个区域中与DNA 序列读取深度显著相关的基因型与附近的一个单核苷酸多态性的插入/缺失有关,称这种变异体为DNaseⅠ敏感性的数量性状位点(DNaseⅠsensitivity quantitative trait loci,dsQTLs)。研究人员分析这些dsQTLs,发现等位基因对DNaseⅠ所具有的敏感性程度与其转录因子结合数量呈高度正相关性。这说明对DNaseⅠ具有高度敏感性的基因所结合的转录因子数量更多,进一步说明DHSs 区域染色质开放度更高。Zhang 等[23]也发现表达水平越高DNaseⅠ越敏感。这也证实了在有转录因子与顺式作用元件结合的区域,染色质更容易被DNaseⅠ所降解,即DHSs 染色质处于开链或松散状态。

4 结 语

真核生物的DHSs 通常与调控元件相关联,绘制DHSs 是识别基因调控元件的一个准确方法。新一代测序技术等实验手段的发展和生物信息学技术的不断完善,不仅能对一个物种的深度测序、单核苷酸多态性(single nucleotide polymorphism,SNP)研究、转录组测序、小分子RNA 研究以及转录调控等组学研究变得简单易行,也为ENCODE 计划提供了技术支持[1]。在新一代测序技术的支持下,ENCODE计划绘制出的人类DHSs 图谱为研究人类转录因子的结合位点、核小体、DHSs 与基因表达的内在联系提供了大量的数据[24-25]。DHSs 通过与启动子关联起到增强子作用,调控基因转录活性以及增强染色质的开放性等从而影响基因转录调控功能的研究,只是为研究真核生物转录调控功能提供理论上的支持,但将DHSs 与SNP 联系起来,则是人类基因组计划走向应用的一个重要步骤。近年来,通过全基因组关联研究已经发现许多与糖尿病、多发性硬化症等重要疾病相关的SNP 突变位点[26-27]。

在研究人类转录因子的结合位点、核小体、DHSs与基因表达的内在联系时,ENCODE 计划无疑为其提供了大量的数据支持。目前,ENCODE 计划已完成前两个阶段的研究和实验,其现有研究成果汇总成30 篇学术论文分别发表于Nature(6 篇)、Genome Research(18 篇)和Genome Biology(6 篇)等SCI 期刊供其他研究者参考。但是,真核生物的基因转录调控机制复杂多样使得ENCODE 研究计划在取得丰硕成果的同时也面临着巨大的挑战[28-32]。相信ENCODE 计划下一阶段的相关科研工作将对功能元件的分类和转录调控研究会更加深入和细化,将为人类疾病的研究和治疗提供更加丰富的实验和数据资源[33]。

[1] Gross DS,Garrard WT.Nuclease hypersensitive sites in chromatin[J].Annu Rev Biochem,1988,57:159-197.

[2] Natarajan A,Yardimci GG,Sheffield NC,et al.Predicting celltype-specific gene expression from regions of open chromatin[J].Genome Res,2012,22(9):1711-1722.

[3] Boyle AP,Davis S,Shulha HP,et al.High-resolution mapping and characterization of open chromatin across the genome[J].Cell,2008,132(2):311-322.

[4] John S,Sabo PJ,Thurman RE,et al.Chromatin accessibility pre-determines glucocorticoid receptor binding patterns[J].Nature Genet,2011,43(3):264-268.

[5] Song L,Zhang Z,Grasfeder LL,et al.Open chromatin defined by DNaseⅠand FAIRE identifies regulatory elements that shape cell-type identity[J].Genome Res,2010,21(10):1757-1767.

[6] Cockerill PN.Structure and function of active chromatin and DNaseⅠhypersensitive sites[J].Febs J,2011,278(13):2182-2210.

[7] 侯 琳,钱敏平,朱云平,等.转录因子结合位点生物信息学研究进展[J].遗传,2009,31(4):365-373.

[8] Crawford GE,Holt IE,Whittle J,et al.Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing(MPSS)[J].Genome Res,2006,16(1):123-131.

[9] Wang YM,Zhou P,Wang LY,et al.Correlation between DNaseⅠhypersensitive site distribution and gene expression in HeLa S3 Cells[J].PLoS One,2012,7(8):e42414.

[10] Ling G,Waxman DJ.DNaseⅠdigestion of isolated nulcei for genome-wide mapping of DNase hypersensitivity sites in chromatin[J].Methods Mol Biol,2013,977:21-33.

[11] Zeng WP,McFarland MM.Rapid and unambiguous detection of DNaseⅠhypersensitive site in rare population of cells[J].PLoS One,2014,9(1):e85740.

[12] Thurman RE,Rynes E,Humbert R,et al.The accessible chromatin landscape of the human genome[J].Nature,2012,489(7414):75-82.

[13] Dostie J,Richmond TA,Arnaout RA,et al.Chromosome Conformation Capture Carbon Copy(5C):a massively parallel solution for mapping interactions between genomic elements[J].Genome Res,2006,16(10):1299-1309.

[14] Sanyal A,Lajoie B,Jain G,et al.The long-range interaction landscape of gene promoters[J].Nature,2012,489(7414):109-113.

[15] 王 海,阮修艳,方向东.位点控制区(LCR)调控基因表达的研究进展[J].生命科学,2010,22(1):74-78.

[16] 金吉春,金星林.microRNA 的概述及其研究[J].医学研究生学报,2013,26(10):1109-1112.

[17] 丁 楠,渠鸿竹,方向东.ENCODE 计划和功能基因组研究[J].遗传,2014,36(3):237-247.

[18] Winter DR,Song L,Mukherjee S,et al.DNase-seq predicts regions of rotational nucleosome stability across diverse human cell types[J].Genome Res,2013,23(7):1118-1129.

[19] Inoue K,Imai Y.Identification of novel transcription factors in osteoclast differentiation using genome-wide analysis of open chromatin determined by DNase-seq[J].J Bone Miner Res,2014,29(8):1823-1832.

[20] 刘 辉,壮子恒,关佶红,等.核小体定位的转录调控功能研究进展[J].生物化学与生物物理进展,2012,39(9):843-852.

[21] Meissner A,Mikkelsen TS,Gu H,et al.Genome-scale DNA methylation maps of pluripotent and differentiated cells[J].Nature,2008,454(7205):766-770.

[22] Jacob FD,Athma AP,Roger PR,et al.DNaseⅠsensitivity QTLs are a major determinant of human expression variation[J].Nature,2012,482:390-394.

[23] Zhang W,Zhang T,Wu Y,et al.Genome-wide identification of regulatory DNA elements and protein-binding footprints using signatures of open chromatin in Arabidopsis[J].Plant Cell,2012,24(7):2719.

[24] Talbot D,Grosveld F.The 5'HS2 of the globin locus control region enhances transcription through the interaction of a multimeric complex binding at two functionally distinct NF-E2 binding sites[J].EMBO J,1991,10(6):1391-1398.

[25] ENCODE Project Consortium.An integrated encyclopedia of DNA elements in the human genome[J].Nature,2012,489(7414):57-74.

[26] Strawbridge RJ,Dupuis J,Prokopenko I,et al.Genome-wide association identifies nine common variants associated with fasting proinsulin levels and provides new insights into the pathophysiology of type 2 diabetes[J].Diabetes,2011,60(10):2624-2634.

[27] Disanto G,Kjetil Sandve G,Ricigliano VA,et al.DNase hypersensitive sites and association with multiple sclerosis[J].Methods Mol Biol,2013,977:21-33.

[28] Birney E.Lessons for big-data projects[J].Nature,2012,489(7414):49-51.

[29] Yavartanoo M,Choi JK.ENCODE:A Sourcebook of Epigenomes and Chromatin Language[J].Genomics Inform,2013,11(1):2-6.

[30] Kavanagh DH,Dwyer S,O'Donovan MC,et al.The ENCODE project:implications for psychiatric genetics[J].Mol Psychiatry,2013,18(5):540-542.

[31] Qu H,Fang X.A brief review on the Human Encyclopedia of DNA Elements(ENCODE)project[J].Genomics Proteomics Bioinformatics,2013,11(3):135-141.

[32] Kellis M,Wold B,Snyder MP,et al.Defining functional DNA elements in the human genome[J].Proc Natl Acad Sci USA,2014,111(17):6131-6138.

[33] Sanfilippo PG,Hewitt AW.Translating the ENCyclopedia Of DNA Elements Project findings to the clinic:ENCODE's implications for eye disease[J].Clin Experiment Ophthalmol,2014,42(1):78-83.

猜你喜欢

染色质高通量远端
染色质开放性与动物胚胎发育关系的研究进展
内侧楔骨远端倾斜与拇外翻关系的相关性
哺乳动物合子基因组激活过程中的染色质重塑
高通量血液透析临床研究进展
豚鼠卵母细胞体外成熟过程中生发泡染色质构型的变化
Ka频段高通量卫星在铁路通信中的应用探讨
水稻基因组有了更清晰的三维图谱
中国通信卫星开启高通量时代
H形吻合在腹腔镜下远端胃癌根治术中的应用
护理干预在高通量血液透析患者中的应用效果