APP下载

增强子对基因表达的调控:从新技术到新机制

2022-05-20武成一洪丹妮童梦莎黄佳良

关键词:特异性位点基因组

武成一,陈 斐,洪丹妮,朱 明,童梦莎,黄佳良

(厦门大学生命科学学院,细胞应激生物学国家重点实验室,细胞信号网络协同创新中心,福建 厦门 361102)

人类基因组中仅约2%的序列是负责蛋白质编码的基因,人们对于剩余大量的非编码序列的生物学功能依然了解甚少.增强子调控元件是一段特定的非编码DNA序列,它们通过与转录因子(TF)结合,对细胞内基因表达进行顺式调控[1].第一个被确定的增强子是猴空泡病毒SV40基因组中一段长72 bp的序列,它可以将宫颈癌HeLa细胞中报告基因的转录提高数百倍[1].增强子通常具有特定的染色质特征,例如DNA序列保守性、染色质可及性、H3K27ac和H3K4me1等组蛋白修饰、可与启动子形成染色质三维环状结构等[2].随着“DNA元件百科全书”(ENCODE)和“表观基因组学路线图”(Roadmap Epigenomics)等计划的实施,研究人员找到大量(在每类细胞中超过10万个)增强子调控元件[3-4].然而,如何有效地注释这些增强子的生物学功能依然面临巨大挑战.

增强子增加了细胞内基因转录调控的复杂性,在发育和疾病发生过程中扮演重要角色[5].目前,利用高通量技术方法研究增强子的主要工作包括以下几方面:1)增强子的预测,利用DNA序列保守性、H3K27ac和H3K4me1等组蛋白修饰、染色质可及性和TF结合图谱等多组学图谱,预测具有细胞特异性的潜在增强子.例如哺乳动物胚胎着床前染色质可及性等动态图谱可用于预测这一生物过程中潜在的增强子[6].2)靶标基因的鉴定,基于染色质线性距离[7]、与基因表达相关性[8]、染色质三维结构[9]和表达数量性状位点[10]等特征和技术手段,寻找增强子潜在下游靶标基因.3)增强子对基因表达的影响,利用聚簇规律间隔短回文重复序列及其相关蛋白9(CRISPR-Cas9)基因编辑等方法,检测增强子对下游靶标基因表达的影响.例如,Fulco等[11]发现利用增强子自身H3K27ac强度、增强子与潜在靶标基因的距离、增强子与潜在靶标基因的染色质相互作用等因素进行建模,可以准确预测出增强子对基因表达的影响.4)增强子与发育和疾病的关系,例如VISTA数据库(https:∥enhancer.lbl.gov/)收集了1 654个经验证在小鼠发育与疾病模型中具有体内活性的增强子[12],发现增强子的冗余性有利于稳定哺乳动物发育过程中的表型[13],且大多数与疾病相关的序列变异(即单核苷酸多态性)富集在增强子等调控元件中[14].

本文回顾近年来增强子调控基因表达研究中的部分最新进展,介绍多组学、单细胞及基因编辑等可应用于增强子研究的相关技术,阐述增强子对基因表达的调控机制,最后对增强子在发育、进化和疾病中的重要功能进行概述.

1 增强子研究的新技术

1.1 多组学技术

1.1.1 染色质开放区域检测技术

染色质可及性是指细胞核内染色质中的DNA能够与生物大分子进行物理接触的程度,其图谱可用于识别基因组上的调控区域.染色质可及性以及核小体的定位传统上是通过核酸酶或限制性内切酶的消化等方法来检测的,这里简要描述几种常用测序(seq)实验技术的原理.1)DNase-seq[15],通过一种可以优先在开放染色质中引入双链断裂的核酸内切酶DNase Ⅰ,消化基因组后对DNA片段进行测序.2)MNase-seq[16],是一种测量核小体占位的技术,MNase同时具备核酸外切酶和内切酶的活性,可以将碱基对逐个切下以切割和消化裸露的DNA区域,直至遇到核小体或DNA结合蛋白等阻滞物.3)ATAC-seq[17],利用一种经过工程学改造的超高活性DNA转座酶(Tn5),同时切割和标记开放的或核小体缺失的染色质区域,具有实验方案简单和所需检测样品细胞少的优势,因此得到广泛应用.除了分析染色质可及性图谱之外,ATAC-seq也可用于检测TF印迹和绘制核小体定位图.

1.1.2 TF结合和组蛋白修饰检测技术

染色质可及性是高度动态变化的,通过染色质结合因子和核小体之间的相互竞争来调节.具有调控作用的DNA元件(如增强子、启动子、绝缘子等)与TF协同调节基因的表达,其中活性增强子附近的核小体通常含有特异组蛋白修饰.染色质免疫共沉淀(ChIP)-seq用于在全基因组水平检测染色质结合因子如TF或组蛋白修饰在基因组上的位置[18].对于组蛋白修饰ChIP-seq实验,染色质可以从甲醛固定细胞或非固定细胞(天然染色质)中分离出来,并通过超声波或MNase消化作用将组蛋白修饰区域片段化至100~500 bp.对于TF结合ChIP-seq实验,染色质需要通过甲醛固定交联以保留蛋白质与染色质的相互作用.这些DNA片段被特异性抗体以及Protein A/G偶联琼脂糖珠或磁珠捕获后进行建库和测序.近年来,研究人员已经开发出更多高效衍生方法,其中核酸酶靶向切割和释放(CUT&RUN)技术是一种以简单、可靠且成本较低的对染色质结合蛋白进行高分辨率分析的技术[19].此技术利用Protein A/G-MNase融合蛋白结合目标抗体,激活MNase对目标蛋白结合位点周围的染色质进行切割、捕获.与传统的ChIP-seq相比,该技术不需要甲醛交联,具有更高的信噪比且所需的样品量少,已应用于单细胞水平的检测.Skene等[20]还推出了靶向剪切及转座酶(CUT&Tag)技术,与CUT&RUN相比,CUT&Tag使用了Tn5代替MNase.这两种方法低成本、高效率、高可重复性和高通量的特点,使其逐渐成为常规表观基因组分析的首选方法.

1.1.3 三维基因组技术

越来越多的证据表明,基因组的三维结构在不同尺度呈现层次结构,并在功能上与基因表达调控紧密关联[21].染色体在细胞核中占据的位置称为染色体区域,这些区域被划分为染色体室,并进一步划分为拓扑关联域(TAD),以及增强子-启动子相互作用介导的染色质环.在三维基因组结构研究中最有影响力的检测技术是高通量染色体构象捕获(Hi-C)技术[22],该技术可对整个基因组的DNA相互作用进行分析,分辨率范围为数个碱基到数兆个碱基.根据DNA被甲醛交联在一起的概率,Hi-C技术可以测量两个DNA片段在三维空间中物理结合的总体平均频率.利用限制性内切酶将交联的DNA消化并剪切,之后将相互作用的片段连接在一起并用生物素标记,从而对选择性纯化并形成嵌合DNA分子的基因组文库进行测序.Hi-C的衍生技术可以检测由感兴趣的蛋白质所驱动或者所选定基因组位置的特异性DNA相互作用,包括ChIP-loop、ChIA-PET、HiChIP、PLAC-seq和Capture-Hi-C等[23].Hi-C及其衍生技术的分辨率很大程度上受限于限制性内切酶位点的分布.Micro-C技术引入了双重交联,并用MNase消化取代了Hi-C技术中使用的限制性内切酶,这不仅能产生非常均匀的切割片段从而提高局部分辨率,还可以保留核小体定位的信息[24].也有研究发现增强子和启动子的功能连接性可以通过它们自身转录的RNA相互作用来实现[25].RNA原位构象测序(RIC-seq)技术可以用于对分子内和分子间的RNA-RNA相互作用进行全局分析,有助于生成人类细胞中RNA的三维相互作用图谱[26].

目前利用Hi-C等技术检测全基因组染色质三维结构图谱在技术上依然存在困难,而且非常昂贵,因此刺激了计算分析和数学建模的发展,结合验证实验,有助于实现对染色质结构和功能的理解.Huang等[27]构建贝叶斯累加回归树BART计算模型,在概念上首次论证了利用组蛋白修饰数据可以有效地预测染色质三维结构.Marco等[28]开发了层次化隐马尔可夫模型的计算方法,能够跨不同尺度系统地注释染色质状态,对增强子进行功能注释,从而更好地筛选出细胞中关键的增强子.

1.2 单细胞组学技术

1.2.1 单细胞多组学技术

在过去很长一段时间内,RNA-seq技术已被广泛用于研究群体水平的基因表达模式.单细胞RNA-seq(scRNA-seq)[29]的出现为在单细胞水平上探索基因表达谱提供了前所未有的机会,并为研究细胞的基因表达异质性和动态变化提供更加深入的见解.单细胞ATAC-seq(scATAC-seq)可以在单细胞分辨率下检测染色质可及性,从而帮助人们了解细胞间的谱系关系[30].除此之外,研究人员还开发了许多方法来同时获得单细胞的染色质可及性和基因表达水平,例如Paired-seq[31]、SNARE-seq[32]和SHARE-seq[33]等.

1.2.2 单细胞多组学图谱

Li等[34]利用scATAC-seq捕获了成年小鼠同形皮层、嗅球、海马以及脑核区45个区域共计超过80万个细胞的染色质可及性,构建了超过160多种细胞类型的顺式作用元件调控图谱,为全面分析哺乳动物大脑的基因调控程序奠定了基础,有助于解释人类各种神经系统疾病.Domcke等[35]对发育时间72~129 d人类胎儿的15个器官121个样本进行scRNA-seq和scATAC-seq,获得了400万个单细胞的基因表达和染色质可及性数据,为更好地理解人类发育中的罕见和常见疾病提供了信息资源,同时也为开发潜在的治疗方法提供了支持.Ranzoni等[36]对8 000多个来自胎儿肝脏和骨髓的血细胞进行scRNA-seq和scATAC-seq,确定了肝脏和骨髓的造血干细胞之间的转录和功能差异.Trevino等[37]等对不同时期的人类胎儿大脑皮层组织进行scRNA-seq和scATAC-seq,通过整合分析,完成了人大脑皮层发生过程中各细胞类型的单细胞基因表达和调控图谱,发现了神经元和胶质细胞发育分化的路径以及不同的TF在这些过程中的调控机制.这些单细胞多组学图谱有助于在单细胞分辨率下进一步揭示发育或疾病过程中细胞命运调控的机制.

1.3 基因编辑技术

1.3.1 CRISPR-Cas9基因编辑技术

随着CRISPR和Cas的发现,CRISPR-Cas工具也逐渐成为各个领域广泛使用的基因编辑技术.Ⅱ型CRISPR-Cas系统由单个导向RNA(sgRNA)和DNA内切酶Cas9组成,sgRNA引导Cas9到特定的DNA序列并进行切割,从而实现便捷有效的基因编辑[38-39].此外,由Cas9两个核酸酶结构域内残基的突变体产生的失活Cas9(dCas9),虽然不能切割DNA,但是保留了以特定序列方式结合DNA的能力.dCas9可将转录激活因子招募到转录起始位点,促进基因转录激活(CRISPRa)[40],也可以结合转录抑制因子Kruppel相关盒(KRAB)特异性地抑制基因表达(CRISPRi)[41].此外还有与各种效应域融合的dCas9,大大方便了对真核生物转录组和表观基因组的操纵.例如,原位CRISPR亲和纯化调节元件(CAPTURE)方法可以识别位点特异性染色质调控复合物和远程DNA相互作用[42],使用融合生物素的dCas9,可以与链霉素结合从而分离完整的调控复合物.在非编码调控元件的功能研究上,Li等[43]设计了以增强子为靶标的体内CRISPR双效应表观遗传编辑系统enCRISPRa和enCRISPRi,用于在体外、异种移植和体内高效分析增强子功能.在染色质空间构象与疾病的研究中,Lupiez等[44]利用CRISPR-Cas系统构建了特定基因位点染色体重排的小鼠模型,发现染色体重排破坏了编码基因及其增强子相对于TAD边界的正常拓扑结构,导致远端调控结构重新连接而致病.

1.3.2 CRISPR-Cas9文库筛选技术

传统的利用RNA干扰途径进行基因敲除和大规模筛选的方式,存在广泛脱靶效应和基因敲除不完全等问题.而CRISPR-Cas9为高通量筛选提供了更高效便捷的平台,通过设计sgRNA文库,可以根据特定的表型筛选重要基因,成为全基因组功能分析的强有力工具[45].新开发的Perturb-seq将CRISPR-Cas9与scRNA-seq结合起来,在单个样品中平行生成数千个基因扰动,并测定每个细胞的扰动和表型,从而准确鉴定受扰动影响的单个基因靶点、基因特征和细胞状态,实现了大规模的基因组功能筛查[46].基于CRISPR-Cas9系统的全基因组筛选技术对筛选疾病发生中起重要作用的非编码调控元件具有重要意义[47].为了有效地预测增强子与基因之间的连接,研究人员将CRISPRi、RNA荧光原位杂交(FISH)和流式细胞术结合起来开发了CRISPRi-FlowFISH,该方法通过扰动非编码元件并量化其对基因表达的影响,可以系统地大规模预测增强子调控基因[11].此外,新开发的CRISPRpath方法[48]将传统的仅限单个基因的增强子筛选方法进一步扩展,通过对人类诱导多能干细胞中的6个基因进行干扰和切割,可以同时表征参与同一生物学途径中多个靶基因的调控元件,并区分出不同增强子在功能强度上的差异.Fei等[49]分别设计了针对叉头框蛋白A1(FOXA1)或CCCTC结合因子(CTCF)结合位点的全基因组CRISPR-Cas9敲除筛选文库,并在乳腺癌和前列腺癌细胞系中进行大规模筛选,筛选并探究超过1万个与FOXA1或CTCF结合的顺式作用元件的功能及特征.增强子研究中的相关技术总结于表1.

表1 增强子研究中的相关技术

2 增强子相关新机制

2.1 增强子靶标基因的预测方法

对增强子位置的识别只是解析其生物学功能的第一步.在此基础上,鉴定出每一个增强子直接作用的基因靶点,是理解增强子生物学效应不可或缺的部分.Hi-C技术直观地反映了有物理接触的基因组位置信息,特别是利用Promoter Capture Hi-C特异性捕获增强子和启动子相互作用的片段,可以达到更高的分辨率[50].此外,利用多个样本ATAC-seq 或H3K27ac信号和基因表达量相关性的方法也被广泛应用于预测增强子的靶标基因[51],甚至应用于单细胞水平[8].还有研究人员设计了一种称为ABC(activity-by-contact)的方法构建了人类全基因组增强子-靶基因映射图谱[11],此方法综合考虑了增强子本身的表观修饰强度以及与靶基因三维连接的强度,已应用于对全基因组关联研究位点的功能性注释中[52].

2.2 增强子簇

许多增强子于基因组中协同调节同一个靶基因,并以簇的形式存在.2008年“阴影增强子”的概念被提出[53],阴影增强子代表在空间和时间上表现出部分或完全冗余的调控模式的多个增强子.研究表明阴影增强子可能提供了一种重要的机制,用于缓冲与人类疾病相关的基因非编码调控区突变而导致的基因表达紊乱,提高动物发育过程中基因表达的精确性和表型稳健性[13,54].增强子簇中通常具有异常高水平的增强子活性和增强子相关染色质特征,如H3K27ac的富集,TF、辅助激活因子和染色质的结合与占用等,因此在研究中也被鉴定为超级增强子(SE)[55].SE通常与细胞命运决定和肿瘤发生发展过程密切相关.目前SE是利用生物信息学方法通过对基因组中距离在12.5 kb以内的增强子进行线性聚类而识别的.

2.3 增强子之间的层次结构

增强子簇在细胞命运决定和疾病过程中扮演重要角色,然而它是如何发挥作用的尚不清楚,其中一个关键问题是,增强子簇内多个增强子元件是如何相互协调以实现对目标基因表达的精确调控的[56].大量研究证明增强子的调控机制具有高度的多样性和异质性.例如:Hay等[57]对α-珠蛋白增强子元件的解析表明,α-珠蛋白基因的活性随着增强子的数量增加呈线性增加的状态;Bahr等[58]证明了调节MYC基因的增强子簇的加和性协同作用;Shin等[59]发现乳清酸蛋白基因(Wap)增强子簇中最远端的增强子似乎起到最关键的作用.增强子在基因激活方面也表现出时间上的差异,小鼠Fgf5增强子簇中的大多数增强子元件会在不同时间点促进Fgf5的表达,从而诱导小鼠干细胞的分化[60].也有研究提出动态“转录枢纽”的概念,即多个增强子及其目标启动子、大量TF、转录辅助因子和RNA聚合酶Ⅱ同时参与相同的微环境,形成一个转录共激活聚合物[61],为多个增强子对启动子的调控提供潜在的模型.

Huang等[62]利用CRISPR-Cas9基因编辑技术,在造血干细胞体外分化为成红细胞的模型中,解析了两个SE:1)造血干细胞特异性转录因子GATA2基因的SE通过3个增强子不同分工,精确调控GATA2在分化过程中的动态表达,从而影响干细胞的维持和分化;2)SCL25A37SE中,增强子E3不仅对基因表达影响最大,而且还决定了E1和E2的功能,表明增强子在功能上存在层次结构.Huang等[63]还基于染色质三维结构和组蛋白修饰等表观组学图谱,在人白血病细胞K562中系统解析了全基因组范围内的SE,发现在SE内部存在一个重要的枢纽增强子,负责协调多个增强子共同调控基因表达,由此提出一个包含枢纽增强子的模型,阐述增强子之间功能层次结构的分子机制.Kai等[64]的最近一项研究还发现增强子在形成时间上同样存在层次结构,增强子簇中的元件在分化过程中的不同时间点出现,通过与不同的细胞特异性TF结合来驱动细胞的分化过程.

3 增强子调控基因表达的功能

3.1 发 育

单细胞受精卵通过一系列发育途径的选择过程发展成为一种复杂的多细胞动物.发育过程中增强子可以精确控制基因的时空表达,使得基因在物种特异性遗传程序的控制下表现出时空受限的表达模式,调控从生殖层形成到细胞分化的发育过程.调节细胞特异性基因的元件中,最典型的例子是基因座控制区(LCR)[65],LCR通常是基因组上具有调节能力的DNA序列,比如人类β-珠蛋白LCR由多个红系特异性的增强子组成,可以在不同发育时期通过染色质环状结构与珠蛋白基因结合来促进基因特异性的表达.关于增强子在肢体发育中的作用也开展了大量研究,这里以Shh和HoxD基因位点为例.远端骨骼的发育模式部分由Shh基因所控制,而Shh基因的表达由一个被称为“极性活化带调控元件”(ZRS)的增强子驱动[66],ZRS可以与TF ETS1结合,从而驱动Shh的转录.在ZRS缺失的突变体中,Shh转录信号消失,导致小鼠远端骨骼的缺失,这表明ZRS对于远端肢体发育具有关键作用.HoxD在四足动物四肢的构建中起着至关重要的作用,控制HoxD的增强子多达7个,其中位于3’-端的两个增强子控制HoxD表达的早期阶段,随后染色质发生拓扑变化,使得部分增强子与5’-端增强子一起调控HoxD后期表达[67].近期一些研究还探究了增强子在血液细胞发育过程中的作用.Huang等[62]利用人类造血干细胞体外分化模型,结合RNA-seq和ChIP-seq等技术检测细胞的转录组和表观基因组,利用MAnorm[68]分析了增强子上H3K27ac组蛋白修饰信号的差异,系统绘制了人类造血干细胞分化过程中增强子激活或失活的动态图谱,发现不同的TF组合以高度特定的方式合作调控增强子的时空活动,比如造血干细胞和祖细胞(HSPC)特有的RUNX1-FLI1-PU.1-ETS模块,血液细胞中的GATA1和TAL1模块,以及无处不在的“管家”E2F-SP1和激活蛋白1(AP1)模块等,进一步阐述了增强子在人类造血干细胞分化过程中的调控网络.Cai等[69]还发现分化后期的红细胞中细胞特异性基因表达依赖于远端增强子的程度比在胚胎时期红细胞中的更强.这些特异性基因主要通过远端增强子所结合的Myb以及Myb介导的Gata1占位来调控,而胚胎时期红细胞特异性基因主要通过Gata1在近端启动子区域的占用来调节,说明细胞特异性调节模式随个体发育而改变.

3.2 进 化

除在发育调控中的核心作用外,增强子还是产生进化变异的热点[70],因为它们拥有细胞特异性,允许在特定组织环境中调节靶基因表达,而不影响其他基因功能,还可以通过冗余性来缓冲致死风险从而促进遗传变异的积累.在哺乳动物基因组中包含数百个连续的保守碱基序列,可以作为远距离增强子发挥作用,称为“超保守”增强子.这些超保守调控元件对维持正常发育过程有着不可或缺的作用[71].TF和增强子的相互作用在动物发育过程中决定了细胞特性,尽管TF家族在动物界高度保守,但控制基因表达的增强子在很大程度上具有物种特异性[72],在哺乳动物基因组中,只有1%的人类组织特异性增强子是保守的[72].在更大进化距离上有相似性的增强子更为罕见,即使是超保守增强子,其功能也并不一定需要在进化中通过序列的完美保守来维持[73].虽然泛后生动物中增强子保守性似乎很少见,但有研究发现增强子存在一种古老、保守但灵活的调控机制[74].人类与海绵动物的胰岛增强子没有显著的序列一致性,但它们通过一套相似的TF结合基序来驱动相似的基因表达模式.这种保守的TF结合基序在进化过程中保持了稳定的增强子功能,同时这些增强子可以通过扩展整合新的TF结合基序以及丢掉其他基序来完成进化.

3.3 疾 病

随着研究的不断深入,发现SE驱动的基因转录调控是一种参与癌症发生发展的独特转录调控机制,在乳腺癌[75]、结直肠癌[76]和急性淋巴白血病[77]等多种癌症中驱动或抑制癌症的发生,对肿瘤细胞的生长、耐药性以及免疫逃逸等能力产生重要的影响.SE介导癌症发生的机制主要有以下几种:1)基因组上的碱基突变导致新的TF结合位点出现,进而出现新的SE,例如在一部分T细胞急性淋巴细胞白血病(T-ALL)病例中,由于TAL1上游非编码区域发生突变,产生了新的MYB结合位点,MYB蛋白结合在此新位点上并招募组蛋白乙酰转移酶(CBP)形成新的SE,激活相邻的原癌基因TAL1的表达,导致肿瘤的发生[77];2)SE中某些关键位点的突变导致致癌基因或抑癌基因的表达异常,从而影响癌症的发生和发展,例如位于神经母细胞瘤致癌基因LMO1内的SE中的单碱基突变G > T,使得原有的TF GATA3的结合位点被破坏,导致SE驱动的LMO1表达下降,影响了神经母细胞瘤的易感性[78];3)SE通常调控其所在TAD内的基因,由碱基突变等原因导致TAD边界发生改变,造成染色质结构的重组,使得原本不受SE调控的基因出现异常表达,例如在一些T-ALL病例中,TAD边界发生突变导致SE异常驱动原癌基因TAL1和LMO2的表达[79].SE功能层级的紊乱通常也伴随着基因的表达异常.例如研究发现位于MYC基因下游1.7 Mb的血液增强子簇(BENC)在MYC基因的表达调控中发挥着重要作用,BENC是一段由9个具有选择性活性的增强子组成的SE,在不同的造血系统中每个增强子的活性不同,从而使多个增强子能够形成不同的组合,实现谱系特异性的基因调控,而BENC的调控异常使MYC基因的表达失调,导致白血病的发生[58].

近年来针对各类疾病的基因编辑疗法正在快速发展,其中靶向增强子位点的基因编辑疗法已被成功应用到镰刀型贫血症和β地中海贫血症中,这类疾病是由于编码β-珠蛋白的基因突变使其无法与α-珠蛋白形成正常的血红蛋白HbA导致的.利用CRISPR-Cas9对患者自身CD34+细胞中BCL11A增强子上的GATA1结合位点进行切割,由于增强子的时空特异性,对该增强子的切割不影响其他细胞类型中BCL11A的功能,仅特异性地抑制了红系细胞中BCL11A的表达,恢复了出生后被抑制的γ-珠蛋白的表达,与α-珠蛋白重新形成胎儿血红蛋白HbF[47,80].经靶向增强子编辑后的CD34+细胞回输到患者体内后,能有效恢复患者体内的HbF水平,使患者不再需要输血治疗[81].相比于靶向基因序列,对增强子进行编辑改变了对基因的表达调控,且没有造成基因突变,增强子的时空特异性也大大降低了基因编辑的风险,使其成为各类疾病中都具有巨大潜力的基因编辑疗法新靶点.

4 总结与展望

增强子是基因转录的关键调节元件,研究人员在其效应和机制研究方面取得了巨大进展,它们的功能与TF、辅助因子的募集以及增强子与启动子相互作用的形成密切相关.近年来,二代测序的发展也极大地扩展了人们探索全基因组组成的知识和技能.本文从不同方面回顾了增强子的历史、研究技术、重要性、机制和研究进展(图1).目前,如何有效注释基因组中大量增强子的生物学功能及其作用机制是该领域的研究热点.

P表示启动子;E表示增强子;hub表示枢纽增强子.

目前仍有许多关于增强子的未解之迷,如:增强子是如何选择目标基因的?多个增强子如何在调节网络中协调,这些增强子中的冗余有多广泛?增强子与启动子活性的机制差异是什么?三维环状染色质结构是否是基因调控的决定因素?增强子激活靶基因启动子的确切机制是什么?研究人员需要在开发新方法和积累不同细胞类型和组织的数据方面做出更多努力,为该领域的研究提供更多的线索,以期进一步了解增强子在基因调控中的作用和机制.

猜你喜欢

特异性位点基因组
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
DNA脱碱基位点的检测方法及其生物学研究进展
多环境下玉米保绿相关性状遗传位点的挖掘
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
老年慢性非特异性腰痛综合康复治疗效果分析
第一代基因组设计的杂交马铃薯问世
牛参考基因组中发现被忽视基因
一种改进的多聚腺苷酸化位点提取方法