DNA甲基化和组蛋白甲基化修饰的表观遗传调控作用研究进展
2022-09-14张淼杨露露贾岩龙王天云
张淼 杨露露 贾岩龙 王天云
(1.新乡医学院药学院,新乡 453003;2.新乡医学院重组药物蛋白表达系统国际联合实验室,新乡 453003;3.新乡医学院基础医学院,新乡 453003)
表观遗传基因调控作用在DNA和组蛋白N末端,对基因表达稳定性起着关键性作用。染色质是由真核生物细胞核内的DNA和蛋白质组成,根据致密程度的不同可分为常染色质(euchromatin)和异染色质(heterochromatin)[1]。基因组表观修饰的主要机制可分为DNA中的甲基化和染色质中组蛋白的转录后修饰,DNA的CpG二核苷酸和组蛋白H3赖氨酸9(H3-K9)中胞嘧啶的甲基化是其中两种重要的表观遗传修饰,其高水平状态是转录沉默基因启动子和组成型异染色质的特征[2]。
DNA甲基化(DNA methylation)是核苷酸胞嘧啶上甲基(CH3)基团的共价修饰,在真核细胞中,基因沉默、DNA甲基化和染色质的结构三者之间相互依存相互影响[3]。例如,CpG甲基化的高水平表达与异染色质区域的形成相关,相比之下,基因组中富含非甲基化CpG的区域,称为CpG岛,与基因启动子和其他调节功能相关联,在此区域内它们似乎更有助于转录[4]。由于与基因沉默有关,这些CpG岛的甲基化区域在癌症沉默基因中也普遍存在。在染色质的背景下,DNA甲基化与组蛋白修饰都不是独立存在的,两者之间存在复杂且紧密的联系,其中包括组蛋白甲基化、乙酰化和泛素化。已有研究表明,染色质中组蛋白的甲基化状态会随着DNA的修饰方式不同和序列的改变而改变,而染色质中组蛋白赖氨酸的甲基化状态又可能影响DNA自身的修饰[5]。
1 DNA甲基化及其调控
1.1 DNA甲基化修饰及其功能
DNA甲基化是一种在原核和真核生物基因组中常见的复制后表观遗传修饰,也是哺乳动物中基因表达的重要调控方式,在基因转录抑制方面起关键作用[6]。
DNA甲 基 转 移 酶(DNA methyltransferase,Dnmt)具有催化和维持的作用,其主要分为两种类型,一种是DNA的两条链都未发生甲基化,而在DNA甲基转移酶的催化下都发生甲基化,称为新生甲基化。另一种是DNA的其中一条链已甲基化,而另一条未甲基化的DNA链被甲基化,这种类型称为保留甲基化。这两类甲基化过程都需要C5胞嘧啶甲基转移酶的参与,即是指在S-腺苷甲硫氨酸(S-adenosyl methionine,SAM)作为甲基供体的前提下,胞嘧啶的第5位碳原子被甲基化[7]。哺乳动物细胞中DNA甲基转移酶主要分为dnmt1、dnmt2、dnmt3a、dnmt3b和 dnmt3l,但只有 dnmt1、dnmt3a和dnmt3b三种酶具有甲基转移活性。Dnmt1为持续性甲基转移酶,它主要是参与DNA复制新合成链的完全甲基化,dnmt3a和dnmt3b主要参与从头甲基化,其中dnmt3a主要以自抑制的方式存在[8]。在肿瘤细胞中,抑癌基因的甲基化程度影响其表达从而影响细胞周期,很多癌变组织中dnmt的表达也随之发生改变,大部分呈上升趋势[9]。DNA从头甲基化和DNA甲基化的维持与不同的组织细胞、不同基因的表达有关[10]。作为一种遗传信息,DNA甲基化既可以传给后代,又可以表达DNA的亚序列水平。细胞周期调控机制失调的主要原因是由于甲基化漂移,基因沉默或过表达从而影响衰老组织的基因表达[11]。
1.2 DNA甲基化与基因表达调控
DNA甲基化基本上是在胞嘧啶-磷酸-鸟嘌呤(CpG)和非CpG二核苷酸位点的胞嘧啶残基的碳原子上增加一个甲基(5mC),其功能主要是抑制启动子区和转录起始位点的甲基化,因此在基因表达调控、转座子的沉默和异染色质的维持方面起着重要作用。相比之下,基因组中富含非甲基化CpG的区域,称为CpG岛,与基因启动子和其他调控特征相关,它们似乎更有助于转录,其特点是此区域的甲基化与基因沉默有关,常在癌症中存在[12]。有研究表明DNA甲基化启动基因序列将会导致基因沉默、基因点突变以及影响基因错配修复[13]。启动子甲基化与RNA聚合酶有关,若该区域发生甲基化,RNA聚合酶则无法与启动子结合,从而使目的基因的转录受到抑制,表达也受到影响。此外在一些癌变及肿瘤发生过程中,DNA甲基化水平会发生变化并影响基因的表达[14]。增强子是控制基因表达中不含CpG岛的关键因子,一般认为增强子的DNA甲基化状态与其活性之间成反比关系[15]。基因上游是通过CpG的甲基化差异区通过招募蛋白使目的基因沉默,基因的下游被DNA甲基化的印记控制区(imprinting control region,ICR)调控,使基因转录受到抑制,该区域被称为沉默子[16]。总体而言,DNA甲基化造成基因沉默的原因大多都是由于转录受到抑制从而影响了目的基因的表达,可分为以下3个方面:(1)启动子区域发生甲基化;(2)基因序列中某位点发生甲基化抑制蛋白的表达;(3)染色体结构由于受到DNA序列的变化从而变得紧密。
dnmt3a和dnmt3b主要作用是合成甲基化酶,而dnmt1则是维持甲基化酶的稳定。研究表明S-腺苷甲硫氨酸SAM和DNA链与结构域的结合是通过dnmt3a的催化,其N末端调节结构域主要参与核酸定位和蛋白质的相互作用[17],其C末端主要催化其活性,调节结构域将核蛋白进行招募并进行染色质重塑。组蛋白修饰及其基因转录等研究[18]表明dnmt3a与肿瘤、肝癌、大肠癌等疾病有着密不可分的作用。大多数基因组DNA的低甲基化与癌症初始阶段有关,并且可能有助于癌症形成。DNA甲基化状态发生异常可能是由于dnmt3a的蛋白表达发生变化,进而使抑癌基因变为高甲基化状态,而在敲除相关的dnmt之后,癌细胞的甲基化状态又会恢复正常,即在肿瘤中DNA甲基转移酶改变的方式主要由突变、缺失及过表达组成[19]。而癌症的调节剂miRNA则是通过靶向dnmt3a抑制癌细胞的进展[20]。利用CRISPR/Cas9基因编辑技术敲除dnmt3a酶后,影响蛋白水平并增加了表达稳定性,而其生长特性并未受到影响。有研究表明,通过建立DNA甲基转移酶dnmt3a缺陷的CHO细胞系观察到缺陷型细胞对稳定转染的CHO细胞重组蛋白表达的维持有积极影响[21]。也有研究表明敲除dnmt3a对CHO和HEK293T细胞起积极作用,会降低其甲基化水平,但是对表达外源基因并无积极作用[22]。在CHO细胞中,dnmt3a基因的敲除对细胞的生长无明显影响,但会影响外源基因的表达;而对于HEK293T细胞来说,dnmt3a基因可能对这两方面都起着重要作用,该基因的敲除会导致细胞生长延缓以及外源基因的表达水平降低。
2 组蛋白甲基化
2.1 组蛋白甲基化修饰及其功能
在真核细胞中,DNA存在于细胞核的染色质中,核小体是染色质的结构和功能的基本单位,由146-147个碱基对的DNA和一个组蛋白八聚体组成,带有一个H2A-H2B四聚体和两个H3-H4二聚体[23]。组蛋白的N末端和C末端被翻译后修饰,可分为乙酰化、磷酸化、甲基化、糖基化和泛素化[24]。这些转录后修饰可以通过影响与DNA结合的组蛋白末端的电荷和结构,从而改变染色质状态和基因表达。组蛋白甲基化是主要的转录后修饰之一,由组蛋白甲基转移酶(histone methyltransferases,HMTs)催化将甲基转移到组蛋白的H3和H4的赖氨酸残基上。作为基因表达的活性或抑制标记,组蛋白的赖氨酸残基分别可以进行单甲基化、二甲基化和三甲基化(分别为 me1、me2 和 me3)[25]。
2.2 组蛋白甲基化与基因表达调控
组蛋白甲基化在基因表达调控、维持基因组稳定性等方面起着重要的作用。一般来说,甲基化发生在不同的氨基酸残基上,其中赖氨酸和精氨酸的甲基化的研究较为广泛,主要催化组蛋白的位点和特异性赖氨酸甲基化[26]。到目前为止,组蛋白H3和 H4的 N末端尾部(H3K4,H3K9,H3K27,H3K36和H4K20)的5个残基的甲基化,以及组蛋白H3的球状结构域(H3K64和H3K79)的两个残基的甲基化已经被功能性表征[27](表1)。H3K4、H3K36和H3K79被认为是活跃标记,它们占据染色质中活跃转录的基因区域,H3K9、H3K27和H4K20被称为抑制标记,通常与沉默的基因表达和浓缩的染色质有关[28]。H3K4甲基化在增强子区、启动子区和转录起始位点(TSSs)高度富集,在卵母细胞中,H3K4me3调控癌基因和抑癌基因的结构域为非典型排列方式[29]。H3K9甲基化通常与基因阻遏和异染色质形成有关,H3K27甲基化通常被认为是基因抑制的标志,通过启动子和增强子的富集,H3K27me3对相关基因的抑制起重要作用[30]。H3K36甲基化通常被认为是基因间和基因内区域富集的活性标记。在人类细胞中,通过H3K9甲基化和转录延伸的相互作用保持基因转录后被抑制的染色质状态。在基因间区,H3K36me2还可以招募dnmt3a来调控DNA甲基化的建立和维持,H3K79甲基化在编码区富集,并与活性转录相关,H4K20甲基化是组蛋白修饰的抑制标志[31],H4K20me1标记了低转录基因的编码区,并在细胞分裂过程中积累在亲代核小体中。多种证据表明H4K20甲基化与基因组稳定性、DNA损伤反应、染色质压缩、DNA复制和核小体翻转有关[32]。总的来说,组蛋白赖氨酸甲基化对细胞的发育和增殖起着关键性作用。
表1 组蛋白甲基转移酶及其在组蛋白上赖氨酸的靶向位点Table 1 Targeting sites of histone methyltransferase and its lysine on histone
精氨酸甲基化由蛋白质精氨酸甲基转移酶(protein arginine methyltransferase,PRMTs)的酶家族催化,所有成员都能够将精氨酸单甲基化。但根据二甲基化的类型,它们被分为两类:Ⅰ型(PRMT1、3、4、6、8)不对称二甲基精氨酸和Ⅱ型(PRMT5、7、9)对称二甲基精氨酸[33]。H3R2、H3R8、H3R17、H3R26、H4R3和H2AR3是已知的体内PRMT靶标,相同精氨酸的对称或非对称甲基化可以标记不同的染色质区域,精氨酸甲基化在染色质结构和转录中的功能作用至今仍未被充分研究。此外,精氨酸甲基化的一般水平似乎低于赖氨酸甲基化,这表明基因调控的功能更受限制,而不是染色质形成的一般结构作用[34]。当被PRMT1不对称甲基化时,H4R3me2作为几个ER调节基因的转录激活标记,并且在体内对于由H3和H4乙酰化标记的开放染色质结构域的建立和维持是必需的[35]。然而,当被PRMT5对称二甲基化时,H4R3me2反而参与转录沉默[36]。H3R8me2和H4R3me2已被证明以 DNA 甲基化依赖的方式调节DNA启动子活性[37]。
2.3 H3K9甲基化与基因表达调控
H3K9甲基化对基因转录起抑制作用,常与异染色质的形成、X染色体失活及Rb介导的基因抑制等有关[38]。H3K9甲基化,特别是二甲基化H3K9me2和三甲基化H3K9me3,通常与基因抑制和异染色质形成相关[39],H3K9me1也在与活性基因相关的TSSs周围被检测到[40]。H3K9me1和 H3K9me2同时存在于细胞质和细胞核中,而H3K9me3仅存在于细胞核中[41]。在哺乳动物细胞中,几种H3K9甲基转移酶-SUV39H1/KMT1A、SUV39H2/KMT1B、SETDB1/KMT1E、二聚体G9a/KMT1C-GLP(G9a-like protein)/KMT1D和PRDM家族具有不同的催化活性和靶基因,在不同的细胞中发挥作用[42]。Suv39(suppressor of variegation 3-9)为组蛋白H3第9位赖氨酸的甲基化酶杂色抑制因子3-9被发现是第一个能催化组蛋白赖氨酸甲基化的酶[43]。在哺乳细胞中,suv39在哺乳动物中可分为suv39h1和suv39h2,可使H3K9二甲基化、三甲基化,被催化形成三甲基化的H3K9是异染色质蛋白1(Heterochromatin Protein 1,HP1)停泊位点[44],suv39h1/2也含有一个染色质域,它们可以被hp1α/β或自身进一步招募,hp1α/β、suv39h1/2和 H3K9me3之间的多重相互作用确保了H3K9me3在异染色质区域的扩散[45]。Suv39h1 被认为参与细胞分化的方式,是调节细胞周期的转录因子[46]。Setdb1主要在常染色质区域发挥作用,是唯一能催化H3-K9三甲基化的常染色体HMT,这被认为是中心周围异染色质的标志,表明Setdb1在连接基因表达的转录沉默和局部异染色质形成中的作用[47],与HP1及其共抑制子KAPI在异染色质的结合,促进H3K9me3生成[48],同时参与核糖体DNA转录和核仁染色质重塑,调控基因的转录形成[49]。作用于常染色区的SUV蛋白为G9a,又称常染色质组蛋白赖氨酸 N-甲基转移酶 2(Euchromatic histone lysine N-methylase 2,EHMT2),既能够催化组蛋白H3K9一甲基化和二甲基化,也可催化组蛋白H3K27的甲基化修饰[50]。G9a-GLP主要产生基因表达的抑制作用,通过与不同的DNA结合蛋白直接相互作用来招募靶基因启动子[51],调节H3K9的单甲基化和二甲基化。
组蛋白赖氨酸甲基化也与癌症密切相关。组蛋白甲基转移酶在肿瘤细胞中,通过甲基化组蛋白发挥重要作用。因此,对组蛋白甲基化转移的研究具有重要的理论和临床价值。在胃癌细胞中,小干扰RNA敲低Suv39h2,H3K9me3的富集程度显著降低,阻断了转录的抑制作用;敲低Setdb2,胃癌细胞中抑癌基因表达增强,胃癌细胞系的增殖、迁移和侵袭显著降低[52]。有研究结果表明在细胞水平上抑制Suv39h1基因可以促进外源转基因的表达[53],可能在各种人类疾病中起作用如致癌基因的急性激活和肿瘤的形成,使用suv39h1和HDAC抑制剂的联合治疗在白血病和癌症的治疗中具有潜在的价值[54]。Setdb1与内源性DNA甲基转移酶活性相关,与dnmt3a的共表达对于抑制基因的表达至关重要。已经证明mbd1与setdb1相互作用,从而以依赖于DNA甲基化的方式建立了复制偶联的H3-K9三甲基化模式[55]。也有一些研究报道了组蛋白修饰状态、甲基化以及去甲基化酶在信号通路途径中的作用,在非典型的Wnt通路中,setdb1发生磷酸化并产生抑制作用,从而导致H3K9甲基化进而抑制了PPARγ对其目的基因的激活,这都是由于Wnt5a激活 NLK(Nemo-likekinase)[56]。在肺癌结肠癌等一些癌症患者中发现,高表达setdb1后病人恢复较差,这可能是由于setdb1能够促进癌细胞的生长,然而癌细胞的侵袭能力、增殖能力、转移能力也会随着下调setdb1后显著降低[57]。G9a在癌细胞中主要以过表达的形式存在,下调G9a则可抑制癌细胞的生长,上调则加快乳腺癌细胞和肺癌细胞的转移[58]。
3 DNA甲基化与组蛋白甲基化协同作用
从真菌到人类的真核生物中,组蛋白甲基化和DNA甲基化都与基因沉默有关,尤其是组蛋白H3K4me的缺失和H3K9甲基化。H3K9甲基化的发生可能是DNA甲基化的前提[59]。有研究表明DNA甲基化可能在赖氨酸甲基化过程中起积极作用,甲基化的CpG连接蛋白(methyl-CpG binding domain,MBD)使组蛋白去乙酰化酶的复合物聚集,染色体上组蛋白被高度乙酰化,甲基化的组蛋白末端可募集 DNMTs,使基因转录受到抑制[60]。在研究甲基CpG结合蛋白的同时发现,除了与甲基化CpG二核苷酸特异性结合之外,这些蛋白还与多种不同的染色质修饰酶结合,包括组蛋白去乙酰化酶和组蛋白赖氨酸甲基转移酶,像DNA甲基化一样,H3K9me通常与转录抑制的基因调控元件和基因组的异染色质区有关[30]。Suv39h1/2是通过它们的酶定位H3K9me3在着丝粒周围异染色质上建立DNA甲基化所必需的,Dnmt3a/3b通过与HP1直接相互作用而被招募到H3K9甲基化的异染色质中,这二者的关系主要归因于MBD1蛋白和setdb1甲基转移酶,这种相互作用为确保复制偶联染色质组装期间H3K9甲基化的正确位置,被认为在DNA复制过程中在异染色质H3K9甲基化的正确维持中起着重要作用[61]。Dnmt3a/3b通过与HP1直接相互作用而被招募到H3K9甲基化的异染色质中,HP1通过其染色域与H3K9me3结合[62]。Dnmt3a也可能通过色域蛋白MPP8与常染色质相关的H3K9甲基转移酶G9a/GLP相互作用[63](图1)。
图1 DNA与H3K9甲基化之间的相互作用Fig.1 Interaction between DNA and H3K9 methylation
4 总结与展望
近年来,许多研究发现DNA甲基化和组蛋白修饰之间的密切联系,我们开始逐渐解开CpG甲基化是如何建立的这个长期以来的谜团。DNA甲基化与组蛋白甲基化尤其是H3K9甲基化相结合,促进了长期转录抑制。然而,对这些表观遗传修饰之间相互作用的理解还不全面,接下来主要的挑战是需要更深入了解表观遗传调控在特定情况下沉默特定基因组区域所需的共价组蛋白和DNA修饰的不同状态,DNA甲基化是否与其他组蛋白修饰之间的联系。