DNA胞嘧啶的甲基化与去甲基化进展
2021-12-06宋星睿凌晓婷赵楚斌赖玮毅汪海林
宋星睿, 凌晓婷, 赵楚斌, 赖玮毅, 汪海林
(1.中国科学院生态环境研究中心,北京 100085;2.国科大杭州高等研究院,浙江杭州 310024)
1 DNA甲基化
表观遗传修饰,主要是指研究非DNA序列变化的其他途径与机理所引起的可遗传性的基因表达改变[1,2]。DNA甲基化是一类较为重要的表观遗传修饰,除此外还有组蛋白修饰以及多种小RNA等其他方式[3 - 5]。DNA甲基化一般是由DNA序列中的胞嘧啶、腺嘌呤的C或N上的H被CH3所替代,而形成甲基化修饰[3 - 5],如5-甲基胞嘧啶(5-Methylcytosine,5mC)、N6-甲基腺嘌呤(N6-Methyladenine,6mA)、N4-甲基胞嘧啶(N4-Methylcytosine,4mC)。5mC是哺乳动物基因组DNA中含量最高的甲基化修饰,占总胞嘧啶的3%~5%[6]。DNA 5mC修饰主要发生在DNA序列上胞嘧啶接着鸟嘌呤出现的位点,称为CpG位点(CpG sites)。哺乳动物DNA C5-胞嘧啶甲基化转移酶有3种:DNMT1、DNMT3a和DNMT3b。在胚胎发育过程中,DNMT3a和DNMT3b将两条链均不含5mC的DNA甲基化,从头建立DNA的甲基化,被称为从头甲基化酶(denovoMethyltransferase);而DNMT1则倾向于甲基化双链DNA中半甲基化CpG位点,这一甲基化过程发生在DNA半保留复制中,将新链甲基化,维持了该DNA原本的甲基化状态,因此DNMT1被称为维持甲基化转移酶(Maintenance Methyltransferase)。此外,在啮齿动物中还存在一种从头甲基化酶DNMT3c,在精子生成过程介导雄性生殖细胞的逆转录转座子的启动子甲基化[7]。
组织内DNA甲基化的分布与丰度,可用于某些疾病的诊断与治疗,目前DNA甲基化分析已开始应用于临床诊断。例如,进食障碍(Eating Disorders,ED)与内稳态通路DNA异常甲基化有密切的联系,预期DNA甲基化的分析和表征有助于发展更有效的ED的治疗方法[8]。在癌症的诊断上,DNA甲基化也可作为肿瘤诊断及预后康复的标记物[9]。紧密连接蛋白1(Tight junction protein 1,ZO -1)甲基化检测试剂盒可以用于急性白血病的诊断[10];此外,DNA结合因子抑制剂4(Inhibitor of DNA binding 4,ID4)和ZO -1的异常甲基化可以作为淋巴瘤诊断的生物标记物;尿液中谷胱甘肽硫转移酶P1(Glutathione S-transferase P1,GSTP1)基因的甲基化产物可用于前列腺癌的诊断[11]等。
2 DNA 5-甲基胞嘧啶去甲基化
DNA去甲基化是将已甲基化碱基转化为不含甲基化修饰碱基的过程,是DNA甲基化的逆过程[12,13]。DNA甲基化和去甲基化在生物体内一般处于动态平衡,共同调控着基因的时空表达[14]。目前的研究认为,DNA 5mC去甲基化过程复杂度远大于DNA甲基化,大致可分为被动去甲基化(Passive DNA demethylation)与主动去甲基化(Active DNA demethylation)两种途径。被动去甲基化主要发生在DNA复制过程,复制产生的新链均为非甲基化DNA,如新链没有被维持甲基化转移酶甲基化,则5mC被逐步稀释,总体水平下降。DNA主动去甲基化则是CH3在各种酶的作用下被移除,目前动植物DNA主动去甲基化已有一定研究,但有关机制仍需进一步解释。
植物体内DNA去甲基化过程主要为主动去甲基化,由ROS1/DME酶介导的碱基切除修复(Base Excision Repair,BER)通路进行[15,16]。ROS1突变体的形成可能会使RD29A基因启动子区域的基因DNA甲基化水平显著升高,并最终导致表达沉默[17]。Gehring等[18]发现,当种子胚乳中DME突变体产生时,CG基因DNA甲基化水平同样显著升高,预示着DNE突变体具有与ROS1突变体一致的作用。
哺乳动物5mC氧化去甲基化路径的发现,对5mC去甲基化研究意义重大。2009年,Rao研究组发现,在哺乳动物脑组织和胚胎干细胞中,DNA 5mC可通过TET1酶催化氧化为5-羟甲基胞嘧啶(5hmC)[19],Purkinje细胞DNA中5hmC占0.59%,颗粒细胞DNA中5hmC占0.23%等[20 - 22]。一般哺乳动物5hmC含量可分为三类:神经元组织和胚胎干细胞中的高表达(0.3%~0.7%);肾脏、膀胱、心脏等的中度表达(0.15%~0.17%);肝脏和内分泌腺的低表达(0.03%~0.06%)。后续研究发现,TET蛋白可进一步将5hmC氧化为5甲酰基胞嘧啶(5-formylcytosine,5fC)、5-羧基胞嘧啶(5-carboxycytosine,5caC)两种重要修饰。这两种修饰可通过碱基修复机制除去,使5mC回复到无修饰胞嘧啶状态,实现5mC主动去甲基化[19,22]。并且TET蛋白催化5mC至5hmC的转化速率远快于5hmC至5fC和5fC至5caC的转化速率[23]。
一些小分子物质也可改变细胞内5hmC、5fC和5caC水平,如维生素C可作为辅助因子与Tet酶的直接作用,显著提高Tet蛋白介导的5mC氧化,经维生素C处理的小鼠胚胎干细胞基因组5hmC水平可由0.1% 提高至0.3%,5fC水平由7.7×10-6提高至8.1×10-6,5caC水平则提高了20倍[24]。此外,环境污染物醌类化合物可增强细胞内TET蛋白活性[25];而典型环境内分泌干扰物双酚A、双酚S均可调控TET基因转录和表达,影响细胞内5hmC水平[25]。
在碱基切除修复通路中,尿嘧啶DNA糖苷酶家族胸腺嘧啶糖苷酶(Thymine DNA Glycosylase,TDG)具有进行G/T错配修复的能力,在碱基切除修复路径,发现TDG具有新的功能,负责识别和切除5fC和5caC修饰。另外,TDG的特殊结构位点使其在AID或载脂蛋白B mRNA编辑酶催化多肽(APOBEC) 存在时通过脱氨反应,在Gadd45a的协助下识别去除5fC等去甲基化中间产物,最终达到将5mC∶G修复成未经修饰的C∶G的目的[26]。TDG调控的DNA去甲基化在胚胎发育过程中可能发挥了重要作用。有研究发现,哺乳动物胚胎干细胞与人类生殖细胞的甲基化水平都会经历高度甲基化-去甲基化-重新甲基化过程[27]。在对小鼠的TDG基因敲除实验中,缺失TDG的小鼠胚胎会在发育早期(约12a)即出现死亡,并且在死亡胚胎中观察到了多种发育障碍[28]。胚胎发育阶段,TDG保护与调控发育相关的基因启动子,使其不被甲基化而表达沉默,维持了胚胎细胞的正常发育[29]。
哺乳动物中DNA去甲基化不仅可以影响胚胎发育、分化等发育过程,还会对生物体正常生理代谢活动起到调控作用。例如,DNA去甲基化可能影响哺乳动物脂肪沉积。Melzner等人[30]通过对前脂肪细胞分化时Leptin基因启动子区甲基化程度进行分析,发现了脂肪细胞进行分化期间,该基因启动子区甲基化状态也呈显著下降状态,即从前脂肪细胞向分化末期的成熟脂肪细胞转化过程中,Leptin基因启动子区从高度甲基化向高度去甲基化转变。当人工干预年轻细胞体基因组DNA去甲基化后,细胞体在连续传代后更容易出现如DNA合成能力下降等衰老的特征,提示了DNA去甲基化对细胞衰老的影响[31]。后续相关研究表明,DNA去甲基化会引起人二倍体成纤维细胞端粒缩短,从而加速人体细胞衰老[32]。总体而言,DNA去甲基化会对哺乳动物细胞体生长发育、分化、生命代谢活动等多方面起到调控作用。
3 疾病中的甲基化与去甲基化
DNA胞嘧啶异常甲基化包括基因组整体低甲基化和基因特定区域高甲基化,在各种形式的癌症中都很常见,与肿瘤的发生和发展密切相关,而DNA去甲基化异常也会对机体正常代谢产生不利影响[33]。因此,DNA甲基化去甲基化与疾病的关系、甲基化去甲基化作为疾病标记物、干涉甲基化去甲基化过程治疗疾病的研究受到广泛关注。目前已有相关实验或流行病学调查发现的与DNA甲基化与去甲基化异常有直接关联的疾病有恶性肿瘤(癌症)、阿尔茨海默氏病、心血管疾病(如冠心病等)、肺纤维病变和进食障碍等。
3.1 基于DNA 5mC去甲基化中间产物的癌症诊断
肿瘤发生过程中,一些关键基因的胞嘧啶甲基化状态发生改变,因此机体DNA甲基化模式和水平变化的分析对肿瘤的早期诊断及预后评估是尤为重要的[34,35]。其中,DNA去甲基化的中间产物5hmC也与肿瘤细胞的发展密切相关。因此,5hmC水平的变化可以预示某些肿瘤的发生,并在临床中作为可靠的肿瘤诊断标记物[4]。例如,5hmC和5fC在肝癌组织中均显著下降,5fC水平可区分肝癌的发展阶段,肝癌基因组5hmC和5fC整体水平下降与肝癌患者预后不良有关;5hmC水平的降低对于诊断结肠癌也有重要的参考意义,可基于此进行前腺癌的诊断[36]。在circulating tumor DNA、循环瘤DNA(ctDNA)中,同样可基于5hmC水平变化进行临床癌症诊断及5hmC作为预后标记物。在不同的癌症和癌症不同分期阶段,ctDNA中5hmC水平会呈现显著差别[37]。因此,可根据不同患者特定组织细胞体DNA甲基化水平的特点,对其患癌的可能性及类型进行合理预判和分析,甚至存在用血液样本分析癌症的可能性[38]。
TDG介导的DNA 5mC去甲基化同样与恶性肿瘤的发生发展具有密切联系。例如在胰腺癌[39]、食道癌[40]和直肠癌[10]等恶性肿瘤疾病中均可发现TDG的异常性表达。未来研究肿瘤发展与TDG介导的DNA去甲基化的相关性,可能有助于我们理解肿瘤发生发展的内在机理。
3.2 阿尔茨海默氏病
阿尔茨海默氏病(Alzheimer’s Disease,AD)是一种以认知、记忆和语言功能等渐进性减弱,或产生障碍为主要症状的神经退化性疾病,该疾病由遗传因素与非遗传因素所共同作用,其中约70%发病风险为遗传性因素[41]。对小鼠的AD模型研究发现,小鼠模型的大脑皮质基因组5mC含量在不同阶段分别产生了不同波动,提示DNA甲基化与去甲基化在AD形成过程中可能起到了直接作用[42]。针对AD患者死后大脑中APOE基因DNA甲基化分析研究表明,AD患者脑中的非神经元细胞主要由神经胶质组成,AD患者脑中APOE基因DNA甲基化程度显著降低[43],说明APOE的异常去甲基化可能是影响AD风险的主要因素。在正常健康和AD患者脑组织中,HSPA8和HSPA9的启动子DNA甲基化水平差异明显,表明相关基因及其甲基化修饰是AD发病机制的一部分[44]。另外,DNA去甲基化过程的中间产物如5hmC及miRNA诱导的沉默复合体等标志物,对维持动物体神经细胞正常运行具有重要作用。理解对DNA去甲基化有关的表观遗传因素与非遗传因素的相互作用,有助于对AD发病机制的理解,并有望用于研究新型诊断性生物标志物或药物并投入使用。
3.3 心血管疾病
心血管疾病(Cardiovascular Diseases,CVD)是全球负担最重的慢性疾病之一。根据2016年全球疾病负担显示,CVD所造成的居民死亡人数已超越癌症,成为了全球居民死亡首位因素[45]。
冠心病是由多基因遗传和环境诱发等因素共同作用产生的疾病,目前心血管领域研究的热点在于对表观遗传修饰的研究,即环境与基因之间的相关作用可以通过表观遗传学中某些机理进行解释,冠心病类疾病的产生与恶化与相关DNA的异常甲基化关系密切[46,47]。研究发现,相关基因中5hmC水平程度与低氧环境下血管生成密切相关,5hmC作为DNA去甲基化中间产物,根据其水平可活化凋亡基因和被抑制基因,基因中5hmC水平的下降则会导致相关基因缺乏保护,从而导致心脑血管疾病的发生[48]。相信随着检测技术的改进与相关研究的深入,5hmC有可能成为人类心血管疾病早期诊断与预后诊断的新的表观遗传标志。
PM2.5是大气中重要的环境污染物,是造成心血管疾病的可控的环境危险因素。PM2.5进入人体后可通过影响机体DNA甲基化水平途径影响CVD的发生[49]。在CVD病变出现前就有DNA甲基化的改变,因此DNA甲基化可为CVD临床早期诊断提供依据[50]。PM2.5暴露量与特定基因位点甲基化与去甲基化的作用,主要影响参与人体系统炎症因子反应、血管延舒收缩和凝血系统启动活性等,这些功能的受损均与CVD的发病机理相关[49]。
3.4 尘肺病等肺纤维病变
尘肺病是以肺部纤维化病变为主要特征的疾病,主要发生于易长期吸入微粒粉尘的职业从业者中。在疾病发生过程中,细胞因子基因活性可通过DNA甲基化过程而被调节或改变,从而影响相关因子的转录成功率[51,52]。有研究对矽肺病病例血液样本进行调查,发现其血液中O6-甲基鸟嘌呤DNA甲基转移酶基因、死亡相关蛋白激酶基因等均产生甲基化失衡,表现出高甲基化状态[51]。有学者通过对尘肺病患者相关基因表达及其甲基化状态进行研究,研究发现基因启动子可通过高甲基化进行基因沉默,使其丧失转录活性,同样可通过去甲基化促进基因的表达,而相关从业者长期大量的稀土粉尘的吸入,会使其IFN-γ基因启动子甲基化率高于正常人群,而IL-10基因启动子去甲基化率高于正常人群。该研究表明,稀土粉尘的长期高摄入量对从业者肺部相关基因表达造成了明显影响,DNA甲基化与去甲基化平衡被打破,造成相关基因启动子失衡[53]。
3.5 进食障碍
进食障碍(Eating Disorders,ED),作为人类精神疾病中死亡率最高的疾病之一,该疾病的产生现已被证明与表观遗传修饰具有深刻的联系[8,54]。ED的产生目前已被发现与内稳态通路DNA异常甲基化有密切的联系。神经性厌食症(Anorexia Nervosa,AN)患者呈现整体水平DNA低甲基化。有研究对AN患者进行高通量DNA甲基化分析发现,无论是临床急性发作的AN患者还是体质量正常的AN患者,其机体甲基化程度均异于正常人群对照组[55]。通过研究ED的整体甲基化模式,建立小鼠进食成瘾行为模型,发现成瘾样小鼠前额皮质相同脑区蛋白表达上调,其基因启动子DNA甲基化显著降低[56]。
4 总结与展望
在植物体和动物体的生命活动过程中,作为DNA胞嘧啶甲基化沉默基因表达的逆过程,DNA去甲基化扮演着重要角色。目前对动植物DNA主动去甲基化已有一定的理论支持,在植物机体内,以ROS1/DME酶介导的碱基切除修复去甲基化过程已被证实,但哺乳动物中是否存在直接5mC去甲基化酶还尚未定论。
DNA 5mC甲基化异常及去甲基化异常均会对机体正常生命活动产生不利影响,与DNA甲基化相比,DNA去甲基化似乎是一个更为敏感的标志物,对DNA去甲基化功能的理解对于解释在癌症等疾病中观察到的甲基化含量变化是必要的。通过对恶性肿瘤、阿尔兹海默症、心血管疾病、肺纤维病变、进食障碍等进行的研究,均表明了DNA去甲基化在疾病临床诊断和预后康复的巨大潜力。因此,研究DNA去甲基化及其对于生物体机理的改变,对于临床医学具有深远的意义。
真核生物6mA修饰是近年研究的热点。自2015年,发现果蝇、线虫和绿藻基因组DNA中存在6mA修饰后[57,58],引起了广泛关注。但6mA是否存在于哺乳动物基因组中一直存在争议[59]。目前已发现哺乳动物细胞内6mA可来源于聚合酶依赖的掺入[60],而是否存在甲基化转移酶介导的N6-腺嘌呤甲基化,以及6mA修饰在细胞中可能具有什么功能依然有待探索。