“第六碱基”
——5-羟甲基胞嘧啶研究进展
2019-01-05樊丹平戴自城
夏 娅 ,樊丹平 ,戴自城 ,肖 诚 *
(1.北京中医药大学,北京 100029;2.中日友好医院临床研究所,北京 100029;3.中国医学科学院 北京协和医学院研究生院,北京 100730;4.香港理工大学应用生物及化学工程系,中国香港)
表观遗传学是目前生物领域最热门的研究之一,其中DNA甲基化是表观遗传学修饰的一种重要方式[1],指在DNA分子中加入甲基的过程。大量研究表明,DNA甲基化可引起DNA构象、染色质结构、DNA稳定性以及DNA与蛋白质相互作用方式的改变,从而调控基因表达[2]。遗传信息载体DNA由腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶4种碱基组成,胞嘧啶 (cytosine,C)可在DNA甲基化转移酶(DNA methyltransferases,DNMTs)的作用下发生甲基化,生成 5-甲基胞嘧啶(5-methylcytosine,5mC)。 5mC是一种表观遗传修饰机制,意指在核苷酸序列不发生改变的情况下,基因表达的可遗传的变化,被称为“第五碱基”。
5-羟甲基胞嘧啶 (5-hydroxymethylcytosine,5hmC)是由甲基胞嘧啶双加氧酶 (ten-eleven translocation proteins,TETs)介导的,5mC的羟甲基化形式,是DNA去甲基化的中间产物,被称为“第六碱基”,同样发挥着表观遗传修饰的重要作用[3]。5hmC在不同组织中表达各异,其在脊髓和中枢神经中含量最高,在肾脏、心脏、肺部、骨骼肌、膀胱和鼻上皮细胞的含量居中,而脾脏、肝脏和内分泌腺中的含量最低。随着对TETs功能的认识逐渐加深,5hmC的表观遗传作用日益受到科学界重视。
1 5hmC的生成与去甲基化
1953年,Wyatt GR和Cohen SS在T2噬菌体DNA中发现5hmC[4]。半个多世纪后,Kriaucionis S和Heintz N在小鼠神经元和脑组织DNA内也发现了5hmC[5]。5hmC在哺乳动物内的相关科学研究随之展开。
5hmC曾被认为是DNA受损的产物[6],但之后的研究推翻了这种观点。尔后去甲基化酶TETs的发现,为理解5hmC的生成提供了新的视点。TETs属于α-酮戊二酸加氧酶家族,依赖Fe2+作为辅助因子,将底物的双电子氧化作用与α-KG的氧化脱羧作用相结合[7]。TETs包含TET1、TET2、TET3 3种具有组织表达特异性的亚型,能在不同的组织或细胞中将5mC逐渐氧化转变为5hmC。其中TET1存在于单细胞胚胎到囊胚期,主要位于细胞核内,且N端含有一个保守CXXC锌指结构域可与染色体相互作用[8]。有研究报道,小鼠原始生殖细胞中的DNA在TET1和TET2高水平的驱动下,通过将5mC转化成5hmC来实现全面去甲基化[9]。TET3在小鼠雄性原核阶段特异性表达,其介导的DNA羟甲基化作用参与自然受精后合子父本DNA的表观遗传重编[10]。正常情况下,基因组中大部分的5hmC来源于之前存在的5mC,并在TETs的作用下保持DNA甲基化状态的动态平衡。
DNA甲基化通过招募基因表达蛋白,或抑制转录因子与DNA的结合来调控基因表达,使细胞分化为稳定而独特的甲基化模式[11]。在某些情况下,DNA甲基化水平可以通过涉及活性DNA去甲基化的机制迅速改变。5hmC生成是去甲基化的关键环节,它既可以通过DNA复制被被动消耗,也可以通过迭代氧化和胸腺嘧啶DNA糖基化酶介导的基底切除修复被主动还原为胞嘧啶[12],还可以作为活跃的氧化去甲基化的中间产物。目前关于5hmC在DNA去甲基化过程中的作用机制主要有两种可能方式:第一种是5hmC在TETs介导下参与了主动去甲基化过程;第二种是细胞生长过程中5hmC的存在影响了DNMT1介导的DNA甲基化过程,被动参与DNA的去甲基化[13]。
2 不同技术检测5hmC在哺乳动物体内不同组织的分布及基因分布特点
2.1 组织分布特点
Szwagierczak[14]采用放射标记法对小鼠不同成体组织和分化胚胎干细胞中的5hmC水平进行了检测,研究结果表明:基因组5hmC的最高水平出现在大脑区域,其中皮质、海马、小脑区约占0.9%~1.3%;肾脏内水平也较高,达到了0.8%;肺组织和肝组织为0.3%~0.4%。此外,Globisch等[15]采用HPLC-MS分析和免疫组化方法,发现实验小鼠所有组织和细胞中均存在5hmC,且浓度最高的是在中枢神经系统的神经元细胞中,为0.3%~0.7%;脊髓DNA中的5hmC为0.47%;肾脏、鼻腔上皮、膀胱、心脏、骨骼肌和肺部的DNA中5hmC为0.15%~0.17%;肝脏、脾脏和内分泌腺 (睾丸和垂体)的DNA中5hmC含量最低,为0.03%~0.06%。在人体内Li等[16]通过免疫测定发现不同组织中5hmC的含量存在显著差异:其中大脑 (0.67%)、肾组织(0.38%)、结肠组织(0.45%)、直肠组织(0.57%)和肝组织(0.46%)中5hmC含量丰富;肺中含量较低,约0.14%;心脏、乳腺、胎盘中5hmC含量极低,均在0.05%左右;且癌组织内含量较正常组织显著降低。虽然不同时期各组实验检测出来的数据都有一定的差异,但是不同组织内5hmC丰度大致可分为 3 类:(1)高丰度组:脑组织、脊髓;(2)中丰度组:肾、直肠、结肠、骨骼肌;(3)低丰度组:心脏、脾、内分泌腺、胎盘。而肝和肺的5hmC含量在不同检测中差异较大,需进一步精确测定。
2.2 基因分布特点
越来越多的证据表明,5hmC在胚胎干细胞等细胞类型中大量存在,通过5hmC基因组图谱检测将有利于进一步了解5hmC的功能。Stroud等[17]通过hmeDIP-seq生成了人类胚胎干细胞中5hmC的全基因组图谱,测序后发现有3028个增强子与5hmC峰重叠,多效性因子NANOG和OCT4结合位点以及绝缘体结合蛋白CTCF位点均富集了5hmC,这说明5hmC在增强子及转录因子结合位点上高度富集。Jin等[18]通过应用免疫沉淀技术检测人脑额叶组织DNA中5hmC的发生情况,结果发现5hmC富集在启动子和基因体区域,尤其是非编码区。对于CpG含量中等或较高的启动子,转录起始位点的5hmC峰值与基因表达水平无关。与5mC相比,5hmC对基因的靶向性更强,且5hmC在基因体中的存在与基因表达水平呈正相关。因此,我们有理由认为,5hmC可能与多种调控因子和调控过程有关。
3 5hmC的生理功能
噬菌体DNA的5hmC修饰可以避免其在感染大肠杆菌宿主的过程中受到限制和降解[19]。哺乳动物大脑中5hmC表达丰富,说明它在调控脑组织的发育方面发挥着特殊作用。对胚胎小鼠大脑神经元研究后发现,5hmC在神经元分化过程中增加,且常伴随着H3K27me3的损失,而这一状态会促进大脑发育[20]。与该结果一致,缺乏TET1的小鼠表现出海马神经受损,并伴有学习和记忆障碍[21]。另有研究发现,TETs蛋白是早期胚胎分化的关键调节因子。诱导胚胎干细胞分化的刺激会引起TET1、TET2表达丢失,以及基因组5hmC的丢失。相反,成纤维细胞转化为诱导多能干细胞与TET 1、TET 2和5 hmC的增加有关[22]。
虽然5hmC在哺乳动物和人体内的作用和作用机制尚未完全清楚,但其对基因表达的调控,神经元的促进是肯定的。一旦这种生理状态被破坏,就会导致疾病的产生。
4 5hmC相关疾病的研究
4.1 5hmC与肿瘤
甲基化状态的改变被认为与失活抑癌基因和激活原癌基因有关,从而导致肿瘤的发生。5hmC作为DNA去甲基化的中间体,在机体中的含量和分布甚至已经开始被作为多种肿瘤疾病早期诊断和预后的新标志之一[23]。研究发现降低TET1的水平和活性,从而导致5hmC水平降低,与造血系统恶性肿瘤、结肠癌、乳腺癌、前列腺癌、肝癌和肺癌相关,并且乳腺癌的侵袭率增加是TET1下调的直接后果。在各种骨髓恶性肿瘤也发现了TET2突变及5hmC水平降低[24]。在肺癌中,随着肺癌发病进程的推进,5hmC呈阶段性逐渐减少;肝癌和胰腺癌组织细胞内羟甲基化状态也会发生特异性改变[25];结直肠和胃肿瘤样本中5hmC丰度较正常组织平均降低85%和64%[26];在T细胞淋巴瘤(T-cell lymphoma,TCL)中,可检测到 5hmC 水平降低,且这种改变与参与调控胞嘧啶甲基化的基因突变无关[27];黑色素瘤患者5hmC的表达也有相似的结果,同时发现晚期黑色素瘤患者5hmC表达较早期少,且已发生转移的黑色素瘤患者的5hmC较未发生转移的患者表达少[28];其他如鳞状细胞癌、甲状旁腺腺瘤等肿瘤中均可检测到5hmC表达降低。这些研究结果也进一步说明5hmC与肿瘤疾病密切相关。
4.2 5hmC与神经系统疾病
之前的研究曾指出,肿瘤的发生会大量消耗5hmC,然而胶质瘤是一个例外。胶质瘤是一种恶性脑部肿瘤,与其他肿瘤相比,胶质瘤中5hmC水平相对较高。因为胶质母细胞发育需要TET1介导的5hmC的产生,而5hmC招募与亚甲基化相关的PRMT1(CHTOP)染色质靶蛋白,该蛋白使组蛋白H4上的精氨酸甲基化,从而激活癌症相关基因的转录[29]。另外有研究通过气相色谱/质谱联用技术检测正常和痴呆患者的脑组织DNA,并对5hmC进行定量分析,结果发现阿尔茨海默病患者脑组织DNA中5hmC水平发生了显著变化,且不同分期表现不同[30]。有研究还发现5hmC介导的DNA去甲基化途径可能参与雷特综合征的发病机制[31]。说明5hmC可能与年龄相关性神经退行性疾病有关。
4.3 5hmC与自身免疫性疾病
对系统性红斑狼疮 (systemic lupus erythematosus,SLE)患者CD4+T细胞进行基因组羟甲基化分析发现[32]:SLE患者CD4+T细胞基因组DNA中5hmC水平升高,且在细胞启动子区检测到2748个5hmC表达上调的基因。而这些基因多在神经营养素信号、WNT信号、MAPK信号、钙信号和mTOR信号通路等关键通路中富集。同时,还可发现TET2、TET3表达上调。
5hmC 和类风湿关节炎(rheumatoid arthritis,RA)也表现出潜在的关系。最近一项研究表明,TET2可通过维持基因组5hmC水平调节破骨细胞分化。TET2敲除的小鼠体内有破骨细胞功能受损的表现,如骨硬化,骨量增加;且在不同基因组位点5hmC表达水平不同[33]。RANKL/OPG是破骨细胞发育的重要调控因子,有研究表明,CpG岛甲基化的改变会导致RANKL/OPG基因发生差异性表达[34]。而破骨细胞的分化水平与RA密切相关,可以猜测,5hmC可能参与RA的病理变化过程。
5 结语
DNA甲基化对于人类细胞分化、发育过程的重要性得到了普遍认同,在神经系统疾病、肿瘤及系统性红斑狼疮等多种疾病的发病机制中也开展了较为深刻的研究。很长一段时间以来,5mC被视为DNA共价修饰的唯一方式,但是5hmC及TETs的发现推翻了这种观点。作为后起之秀的5hmC,其相关研究也在逐渐深入,科学技术的发展将5hmC表观遗传作用提升到一个更加精确的维度,且现有研究已显示5hmC在多种疾病组织内的表达发生了特异性改变。目前文献中关于5hmC与RA、银屑病、糖尿病的报道尚无,但这些疾病均与DNA甲基化具有相关性,因此5hmC在疾病中的变化还需要进一步深入研究,同时也希望5hmC的研究能为疾病的诊疗带来新的突破。