APP下载

DNA羟甲基化在环境流行病学中的研究进展

2021-04-17付铭白岩森郭欢

环境与职业医学 2021年6期
关键词:甲基化基因组位点

付铭,白岩森,郭欢

华中科技大学同济医学院公共卫生学院劳动卫生与环境卫生学系,湖北 武汉 430030

环境污染对人类健康产生了极为深刻的影响,据世界卫生组织统计,仅2012年全球约有1 260 万人的死亡归因于空气、水和土壤污染以及气候异常变化等环境因素,占全球死亡总数的23%[1]。研究表明,环境暴露可通过表观遗传机制影响人体健康[2],其中DNA 甲基化的主要形式5-甲基胞嘧啶(5-methylcytosine,5mC)作为表观遗传修饰的重要指标,能够响应多种环境因素的改变,在预测环境污染所致的疾病进程中具有现实意义[3]。5mC 的氧化产物5-羟甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)不仅是DNA 主动去甲基化的中间产物,也是一种稳定的表观遗传标记[4]。正常的5hmC 水平对维持细胞稳态和个体生长发育十分关键,现已在恶性肿瘤、神经系统疾病、心血管系统疾病等多种重大慢性疾病中发现了基因组5hmC 水平的异常变化。研究提示环境因素可能通过影响基因组5hmC 的模式参与调控疾病的发生发展,并且5hmC 在指示某些外界环境因素暴露导致的健康效应变化方面可能比5mC 更加敏感[5]。因此,本文以5hmC 为中心,整合目前环境因素引起5hmC 改变的证据,总结5hmC 与部分重大慢性病关联的研究现状,提出尚存在的科学问题,展望研究方向,以期为环境分子流行病学研究提供新思路。

1 5hmC背景简述

1.1 5hmC的生成与DNA主动去甲基化

5hmC 是5mC 在TET(ten-eleven translocation)蛋白的氧化作用下生成的[6]。TET 蛋白是一类α-酮戊二酸(α-ketoglutarate,α-KG)和Fe2+依赖的双加氧酶,有TET1、TET2 和TET3 三个成员[7]。TET 将5mC 氧化为5hmC 后,还可进一步作用于5hmC 将其连续氧化成5-醛基胞嘧啶(5-formylcytosine,5fC)和5-羧基胞嘧啶(5-carboxylcytosine,5caC)[8]。后二者可被胸腺嘧啶DNA 糖苷酶识别并切除,形成无碱基位点,然后启动碱基切除修复将该位点修复成未修饰的胞嘧啶[9],从而实现DNA主动去甲基化过程。

由于TET 蛋白存在底物偏好性[10],5hmC 不易被进一步氧化,因此相比5fC 和5caC,5hmC 是最丰富、最稳定的氧化产物,具有重大的研究意义。近年来的研究认为,5hmC 除了作为DNA 主动去甲基化的中间产物,通过介导DNA 去甲基化减轻5mC 的沉默效应,还可以调控基因的表达[11]。已有研究报道了一些能够识别并结合5hmC 的蛋白,如MeCP2、RPL26、MHS6、UHRF、Wdr76、Thy28、Neil1 等[12-14],但具体的生物学作用过程尚不清晰,仍然需要更多深入的功能性研究。

1.2 5hmC在组织和基因组中的分布

5hmC 广泛分布于哺乳动物的组织和细胞中,与5mC 不同,各组织间5hmC 的含量具有明显的差异。Globisch 等[15]通过对成年小鼠的研究发现,5hmC 在大脑皮层的含量最高,约占脱氧鸟嘌呤的0.7%;在脾脏中的含量最低,约0.03%;而各组织间5mC 含量差别不大,为(4.22±0.22)%。值得注意的是,5hmC 的丰度远低于5mC,人类基因组中约80%的CpG 发生了甲基化修饰,而成人5hmC 含量最丰富的大脑组织中也仅有约13%的CpG 发生了羟甲基化[16],这对精确检测5hmC提出了挑战。在基因组的分布上,Cui等[17]通过绘制人体19 种组织的5hmC 修饰图谱,发现不同组织中5hmC 在基因组分布上的一致性:在启动子、外显子和增强子上富集,在基因间区和在转录起始位点处相对缺失。

1.3 5hmC的检测技术

研究人员基于色谱、质谱、高通量测序等技术开发了多种对5hmC 定量或定位的检测方法,根据不同的研究目的,可以从基因组的三个水平上检测5hmC。

(1)基因组总体5hmC 水平:常用的方法有薄层色谱[6-7]、液相色谱-质谱联用[15,18]、酶联免疫吸附试验(enzyme linked immunosorbent assay,ELISA)[19]、免疫组化[18]等。这类方法成本较低、易于开展,然而只能提供基因组5hmC 的总体平均水平,无法开展后续基因通路、分子机制的研究。

(2)基因组特定区域5hmC 水平:主要是先通过各种富集方法,如抗体、葡糖基修饰、限制性内切酶[20]等,将含有5hmC 的DNA 片段富集后,再联合高通量测序或芯片技术测定基因组特定区域的5hmC 分布,如羟甲基化DNA 免疫共沉淀测序(hydroxymethylated DNA immunoprecipitation coupled with deep sequencing,hMeDIP-Seq)[18]等。这类方法可以识别一些差异羟甲基化区域(differentially 5-hydroxymethyated regions,DhMRs),但对5hmC 密度低的区域检测灵敏度较低,并不能准确测定5hmC的总量,无法达到单碱基分辨率的水平。

(3)基因组单碱基5hmC 水平:甲基化的常用检测技术如重亚硫酸盐测序(bisulfite sequencing,BSSeq)等,并不能区分5mC和5hmC,因此研究人员开发出基于BS-Seq的TET辅助重亚硫酸盐测序(TET-assisted bisulfite sequencing,TAB-Seq)、氧化重亚硫酸盐测序(oxidative bisulfite sequencing,OxBS-Seq)等方法[20],先采用不同的化学修饰手段在测序前将5hmC 与5mC区别开,然后通过比对同一样品在化学修饰前后BS-Seq 测定的序列,从而定位5hmC。但由于重亚硫酸盐对DNA样本具有较强的破坏性,在样本量少时应用有局限性,因而研究人员又开发了借助单分子实时测序[21]和纳米孔测序[22]检测5hmC 的第三代测序技术,以及载脂蛋白B mRNA 编辑酶催化多肽耦联表观遗传测序[23]、TET 辅助吡啶硼烷测序[24]等不依赖重亚硫酸盐转化的新技术。这类方法可以检测全基因组单个CpG 位点的羟甲基化状态,能够提供更多的生物学信息,但目前由于价格昂贵,在大样本人群研究中比较受限。

2 环境因素暴露对5hmC水平影响的研究现状

DNA主动去甲基化增强了细胞和组织的可塑性,并且为环境分子流行病学研究提供了一个新的潜在的效应生物标志物—5hmC。5hmC 是TET 的主要氧化产物,故TET 蛋白表达增加或者活性增强能够升高5hmC 的水平。由于TET 的酶促反应需以α-KG 和O2为底物,以Fe2+和维生素C 作为辅因子,所以各底物和辅因子的浓度能够直接影响5mC 的氧化效率[25-28],进而影响5hmC 的水平。研究发现,环境因素可以通过体内的代谢过程影响上述TET 的底物和辅因子的水平从而与5hmC 关联,也可以通过对TET基因本身或转录后RNA、翻译后蛋白质的调控来影响基因组5hmC水平[29]。

2.1 金属和类金属

金属和类金属在工业生产和日常生活中应用广泛,人体长时间低剂量接触可使其在某些器官或组织中蓄积,引起慢性毒性作用。目前已有研究报道了砷、铅、汞、镉、铬、镍、锑等金属或类金属与5hmC 水平的关联[30-38],5hmC 有望成为某些金属或类金属暴露的效应生物标志物。

砷是确认的人类致癌物,职业暴露可引起肺癌、皮肤癌、膀胱癌等[31]。目前已有多篇研究报道了砷对5hmC水平的影响。Zhang等[32]通过给予雄性大鼠8周较低水平(0.5、2或10 ppm)的饮用水亚砷酸钠暴露,观察到5hmC 的整体水平在心、肺、脾中升高,在胰腺中下降,而大多数器官的5mC 整体水平并没有出现明显的改变;作者认为这可能是由于S-腺苷蛋氨酸在低水平砷暴露时仍保持稳态,可以同时为砷甲基化和DNA 甲基化提供甲基供体,该研究提示5hmC 也许能比5mC 更加敏感地指示砷暴露。Niedzwiecki 等[31]基于孟加拉国的两个队列人群(分别为196 人和375 人)检测外周血白细胞或单核细胞DNA 的5hmC 水平,发现饮用水中的砷以及人体尿砷、血砷浓度与5hmC 水平的关联具有性别差异,在男性中呈正相关,在女性中呈负相关。Du 等[33]对刚断乳的雄性大鼠用三氧化二砷饮水染毒6 个月,发现砷暴露可以降低大脑皮层和海马组织中5mC 和5hmC 的水平,损害大鼠的认知能力,并且这种神经毒性与氧化应激和α-KG 的水平有关。

由于多种重金属或其化合物能够通过胎盘进入胎儿体内,因此孕期铅、汞、镉、砷等重金属的暴露对子代表观基因组的影响是目前的研究热点之一[34]。Cardenas 等[35]基于美国的出生队列首次评估孕期汞暴露和子代基因组5hmC 水平的关系,发现306 位孕妇孕中期时红细胞汞浓度与新生儿脐带血中5hmC 水平呈负相关,并且这种关联可持续到出生后5年。Sen等[36]运用改良的羟甲基化DNA 免疫共沉淀结合450K芯片的方法检测基因组5hmC,研究产前铅暴露影响新生儿脐带血基因组5hmC 的模式,发现与铅相关的DhMRs 可以进一步分为与性别有关和无关的两种类型。

在金属影响5hmC的机制研究方面,Yin等[37]利用尺寸排阻色谱-电感耦合等离子体质谱分析发现,Ni2+可与小鼠TET1蛋白的催化中心域结合,并且其亲和力是辅因子Fe2+的7.5倍,因此能有效地替换掉Fe2+,抑制TET1的催化活性,降低5hmC的形成。此外,他们还发现Pb2+和Cd2+也有类似的作用,但其亲和力比Ni2+弱。Liu等[38]发现亚砷酸盐在体外可以直接结合到TET蛋白的锌指结构上,抑制TET介导的5hmC生成。

2.2 醌类化合物

醌类化合物是一类广泛存在于环境中的氧化还原活性物质,能够刺激活性氧的产生,具有一定的细胞毒性、免疫毒性和致癌性,同时也因其对癌细胞具有极强的杀伤力而被用作抗癌药物[28]。Zhao等[28]研究发现杀虫剂五氯苯酚的活性代谢物四氯苯醌和四氯氢醌可以提高细胞内可利用Fe2+的水平,从而刺激TET蛋白的催化活性,促进多种人源细胞株5hmC的形成。Coulter等[39]也发现了苯的代谢产物氢醌可通过提高TET1的活性,升高HEK293T细胞中的5hmC水平。

2.3 双酚类内分泌干扰物

双酚A 和双酚S 广泛应用于食品包装、饮料容器、医疗器械等塑料制品的生产,是常见的环境雌激素,研究发现其具有一定的生殖毒性、神经毒性、免疫毒性、胚胎发育毒性和潜在的致癌性等[40]。Zheng 等[41]对30 位双酚A 职业暴露的男性和25 例对照进行了精子样本的全基因组5hmC 的检测,发现职业暴露者的5hmC 整体水平升高。Li 等[42]通过对人乳腺癌细胞系的研究揭示双酚A/S 可与雌激素受体α(estrogen receptor α,ERα)结合使其形成二聚体和发生磷酸化,激活的ERα 可促进DNA 甲基转移酶(DNA methyltransferase,DNMT)1 和DNMT3B 甲基化TET2基因的启动子,从而抑制TET2的转录和表达,降低基因组5hmC 水平,最终促进乳腺癌细胞的增殖,并具有明显的时间效应关系和剂量效应关系。

2.4 大气颗粒物

大气颗粒物是化学组成较为复杂的环境污染物,可引发呼吸系统、循环系统等多种器官系统的疾病,增加死亡风险。Sanchez-Guerra等[43]在北京招募60名卡车司机和60 名办公室工作人员作为研究对象,每人佩戴采样器以评估个体PM2.5的暴露水平,并根据环境监测点的PM10数据综合评估个人1、4、7和14 d 的PM10平均暴露水平,采用ELISA 检测外周血DNA 5mC和5hmC 水平,观察到PM10与5hmC 呈稳定的正相关关系,但与5mC 关联无统计学意义,认为这可能与暴露水平、检测方法的精确程度以及5hmC、5mC 本身具有不同的生物学功能有关。比利时鲁汶大学的学者De Nys 等[44]以26 名学生的口腔颊黏膜细胞作为研究对象,发现一周内PM2.5和PM10的平均暴露水平与细胞5hmC整体水平呈负相关。

2.5 生活方式

目前已有一些研究关注了吸烟、饮酒、锻炼、饮食习惯等多种生活方式与TET 蛋白及5hmC 水平的关联[45-48]。Ringh 等[45]通过对20 名吸烟和29 名不吸烟健康志愿者的支气管肺泡灌洗液细胞进行羟甲基化的芯片检测,发现吸烟者的差异羟甲基化位点几乎均呈高羟甲基化的状态。Gatta 等[46]基于一项25 对慢性酗酒者和非酗酒者的病例对照研究,发现酗酒者的小脑组织中TET1mRNA 表达水平高于对照组,但5hmC平均水平升高无统计学意义。Jessop 等[47]发现老年小鼠的自主锻炼情况与海马体中TET1/2mRNA 的表达水平及miR-137基因启动子区的5hmC 水平呈正向关联。Spallota 等[48]通过对人群、小鼠和细胞的研究发现,高脂高糖饮食暴露可能会造成心脏间充质干细胞5mC 及其氧化产物5hmC、5fC 累积。Wu 等[18]研究发现较高的葡萄糖浓度能抑制人外周血单核细胞的5hmC水平,而5mC总体水平变化无统计学意义。

综上所述,多种环境因素的暴露均可引起基因组5hmC水平的改变,并常具有以下共同点:(1)在相同的环境刺激下,基因组5hmC 的整体水平出现了明显变化时,5mC 的整体水平尚未发生明显改变。这提示5hmC 可能是一个比5mC 更加敏感的效应标志物,但具体的生物学机制尚不明确;(2)环境因素暴露引起的5hmC 变化具有组织器官、细胞类型的差异,因此,在不同的研究过程中要注意所选生物样本对目标疾病的代表性;(3)环境因素暴露引起的5hmC 变化存在性别差异。然而,目前的大多数研究仅建立了环境因素与5hmC 总体水平的关联,未采用单碱基分辨率的方法,所以无法选出对环境敏感的特异性靶基因或者CpG 位点,限制了进一步的分子机制的解析。环境因素通过5hmC 影响特定基因表达的机制将是未来环境与健康研究领域的热点之一。

3 5hmC与疾病的研究现状

5hmC 的异常改变可能是引起多种疾病发生的生物学基础[49],已有研究报道了5hmC 与多种重大慢性病(包括恶性肿瘤、神经系统疾病、心血管疾病等)的关联。

3.1 5hmC与恶性肿瘤

5hmC整体水平的降低是恶性肿瘤的表现特征之一。研究人员在肺癌、乳腺癌、肝癌、结直肠癌、胃癌、胰腺癌、前列腺癌、皮肤癌、神经胶质瘤和造血系统肿瘤等多种肿瘤样本中均发现了5hmC总体水平的下降[50-51]。研究发现,肺鳞癌组织中的5hmC 水平可低至正常肺组织的1/5,而脑肿瘤中可降低至1/30[51]。可能的原因有:(1)TET及相关基因如IDH、WT1的突变是多种肿瘤发生的共同早期事件[25,52],由此造成的TET 的表达减少或功能异常可能造成5hmC 生成减少;(2)TET 蛋白对α-KG、O2和Fe2+的依赖性使其催化活性受细胞代谢状态的调控[25-28],而肿瘤细胞异常的能量代谢和氧化状态可能抑制TET 的功能,导致5hmC 表达水平降低;(3)肿瘤细胞增殖较快,在不断的DNA复制过程中,由于DNMT1具有底物偏好性[53],难以维持胞嘧啶的羟甲基化,因此逐渐稀释了基因组中5hmC的密度。

研究发现,TET 蛋白与5hmC 参与肿瘤的发生发展过程。Li 等[42]、Park 等[54]、Lian 等[55]多位研究者通过在人乳腺癌、胃癌、或黑色素瘤细胞系中敲减或敲除TET 蛋白,观察到5hmC 水平降低和细胞增殖能力提高的现象,且发现过表达TET 蛋白可重建5hmC的水平并抑制肿瘤的生长。在5hmC 对肿瘤发生发展中的作用机制方面,Kafer 等[56]研究发现5hmC 富集在癌细胞系中的内源性DNA 损伤位点以及微辐射或阿非迪霉素诱导的外源性DNA 损伤位点,认为5hmC 在维护基因组的完整性方面发挥着重要作用。Uribe-Lewis 等[57]的研究发现正常组织中基因启动子区的5hmC 高表达可以抑制与癌症发生相关的基因启动子区的甲基化。Jia等[58]研究发现5hmC及其结合蛋白淋巴特异性解旋酶表达水平的降低与肿瘤的转移和基因组不稳定性有关。Sun 等[59]研究发现TET1 可以通过调控特定基因(HOXA)启动子的去甲基化来抑制小鼠乳腺癌移植瘤的生长和转移。

5hmC 在肿瘤的早期诊断、预后预测和液体活检等方面的具有广阔的临床应用前景。Cai 等[60]利用5hmC-Seal 技术检测早期肝癌患者和正常人外周血循环DNA(circulating free DNA,cfDNA)中的5hmC,寻找有明显差异的5hmC位点,随后利用弹性网络分析和十倍交叉验证的方法对差异位点进一步筛选,利用得到的32 个位点建立肝癌的早期诊断模型,该模型在独立样本中验证ROC 曲线下的面积可达88.4%。Song等[61]采用改良的hMe-Seal技术检测7种癌症cfDNA的5hmC,发现肺癌、肝癌和胰腺癌的cfDNA中显示出不同的5hmC模式,使用机器学习算法可以准确区分这三种癌症类型;还发现5hmC水平随着肺癌的进展呈阶段性下降,且cfDNA的5hmC水平可用于肝癌患者的治疗和复发情况的监测。随着研究的不断深入,5hmC在肿瘤领域的临床应用价值正在逐步被发掘。

3.2 5hmC与神经系统疾病

脑组织中存在丰富的5hmC,因此其在神经系统中的功能引起了研究人员们的关注。研究表明,5hmC参与神经系统的发育过程,且与雷特综合症、孤独症等神经发育障碍性疾病以及阿尔茨海默病(Alzheimer disease,AD)、亨廷顿病、帕金森等神经退行性疾病有关[62]。Coppieters 等[63]通过免疫组化分析,发现与健康对照人群相比,AD 患者额叶中回以及颞中回的5mC 和5hmC 水平增加,且其增加的幅度与AD 的病理分子标志(β-淀粉样蛋白、tau 蛋白和泛素蛋白)呈正相关。Fetahu 等[64]将AD 患者和健康对照来源的诱导性多能干细胞逐步诱导分化成皮层神经元,然后通过OxBS-Seq 和甲基化酶辅助亚硫酸氢盐测序法以单碱基分辨率绘制全基因组5mC、5hmC、5fC/5caC 的分布情况,得到了能够在独立的临床队列中印证的、与AD相关的27 个区域和39 个CpG 位点,证明5mC 及其氧化产物的改变发生于疾病进展前。由于高度分化的神经元几乎不会分裂,因此无法通过依赖细胞复制的被动去甲基化机制去甲基化,所有甲基的消除几乎都需要主动去甲基化,5hmC 作为主动去甲基化的关键中间产物,有可能成为AD 早期诊断的一大突破。

3.3 5hmC与心血管疾病

越来越多的研究在心血管疾病中发现TET 和5hmC 的异常改变。Jiang 等[65]研究发现113 位病人外周血单核细胞的5mC 和5hmC 水平与颈动脉斑块的严重程度呈正相关;且校正混杂因素后,仅发现5hmC(而不是5mC)是冠状动脉粥样硬化的危险因素。Liu 等[66]研究发现TET2 和5hmC 在收缩型的血管平滑肌细胞中富集,而在去分化型的平滑肌细胞中缺失,且其缺失程度与小鼠的血管损伤程度和动脉粥样硬化程度呈正相关;在体内,局部过表达TET2 可恢复5hmC 的水平和收缩相关基因的表达,并减轻内膜增生。此外,除了调节血管平滑肌细胞的表型转换,5hmC 还可能参与动脉粥样硬化病变过程中血管内皮细胞的程序性死亡、免疫细胞的分化等过程[67]。

近年来,DNA 羟甲基化与多种重大慢性病的研究取得了一定的进展,5hmC 的高度组织特异性和敏感性为阐明疾病的发生发展机制,开发早期诊断技术和发现有效干预靶点提供了极具前景的表观遗传学新策略。然而,目前关于5hmC 的流行病学研究通常样本量较小,今后还需要开展大规模、多中心的前瞻性研究来确定与重大慢性病相关的5hmC 位点,并在精细设计的体内外实验中探讨其生物学机制。

4 5hmC在环境暴露与疾病间关联的作用

5hmC 不仅受到环境因素的影响,也与多种慢性病的发生有关,因此5hmC 作为表观遗传学的重要指标,在连接环境暴露与疾病发生过程中可能发挥“桥梁”作用。Li 等[42]基于双酚类内分泌干扰物与乳腺癌的流行病学背景,研究发现双酚A 和双酚S 可通过激活ERα,上调DNMTs 的表达,进而提高TET2基因启动子的甲基化水平,使TET2表达水平和基因组5hmC 水平降低,最终促进乳腺癌细胞的增殖,建立了环境污染物-TET2-5hmC-细胞增殖之间的关联。Wu 等[18]在多种人源肿瘤细胞系中发现,高糖状态可抑制腺苷酸活化蛋白激酶对TET2 蛋白的磷酸化作用,使TET2 蛋白不稳定,5hmC 水平下降,细胞增殖能力增强;并结合hMeDIP-seq、基因表达谱芯片、RT-qPCR 发现和验证了高糖环境下与DhMR 相关的上调原癌基因和下调抑癌基因;该研究将细胞外葡萄糖浓度与5hmC 的动态调节、肿瘤细胞的增殖联系起来,描述了一个从营养环境改变到出现健康效应的表观遗传学机制。随着环境分子流行病学研究的不断深入,今后将会有更多关于5hmC 在环境暴露与疾病间关联的研究报道。

5 总结和展望

DNA 羟甲基化作为新兴的表观遗传学标志物,能够敏感指示环境暴露的生物效应,在环境分子流行病学中逐渐受到重视。尽管已有大量研究将5hmC 整体水平的变化与环境暴露或疾病的发生发展相关联,但是5hmC 的生物学功能还没有被完全认识,多种环境因素复合暴露如何诱导5hmC 谱的变化也尚不清楚。因此,在今后的体内外功能研究中,发展准确灵敏且低成本的单细胞组学分析技术,并结合位点特异性的5hmC 修饰技术,实现单个位点的5hmC 的写入或擦除,将有助于进一步揭示5hmC 的生物学功能;在大样本前瞻性队列研究中,将暴露组、表观遗传组、基因组、转录组、蛋白组等多组学生物技术结合起来,有助于进一步明确与疾病有关联的5hmC 位点,阐明疾病的发生发展机制,探索有效的早期诊断标志物。

猜你喜欢

甲基化基因组位点
镍基单晶高温合金多组元置换的第一性原理研究
牛参考基因组中发现被忽视基因
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
二项式通项公式在遗传学计算中的运用*
鼻咽癌组织中SYK基因启动子区的甲基化分析
胃癌DNA甲基化研究进展
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组
全甲基化没食子儿茶素没食子酸酯的制备
含内含子的核糖体蛋白基因转录起始位点情况分析