APP下载

可溶性环氧化物水解酶2基因与中国汉族人群非综合征型唇腭裂的关联研究

2022-06-09杨梦夕王艺儒殷斌郑谦石冰贾仲林

华西口腔医学杂志 2022年3期
关键词:变异基因组位点

杨梦夕 王艺儒 殷斌 郑谦 石冰 贾仲林

口腔疾病研究国家重点实验室 国家口腔疾病临床医学研究中心四川大学华西口腔医院唇腭裂外科,成都 610041

唇腭裂(cleft lip with or without cleft palate,CL/P)是一种先天性颅面部缺损的多基因遗传病,在我国其发病率约为1.67‰,西南地区发病率位居全国第二,约为1.97‰[1]。唇腭裂的防治是我国出生缺陷防控重点之一,探究唇腭裂的发病机制将为该疾病的预防提供科学依据。

根据是否伴发有其他部位的先天畸形可将唇腭裂分为非综合征型唇腭裂(non-syndromic cleft lip with or without cleft palate,NSCL/P)和综合征型唇腭裂(syndromic cleft lip with or without cleft palate,SCL/P),其中NSCL/P 约占70%[2]。SCL/P遵循孟德尔遗传规律,属于单基因遗传病。而NSCL/P 的病因非常复杂,涉及多个基因、环境因素以及基因和环境的交互作用[3]。早期通过连锁研究以及基于全基因组连锁研究的Meta 分析[4]发现,8p21区域的差异具有统计学意义。此外,针对220个菲律宾NSCL/P 大家系进行的全基因组连锁分析[5]发现,8p11-23 区域和NSCL/P 的相关性具有统计学意义,可溶性环氧化物水解酶2 基因(soluble epoxide hydrolase 2 gene,EPHX2)是该区域内具有统计学意义的基因。随后,随着全基因组关联研究(genome wide association study,GWAS)技术在NSCL/P 的遗传研究方面被广泛应用,学者们报道了17 个GWAS,发现了50 多个NSCL/P的易感位点/基因,其中包括干扰素调节因子6、同源异性盒基因1、甲状腺转录因子1 等,EPHX2基因是其中之一[6-14]。Ludwig 等[15]的GWAS 报道了位于EPHX2基因上的rs6558002 与欧洲和亚洲人群NSCL/P 相关。Gowans 等[16]在撒哈拉以南的非洲人群中进一步探究了rs6558002 与NSCL/P 的关联性。

然而,GWAS 虽然成功解释了NSCL/P 部分遗传病因,但所关注的常见变异仅占复杂疾病遗传因素的一小部分,未发现的遗传因素可能包括基因组中广泛存在的低频/罕见变异。此外,常见变异对疾病的影响有限,就严重程度和较早发作而言,罕见变异对疾病的影响可能更大[17-18]。随着测序技术的不断发展,二代测序为复杂疾病的遗传学研究提供了新的契机,它既能覆盖常见变异,又能检测罕见变异[19-20]。与一代测序技术相比,二代测序实现了对基因组序列的平行测序,能同时检测百万条序列,测序速度更快且费用更低,可以对基因组进行更全面地分析[21]。在二代测序中,针对特定区域进行测序的方式称为目标区域捕获测序,该技术不仅能捕获目标区域获得较全面的常见变异和罕见变异信息,而且测序时间较短和经济成本较低,是深度挖掘疾病候选基因的有效手段。本课题在中国汉族人群NSCL/P中对EPHX2基因所在单倍型区域进行了目标区域捕获测序,以便能够全面、完整地筛查该区域的常见易感位点和低频/罕见变异,进一步深入探究EPHX2基因与NSCL/P的相关性。

1 材料和方法

1.1 研究对象

病例组收集2016年2月—2018年12月于四川大学华西口腔医院唇腭裂外科住院手术治疗的159个NSCL/P 病例,包括79 名非综合征型单纯唇裂(non-syndromic cleft lip only,NSCLO)患者和80名是非综合征型唇裂伴腭裂(non-syndromic cleft lip and palate,NSCLP)患者(表1),所有研究对象均属于中国汉族人群,且符合先天性NSCL/P 诊断标准,不合并其他先天畸形或先天性疾病。

表1 NSCL/P患者的临床特征Tab 1 Clinical characteristics of patients with NSCL/P

对照组来自诺禾致源基因数据库(http://www.novogene.com/)的542 名中国汉族健康人的全基因组测序数据。该研究获得华西口腔医院伦理委员会批准(批件号:WCHSIRB-D-2016-012R1)。

1.2 目标区域的捕获和测序

1.2.1 捕获目标测序区域 结合HapMap 数据库中亚洲人群(中国北京汉族人群和日本东京人群)的连锁不平衡(linkage disequilibrium,LD)结构,在chr8:27359373-27410543(GRCh37/hg19)区域(图1)进行目标区域捕获测序。该部分实验委托诺禾致源公司进行,基因组DNA 片段化和文库质量检测后,用安捷伦SureSelectXT定制试剂盒富集捕获目标区域序列,通过Illumina Hiseq 4000 进行双末端测序,每端读取碱基序列长度为150个碱基对。

图1 目标测序区域chr8:27359373-27410543(GRCh37/hg19)Fig 1 Target sequencing at chr8:27359373-27410543(GRCh37/hg19)

1.2.2 生物信息分析 首先对测序得到原始数据进行初步过滤,再用国家微生物科学数据中心的BWA软件把过滤后的数据和参考基因组进行比对;生成相应文件后,使用SAMtools 软件对该文件得到的数据进行排序,重复序列通过Picard软件来进一步处理;再使用SAMtools 和BCFtools 等软件来识别单核苷酸多态性(single nucleotide polymorphism,SNP)位点和插入缺失;运用ANNOVAR 进行注释,通过dbSNP、1000 Genome、ExAC、HGMD等数据库获得变异的位置、类型和保守预测等信息;非同义突变通过CADD、SIFT、PolyPhen2 和MutationTaster这4个软件进行有害性预测。

1.3 统计分析

按照变异位点最小等位基因频率分为2类:常见变异的最小等位基因频率(minor allele frequency,MAF)≥0.01 和罕见变异的MAF<0.01[17]。对符合哈迪-温伯格平衡(Hardy-Weinberg equilibrium,HWE)检验的常见变异,使用PLINK 软件进行关联分析。

对符合以下2条纳入标准的罕见变异进行负荷分析:1)在1000 Genome 数据库和诺禾致源数据库的中国北京汉族人群及中国南方汉族人群中MAF<0.01;2)GnomAD 数据库中MAF<0.001。经SIFT、PolyPhen2,MutationTaster 和CADD 这4 个软件进行预测,上述预测软件中最少有2个软件显示是有害突变。

2 结果

2.1 测序结果

通过对chr8:27359373-27410543(GRCh37/hg 19)区域进行捕获测序,共发现了192个单核苷酸变异位点及45 个插入缺失突变,根据这些变异位点的MAF分为常见变异和罕见变异。

2.2 常见变异的关联分析结果

将所有通过HWE 检验的常见变异位点纳入关联分析,结果发现:有5 个SNP 位点与NSCL/P 相关;其中位于EPHX2 基因外显子区的rs57699806与NSCL/P 具有关联性[P=0.000 13,比值比(odds ratio,OR)=2.849,95%置信区间(confidence interval,CI):1.691~4.800]其次是位于基因间的rs-4732723(P=0.006 50,OR=0.662,95%CI:0.491~0.892),内含子区的rs7829267(P=0.009 20,OR=1.496, 95%CI: 1.117~2.005), rs721619 (P=0.011 00,OR=1.474,95%CI:1.098~1.980)和rs-7816586(P=0.040 00,OR=1.310,95%CI:1.015~1.691)(表2和图2)。

图2 EPHX2基因的SNP与NSCL/P关联分析的LD分布图Fig 2 LD Plot of the SNPs at EPHX2 gene for NSCL/P association analysis

表2 EPHX2基因区域常见变异与NSCL/P的关联分析Tab 2 Association analysis between common variations in the EPHX2 gene region and NSCL/P

2.3 罕见变异的负荷分析结果

罕见变异负荷分析结果显示,病例组和对照组的差异无统计学意义(P>0.05)。

2.4 功能预测

对常见变异关联分析中的SNP 位点rs576998-06 进行了功能预测,结果发现,rs57699806 为A等位基因时,可以改变2 个转录因子的结合位点GATA_disc4和Mxi1_known1(表3)。

表3 rs57699806 为A 等位基因改变的转录因子结合位点Tab 3 rs57699806 is the transcription factor binding site changed by A allele

3 讨论

EPHX2基因具有功能多样性[22],它是否会影响颌面部的发育仍有待进一步的探索。颌面部的发育是一个复杂的过程,涉及神经嵴细胞的增殖、分化和迁徙,面部的突起在特定的时间和空间里生长、融合或联合,该过程由多种信号分子共同

参与调节,若发生变化可能会引起颌面畸形[23-24]。本研究采用目标区域捕获测序技术进一步筛查EPHX2基因区域的常见变异和罕见变异,并分别进行了关联分析和负荷分析。通过常见变异的关联分析,发现了该区域5 个与NSCL/P 相关的SNP位点。其中,位于EPHX2 基因外显子区的rs57-699806 具有统计学意义(P=0.000 13,OR=2.849,95%CI:1.691~4.800)。当rs57699806 突变为A 等位基因时,可以改变GATA_disc4 和Mxi1_known1 2 个转录因子的结合区域。GATA 家族成员包括GATA1~6,参与胚胎早期细胞分化和器官发育,大多数GATA家族成员的突变可导致人类发育性疾病[25]。其中GATA 4 参与神经嵴细胞和颌面部骨骼的生长发育,GATA4 缺失可以导致细胞的增殖减少,条件性敲除Gata4基因的小鼠出现了下颌骨、额骨、硬腭的矿化减少以及牙齿形态变小,敲低斑马鱼胚胎gata4基因的表达也出现了类似上述小鼠模型的形态特征,斑马鱼的下颌弓变得短小[26]。另一个GATA 家族成员GATA6,GATA6 的下调参与介导地塞米松诱导腭裂的过程,可能与腭突细胞的凋亡有关[27-28]。Mxi1 是Mad 转录家族(包括Mad1、Mxi1、Mad3、Mad4、Mnt 和Mga) 成员之一,通过Myc/Max/Mad网络来调控细胞的增殖、分化和凋亡[29-30]。Mxi1 对调控正常细胞生长、诱导和维持细胞分化至关重要[31]。尽管没有直接证据显示Mxi1 与唇腭裂的关联,但Mad 转录家族中同样参与Myc/Max/Mad 网络调控的Mnt基因的敲除可导致小鼠出现不同程度的腭裂和颅骨发育迟缓[32]。

通过目标区域捕获测序在EPHX2基因区域发现了5 个与NSCL/P 相关的SNP 位点(rs57699806、rs4732723、 rs7829267、 rs721619、 rs7816586),其中rs721619 在之前的全基因组连锁分析[5]中已有报道,其余4个位点为新发现位点。罕见变异负荷分析结果显示病例组和对照组的差异无统计学意义,这可能是由于罕见变异在人群中出现的频率较低,在当前研究样本量较小的情况下,不易检出而导致阴性结果。罕见变异在NSCL/P 等复杂疾病的发生过程中发挥非常重要的作用,近些年的研究结果显示,越罕见的遗传变异疾病致病性越强,在将来的研究中非常有必要纳入更多人群样本来检测罕见变异,完善NSCL/P 易感位点突变谱,为以后唇腭裂的分子诊断和遗传咨询奠定基础。

综上,本研究发现中国汉族人群EPHX2基因单核苷酸多态性与NSCL/P 的发生存在相关性。虽然EPHX2基因区域罕见变异的负荷分析结果在两组的差异无统计学意义,不过就目标区域捕获测序技术本身而言,该技术为基因组中广泛存在的罕见变异的筛查提供了契机,能更全面地揭示影响复杂疾病发生的遗传因素。本研究为EPHX2基因与NSCL/P 之间的关联提供了新的证据,但还需要在其他大样本人群研究中验证,EPHX2基因是否参与了颌面部的发育过程,仍需通过功能研究来揭示其在调控网络中的角色。

利益冲突声明:作者声明本文无利益冲突。

猜你喜欢

变异基因组位点
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
“植物界大熊猫”完整基因组图谱首次发布
牛参考基因组中发现被忽视基因
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
变异危机
变异
一种改进的多聚腺苷酸化位点提取方法