微粒体环氧化物水解酶1和谷胱甘肽S-转移酶P1与中国北方汉族慢性阻塞性肺疾病及其肺功能表型的相关性
2019-04-26安立林英翔张鸿逯勇张曙华琳
安立 林英翔 张鸿 逯勇 张曙 华琳
(1首都医科大学附属北京朝阳医院呼吸与危重症医学科 北京市呼吸疾病研究所 北京市呼吸与危重症诊治工程技术研究中心,北京 100020;2首都医科大学生物医学工程学院数学与生物信息学教研室)
慢性阻塞性肺疾病(COPD)是一复杂的多基因疾病。其中,微粒体环氧化物水解酶(EPHX)1、谷胱甘肽S-转移酶(GST)P1都属于异生物代谢酶基因,主要参与对香烟烟雾等外来异生型物质、氧化物和反应性氧化物的中间产物在肺中的首过代谢。EPHX1有两个常见的突变位点Try113His和His139Arg,分别被称为慢等位基因和快等位基因,能够引起酶活性的改变〔1〕。而GSTP1常见的突变位点位于外显子5(Ile105Val)和外显子6(Ala114Val)。研究证实105Ile等位基因较105Val有更高的催化活性〔2〕。近年来人们对这两个基因与COPD易感性的关系进行了探讨,发现结果存在明显的种族差异〔3~6〕,而在中国人群中的研究中也有不一致现象,研究多集中于上述几个突变位点〔7~9〕。本研究旨在探讨在中国北方汉族人群中EPHX1、GSTP1与COPD发病及肺功能表型之间的关系。
1 材料与方法
1.1研究对象 收集2007年10月至2009年3月北京朝阳医院及各合作医院呼吸科门诊就诊的稳定期汉族COPD患者316例(病例组)。入选标准:①年龄40~75岁,男女不限;②肺功能检查符合COPD诊断标准。且符合应用支气管扩张剂后第1秒用力呼气容积(FEV1)/用力肺活量(FVC)≤70%和FEV1≤80%pre;③所有患者处于疾病的稳定期,入选前6 w内没有咳嗽、咳痰或呼吸困难加重;没有发热;没有针对呼吸症状加重的用药改变;④不伴有以下任何一种疾病或情况:哮喘、过敏性鼻炎、支气管扩张、囊性纤维化、神经肌肉异常等影响运动的疾病及精神异常和认知障碍。同期在北京朝阳医院和各合作医院的体检门诊及周围社区选择年龄40~75岁,性别匹配的汉族健康对照者213例。所有的受试者在试验前签署知情同意书。
1.2DNA的提取及基因分型 所有受试者于采血前均禁食12 h,晨起空腹抽取静脉血3 ml,经乙二胺四乙酸(EDTA)抗凝,离心(3 000 r/min,15 min)分离血浆,低渗法破坏血细胞沉淀中的红细胞,将所得白细胞沉淀于-80℃保存,用于提取DNA。应用Illumina公司提供的BeadXp ress的基因分型平台采用等位基因特异性杂交法进行EPHX1和GSTP1的SNP检测。
1.3SNPs位点的选择 由于在人类的基因组中天然存在连锁不平衡(LD),因此应用较少的标签SNPs(Tag SNP)便足以能够获取存在于高度连锁区域的遗传变异信息〔10〕。挑选Tag SNPs的步骤如下:首先我们列出在以往文献中曾经报道的关于4个基因中和COPD易感及表型相关的SNPs位点EPHX1:rs1051740、rs2234922、rs1051741、rs2292558、rs3728042、rs3753661、rs3766934、rs1009668、rs868966、rs2292566、rs1877724、rs2260863、rs3753658;GSTP1:rs1695、rs1799811、rs612020、rs11227884〔3,5,11~15〕。其次,下载HapMap数据库亚洲人群〔中国汉族(CHB);日本人群(JPT);选用两个人群可以增加Tag SNP的覆盖度〕的EPHX1和GSTP1两个基因的基因型数据。使用软件Haploview(Haploview4.2;release 23;CHB+JPT panel),在每个基因中依据它们自身能够探及LD区块的能力,挑选出可以覆盖该基因的Tag SNPs,并将其作为背景数据库。再次,将阳性位点强行纳入Tag SNPs列表中(EPHX1:rs868966、rs1877724、rs3766934、rs1051740、rs2234922、rs2292558、rs1009668;GSTP1:rs1695)。最后,在pairwise 模型下,设定r2=0.8,然后运行Haploview,计算出覆盖整个基因所需的所有Tag SNPs。
1.4统计分析 采用SPSS16.0软件进行独立样本t检验、χ2检验。Hardy-Weinberg平衡检验采用χ2检验。各SNPs位点与COPD发病风险的相关性采用二分类Logistic 回归分析,与肺功能表型的相关性采用直线回归分析,并对年龄、性别和吸烟指数等混杂因素进行校正。回归模型分别采用显性遗传模型(AA/AC vs.CC)、隐性遗传模型(AA vs.AC/CC)和加性遗传模型(AA vs.AC vs.CC)。对各SNPs位点与COPD发病及肺功能表型之间的所有相关性分析皆进行Bonferroni 多重检验〔16〕。上述检验均采用全基因组关联分析软件PLINK1.06来完成。
2 结 果
2.1受试者一般临床资料 根据基因分型的结果,病例组最后纳入研究的COPD患者为310例,对照组为203例。两组FEV1、FEV1%pre、FEV1/FVC、FVC有统计学差异(P<0.001)。病例组年龄和吸烟指数显著高于对照组,体重指数显著低于对照组(P<0.05)。见表1。
2.2EPHX1及GSTP1的基因多态性与COPD易感性的关系 两个基因13个SNPs的等位基因频率分布皆符合Hardy-Weinberg平衡,各SNPs的最小等位基因频率在病例和对照组中的分布情况见表2。EPHX1的1个SNP位点(rs3766934),GSTP1的1个SNP位点(rs36211088)的等位基因分布在两组中有明显差别(P<0.05)。之后以是否发病为因变量,以各个SNPs位点的基因型作为自变量进行二分类Logistic回归分析,并对年龄、性别和吸烟指数进行校正,结果显示:在显性、隐性和加性遗传模型下EPHX1的2个SNPs位点(rs3738040和rs3766934)、GSTP1的1个SNPs位点(rs36211088)皆与COPD易感性相关(P<0.05)。经Bonferroni多重检验后各SNPs位点与COPD发病的相关性消失,见表3。
表1 研究对象的临床特征
表2 两基因SNP标签物理位置及等位基因频率在病例组和对照组中的分布情况
表3 两基因各SNPs位点与COPD易感性的相关性分析
PBon:经过Bonferroni校正后的P值;NA:等位基因频率太低而无法进行分析;表4、5同
2.3EPHX1和GSTP1的基因多态性与基线肺功能的关系 如表4、5所示:在显性模型下,EPHX1的2个SNPs位点(rs3738040和rs3766934)、GSTP1的1个SNP位点(rs36211088)分别与FEV1值和FEV1/FVC值显著相关(P<0.05)。经Bonferroni多重检验后发现EPHX1的rs3766934仍然与FEV1和FEV1/FVC显著相关(P<0.05),rs3738040则仅与FEV1/FVC显著相关(P<0.05)。即携带rs3766934T基因的患者与更高的FEV1和FEV1/FVC值相关,携带rs3738040A的患者仅与更高的FEV1/FVC值相关。显性模型下GSTP1的rs36211088仍显示与基线FEV1明显相关(P<0.05),而与FEV1/FVC的相关性消失(P>0.05)。
2.4LD特征分析与单体型分析
2.4.1LD分析 将对照组中各基因所有样本的基因型数据导入HaploView(V4.2),分析各基因的所有SNPs位点之间的LD特征并用其构建出每个基因的单体型图(图1)。EPHX1上的2个阳性位点rs3738040和rs3766934之间处于强连锁(D′=0.83)。由于GSTP1的位点数太少,只能看到各SNPs位点间的LD关系,而无法构建连锁区块。
表4 两基因各SNPs位点与FEV1的相关性分析
仅显示了P<0.1 的SNPs;表5同
表5 两基因各SNPs位点与FEV1/FVC的相关性分析
共使用了8个常见变异位点(common SNP)构建了EPHX1的LD图谱。连锁区块内的数值显示的是两两位点间的D′值。红色代表D′=1,白色代表D′=0,而中间的过渡色代表 0 2.4.2单体型分析 应用滑动窗方法对相邻3个SNPs构成的单体型进行分析,以探讨可能与COPD发病和肺功能表型相关的区域。结果显示,在EPHX1基因中CAT和CAA个单体型与COPD的发病相关,其中CAT与COPD发病更为密切(Pspecific=0.014)。在GSTP1基因中AGG与COPD易感性密切相关(Pspecific=0.010,Pglobal=0.036)。见表6。在与肺功能表型相关的分析中发现EPHX1基因中有4个单体型(GGA、GAA、AAG、AGA)分别与FEV1和FEV1/FVC显著相关(P<0.05)。GSTP1中有1个单体型(AGG)与FEV1和FEV1/FVC明显相关(P<0.05),见表7。上述单体型中都包含有前述的单点分析的阳性位点。 表6 两基因与COPD发病的单体型分析 仅列出了P<0.05的单体型,Pspecific值是指在3个位点构成的单体型中最小的P值;Pglobal值是指3个位点构成的单体型中总体P值;单体型组合中的SNPs的序号与表2中各基因的SNPs序号一致;下表同;F_A:在COPD组的单体型频率,F_U:在对照组中的单体型频率 表7 两基因与基线肺功能的单体型分析 EPHX1是由支气管上皮细胞表达的具有解毒功能的异物代谢酶。EPHX1基因位于1q42.1染色体,已经较为明确的基因多态性表现在外显子3(rs1051740)和外显子4(rs2234922),外显子3的基因突变型为T-C替换,组氨酸取代113位的酪氨酸(Try113-His),酶活性减少50%(慢等位基因型);外显子4的突变为A-G替换,精氨酸取代139位的组氨酸(His-Arg),酶活性增强25%(快等位基因型)。Smith等〔3〕首次报道EPHX1的基因多态性与肺气肿的发病相关,并发现慢等位基因频率在肺气肿患者中的发生率(28%)明显高于对照组(6%)。然而,之后其他研究均未发现外显子3和4的等位基因频率在COPD组和对照组中有明显差别〔17~19〕。目前对于中国北方汉族人的研究亦有不同的结果,张荣葆等〔8〕的研究表明EPHX1的基因多态性与中国COPD的易感性无相关性,但肖丹等〔9〕的研究表明EPHX1的基因多态性与中国COPD的易感性相关,并且EPHX1的基因型与吸烟之间有交互作用。但是鉴于这2个研究的样本量较少,EPHX1是否为中国人群中COPD的易感基因尚需更大的样本来验证。 对于上述较为关注的2个SNPs位点,本研究未发现其与COPD易感性及肺功能表型相关。而另2个以前鲜有报道的SNPs位点rs3738040和rs3766934则分别显示与COPD发病及肺功能表型显著相关。在经过Bonferroni多重检验后,除rs3738040与FEV1相关性不显著外,这2个位点仍显示与肺功能表型显著相关。Bonferroni多重检验是目前在多位点关联分析中为降低统计学方面的假阳性而进行多重检验的常用方法〔16,20〕。Rs3738040位于启动子区,而rs3766934位于内含子1,由本研究数据(研究样本和基因型)所构建的包含8个SNPs位点的EPHX1基因LD图谱看,两者处于强连锁,D′为0.83,上述2个SNPs位点均位于第1个强连锁区块内(Block 1)。上述2个位点所在的区域,位于RNA选择性转录剪切区〔21〕。研究发现〔21〕,位于此区域的一剪切突变位点(外显子1)在肝脏中呈高表达,而另一变异体也同时在机体的其他部位包括肺脏中表达。每一个剪切变异体都有自己的5′端启动子区,提示这个区域在调节EPHX1 mRNA水平方面存在组织特异性。目前已有研究表明,此区域与COPD患者的某些数量性状密切相关〔11〕。本研究中的2个阳性SNPs位点具体通过何种途径对COPD及其肺功能表型进行影响尚需进一步探讨。 此外,单体型分析对识别某些不能直接观察到的致病位点有一定的优势。研究表明,探讨基因和疾病相互关系时,应用单体型信息和用SNPs为基础的单点分析相比,其可信度可增加15%~50%〔22,23〕。因此,在相关分析中联合应用单点分析和单体型分析对结果的判断更有效〔24〕。综合单点分析和单体型分析的结果推测,中国北方汉族人群中与肺功能表型相关的位点可能位于Block 1。 GSTP1属于GSTs同工酶家族,也是一种重要的抗氧化解毒酶。由于在肺脏组织中的表达较其他GSTs更丰富,因此被认为是在肺脏局部对异生物质解毒的主要GSTs同工酶〔25〕。它的外显子5、6存在多态性。在第5外显子(rs1695)发生的单个碱基替换(GTC/ATC,G-A)会导致105位异亮氨酸(Ile)替换为缬氨酸(Val);第6外显子发生(GCG/GTG,C-T)替换,导致114位的氨基酸由丙氨酸(Ala)替换为Val。研究进一步证实GSTP1纯合野生型(105 ILe/ ILe)的催化活性显著高于杂合型(105 Ile/ Val)和纯合变异型(105 Val/ Val)。GSTP1的基因型分布在不同种族间差异极大。Ishii等〔5〕在病例-对照研究中发现GSTP1 105位Ile纯合子的比例在COPD患者较对照组明显升高。而Yim 等〔6〕在研究中却没有发现阳性。本研究同样未发现rs1695与COPD易感相关,但发现另一与COPD发病及肺功能表型显著相关的SNP位点——rs36211088,且在经过Bonferroni多重检验后仍有统计学意义。本研究发现,在HapMap数据库及本研究数据构建的LD图谱中,此位点与其他SNPs位点的连锁程度较弱。此外,虽然单体型分析表明包含rs36211088A,rs4147581G,rs1695G的单体型频率在病例和对照组中有明显差别(Pspecific=0.010),但AGG单体型频率极低(Fre=0.02)。而且与肺功能表型的相关性分析中也是同样的结果。故此位点在COPD发病中的作用尚需进一步探讨。 综上,本研究发现在中国北方汉族中,异生物代谢酶EPHX1和GSTP1的基因多态性可能与肺功能表型相关。本研究结果与其他研究结果不一致的原因可能有以下几点:①不同种族的遗传背景不同,不同人群各SNPs位点间的LD程度和形式不同等。②在不同研究人群内部基因与基因,基因与环境等之间的相互作用都是其影响因素。本研究结果有望进一步深化COPD发病的分子机制研究,丰富国人COPD遗传易感机制方面的知识。本研究尚存在一定缺陷,样本量不够大,同时未能进行重复人群的验证。3 讨 论