伴放线放线杆菌中幽门螺杆菌毒力相关基因的生物信息学分析
2020-06-05孙静华张琛侯本祥
孙静华 张琛 侯本祥
Sun等[1]对35例胃癌前病变患者以及70 例同年龄段健康者的口腔状况进行评估时发现,胃癌前病变与牙周疾病有关,且胃癌前病变患者口腔中的菌群相对于健康者比较单一,表现为主要牙周致病菌有所增高。可见牙周病对胃癌的发生发展有一定的相关性,可能与口腔的菌群变化有关。
幽门螺杆菌(H.pylori,Hp),与慢性胃炎、十二指肠溃疡和癌、胃溃疡和癌的发生有关[2-4],牙周病患者龈下菌斑中Hp的检出率明显高于健康人群[5]。细胞毒素相关基因(cytotoxinassociatedgeneA,cagA)是Hp最重要的毒力因子之一,位于Hp基因组中约40 kb的特殊DNA区域,该DNA片段被称为细胞毒素相关蛋白A致病岛(cag pathogenicity island,cagPAI)[6]。cagPAI包含多个基因,可编码Ⅳ型分泌系统(Type Ⅳsecretion system,T4SS)的主要成分,包括cagE(cytotoxinassociatedgeneE)等,并与毒素装配和分泌有关[7]。CagA蛋白可通过cagPAI编码的T4SS进入上皮细胞,经过磷酸化后与蛋白酪氨酸磷酸酶SHP-2结合,所形成复合物可抑制SHP-2的活性,诱导胃上皮细胞的异常迁移和增殖[8-9]。因此cagA及其毒力岛基因被认为是胃炎的发生、发展甚至癌变的重要因子。Hp的另一个重要毒力因子是空泡毒素(vacuolating cytotoxin A,vacA)编码的VacA蛋白,能通过与靶细胞上的受体结合而进入细胞内,使细胞产生空泡性病变,诱导细胞色素C的释放造成胃上皮细胞的死亡[10]。
伴放线放线杆菌(A.actinomycetemcomitans,Aa)是牙周病的主要致病菌之一,与侵袭性牙周炎密切相关[11-12]。Aa可分泌合成多种毒力因子,能通过改变宿主细胞炎症细胞因子的表达水平,影响宿主的免疫调节能力,破坏牙周组织[13-14]。研究发现,Aa与胃癌的发病风险高度相关,胃癌前病变患者口腔中的Aa显著高于健康对照组[1],提示牙周病和胃癌的主要致病菌间可能存在一定的协同作用。本研究根据Hp的cagPAI基因及vacA基因,用Genebank数据库并通过同源比对的方法分析Aa中是否存在对应的基因;通过进化树分析及序列多态性分析,研究进化过程中致病基因的序列变化及其受到的选择情况,为进一步阐述牙周病和胃癌的相关性提供一定的分子生物学基础。
1 材料与方法
1.1 Aa菌株蛋白序列的获得
首先从ncbi的下拉框中选择protein条目,并用关键词A.actinomycetemcomitans查询Aa的所有蛋白序列;然后在refseq中下载Hp26695的所有cagPAI及vacA基因的蛋白序列,同时利用blastP法查找Aa中对应的蛋白序列(E值为10-5);最后用在线工具Interpro(http://www.ebi.ac.uk/interpro/)预测cagPAI及vacA基因的蛋白结构域。
1.2 系统进化分析
从NCBI(ftp://ftp.ncbi.nlm.nih.gov/genomes/genbank/bacteria/)中下载所有包含完整基因组序列的菌株,根据Hp26695的cagE基因序列,并用tblastn的方法获得除Hp26695外其它菌株中对应的cagE序列。对于有多个菌株的菌种,则根据tblastn的比对结果,选取E值最小的菌株作为该菌种的代表菌株。利用MEGA[15]对所有菌株的cagE进行进化树分析:首先利用Muscle进行多重比对,比对时使用默认的参数;再用极大似然法(Maximum likelihood,ML)建树,建树时bootstrap的值为100,其余参数选默认值。
1.3 cagE序列多态性分析
根据Aa和Hp的蛋白序列,用tblastn法分别查找所有Aa菌株和Hp菌株的cagE序列,经ClustalW多重比对后进行序列多态性分析,DNAsp 5.0法[16]计算比对cagE序列的Pi值和Tajima's D值。Tajima检验根据多重比对中每条序列的分离位点数目以及每条序列的核苷酸多样性值计算得到D值,作为统计检验量,利用模拟(simulation)法得到相应的P值。
2 结 果
2.1 Aa中Hp毒力相关基因的查找
从ncbi下载Aa中所有的蛋白序列,共获得105 610个蛋白序列。根据Hp26695所有cagPAI及vacA基因的蛋白序列,并利用blastP法进行查找,结果发现:Aa中有4个cagPAI基因的同源基因,分别为cagBeta、cagY、cagX及cagE,其中以cagE的E值最显著(表 1)。然而,在Aa中未发现空泡毒素及其他毒力岛基因的蛋白序列。cagY、cagX和cagE均是T4SS的组成成分,与毒素的转运有关[7]。
Aa中cagE的蛋白序列长度为340 个氨基酸,与Hp中cagE的蛋白序列(983 个氨基酸)相比较短。对Aa和Hp的cagE的蛋白序列进行同源比对时发现,两者的序列相似性只有18%(图 1)。 图 1表明,Aa中cagE的蛋白序列主要比对到Hp的C端区域,当忽略N端未比对的区域后,两者的相似性可达到40%。
2.2 CagE蛋白结构域分析
用Interpro对CagE蛋白在Aa和Hp两个物种中的蛋白结构域进行预测显示,Hp的CagE蛋白主要包含两个功能域,其中1 个在N端,序列较短(约50 个氨基酸),具有P型ATP酶活性,属于跨膜蛋白超家族;另1 个在C端,序列较长(约330个氨基酸),为核苷三磷酸水解酶的磷酸环,含有该结构域的蛋白倾向于水解ATP或GTP(图 2A)。Aa的CagE蛋白含有3 个比较明显的结构域,其N端的结构域较短,为溶菌酶样结构域超家族的成员;而其C端则与Hp类似,也是包含有核苷三磷酸水解酶的磷酸环结构域,但结构域的长度显著小于Hp的CagE蛋白(图 2B)。
2.3 cagE基因系统进化分析
从ncbi中下载所有含完整基因组序列的菌株,同时利用tblastn法,并根据Hp26695的cagE基因序列,查找其它菌株中是否含有cagE基因。对于同一菌种的不同菌株,则选取E值最小菌株的cagE序列作为该菌种的cagE序列。对所有菌种的cagE基因序列进行多重比对后进行系统进化树分析,结果如图 3所示:对于多数同属不同种的菌株,其cagE均聚在同一分支上,如布鲁氏菌属(Breculla)和巴尔通氏体属(Bartonella)等;然而,Hp与其它螺杆菌属的细菌并未聚在同一分支上(图 3中红色箭头部分),表明该属菌种的cagE序列有较大的变异;进一步分析发现,与其它螺杆菌属的菌种相比,Aa(图 3中蓝色箭头部分)在进化树上更靠近Hp,表明两者的cagE序列在进化上较为保守。
表1 Aa中Hp毒力相关基因的同源性分析
注:blastP比对后得到的E值,E值越小表示在Aa中无对应蛋白的可能性越大; NA:表示blastP比对后在Aa中未发现对应的蛋白
A:Hp的CagE全长蛋白与Aa的比对; B:Hp的CagE蛋白C端与Aa的比对
图1Aa和Hp的CagE蛋白保守性分析
Fig 1 Analysis of CagE protein sequence conservation inHpandAa
A: Hp的CagE蛋白结构域; B: Aa的CagE蛋白结构域
2.4 cagE基因DNA序列的多态性分析
从ncbi中下载含有完整基因组的44 个Hp菌株和8 个Aa菌株,tblastn检验结果发现,所有Hp菌株中均含有cagE基因,而且在8 个Aa菌株中有4 个菌株含有cagE基因,两者均显著高于Genbank中其他菌株的比例(15%)(P<0.05)(图4)。由此可见,与其他非Hp相比,cagE基因普遍存在于Aa菌株中。
图3cagE基因系统在细菌中的进化树分析[红色箭头:螺杆菌属(Helicobacter); 蓝色箭头:Aa]
Fig 3 Phylogenetic analysis ofcagEin bacteria
图4 不同种细菌菌株中cagE的比例分析
Fig 4 Frequency analysis of the strains withcagEgene in different group of bacteria
用DNAsp 5.0计算Aa和Hp的cagE基因序列多态性的Pi值,及用Tajima's D计算其进化过程中cagE基因在这两个物种中所受到的选择作用。结果显示,Aa的Pi值显著高于Hp(P<0.01),表明Aa中的cagE基因有明显的序列变化;而Tajima's D值则在Aa和Hp中均为负值,其Tajima's D对应的P值都小于0.01,表明在其进化过程中cagE基因在这两个物种中均受到了负向选择的作用(表 2)。
表2Aa和HpcagE基因的序列多态性分析
Tab 2 Polymorphism analysis ofcagEgene inH.pyloriandA.actinomycetemcomitanspopulations
细菌Pi值ThetaTajima'sDP值Aa0.2937a0.3223-0.92647<0.001Hp0.1011b0.1515-1.21566<0.01
注:不同字母为P<0.01
3 讨 论
cagA和vacA是Hp的主要致病基因。同时,cagA还是其所在的致病岛区域的基因编码及毒素装配和分泌机能相关的蛋白,对Hp毒性的发挥具有重要作用。本文通过生物信息学方法,分析了Hp致病岛区域的基因以及vacA基因在Aa中的存在及序列变化情况,发现Aa中并不存在cagA和vacA基因,但却存在cagE等其它4 个致病岛区域的基因。与其他物种相比,Hp和Aa中的cagE基因有着较近的进化距离,在蛋白的C端均含有核苷三磷酸水解酶的磷酸环结构域,且该基因在这两个物种内都受到负性选择的作用。
cagE位于cagPAI的右半部分,主要定位在胞质内的ATPase,即可为分泌系统的组装及底物转运提供能量,又能与其他蛋白组成T4SS,对CagA转运有重要作用[17-18],而且在Hp的大部分菌株中都含有该基因。大量研究表明,cagE还与细胞的炎症反应有关。以往的研究发现,感染Hp的cagE阳性菌株后,AGS和KATO-III等胃癌细胞的炎症反应重要因子IL-8表达升高[18]。有研究表明,十二指肠溃疡与患者感染Hp的cagE阳性菌株有关[19]。近年来的一些研究表明,在Aa中也存在cagE基因[20-21]。但与Hp不同的是,并不是所有的Aa菌株都含有cagE基因,该基因只存在于一部分Aa亚型的菌株中[20]。Aa菌株的cagE基因在牙周病中也扮演十分重要的角色[21]。与cagE阴性菌株相比,cagE阳性菌株有着更为显著的白细胞毒性,能作为一个重要的毒力因子而利于Aa菌株更好的定植在口腔中[20]。
对于其它3个在Aa中出现的Hp毒力岛区域基因,cagX和cagY也是Type IV分泌系统组成成分,并在Hp中与CagA 的转运有关[7]。在G-菌中有6种分泌系统[22],T4SS所分泌的蛋白末端有一信号肽序列,其成份主要是疏水性氨基酸,可以引导蛋白穿过细胞内膜而到达目标区域[23]。由于T4SS能直接将毒素蛋白或毒素复合物等大分子物质注入到宿主细胞中,并进而参与病原-宿主间的相互作用,因此在病原菌毒性发挥中具有重要意义[7,24]。T4SS还能介导细菌吸收外界物质,如Hp能通过T4SS的ComB系统从外界环境中获得外界DNA序列[25]。Hp和Aa两种细菌中多个T4SS的蛋白组分的序列保守暗示两者在结构和功能上存在一定的相似性,因而可能有利于细菌间物质的交流和传播。
本课题组最近的一项研究表明,牙周病患者有较高的胃癌前病变风险,且该风险与患者口腔中较高的Aa菌株水平有关[1]。本文通过对Hp中毒力岛基因以及空泡毒素基因在Aa中的存在情况及其序列变化的生物信息学分析发现,两种细菌中T4SS的部分组分特别是CagE蛋白存在一定的保守性。结果揭示了两种疾病关键的致病菌在分子水平存在一定的相似性,为进一步研究牙周病与胃癌的关系提供了新的思路。
doi:10.1128/microbiolspec