布鲁氏菌A19疫苗株全基因组测序及比较基因组学分析
2019-12-23王姝懿赵学亮呼和巴特尔王文龙
王姝懿,赵学亮,孙 柯,呼和巴特尔,王文龙
布鲁氏菌病(Brucellosis)是由布鲁氏菌引起的一种严重的人兽共患病,给人类健康及畜牧业带来严重威胁。目前,疫苗接种是防控布病的重要手段之一。中国在布病严重流行区广泛使用S2和A19疫苗。牛种疫苗布鲁杆菌A19是弱毒疫苗株,1923年经过自然减毒形成,毒力稳定且免疫保护效果优良,从1940年开始在中国推广使用。而美国科学家发现另一种疫苗株S19,在国际上应用广泛且更加安全,是对赤藓糖醇敏感的菌株,也是迄今为止最有效的疾病疫苗[1]。大多数S19均有相应缺失序列(702 bp),在赤藓醇相关的操纵子上有缺失,我国使用的A19和S19相比没有缺失,在缺少赤藓糖醇的培养基上可良好生长。
对于防控布病,疫苗的有效开发意义深远。全基因组测序可以从根本上探究其基因组全面信息。本研究测序A19全基因组,并进行不同种之间的比较基因组学解析,筛选出基因在不同种型之间的差异。通过各种数据库对其进行分类和注释分析,预测其基因功能进而挖掘毒力相关因子。为A19后续研究给予有利的数据支撑,也为疫苗的改良、开发以及鉴别诊断方法的建立奠定理论依据。
1 材料与方法
1.1菌株 A19(齐鲁动保有限公司)。
1.2主要试剂 TIANamp Bacteria DNA Kit 细菌基因组 DNA 提取试剂盒、核酸染料、琼脂糖、λ-Hind Ⅲ digest DNA marker (Takara公司),DL2000(Takara公司)。
1.3提取DNA及凝胶电泳检测 根据制造商的说明,使用TIANamp Bacteria DNA Kit(Tiangen Biotech Co.,Ltd.,Beijing,China)提取纯化总基因组DNA。
1.4布鲁氏菌A19全基因组检测 主要完成对A19基因组 DNA样品的测序、功能基因预测注释以及串联重复序列的预测等工作(Hangzhou Lianchuan Biological Technology Co., Ltd)。
1.5A19与猪羊牛种的比较基因组学分析 A19与猪种(VBI22、1330)、羊种(16M、 M28)和牛种(2308、S19、9-941、A13334)分别进行不同种型的比较基因组学解析,筛选出共有、特有基因以及牛种毒力基因。
2 结 果
2.1样品DNA提取及检测 提取和纯化A19基因组DNA,用琼脂糖凝胶电泳(1%)检测(2 μL)样品DNA,结果见图1。经分光光度法检测DNA后,OD260/280=1.93, 浓度137.6 ng/μL,均符合测序标准。
M1:标准分子量 DNA DL2000;M2:标准分子量DNA λ-Hind Ⅲ digest; 1、2、3、4:A19基因组图1 A19疫苗株基因组凝胶电泳Fig.1 Agarose gel electrophoresis of Brucella vaccine strain A19 genome DNA
2.2 A19基因组测序分析
2.2.1A19基因组序列的基本信息 通过Illumina Hiseq 4000平台测序,A19共得到2.83G原始数据, 经过过滤为2.59G,测序平均深度790×。组装结果表明,A19基因组3 286 167 bp, GC含量57.25%。组分分析发现,预测出编码基因3 371个,总长度2 829 795 bp且平均长度854 bp,占基因组全长的86.11%。tRNA预测数55个,rRNA12个。散在重复序列用RepeatMasker预测,A19预测出52个平均长度176 bp的序列。对串联重复序列预测用 TRF 软件,A19共预测出75个串联重复序列,且60个小卫星(Minisatellite DNA) DNA, 并没有预测到微卫星(Microsatellite DNA)DNA。A19组装结果详见表1,基因组序列预测见表2。
表1 A19基因组测序组装结果统计
Tab.1 Assembly results of genome sequence ofBrucellavaccine strain A19
NameA19-Ch1A19-Ch2No. of all scaffolds11Base in all scaffolds21239971162170G+C content(%)57.1657.34N rate00
表2 A19基因预测结果统计
Tab.2 Gene prediction results ofBrucellavaccine strain A19
A19-Ch1A19-Ch2Gene amont(#)2 1641151Total total length/bp1 810 4221 019 373Gene average length/bp836885Gene density/bp1.020.99GC content in gene region/%58.3058.40Gene / Genome /%85.2087.70Intergenic region length/bp313 575142 797GC content in intergenic region/%50.0049.60Intergenic region length/ genome/%14.8012.30
2.2.2A19基因组的COG预测分析 A19与COG库进行比对,与其相关的基因得到共2 560个,将这些基因信息依据COG分类标准进行分类,A19基因组被划分为22类。
染色质动力学、染色质结构 (B),共1个基因;能量转化产生 (C),共177个基因;细胞周期分裂、调控、染色体的分配 (D),共27个基因;氨基酸运输(E),共306个基因;核苷酸代谢转运(F),共73个基因;碳水化合物运输 (G),共154个基因;辅酶代谢转运 (H),共110个基因;脂质代谢运输 (I),共93个基因;核糖体合成及结构 (J),共164个基因;转录(K),共155个基因;复制、重组和修复(L),共125个基因;细胞膜壁的合成(M),共151个基因;细胞的运动(N),共34个基因;翻译后蛋白质折叠、修饰周转(O),共125个基因;无机离子代谢转运 (P),共182个基因;次级代谢产物运输、合成、分解 (Q),共47个基因;一般性的预测功能 (R),195个基因;未知的功能 (S),294个基因;转导信号机制(T),共67个基因;细胞内及膜泡转运(U),共42个基因;防御机制(V),共37个基因;细胞外结构(W),共1个基因。
2.2.3A19基因组的KEGG代谢通路分类 本研究比对KEGG库,A19中与其对应的基因2 544个,将这些基因划分为33类代谢通路,其分别对应不同基因序列表达产物。每一类基因的功能和数量见图2:排泄系统,共1个基因;消化系统,共1个基因;神经系统,共6个基因;循环系统,共3个基因;环境适应系统,共6个基因;内分泌系统,共7个基因;合成次级代谢产物,共15个基因;合成糖类,共27个基因;能量代谢,共149个基因;全球概览图,共653个基因;氨基酸代谢,共218个基因;聚酮类及萜类代谢,共36个基因;核苷酸的代谢,共89个基因;共208个基因;其他氨基酸的代谢,共62个基因;外源化学物新陈代谢及降解,共61个基因;脂质代谢,共72个基因;碳水化合物合成,共187个基因;辅助因子及维生素代谢,共156个基因;心血管疾病,共2个基因;神经退行性疾病,共9个基因;内分泌和代谢疾病,共9个基因;传染性疾病,共18个基因;癌症,共12个基因;转录,共4个基因;翻译,共83个基因;折叠、分类和降解,共40个基因;复制和修复,共42个基因;膜转运,共228个基因;信号转导,共68个基因;代谢转运及分解,共7个基因;细胞运动,共39个基因;细胞生长和死亡,共26个基因。
2.3A19与其它布鲁氏菌的比较基因组学分析 A19与猪羊牛种共9株菌进行不同种型之间的比较基因组学分析,菌株统计信息见表3。结果显示:A19,S19, 2308,9-941和A13334之间的共有基因有2 819个,特有基因有693个,非冗余基因有5 488个;A19,1330,VBI22, 16M和M28之间的共有基因有411个,特有基因有4 787个,非冗余基因有10 003个。可见不同种布鲁杆菌之间在基因水平上还是存在很大差异的,即使同种不同型别之间也存在一定差异,且种间差异更大。
表3 6株菌基本信息统计结果
Tab.3 Basic information statistical results of 6 strains of bacteria
StrainsChrsSizeGC(%)GeneProteinA1923.2957.23 3713 126133023.3257.23 3583 164VBI2223.3257.23 3613 167M2823.3157.23 3813 14416M23.2957.23 3723 134230823.2857.23 3753 1539-94123.2957.23 3763 153S1923.2857.23 3793 151A1333423.2957.23 3863 168
本研究针对5株牛种野毒和疫苗株进行深入分析,在蛋白质组之间进行成对和相互比较以鉴定100%相同的基因。在693个特有基因中,总共252 199和112个基因分别在野毒株9-941、A13334和2308中被鉴定为特异。且此3株野毒株中功能被注释为假想蛋白的基因分别为39、24和9个。同时对具有明确功能定义的剩余基因进行文献检索以确定这些基因是否具有毒性。通过筛选,在功能明确的特异基因中,超过一半基因编码与生物体基本生命周期有关的各种酶,其中,有几种基因可能与毒力有关。对于9-941、A13334和2308这3株菌的毒力基因,其详细功能注释列于表4中。
图2 A19基因组基因KEGG代谢通路分类Fig.2 KEGG pathway classification for genes of Brucella vaccine strain A19
上述毒力基因都可作为区分野毒株和疫苗株的重要依据。在这些毒力基因中,以ABC转运蛋白(ABC-transporter-permease)、ATP结合蛋白(ATP-binding-protein)、双组分转录调节因子(two-component-transcriptional-regulator)、鞭毛蛋白(flagellar protein)和 IV型分泌系统virB5蛋白等为主要毒力因子。它们会直接或间接影响生物机体的代谢和转运系统。这些差异基因在野毒株中是特异的,意味着在疫苗株中缺失相应的功能,这可能是疫苗A19和S19减毒的原因之一,也为后续诊断方法的建立提供数据保证。
表4 牛种野毒株毒力基因
Tab.4 Virulence genes ofBrucellaabortusstrains
B.abortusstrainsGenesFunction9-941BRUAB_RS00525 (cgs)-cyclic-beta-1-2-glucan-synthetaseBRUAB_RS01455 (fleS/flrB)-sensory-box-sensor-histidine-kinaseBRUAB_RS01480 (allC)-allantoate-amidohydrolaseBRUAB_RS01530 (fadD13)-fatty-acid-CoA-ligaseBRUAB_RS15740 (pvdH)-2,4-diaminobutyrate-4-transaminase-BRUAB_RS02540 (wbpL)-glycosyl-transferase,-group-4-family-proteinBRUAB_RS02665 (pmm)-phosphomannomutaseBRUAB_RS03005 (phoQ)-sensor-kinase-proteinBRUAB_RS03040 (mprA)-two-component-transcriptional-regulator,-winged-helix-familyBRUAB_RS03045 (mprB)-two-component-sensor-kinase-MprBBRUAB_RS03060 (gacS)-sensor-histidine-kinase/response-regulator-GacS表4(续)B.abortusstrainsGenesFunctionBRUAB_RS04200 (bscS)-periplasmic-solute-binding-proteinBRUAB_RS04595 (hasF)-ABC-transporter-permeaseBRUAB_RS05150 (farA)-fatty-acid-resistance-protein-ABRUAB_RS15760 (allR)-DNA-binding-transcriptional-repressor-AllRBRUAB_RS15850 (sugC)-sugar-ABC-transporter-ATP-binding-protein-SugCBRUAB_RS05750 (CbuK_0945)-hypothetical-proteinBRUAB_RS05990 (tuf)-elongation-factor-TuBRUAB_RS06330 (hmuS)-CobN/magnesium-chelatase-family-proteinBRUAB_RS06535 (ddrA)-daunorubicin-resistance-ABC-transporter-ATPase-subunitBRUAB_RS07120 (sigA/rpoV)-RNA-polymerase-sigma-factorBRUAB_RS07530 (mbtI)-anthranilate-synthase-component-IBRUAB_RS07680 (bplA)-probable-oxidoreductaseBRUAB_RS07715 (hitB)-iron(III)-transport-system-permease-protein-hFbpBBRUAB_RS07850 (vceA)-putative-cytoplasmic-proteinBRUAB_RS08040 (adeF)-RND-efflux-transporterBRUAB_RS08550 (hcnC)-hydrogen-cyanide-synthase-HcnCBRUAB_RS08885 (cfcV)-prepillin-peptidaseBRUAB_RS09030 (essC)-FtsK/SpoIIIE-family-proteinBRUAB_RS09305 (YPA_2067)-histidine-transport-system-permease-protein-HisQBRUAB_RS09985 gacS)-multi-sensor-hybrid-histidine-kinaseBRUAB_RS10460 (entD)-ENTEROBACTIN-SYNTHETASE-COMPONENT-DBRUAB_RS10900 (bplA)-probable-oxidoreductaseBRUAB_RS17155 (fliG)-putative-flagellar-motor-switch-protein-FliGBRUAB_RS11125 (flgI)-flagellar-P-ring-protein-FlgIBRUAB_RS17175 (yapJ)-autotransporter-protein-YapJBRUAB_RS11740 (ddrA)-daunorubicin-resistance-ABC-transporter-ATPase-subunitBRUAB_RS13155 (BAbS19_II05480)-Glycerol-3-phosphate-binding-periplasmic-protein-precursorBRUAB_RS13665 (bprC)-AraC-family-transcriptional-regulatorBRUAB_RS14130 (cfl)-coronafacic-acid-synthetase,-ligase-component
BRUAB_RS14260 (bplA)-probable-oxidoreductaseBRUAB_RS14400 (katA)-catalaseBRUAB_RS14465 amino-acid-polyamine-organocation-(APC)-supeorfamily-proteinBRUAB_RS14490 (adeG)-RND-family-efflux-transporterBRUAB_RS14590 (bplA)-probable-oxidoreductaseBRUAB_RS14615 (lpqY)-Probable-sugar-ABC-transporterBRUAB_RS14635 (narG)-nitrate-reductase,-alpha-subunitBRUAB_RS14740 (ddrA)-daunorubicin-resistance-ABC-transporter-ATP-binding-subunitBRUAB_RS14975 (oppA)-hypothetical-proteinBRUAB_RS15320 (pdhB)-Pyruvate-dehydrogenase-(lipoamide)A13334BAA13334_RS10830 (yapK)-autotransporter-protein-YapKBAA13334_RS14945 (adhD)-zinc-containing-alcohol-dehygenase-NAD-dependent,-AdhDdro表4(续)B.abortusstrainsGenesFunctionBAA13334_RS11640 (flhB)-flagellar-biosynthetic-protein-FlhBBAA13334_RS14475 (sugC)-maltodextrin-import-ATP-bindingBAA13334_RS14795 (lngS)-LngSBAA13334_RS13850 (hmuV)-hemin-importer-ATPBAA13334_RS15005 (cyp143)-cytochrome-P450BAA13334_RS15890 (tuf)-elongation-factor-TuBAA13334_RS16075 (hlyB)-hemolysin-BBAA13334_RS01055 (badA/vomp/brp)-Surface-protein/Bartonella-adhesin-BadA-likeBAA13334_RS02065 (bplA)-probable-oxidoreductaseBAA13334_RS03085 (ptxR)-transcriptional-regulator-Ptx RBAA13334_RS03970(vctC)-iron(III)-ABC-transporter,-ATP-binding-proteinBAA13334_RS06480 (kdtB)-lipopolysaccharide-core-biosynthesis-proteinBAA13334_RS07015 (wbdA)-Glycosyl-transferase,-group-1BAA13334_RS07675 (htrB)-Bacterial-lipid-A-biosynthesis-acyltransferaseBAA13334_RS08640 (ETAE_0884)-putative-transglycosylase-signal-peptide-proteinBAA13334_RS09535 (mlsA1)-type-I-modular-polyketide-synthaseBAA13334_RS09580(wbmC)-putative-glutamine-a2308BAB_RS16955 (ctpV)-Putative-metal-cation-transporter-P-type-ATPase-CtpVBAB_RS16970 (fbpC)-iron-uptake-permease-ATP-binding-proteinBAB_RS17750 (ptxR)-transcriptional-regulator-PtxRBAB_RS18125 (pdhB)-pyruvate-dehydrogenase-E1-component-subunit-betaBAB_RS19590 (YPA_2067)-histidine-transport-system-permease-protein-HisQBAB_RS20005 (alcS)-putative-drug-resistance-translocaseBAB_RS22945 (lpg0769)-hypothetical-proteinBAB_RS24650 (mig-5)-putative-carbonic-anhydraseBAB_RS25310 (pbtD)-pyridoxal-phosphate-dependent-enzymeBAB_RS26665 (virB5)-attachment-mediating-protein-virB5BAB_RS27800 (hitC)-iron-utilization-ATP-binding-protein-hFbpCBAB_RS28740 (sugC)-sugar-ABC-transporter
BAB_RS29105 (sugC)-sugar-ABC-transporter-ATP-binding-protein-SugCBAB_RS30105 (msrA/B(pilB))-peptide-methionine-sulfoxide-reductaseBAB_RS30470 (hitB)-iron(III)-transport-system-permease-protein-hFbpBBAB_RS31210 (ipaH2.5)-invasion-plasmid-antigen,-fragmentBAB_RS31375 (sugB)-sugar-transport-integral-membrane-protein-ABC-transporter-SugBBAB_RS31825 (bhuA)-Pollen-allergen-Poa-pIX/Phl-pVI,-C-terminal
3 讨 论
目前全基因组测序技术的发展在国内外都十分迅速,为从研究单个基因水平向基因组整体功能等方向上奠定了基础。2002年16M羊种布鲁氏菌菌株首次完成测序工作[2],猪种1330[3]、牛种2308、9-941[4]也随之公布了基因序列。测序结果显示上述3种菌株具有很高的同源性,但无论在蛋白质水平还是基因水平都存在异同[5]。在我国 A19是防控牛布病的重要疫苗[6],本研究测序A19全基因组、对生物信息学及比较基因组学汇总分析。为A19疫苗的后续实验和毒力致弱机制提供了技术支持和理论保障。
通过测序和组分分析,A19疫苗株和其它种型相比均具有很高的相似度[7]。A19基因组预测出55个tRNA(41个位于ChrⅠ上,14个位于ChrⅡ上)和12个rRNA(8个位于ChrⅠ上,4个位于ChrⅡ上)。而2308、9-941以及S19的RNA预测数一致,均为55个tRNA(41个位于ChrⅠ上,14个位于ChrⅡ上)和9个rRNA(6个位于ChrⅠ上,3个位于ChrⅡ上)[8]。布鲁氏菌104M的55个tRNA有40个位于ChrⅠ上,15个位于ChrⅡ上,且10个rRNA有7个位于ChrⅠ上,3个位于ChrⅡ上[9],作者推测这可能是由于不同的预测软件或算法导致的。
通过COG库注释,得到2 560个基因,这些基因分别不同程度的参与合成和代谢过程,如细胞膜合成、能量转化产生、转录、碳水化合物及氨基酸的运输等,这些功能与A19的毒性关联性很大。通过比对KEGG库,代谢通路富集显著的有氨基酸、膜运转、能量、碳水化合物等,这些重要的功能或富集通路与胞内运输、毒力、基因表达的调控等都有不可或缺的关系。A19与8株菌(GenBank上公布)进行比较基因组学研究,表明即使近缘关系很近的菌株在核酸水平上也存在一些插入缺失的不同。同时找出牛种毒力基因,为疫苗减毒的研究提供了分析思路。
本研究分析了A19疫苗的分子进化、基因结构和毒力因子等特征,并预测了很多有意义的蛋白质及相关的致病基因,丰富了布鲁氏菌的基因组的各种数据库。这些信息为疫苗的开发、诊断方法的建立以及后续的实验研究提供分子基础和指导方向。
利益冲突:无