绿针假单胞菌泛基因组分析及次级代谢通路挖掘
2020-11-19张春芬曹秋芬
肖 蓉,邓 舒,张春芬,曹秋芬
(1.山西农业大学果树研究所,山西太原030031;2.山西农业大学生命科学学院,山西太原030031)
假单胞菌在自然界分布广泛,其繁殖快、营养要求简单、定殖能力强,是重要的生防微生物类群[1]。其中,绿针假单胞菌(Pseudomonas chlororaphis)在植物病害生物防治中应用广泛[2-4]。张莹莹[5]研究表明,绿针假单胞菌HL5-4 对番茄灰霉病有抑制作用,同时还能促进番茄的生长。何延静等[2]在对甜椒疫霉的防治过程中,分离得到1 株绿针假单胞幽株GP72,其能强烈拮抗辣椒疫霉,对于瓜果腐霉、水稻纹枯病菌、终极腐霉等也具有良好的拮抗功能,同时,还能促进甜椒生长。杨艺炜[6]分离获得1 株Pseudomonas chlororaphis subsp. aurantiaca XF10,其菌悬液与发酵上清液均能抑制烟草黑胫病菌。MOROHOSHI 等[7]研究表明,从番茄根部获得的Pseudomonas chlororaphis subsp. aurantiaca 能够抑制番茄根腐病。JIAO 等[8]研究表明,从小麦根际分离得到1 株Pseudomonas chlororaphis subsp. auran-tiaca Pa40,其能够抑制10 种植物性病原真菌和6 种植物性病原细菌。陈亚汶等[9]研究表明,从水稻根际分离得到能够高产吩嗪-1- 甲酰胺的Pseudomonas chlororaphis HT66,其具有抑菌活性。申顺善等[10]从小麦根系中筛选到1 株绿针假单胞菌HG28-5,其对辣椒疫病具有较高的抑制活性。另外,研究表明,绿针假单胞菌还具有降解芳香化合物的功能。张子间[11]首次分离到1 株可降解石油烃的绿针假单胞菌。
因为绿针假单胞菌在病害生物防治、促生及芳香化合物降解方面的突出表现,越来越多的绿针假单胞菌完成全基因组测序。目前,从NCBI 及Ezbiocloud 数据库中能查询到的绿针假单胞菌全基因组序列分别有82 条和73 条。大量基因组数据的存在为全面了解绿针假单胞菌菌株特征提供了支撑。TETTELIN 等[12]在 2005 年提出泛基因组(pangenome)的概念,指出所有菌株都携带的基因叫核心基因(core gene),只有某些菌株(至少 2 株)携带的基因叫非必需基因(dispensable gene),只有一株菌株携带的基因叫特有基因(strain-specific gene),核心基因、非必需基因和特有基因共同构成了该物种的泛基因组。通过分析核心基因,即可了解该物种的基本生物学特征;而分析非必需基因和特有基因,则可以了解该物种的各种特定功能,比如与抗病性相关的次级代谢产物合成基因,与菌株定殖相关的编码菌毛结构的基因等。因此,泛基因组分析能够帮助快速了解一个物种的基本特征,并理解菌株表型及功能多样性。
本研究从NCBI 和Ezbiocloud 数据库中找到46 株有详细分类学信息且有完整基因组测序信息的绿针假单胞菌,对这46 株菌进行了泛基因组分析,确定其泛基因组特征;利用antiSMASH 软件对46 株绿针假单胞菌的次级代谢基因簇进行预测,挖掘其可能产生的活性物质,旨在对绿针假单胞菌的基因组信息进行探索,为全面描述绿针假单胞菌的特征及菌株应用奠定基础。
1 材料和方法
1.1 材料
从 NCBI 数据库(https://www.ncbi.nlm.nih.gov/)及Ezbiocloud 数据库[13](https://www.ezbiocloud.net/)中查找并下载46 株绿针假单胞菌的基因组信息,所有信息均来自2020 年5 月25 日之前的版本。
1.2 方法
1.2.1 基因组平均遗传相似度(Average Nucleotide Identity,ANI)分析 使用在线软件(http://enve-omics.ce.gatech. edu/g-matrix/)中 的 ANI/AAI matrix[14]对46 株绿针假单胞菌进行基因组平均遗传相似度分析,研究基因组之间的进化距离。
1.2.2 基因组系统发育分析 将表1 中菌株对应的fasta 格式基因组数据上传至REALPHY(http://realphy.unibas.ch/realphy)进行全基因组比对[15],以Pseudomonas chlororaphis subsp. chlororaphis DSM_50083 为参考基因组,采用最大似然(ML)算法,使用默认参数运行。运行结果使用FigTree v1.4.4 软件(http://tree.bio.ed.ac.uk/software/figtree/)重构进化树。
1.2.3 泛基因组和核心基因组分析 下载并安装BPGA 软件包(https://sourceforge.net/projects/bpgatool/)[16],从 NCBI 上获取 46 株绿针假单胞菌的蛋白质序列,输入蛋白质序列,采用默认参数设置对46个基因组进行泛基因组和核心基因组分析。
1.2.4 次级代谢产物合成基因簇分析 利用在线软件antiSMASH 5.0[1(7]https://antismash.secondarym etabolites.org)的细菌分析模块,选择relaxed 预测模式进行次级代谢产物合成基因簇分析,参数选用网站默认值。
2 结果与分析
2.1 绿针假单胞菌基因组基本数据分析
从NCBI 和Ezbiocloud 数据库中获得的 46 株组装到完整基因组水平的绿针假单胞菌基本特征如表1 所示,可以看出,46 株绿针假单胞菌共分为4 个亚种,分别为Pseudomonas chlororaphis subsp.aurantiaca、Pseudomonas chlororaphis subsp. aureofaciens、Pseudomonas chlororaphis subsp. chlororaphis和Pseudomonas chlororaphis subsp. piscium;基因组大小在6.61~7.23 Mb,GC 含量为62.0%~63.2%,预测的基因范围是5 915~6 432 个。
2.2 基因组平均遗传相似度(ANI)分析
ANI 分析是在全基因组水平评估物种间亲缘关系的有力工具,尤其适合区分近缘物种。基于全基因组序列的ANI 比较矩阵图1 可以看出,除Pseudomonas chlororaphis subsp.chlororaphis TAMO-ak81 外,其余45 株参考菌株两两比较的ANI 值都在95%以上,而95%是大家公认的界定同种的阈值。各个亚种内部ANI 值更是高达100%,这与已知的菌株基本信息相符。Pseudomonas chlororaphis subsp.chlororaphis TAMOak81 与Pseudomonas chlororaphis subsp. piscium 的 6 株菌(ATCC17809、ATCC17411、ZJU60、DTR133、PCL1391 和 DSM21509)ANI 值仅为94%,说明TAMOak81 与这6 株菌亲缘关系稍远。
表1 46 株绿针假单胞菌基因组信息
2.3 基因组系统发育分析
在REALPHY 在线网站上将46 株绿针假单胞菌基因组进行了比对,去除由重组引起的SNP,然后以Pseudomonas chlororaphis subsp.chlororaphis DSM_50083 为参考基因组,将剩余的SNP 选择最大似然法,构建进化树(图2),可见这46 株绿针假单胞菌由4 个相对独立的亚群演化而成,Pseudomonas chlororaphis subsp. piscium ATCC 17809 和ATCC 17411 这2 株菌与其他同亚种菌株亲缘关系较远。
2.4 核心基因组和泛基因组分析
对46 株绿针假单胞菌进行泛基因组分析,结果表明,46 株菌共有271 910 个功能基因,共鉴定出13 296 个基因家族。从图3 可以看出,46 株菌共有的核心基因家族有3 653 个,占绿针假单胞菌泛基因组的27.5%;非必需基因家族有5 675 个,占绿针假单胞菌泛基因组的42.7%;只有1 株菌株含有的特有基因家族有3 968 个,占绿针假单胞菌泛基因组的29.8%。Pseudomonas chlororaphis subsp. aurantiaca B25 的特有基因家族最多,有 484 个;Pseudomonas chlororaphis subsp. aurantiaca 464 的特有基因家族最少,只有1 个。
BPGA 分析计算了绿针假单胞菌基因组数目、核心基因组和泛基因组之间的关系(图4),可以看出,泛基因组大小(f(x))与基因组数目(x)关系的拟合方程为f(x)=5 171.77x0.2388;核心基因个数(f1(x))与基因组数(x)关系的拟合方程为 f1(x)=5 035.38e-0.0073x。根据拟合方程可以看出,随着绿针假单胞菌基因组测序数量的增加泛基因组增加,而核心基因组则逐渐减少。因此,可以推测绿针假单胞菌的泛基因组目前仍然是开放的。
2.5 次级代谢产物合成基因簇预测
用AntiSMASH 在线工具识别和预测具有编码次生代谢产物功能的基因簇,结果发现,绿针假单胞菌合成次级代谢产物能力较强,每株菌均能预测到12~17 个次级代谢基因簇,基因簇多少与基因组大小无直接相关性。46 株菌总共预测到643 个基因簇,共注释到27 类,按被注释到的频次多少排序可知(图5),非核糖体肽合成酶(NRPS)出现频次最高,为120 次;然后依次为细菌素(bacteriocin,90次),高丝氨酸内酯(hserlactone,60 次),芳基多烯(arylpolyene,48 次),NRPS-like(45 次),β 内酯(betalactone,43 次),铁载体(siderophore,42 次)。说明已经测序的46 株绿针假单胞菌的主要次级代谢产物可能是细菌素、高丝氨酸内酯、芳基多烯和铁载体类化合物。在全部预测到的基因簇中,有408 个与已知基因簇存在一定同源性,其中,同源性大于70%的有35 个(表2);同源性为100%的有32 个,主要是吡咯菌素(pyrrolnitrin)和绿脓菌素(pyocyanine),说明绿针假单胞菌4 个亚种普遍具有产生吡咯菌素和绿脓菌素的能力。而大量同源性较低的基因簇预示着绿针假单胞菌中存在大量新的次级代谢产物。
按亚种分类统计,绿针假单胞菌4 个亚种预测到的次级代谢基因簇类型数量分别为Pseudomonas chlororaphis subsp. aurantiaca 22 类 ,Pseudomonas chlororaphis subsp. aureofaciens 16 类,Pseudomonas chlororaphis subsp. chlororaphis 16 类,Pseudomonas chlororaphis subsp. piscium 15 类。4 个亚种共同拥有的次级代谢基因簇类型有10 种,分别为高丝氨酸内酯、非核糖体肽合成酶、丁内酯(butyrolactone)、细菌素、铁载体、β 内酯、NRPS-like、芳基多烯、NAGGN 以及吩嗪与高丝氨酸内酯杂合基因簇。说明绿针假单胞菌的4 个亚种均能够分泌细菌素、吩嗪、铁载体、丁内酯等。Pseudomonas chlororaphis subsp.aurantiaca 拥有的独有次级代谢基因簇类型比较丰富,有6 个,包括 ectoine、T1PKS、丁内酯等几个杂合基因簇。预示该亚种能够分泌更多的其他潜在生物活性物质。
表2 相似度大于70%的获注释已知次级代谢产物基因簇
3 结论与讨论
本研究在NCBI 数据库获得46 株进行了全基因组测序并组装到完整基因组水平的绿针假单胞菌菌株,泛基因组分析发现,这46 株绿针假单胞菌泛基因组中包含271 910 个功能基因,共鉴定出13 296 个基因家族,其中,核心基因家族有3 653 个、非必需基因家族有5675 个、特有基因家族有3968 个。通过计算发现,随绿针假单胞菌基因组测序数量增加泛基因组增加,而核心基因组逐渐减少,说明绿针假单胞菌泛基因组目前仍是开放的。
通过对46 株绿针假单胞菌的次级代谢产物合成基因簇预测分析发现,绿针假单胞菌合成次级代谢产物能力较强,每株菌均能预测到12~17 个次级代谢基因簇。46 株菌总共预测到643 个基因簇,共注释到27 类,其中,4 个亚种都共同拥有的次级代谢基因簇类型有10 种,分别为高丝氨酸内酯、非核糖体肽合成酶、丁内酯(butyrolactone)、细菌素、铁载体、β 内酯、NRPS-like、芳基多烯、NAGGN 以及吩嗪与高丝氨酸内酯杂合基因簇。说明绿针假单胞菌的4 个亚种均能分泌细菌素、吩嗪、铁载体、丁内酯等。
目前,已经证实,在假单胞菌中存在的抗生素主要有吩嗪类、藤黄绿菌素(Pyoluteorin)、2,4- 二乙酰基间苯三酚(2,4-diacetylphloroglucinol)、氢氰酸(HCN)、粘质酰胺(Viscosinamide)和硝吡咯菌素(Pyrrolnitrin)等[18]。黄玲[19]研究指出,绿针假单胞菌GP72 产生的主要抗菌活性物质为吩嗪-1- 羧酸(phenazine-1-carboxilic acid,PCA) 和 2- 羟基吩嗪(2-hydroxyphenazine,2-OH-PHZ)。其中,PCA 有效防治甜椒疫病和西瓜炭疽病的作用已经得到了国际上的广泛认可,并且其作为新型农药申嗪霉素的主要成分,已经申请了专利。PIERETTI 等[20]从番茄根分离到Pseudomonas chlororaphis subsp.aureofaciens M71,能够产生 2 种吩嗪类物质。CARLIER 等[21]从大豆根际分离到Pseudomonas chlororaphis subsp. aurantiaca SR1 能产生铁载体、HCN 和激素类物质;JIAO 等[8]研究表明,从小麦根际分离得到Pseudomonas chlororaphis subsp. aurantiaca Pa40 能够产生HCN、蛋白酶、铁载体;张莹莹等[5]研究表明,绿针假单胞菌HL5-4 能产生蛋白酶、纤维素酶和嗜铁素;杨艺炜[6]研究发现,绿针假单胞菌XF10 能产生蛋白酶、纤维素酶和5 种有抑菌作用的挥发性酮类产物(2- 壬酮、2- 壬醇、2- 癸酮、2- 十一烷酮、2-十三烷酮);熊欣等[22]、CHEN 等[23]研究表明,生防绿针假单胞菌HT66 的主要代谢产物为吩嗪-1- 甲酰胺,此外,HT66 还可合成铁载体、杀虫蛋白Fit D(Pseudomonas fluorescens insecticidal toxin D)、HCN、Achromobactin(Acr)和脂肽类产物黏液菌素等产物。大量研究已证实,绿针假单胞菌确实有产生多种次生代谢产物的功能,这些次生代谢产物在抑制病原菌、促进植物生长、帮助菌株定殖、菌株的运动性、生物膜形成和代谢等方面发挥着重要作用。同时,本研究还发现,46 株绿针假单胞菌中存在大量同源性较低的基因簇,预示着绿针假单胞菌中有大量新的次级代谢产物,其还有待进一步深入挖掘。
本研究对46 株绿针假单胞菌完整基因组分析发现,其泛基因组含有271 910 个功能基因,13 296 个基因家族,其中,核心基因家族有3 653 个,特有基因家族有3 968 个。次级代谢产物合成基因簇预测显示,共挖掘到27 类、643 个基因簇,其中,4 个亚种都共同拥有的次级代谢基因簇类型有10 种;绿针假单胞菌中还有大量未开发的次级代谢产物,在植物抗病、促生等方面有巨大的应用潜力。