一株产低温蛋白酶地衣芽胞杆菌NWMCC0046全基因组测序及分析
2023-02-02余金凤MohdSobriTakriff马忠仁丁功涛周雪雁张福梅
周 魏, 余金凤, Mohd Sobri Takriff , 向 军, 马忠仁, 丁功涛, 周雪雁,2*, 张福梅*
(1.西北民族大学 生物医学研究中心,甘肃 兰州 730030;2.西北民族大学 生命科学与工程学院,甘肃 兰州 730124;3.Universiti Kebangsaan Malaysia, Department of Chemical and Process Engineering, Selangor Bangi 43600 MALAYSIA)
地衣芽胞杆菌(Bacilluslicheniformis)是一种使用广泛的益生菌,具有对环境友好、促进动物体免疫功能和消化功能等优良特点[1-2]。地衣芽胞杆菌能产生多种抗菌物质及生物活性物质,是近年来病原菌的生物防治、动物饲料和废物处理等相关领域的研究重点[3]。除此之外,其产生的淀粉酶、纤维素酶和蛋白酶等应用于酶制剂行业[4-7]。其中,蛋白酶对于洗涤剂、食品、制药、皮革和废物处理等行业具有重要意义[8]。而低温活性蛋白酶由于其结构的灵活性和较高的转化数(Kcat),已成为目前研究热点[9]。该菌功能基因可通过全基因组测序深入了解,通过克隆表达地衣芽胞杆菌相关酶基因生产重组酶以满足不同行业的需求备受研究者青睐[10]。此外,利用全基因组测序和比较基因组学分析从地衣芽胞杆菌挖掘次级代谢产物也备受关注。本研究前期从土壤中分离得到一株地衣芽胞杆菌菌株NWMCC0046,该菌株所产的碱性蛋白酶在低温下具有良好活性。作为一株具有重大潜力的益生菌,传统的试验分析和鉴定方式难以全面解析该菌的功能基因[11]。为深入研究菌株NWMCC0046,本研究使用PacBio RS II平台和Illumina HiSeq 4000平台对该基因组进行了测序,同时利用数据库(GO、KEGG、COG和CAZy)挖掘菌株NWMCC0046的功能基因,预测菌株NWMCC0046的次级代谢产物以及菌株NWMCC0046和近缘菌株的差异性比较分析,以期为高效开发利用菌株NWMCC0046提供生物信息学基础。
1 材料与方法
1.1 材料
1.1.1 菌种来源 地衣芽胞杆菌(Bacilluslicheniformis)NWMCC0046分离自西藏日喀则地区屠宰场废弃血污放置土壤[12]。
1.1.2 培养基 ①LB培养基;②发酵培养基(g/L):豆粕50,葡萄糖10,酵母浸膏13.46,CaCl20.5,Na2HPO4·12H2O 4,KH2PO40.3,pH 7.5。
1.1.3 主要试剂与仪器设备 干酪素(上海阿拉丁公司);福林酚(北京索莱宝科技有限公司)。超净工作台(SW-CJ-1F,苏州安泰空气技术有限公司);台式压力蒸汽灭菌器(MOST-T24,山东新华医疗器械股份有限公司);隔水式培养箱(GNP-9160,上海精宏实验设备有限公司)。
1.2 方法
1.2.1 去污试验 取冻存菌株NWMCC0046于LB培养基活化2代得种子液,将种子液按4%(体积分数)接种到发酵培养基中培养48 h。收集发酵液,5 000 r/min离心10 min,上清液经初步分离纯化后得到活性较高的蛋白酶(结果未显示)。采用茶、咖啡、可乐、巧克力和血液染色过的白色纱布(6.0 cm×7.5 cm),研究蛋白酶作为洗涤剂添加酶在低温下的去污效果。在加入蛋白酶之前,将洗涤剂溶液(Tide, 7 mg/mL)在90 ℃下孵育1 h,使洗涤剂中存在的内源性蛋白酶失活。20 ℃孵育30 min后,将纱布取出,冲洗干净,然后干燥。观察酶对不同污渍的去除效果,未经染色处理的纱布作为对照。
1.2.2 全基因测序与组装 使用PacBio RS II平台和Illumina HiSeq 4000平台对菌株NWMCC0046的基因组进行测序。
1.2.3 基因组组分分析 Glimmer软件(v3.02)用于组装结果的基因预测[13];rRNA由RNAmmer软件(v1.2)预测[14];tRNA区域和二级结构通过tRNAscan-SE软件(v1.3.1)预测[15];sRNA由Infernal软件与Rfam数据库(v9.1)获得[16]。通过TRF软件(Tandem Repeat Finder, v4.04)预测串联重复序列[17]。通过PhiSpy软件(v3.7.8)预测前噬菌体prophage[18];CRISPRCasFinder软件(v4.2.19)用于识别CRISPRs[19]。
1.2.4 基因功能分析 ①基因功能注释:使用基因本体论(Gene Ontology,GO)[20]、同源基因族(Clusters of Orthologous Groups,COG)[21]、京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)[22]、碳水化合物相关酶(Carbohydrate-Active enZYmes Database,CAZy)[23]四个数据库进行一般功能注释。②比较基因组学与系
统发育分析:目标基因组和参考基因组间的共线性关系使用MUMmer软件(v3.23)进行比对。使用LASTZ(v1.03.54)确定基因组之易位和倒置等区域。采用Treebest(Neighbor-Joining, NJ)软件(v1.9.2)基于基因家族构建进化树。③次级代谢产物分析:利用anti-SMASH 3.0 (https://fungismash.secondarymetabolites.org)对菌株NWMCC0046中次级代谢产物合成基因簇进行预测[24]。
2 结果与分析
2.1 去污效果
碱性蛋白酶能将难溶的蛋白类大分子分解成较小的肽段,而肽段容易溶解在水中或被表面活性剂乳化,从而达到更佳的去污效果。当洗涤剂(Tide)与菌株NWMCC0046碱性蛋白酶在20 ℃下联合使用时,去污效果比单独使用洗涤剂更好(图1)。相比传统的加酶洗涤剂,低温蛋白酶的洗涤剂将会更受欢迎,因为它能够弥补洗涤剂在低温时去污力的不足。
图1 地衣芽胞杆菌NWMCC0046碱性蛋白酶的去污效果Fig.1 Stain removal activity of the alkaline protease from B. licheniformis NWMCC0046对照组为未经处理的纱布;洗涤剂组仅用洗涤剂处理;洗涤剂+蛋白酶组为二者联合去污。洗涤剂(Tide)7 mg/mL,菌株NWMCC0046的蛋白酶活性281.91 U/mLControl group is the gauze without any treatment;Detergent group is treated with detergent only; Detergent plus protease group is the combined decontamination of both. Detergent (Tide) 7 mg/mL, protease activity of NWMCC0046 281.91 U/mL
2.2 菌株NWMCC0046全基因组概况
菌株 NWMCC0046全基因组大小为4 321 565 bp,GC含量为46.78%,含4 504个编码基因;含有串联重复序列(Tandem Repeat, TR)71个,总长度为15 438 bp;50个小卫星(Minisatellite) DNA,总长度为6 096 bp;微卫星(Microsatellite) DNA 5个,总长为 10 103 bp。含有 tRNA 81个,5S rRNA、16S rRNA 和 23S rRNA各8个,sRNA 42个。菌株NWMCC0046全基因组图谱如图2所示,菌株NWMCC0046的全基因组信息与其近缘芽胞杆菌(Bacillus)比较分析结果见表1。
表1 地衣芽胞杆菌NWMCC0046全基因组特征及其与其他近缘芽胞杆菌比较
图2 菌株NWMCC0046全基因组图谱Fig.2 Complete genome mapping of strain NWMCC0046图A最外圈为基因组序列位置坐标,由外到里,分别为编码基因、基因功能注释结果(包含COG、KEGG、GO数据库的注释结果信息)、ncRNA、基因组GC含量(向内的红色部分表示该区域GC含量低于全基因组平均GC含量,向外的绿色部分与之相反,且峰值越高表示与平均GC含量差值越大)、基因组GC skew值(以G-C/G+C表示,向内的粉色部分表示该区域G的含量低于C的含量,向外的浅绿色部分与之相反)。图B表示NWMCC0046基因组中COG、KEGG和GO基因功能注释分析以及ncRNA分类,不同颜色代表不同功能,各大功能数据库的颜色无任何相关性The outermost circle of figure A is the genomic sequence position coordinates. From the outside to the inside, they are coding genes, gene function annotation results (containing annotation result information from COG, KEGG, GO databases), ncRNA, GC content (inward red part indicates that the GC content of the region is lower than the average GC content of the whole genome, outward green part is the opposite, and the higher peak indicates the greater difference with the average GC content), GC skew value (expressed as G-C/G+C, inward pink part indicates that the G content of the region is lower than the C content, the outward light green part is the opposite). Figure B indicates the functional annotation analysis of COG, KEGG and GO genes in NWMCC0046 genome and ncRNA classification, various colors mean that different functions and the colors of major functional databases do not have any correlation
2.3 基因功能注释
2.3.1 GO注释结果 通过GO数据库注释,得到菌株NWMCC0046功能基因的分布情况如图3所示。GO数据库按照生物过程(Biological Process)、细胞组分(Cellular Component)、分子功能(Molecular Function) 三个方面对基因进行注释。细胞过程(Cellular Process)和代谢过程(Metabolic Process)相关编码基因各有1 387、1 372个,表明该菌具有高度的代谢活性;在细胞组分中,共955个基因得到注释,其中有713个与细胞结构实体(Cellular anatomical entity)编码基因表现出高相关性;分子功能分支共3 036个注释结果,其中结合(Binding)、催化活性(Catalytic Activity)和转运活性(Transporter Activity)有关编码基因分别为1 008、1 498、255个。
图3 基于GO注释的功能基因的分布情况Fig.3 Distribution of functional genes based on GO annotationBP:生物过程;CC:细胞组分;MF:分子功能BP:Biological process; CC:Cellular component; MF:Molecular function
2.3.2 COG注释结果 将菌株NWMCC0046基因组中的编码基因与COG数据库进行比对,共有3 132个蛋白编码基因被注释到(图4)。它们大多集中在碳水化合物的运输和代谢(carbohydrate transport and metabolism)以及氨基酸的运输和代谢(amino acid metabolism)。此外,α-淀粉酶、三糖磷酸酯异构酶、6-磷酸甘露糖异构酶和6-磷酸葡萄糖异构酶等众多酶类的编码基因也存在于NWMCC0046基因组中。α-淀粉酶作为工业上广泛使用的一种具有广泛底物偏好和产品特异性的酶,可产生葡萄糖和麦芽糖。此外,我们发现了编码运输各种底物,包括氨基酸、肽、糖、铁、核苷酸和其他小分子的MFS超家族转运蛋白(major facilitator superfamily, MFS)的44个编码基因。磷酸转移酶系统(The phosphotransferase system, PTS)和ABC转运体系统(ABC transporter system, ABC)在促进宿主能量储存和代谢方面发挥着关键作用[25]。在地衣芽胞杆菌NWMCC0046的全基因组中共发现了65个参与PTS系统的基因,如编码蔗糖的scrA基因、编码纤维二糖的celB基因和编码抗坏血酸的ulaA基因。此外,菌株NWMCC0046的基因组中还有ABC转运渗透酶、ABC转运ATP结合蛋白和氨基酸ABC转运渗透酶。细菌通过碳水化合物磷酸转移酶系统将许多碳水化合物运送到细胞中,促进了新陈代谢过程。这些结果表明,菌株NWMCC0046具有降解蛋白质和碳水化合物的良好潜力,对于胃肠道具有特殊的适应性。
图4 基于COG注释的功能基因的分布情况Fig.4 Distribution of functional genes based on COG annotation
2.3.3 KEGG注释结果 在 KEGG 数据库中,对应到 KEGG代谢通路的2 602个基因富集在226条代谢通路中。碳水化合物代谢(carbohydrate metabolism)、氨基酸代谢(amino acid metabolism)和膜运输(membrane transport)是最主要的三种代谢通路,分别有315、234和191个基因注释结果;此外,辅酶和维生素的代谢(metabolism of cofactors and vitamins)、信号转导(signal transduction)、能量代谢(energy metabolism)、核苷酸代谢(nucleotide metabolism)、脂质代谢(lipid metabolism)通路与菌株也具有较高的相关性(图5)。地衣芽胞杆菌NWMCC0046含有编码多种胞外蛋白酶的基因(aprX、apre、epr、vpr、isp)以及多种内肽酶和外肽酶等酶的基因(Glup、degP、htrA、sppA、amps、bpr、dacC)。此外,还发现了多种酶(表2)。菌株NWMCC0046含有多种抗氧化酶的编码基因,如与完整的硫氧还蛋白有关的基因,包括三个编码硫氧还蛋白的trxA基因,两个编码硫氧还蛋白还原酶的trxB基因,三个编码硫醇过氧化物酶的tpx基因。结果显示该菌参与了包含苯丙氨酸和色氨酸等芳香族氨基酸代谢途径,表明该菌可为食品提供特定的风味。此外,我们还发现了参与抗生素、生物降解等代谢过程有关基因以及可调控免疫和炎症的通路(包括IL-17信号通路和NOD-like受体信号通路)的组织系统通路相关基因。该菌还存在着多样且复杂的调节基因和信号传递系统(群体效应),可调控植物的病原菌的致病机制。
表2 地衣芽胞杆菌NWMCC0046基因组中鉴定的部分酶
图5 基于KEGG注释的功能基因的分布情况Fig.5 Distribution of functional genes based on KEGG annotation
2.3.4 CAZy功能分析 根据CAZy预测结果,菌株NWMCC0046含79个糖苷水解酶(Glycoside Hydrolases, GHs)和34个糖苷转移酶(Glycosyl Transferases, GTs)。GHs和GTs是一组关键酶,可以水解碳水化合物的糖苷键,并负责维持被宿主免疫系统识别的表面结构[26]。菌株NWMCC0046包含壳聚糖酶(chitosanase, EC 3.2.1.132)、几丁质酶(chitinase, EC 3.2.1.14)、β-葡萄糖苷酶(β-glucosidase, EC 3.2.1.21)、乙酰木聚糖酯酶(acetyl xylan esterase, EC 3.1.1.72)、纤维素酶(cellulase, EC 3.2.1.4)、地衣酶(licheninase, EC 3.2.1.73)等酶的编码基因。地衣酶在动物饲料、酿酒、生物燃料等产业中发挥关键作用,可与其他酶协同作用生产生物乙醇,包括通过生物转化各种植物木质纤维素。地衣芽胞杆菌在土壤中广泛存在的原因之一在于其能利用这些酶维持自身正常代谢。CAZy数据库表明菌株NWMCC0046具有优秀的益生菌能力,可用于病原体的防御和工业酶的生产。
2.4 菌株NWMCC0046的进化和比较基因组学分析
利用基因家族构建物种进化树(图6),结果表明菌株NWMCC0046与B.licheniformisATCC14580、B.licheniformisDSM30615、B.licheniformisATCC9789、B.licheniformisTCCC11148处于同一分支,其亲缘关系特别近,同属地衣芽胞杆菌。菌株NWMCC0046与B.licheniformisATCC14580的全基因组共线性分析表明,两株基因组高度相似,但存在翻转、易位等基因组重排(图7)。两者在氨基酸水平上既相似,又有独特之处。生存环境不同导致两株菌基因组及功能有差异, 菌株NWMCC0046存在大量环境信息处理相关基因。
图6 物种间的进化关系图Fig.6 Map of evolutionary relationships among species海内氏芽胞杆菌NRRLB-41327作为外群,分支长度表示进化距离的大小Bacillus haynesii NRRLB-41327 as an outgroup, and the branch length indicates the evolutionary distance
图7 地衣芽胞杆菌NWMCC0046与ATCC14580的共线性分析Fig.7 Synteny analysis of B. licheniformis NWMCC0046 and B.licheniformis ATCC14580上行为样品基因组,下行为对照基因组。褐色代表基因组序列的正向链;蓝色代表基因组序列的反向链;粉色代表共线性区域;青绿色代表易位区域;黄色代表倒置区域;绿色代表易位兼倒置的区域The upper row is the sample genome and the lower row is the reference genome. Brown indicates the forward strand of the genome sequence; blue represents the reverse strand of the genome sequence; pink means the co-linear region; turquoise represents the translocation region; yellow represents the inverted region; green stands for the translocation-cum-inversion region
2.5 次级代谢产物合成基因簇
采用anti-SMASH对菌株NWMCC0046基因组进行次级代谢产物分析,预测得到11个次级代谢产物基因簇,结果见表4。其中包含5类具有抗菌活性的物质:地衣素(lichenysin)、丰原素(fengycin)、杆菌肽(bacitracin)、杆菌素(bacillibactin)和丁酰苷菌素(butirosin)。菌株NWMCC0046基因组中还存在6种功能未知的基因簇,其中嗜铁素(siderophore)、III型聚酮合成酶(Type Ⅲ polyketide synthase,T3PKS)、萜类(Terpene)、核糖体合成和翻译后修饰的肽(RiPP)、环二肽合酶(CDPS)和套索肽(lassopeptide)各一种。与其亲缘关系较近的芽胞杆菌属相比,菌株NWMCC0046含有额外的次级代谢产物基因簇,结果见表5。这表明菌株NWMCC0046中可能存在合成新物质的基因簇,再加上其独特的生物夺氧作用机制,在农业方面具有较大应用潜力。
表4 菌株NWMCC0046次级代谢产物合成基因簇
表5 近缘芽胞杆菌间次级代谢产物基因簇对比表
3 讨 论
本文研究了菌株NWMCC0046所产低温蛋白酶在洗涤行业的应用潜力,使用PacBio RS II平台和Illumina HiSeq 4000平台对菌株NWMCC0046基因组进行了测序,得到了菌株NWMCC0046的基因组序列信息。该蛋白酶能作为洗涤剂添加酶有效去除污渍,菌株NWMCC0046基因组中存在众多蛋白酶编码基因以及工业酶基因。与众多数据库比对结果表明,该菌具有优秀的益生菌潜力,包括抗氧化活性、抗菌活性。菌株NWMCC0046基因组中包含了抗生素和生物降解等代谢过程。此外,其独特的胃肠道适应性以及优秀的氨基酸代谢能力为其在饲料行业奠定基础。通过比较基因组分析,菌株NWMCC0046为地衣芽胞杆菌,与地衣芽胞杆菌ATCC14580具有良好共线性。同时发现了几种重要的次级代谢产物,是具有很大应用潜力的一株益生菌。
地衣芽胞杆菌NWMCC0046碱性蛋白酶在低温下的去污效果表明其在洗涤行业的巨大潜力。低温蛋白酶在保证催化效率的前提下可以降低反应温度和缩短反应时间,在洗涤剂配方、食品行业和其他生物技术实践中有很大优势。地衣芽胞杆菌NWMCC0046除了能产蛋白酶外,还预测到几丁质酶、壳聚糖酶、地衣酶以及α-淀粉酶的编码基因。此外,菌株NWMCC0046对于胃肠道独特的适应性表明其在饲料行业的潜力,通过添加地衣芽胞杆菌的饲料可以有效提高粗蛋白的消化率[27],有效替代抗生素[28],调节肠道菌群结构改善肠道健康[29]。通过全基因组序列分析预测到菌株NWMCC0046还具有抗氧化活性和抗菌活性。Qin等[30]研究表明地衣芽胞杆菌可以有效改善草鱼抗氧化能力,包括血清中超氧化物歧化酶(SOD)活性的提高和丙二醛(MDA)水平的降低,以及肠道中抗氧化酶(MnSOD)和过氧化氢酶(CAT)mRNA水平的上调。Zhao等[31]通过添加含地衣芽胞杆菌的日粮饲喂肉鸡,结果表明地衣芽胞杆菌可改善回肠、血清和肝脏中抗氧化酶的活性。地衣芽胞杆菌包括其产生的生物活性物质可以有效抑制病原菌的生长[32]。芽胞杆菌属之间的亲缘关系特别近,利用16S rRNA基因序列和脂肪酸谱分类等常规手段无法准确区分;菌株NWMCC0046经16S rRNA基因序列比对,发现其与B.haynesiiNRRLB-41327亲缘性高达99.74%,但这样的结果似乎不太精确。利用基因家族确定菌株NWMCC0046的精准分类,结果表明其与地衣芽胞杆菌同属一个分支。同时测序结果表明菌株NWMCC0046基因组成分B.licheniformisATCC14580共线性较好。但由于两株菌来源不同,独特环境使菌株NWMCC0046编码许多独特功能基因,因此基因组出现了重排现象。微生物产生的次级代谢产物具有多种多样的化学结构和生物活性,有很高的价值。地衣素与丰原素可以通过破坏细胞膜的完整性来抑制真菌的生长[33]。杆菌肽属多肽类抗生素,通过特异性地抑制细菌细胞壁合成阶段的脱磷酸化起到抗菌作用[34]。El-Deep等[35]利用杆菌肽能显著降低梭菌及大肠埃希菌的数量,并能显著提升肠道中乳杆菌的数量。本研究中发现的丁酰苷菌素基因簇与BGC0000693来源的最高相似度仅为7%,说明该基因簇可能合成新的抑菌物质。植物可以利用微生物产生的嗜铁素所螯合的铁, 改善植物的铁营养, 以防治碱性缺铁土壤植物缺铁失绿症[36-37],推测菌株NWMCC0046可用于防治植物病害。综上所述,本研究表明地衣芽胞杆菌NWMCC0046是具有潜在功能的益生菌,实验结果为地衣芽胞杆菌NWMCC0046益生菌特性提供了新的分子基础见解。