APP下载

长双歧杆菌NCC2705分泌蛋白的全基因组预测和功能分析

2016-09-08朱德全王茗悦栗金柳孟祥晨程广东岳丽红王长平

安徽农业科学 2016年20期
关键词:肽酶信号肽双歧

朱德全,王茗悦,栗金柳,孟祥晨,程广东,岳丽红,王长平,薛 勇

(1.佳木斯大学生命科学学院,黑龙江佳木斯 154007;2.东北农业大学乳品科学教育部重点实验室,黑龙江哈尔滨 150030)



长双歧杆菌NCC2705分泌蛋白的全基因组预测和功能分析

朱德全1,2,王茗悦1,栗金柳1,孟祥晨2*,程广东1,岳丽红1,王长平1,薛 勇1

(1.佳木斯大学生命科学学院,黑龙江佳木斯 154007;2.东北农业大学乳品科学教育部重点实验室,黑龙江哈尔滨 150030)

以长双歧杆菌NCC2705基因组序列为研究对象,使用 SignalP 4.0、LipoP 、TMHMM 2.0 软件分析该基因组中的分泌蛋白及其信号肽的类型,同时采用COG (Cluster of Orthologous Groups of proteins)功能数据库对预测的分泌蛋白进行功能注释和聚类分析。结果表明,长双岐杆菌NCC2705 中共有37个Sec 途径分泌蛋白,其中Sec 途径分泌蛋白包括27个被I 型(SPase Ⅰ)信号肽酶和10个 Ⅱ 型信号肽酶(SpaseII)识别的蛋白,Sec 途径分泌蛋白信号肽长度最多的有52 个氨基酸,最少的有10个氨基酸。分泌蛋白的功能分析表明,该菌株分泌蛋白中含有大部分的假定蛋白,主要参与氨基酸代谢与转运、碳水化合物代谢转运,无机盐离子代谢转运,细胞壁和细胞膜生物合成的功能有关。

长双歧杆菌;基因组;分泌蛋白;分泌途径;信号肽

双歧杆菌是人和动物肠道最常见的革兰氏阳性有益细菌,约占人体肠道可培养微生物的10%。大量研究表明,双歧杆菌对宿主具有多种益生功能,可以通过平衡肠道菌群维持机体的整体健康水平。因此,双歧杆菌属的微生物是应用较多的益生菌之一,在食品中通常通过添加在乳制品中食用。双岐杆菌的分泌蛋白在介导菌体与宿主细胞黏附定值、与外界环境相互作用方面起着非常重要的作用[1]。Mac Conaill等[2]从输出系统鉴定了双岐杆菌的分泌蛋白,Moon GS 利用基于凝胶的蛋白组学方法初步分析了假小链双歧杆菌(BifidobacteriumpseudocatanulatumBP1)的分泌蛋白[3],但这些方法都不能完全鉴定出双歧杆菌的分泌蛋白。随着第1株双歧杆菌NCC2705全基因组测序的完成,从基因组层面上部分揭示了该菌在消化道环境的适应特征[4]。此后,在全世界范围内掀起了双歧杆菌全基因组测序的浪潮,截至2015年4月已有超过47株双歧杆菌全基因组完成序列测定并向国际公共数据库NCBI递交了全基因组序列。因此,使得利用基因组学数据进行功能基因组学分析得以实施,如分泌蛋白的基因组预测和分析。

目前,关于基因组分泌蛋白分析的研究报道主要集中在病原菌方面[5-7]。周晓罡等[6]对马铃薯晚疫病菌全基因组分泌蛋白进行了初步分析。笔者以长双歧杆菌亚种NCC2705全基因组序列为研究对象,使用 SignalP 4.0、LipoP、TMHMM 2.0软件分析该基因组中的分泌蛋白和分泌信号肽的类型,同时采用COG数据库对预测的分泌蛋白进行功能注释和聚类分析。

1 材料与方法

1.1材料以美国国立生物技术信息中心(NCBI)网站GenBank数据库公布的长双歧杆菌NCC2705 的基因组序列的编码蛋白质为研究对象,GenBank数据库中的登录号为NC_004307.2。

1.2方法

1.2.1Sec 途径分泌蛋白的筛选。Sec途径分泌蛋白包括具有SPase Ⅰ肽酶识别和SPase Ⅱ 肽酶识别的分泌蛋白。使用SignalP 4.0 软件(http://www.cbs.dtu.dk/services/SignalP)对长双岐杆菌NCC2705基因组蛋白进行初筛,若Sprob>0.8或Smean>0.6则初步认为具有信号肽,使用TMHMM 2.0 软件(http://genome.cbs.dtu.dk/services/TMHMM/)对含有信号肽的序列进行分析,分析是否具有跨膜螺旋,对于没有跨膜螺旋或只有1个跨膜螺旋的蛋白进行进一步分析。使用LipoP1.0 软件(http://www.cbs.dtu.dk/services/LipoP/)分析是否可以被SPase Ⅰ 型信号肽酶和II 型信号肽酶识别,其中不能被I 型信号肽酶识别但可以被II 型信号肽酶识的蛋白则被归类为SPase Ⅱ 肽酶识别的分泌蛋白[8]。

1.2.2Sec 途径分泌蛋白信号肽的分析。统计SPase Ⅰ 和SPase Ⅱ肽酶信号肽,分析它们的序列特征。

1.2.3分泌蛋白的功能注释和聚类分析。使用COG (http://eggnog.embl.de/)功能数据库对分析得到的分泌蛋白质进行功能注释,同时进行聚类分析。

2 结果与分析

2.1长双歧杆菌亚种NCC2705基因组分泌蛋白筛选先后使用3种软件对长双歧杆菌亚种NCC2705基因组中的1 726个蛋白进行分泌蛋白的预测分析,预测结果见表1。SPase Ⅰ肽酶识别的Sec途径分泌蛋白信号肽结果见表2,Spase Ⅱ肽酶识别的Sec途径分泌蛋白结果见表3。

表1长双歧杆菌NCC2705基因组中分泌蛋白的预测结果

Table 1The prediction results of secretory protein in Bifidobacterium longum NCC2705 genome

分泌蛋白种类Typeofsecretoryprotein数量Quantity百分比Proportion%SpⅠ分泌蛋白SpⅠsecretoryprotein271.6SpⅡ蛋白SpⅡprotein100.6分泌蛋白总数Totalsecretedproteins372.2

表2长双歧杆菌NCC2705 SPase Ⅰ肽酶识别的Sec途径分泌蛋白信号肽和功能分析

Table 2Identification of Sec pathway secreted protein signal peptide and functional analysis of Bifidobacterium longum NCC2705 SPase Ⅰ peptide enzyme

序列号SerialNo.基因编号GeneNo.蛋白名称ProteinsCOG注释功能聚类COGannotationfunctionclustering信号肽种类Signalpeptidetypes信号肽序列Signalpeptidesequence1BL00155’-nucleotidasefamilyproteinCOG0737[F]SPaseⅠMKNRRWAGKRSGIAFGAVALILTALVVPY-ACA2BL0025hypotheticalsecretedproteinwithprob-ableacidphosphatasedomainCOG1404[O]SPaseⅠMEHMKMFRHLSSVFAIATIAPLALA3BL0032hypotheticalprotein—SPaseⅠMRRVTRTIAAAGAAIACCVTMTACS4BL0033solutebindingproteinofABCtrans-portersystempossiblyforsugarsCOG1879[G]SPaseⅠMKNWKKAIALVASAAALVSVAACG5BL0077solute-bindingproteinforglutamate/aspartateABCtransportersystemCOG0834[ET]SPaseⅠMSIKVGKSFKALIAAGAALVMAAS-MAACGPSAGTPSEA6BL0091hypotheticalprotein—SPaseⅠMKRSDYMLAALASAVLPNLGVAGVREN-VQA7BL0103possiblesolutebindingproteinofABCtransporterCOG0715[P]SPaseⅠMKKSLVSKAAALVGALAMTFGFA8BL0104possiblepermeaseproteinofABCtransportersystemCOG0600[P]SPaseⅠMSIAKRLKRR9BL0113phosphomethylpyrimidinekinaseCOG0351[H]SPaseⅠMRCVPVMRTKTPSRRSTSLSA10BL0122possiblelipoproteinsignalpeptidaseCOG0597[MU]SPaseⅠMAVFACVAAAALIVDQLTKAWA11BL1317peptidoglycansynthetase;penicillin-bindingprotein3precursorCOG0768[M]SPaseⅠMNTIRRIVEFAKVKTFAFKCIAIGAALAL-VASACVIQLASTQLIGGRQTAQA12BL1330solute-bindingproteinofABCtrans-portersystemCOG1653[G]SPaseⅠMKGTFKKAVALGSAIALVGGLAACGSSSG-DGTAEL13BL1335endo-beta-N-acetylglucosaminidaseCOG4724[G]SPaseⅠMRRGEQERKPMNKTMTWRRV-LAASLAAMLAMSLAACSGGTSA14BL1345solute-bindingproteinofABCtrans-porterforpeptidesCOG0747[E]SPaseⅠMNSKKILAAAVSVAAIASLTACGGVKDD-TAAGA15BL1386DppACOG4166[E]SPaseⅠMKKKALAFAAMACSVAMLLSACGGSNSNA16BL1395hypotheticalprotein—SPaseⅠMTRRILGLLACMAAVLSLAACTPAGR17BL1403histidinekinasesensoroftwo-compo-nentsystem—SPaseⅠMPVTTRVWCSVVMVPLASFMCMAQTSFFA18BL1485hypotheticalprotein—SPaseⅠMKGIRRIRQRLCALPLALACLMGLA19BL1488hypotheticalprotein—SPaseⅠMKPGLRKVAALILASVTLFGSGASA20BL1489hypotheticalproteinwithlimitedsimi-laritytoPrgBaggregationsubstance—SPaseⅠMNFGRKMMKAGVAAVAAIATLGAGGV-VASTAFA21BL1498hypotheticalprotein—SPaseⅠMVFARRSTTLLAAIIASCAMVLSLTACT22BL0780hypotheticalprotein—SPaseⅠMFELSCHTSGSRTSSSQAMPVSLR23BL0829oligopeptidebindingproteinofABCtransporterCOG4166[E]SPaseⅠMNTRHVTSLVAAGAAIVMLLSGCGST-GTSNSSNA24BL0831hypotheticalprotein—SPaseⅠMNTRLATKTKAAIIAAAISLLALTIGI-IWMMTPHGSSNDSA25BL0855hypotheticalproteinCOG1835[I]SPaseⅠMTRSDDVINEDGHDVIAAHTRVVRG-MAAALAAIAATGAGVTAAA26BL0889hypotheticalprotein—SPaseⅠMKNKLFASVPNILFGALITIAPQTFAHA27BL0994solutebindingproteinofABCtrans-portersystemCOG0803[P]SPaseⅠMGTQITRLTRLAAAGLSAVLLFATTACA

表3长双歧杆菌NCC2705 SPase Ⅱ肽酶识别的Sec途径分泌蛋白信号肽和功能分析

Table 3Identification of Sec pathway secreted protein signal peptide and functional analysis of Bifidobacterium longum NCC2705 SPase Ⅱ peptide enzyme

序列号SerialNo.基因编号GeneNo.蛋白名ProteinsCOG注释功能聚类COGannotationfunctionclustering信号肽种类Signalpeptidetypes信号肽序列Signalpeptidesequence1BL0022glutamate-bindingproteinofABCtrans-portersystemCOG0834[ET]SPaseⅡMIAALAAVACTMSLA2BL0032hypotheticalprotein—SPaseⅡMRRVTRTIAAAGAAIACCVTMTA3BL0033solutebindingproteinofABCtransportersystempossiblyforsugarsCOG1879[G]SPaseⅡMKNWKKAIALVASAAALVSVAACG4BL0077solute-bindingproteinforglutamate/as-partateABCtransportersystemCOG0834[ET]SPaseⅡMSIKVGKSFKALIAAGAALVMAAS-MAA5BL1330solute-bindingproteinofABCtransportersystemCOG1653[G]SPaseⅡMKGTFKKAVALGSAIALVGGLAA6BL1345solute-bindingproteinofABCtransporterforpeptidesCOG0747[E]SPaseⅡMNSKKILAAAVSVAAIASLTA7BL1386DppA2COG4166[E]SPaseⅡMKKKALAFAAMACSVAMLLSA8BL1395hypotheticalprotein—SPaseⅡMTRRILGLLACMAAVLSLAA9BL1485hypotheticalprotein—SPaseⅡMKGIRRIRQRLCALPLALACLM-GLAAC10BL0829oligopeptidebindingproteinofABCtrans-porterCOG4166[E]SPaseⅡMNTRHVTSLVAAGAAIVMLLS

据此推测,分泌蛋白没有或只有1个跨膜螺旋,根据该条件发现SpaseI 信号肽识别的分泌蛋白27个。LipoP 1.0 软件分析结果表明,27个蛋白为SPase Ⅰ 信号肽酶所识别,10个蛋白可被SpaseII 信号肽酶所识别。Sec 途径分泌蛋白信号肽长度最多的有52个氨基酸,最少的有10个氨基酸。

2.2长双歧杆菌亚种NCC2705基因组分泌蛋白功能分析分泌蛋白的功能分析表明,该菌株分泌蛋白中含有大部分的假定蛋白,共有14个蛋白COG没有功能注释,具体结果见图1。其中,SPase Ⅰ 型信号肽分泌蛋白中有假定蛋白10个,占SPase Ⅰ 分泌蛋白的37.0%。这些蛋白在COG功能注释结果中,11个蛋白没有COG功能注释,有功能注释的分泌蛋白主要参与氨基酸代谢与转运、碳水化合物代谢转运,无机盐离子代谢转运,细胞壁/细胞膜生物合成的功能有关。SPase Ⅱ 型信号肽酶识别的分泌蛋白中有假定蛋白10个,3

图1 长双歧杆菌NCC2705 Sec途径分泌蛋白的COG功能分析Fig.1 COG function analysis of Bifidobacterium longum NCC2705 through Sec pathway

个蛋白没有COG功能注释,其余蛋白参与氨基酸代谢与转运和碳水化合物代谢转运。

3 结论与讨论

分泌蛋白是微生物吸收营养物质、适应外界环境和与宿主发生相互作用的物质基础。通过对长双歧杆菌NCC2705 Sec途径分泌蛋白功能聚类分析结果得以证实。这与其他微生物类似。例如,芽孢杆菌是较早完成分泌蛋白预测的细菌,共发现了301个分泌蛋白,占基因组总数的7.3%。芽孢杆菌的分泌蛋白类型和数量都较多,可能与适应土壤微生物环境有关[9]。

对分泌蛋白的预测和功能分析是研究双歧杆菌适应宿主环境分子机制的重要途径。笔者从对长双歧杆菌NCC2705 Sec途径分泌蛋白的功能预测发现,分泌蛋白主要参与氨基酸、碳水化合和无机盐离子的代谢与转运功能有关,这有利于双歧杆菌在大肠环境中对上消化道不能利用的复杂碳水化合物加以利用,以利于生存[10]。

[1] LIU C,ZHANG Z Y,DONG K,et al.Adhesion and immunomodulatory effects ofBifidobacteriumlactisHN019 on intestinal epithelial cells INT-407[J].World journal of gastroenterology,2010,16(18):2283-2290.

[2] MACCONAILL L E,FITZGERALD G F,VAN SINDEREN D.Investigation of protein export inBifidobacteriumbreveUCC2003[J].Applied and environmental microbiology,2003,69(12):6994-7001.

[3] MOON G S.A preliminary analysis of secreted proteins fromBifidobacteriumpseudocatanulatumBP1 by two-dimensional gel electrophoresis[J].Journal of food science and nutrition,2008,13(4):366-369.

[4] SCHELL M A,KARMIRANTZOU M,SNEL B,et al.The genome sequence ofBifidobacteriumlongumreflects its adaptation to the human gastrointestinal tract[J].Proceedings of the national academy of sciences,2002,99(22):14422-14427.

[5] 赵文杰,曾嘉,柳建设,等.嗜酸氧化亚铁硫杆菌基因组分泌蛋白的初步分析[J].现代生物医学进展,2008(1):22-26.

[6] 周晓罡,侯思名,陈铎文,等.马铃薯晚疫病菌全基因组分泌蛋白的初步分析[J].遗传,2011(7):125-133.

[7] 周晓罡,李成云,赵之伟,等.粗糙脉孢菌基因组分泌蛋白的初步分析[J].遗传,2006(2):200-207.

[8] BABU M M,PRIYA M L,SELVAN A T,et al.A database of bacterial lipoproteins (DOLOP) with functional assignments to predicted lipoproteins[J].Journal of bacteriology,2006,188(8):2761-2773.

[9] VAN DIJL J M,BOLHUIS A,TJALSMA H,et al.Protein transport pathways inBacillussubtilis: a genome-based road map[M]//SONENSHEIN A L,HOCH J A,LOSICK R,et al.Bacillussubtilisand its closest relatives.Washington,DC:ASM Press,2001.

[10] POKUSAEVA K,FITZGERALD G F,VAN SINDEREN D.Carbohydrate metabolism in Bifidobacteria[J].Genes & nutrition,2011,6(3):285-306.

Genome-wide and Function Analysis of the Secretory Proteins ofBifidobacteriumlongumNCC2705

ZHU De-quan1,2,WANG Ming-yue1,LI Jin-liu1,MENG Xiang-chen2*et al

(1.College of Life Science,Jiamusi University,Jiamusi,Heilongjiang 154007; 2.Key Laboratory of Dairy Science of Ministry of Education,Northeast Agricultural University,Harbin,Heilongjiang 150030)

With the genome proteins sequences ofBifidobacteriumlongumFNCC2705 as study objects,SignalP 4.0,LipoP,TMHMM 2.0 software were used to analyze the secretory proteins and types of signal peptide.Function of secretory proteins was also analyzed by COG (Cluster of Orthologous Groups of proteins) database.Results showed a total of 37 secretion proteins through Sec pathway which included 27 secreted proteins recognized by SPase Ⅰ and 10 secreted proteins recognized by SPase Ⅱ.Maximum length of their signal peptide is 52 aa and minimum length is 10 aa respectively.The functions ofBifidobacteriumsecretory protein showed there were many hypothetical proteins.Secretory protein with annotation of COG functions were mainly involved in amino acid transport and metabolism,carbohydrate transport and metabolism,inorganic ion transport and metabolism,etc..The functions of these secretory proteins can help bifidobacterium adapt to its host environment.

Bifidobacteriumlongum; Genome; Secreted proteins; Secretion pathways; Signal peptide

佳木斯大学科研项目(S2011-049);黑龙江省卫生计生委科研项目(2016-325)。

朱德全(1980- ),男,贵州遵义人,讲师,博士,从事微生物生物技术研究。*通讯作者,教授,博士生导师,从事微生物生物技术研究。

2016-06-02

S 188

A

0517-6611(2016)20-109-03

猜你喜欢

肽酶信号肽双歧
猪δ冠状病毒氨基肽酶N的研究进展
运用计算机软件预测木质部寄生属信号肽
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
内源信号肽DSE4介导头孢菌素C酰化酶在毕赤酵母中的分泌表达
2型糖尿病患者代谢综合征组分与血清谷氨酰转肽酶的相关性研究
靶向二肽基肽酶维药体外筛选模型的建立及应用
双歧杆菌三联活菌联合多潘立酮治疗新生儿喂养不耐受40例
母乳婴儿源产细菌素双歧杆菌的分离鉴定
二肽基肽酶-Ⅳ抑制剂的降糖机制研究进展
抗性淀粉在双歧杆菌作用下的体外降解