运用计算机软件预测木质部寄生属信号肽
2017-04-08张志超徐可成杨俊誉
张志超,黄 勇,徐可成,宋 红,杨俊誉,张 彧,黄 琼,3,*
(1.云南农业大学 教育部生物多样性与病虫害控制重点实验室,云南 昆明 650201; 2.云南省医疗器械检验所,云南 昆明 650034; 3.云南生物资源保护与利用国家重点实验室,云南 昆明 650201)
运用计算机软件预测木质部寄生属信号肽
张志超1,黄 勇2,徐可成1,宋 红1,杨俊誉1,张 彧1,黄 琼1,3,*
(1.云南农业大学 教育部生物多样性与病虫害控制重点实验室,云南 昆明 650201; 2.云南省医疗器械检验所,云南 昆明 650034; 3.云南生物资源保护与利用国家重点实验室,云南 昆明 650201)
利用已经公布的木质部寄生属(Xylellafastidiosa)2 766个基因组数据信息,运用在线计算机预测软件,分析了木质部寄生属(Xylellafastidiosa)的分泌蛋白组。运用SignalP version 2.0 预测得到204个开放阅读框架具有编码蛋白质的N-端信号肽;运用TMHMM、GPI-anchored预测具有非跨膜蛋白(或者在N-端信号肽只有1个跨膜区),不具有锚定位点的173个,运用TargetP预测除去分泌到线粒体以及位置不确定的分泌蛋白,最终得到X.fastidiosa的分泌蛋白为149个。分泌类信号肽(Sec-type)114个和具双精氨酸结构的信号肽(RR-motif)32个,分别占分泌蛋白的76.5%和21.5%,脂蛋白信号肽3个,仅占2%,没有预测到类前菌毛信号肽和细菌素及外激素信号肽。
木质部寄生属;分泌蛋白;信号肽
木质部寄生属(Xylella)菌体短杆状,单生,大小为(0.25~0.35)μm ×(0.90~3.50)μm,细胞壁波纹状,无鞭毛,不能运动。革兰氏染色反应阴性,好气性,氧化酶阴性,过氧化氢酶阳性。对营养要求十分苛刻,要求有生长因子。营养琼脂上菌落有两种类型:一种是枕状凸起,半透明,边缘整齐;另一种是脐状,表面粗糙,边缘波纹状。DNA中G+C含量为 49.5%~53.1%。
寄生木质部的类立克次体(rickettsia-like organism,RLO)或木质部难养菌 (xylem limited bacterium,XLB)可引起葡萄皮尔氏病(PD),也易导致梅、榆树、槭树、枥属、悬铃木、桑树、咖啡、苜蓿、柑橘、桃等感染病害[1-2],近年来该菌已获得纯培养并接种成功,鉴定为木质部寄生属(X.fastidiosa)。该菌由叶蝉类昆虫传播,侵染木质部后在导管中生存、蔓延,使全株表现叶片边缘焦枯、叶灼、早落、枯死,生长缓慢、生长势弱、结果减少和变小、植株萎蔫等症状,最终导致全株死亡。侵染这些植物的X.fastidiosa都属于同一个种,但在寄主范围和致病性上有差异,RFLPs、DNA (RAPD)-PCR、RFLP和DNA-DNA杂交研究显示,PD菌株与侵染桃、梅以及小长春花三种植物的菌株有明显差异[3]。用RAPD-PCR及16S-23S rDNA分析可将X.fastidiosa分为葡萄、桑树、榆树、悬铃木、柑橘5个亲缘关系相近的遗传类群[4-5]。在原有研究基础上,本文利用已公布的葡萄皮尔氏病的全基因组序列分析预测信号肽的比例和类型[6],运用在线计算机预测软件,分析木质部寄生属X.fastidiosa的分泌蛋白组。
1 材料与方法
木质部寄生属2 766个基因序列来源于Superfamily(http://supfam.cs.bris.ac.uk/SUPERFAMILY/cgi-bin/gen_list.cgi?genome=xf)。我们将N-端信号肽,无跨膜区,无GPI-锚定位点,位于线粒体或其他细胞器的蛋白质无分泌信号的归为水溶性分泌蛋白,满足以上条件者作为计算机预测的分泌蛋白。
我们应用Internet上SignalPv2.0(http://www.cbs.dtu.dk/services/SignalP-2.0/)确定N-端信号肽,TMHMM(http://www.cbs.dtu.dk/services/ TMHMM)预测跨膜区,TargetP v1.0(http://www.cbs.dtu.dk/services/TargetP) 预测GPI-锚定位点。
2 结果与分析
木质部寄生属的2 766个基因,蛋白长度范围为30~3 455个氨基酸。采用SignalP 2.0对2 766个蛋白序列进行信号肽预测,用SignalP的Smean和Cmax判定能分泌的蛋白质的有效性[7]。用SignalP确定N-端信号肽204个,Smean和Cmax均大于0.5;TMHMM分析整个基因组发现,2 207个蛋白序列无跨膜区,356个蛋白序列有1个跨膜区,83个蛋白序列有2个跨膜区,120个蛋白序列有2个以上的跨膜区。TargetP分析结果表明,S型分泌途径为640个,486个分泌到线粒体,1 640个分泌位置不确定。对SignalP确定的204个N-端信号肽分析发现,其中31个信号肽具有2个和2个以上的跨膜区,105个信号肽没有跨膜区,68个信号肽具有1个跨膜区,且跨膜区位于N-端55个氨基酸的前40个氨基酸的位置,因此,173个信号肽具有潜在的分泌蛋白。由于原核生物细胞通常分泌蛋白进入细胞器,较少分泌到胞外,采用TargetP分析这173个分泌蛋白,除去分泌到线粒体的13个分泌蛋白和分泌位置不确定的6个分泌蛋白,S型分泌途径为154个。对154个S型分泌途径的蛋白进行GPI-锚定位点分析,发现没有一个具有GPI-锚定位点,因此保留没有GPI-锚定位点的154个分泌蛋白,并对其中5个无法归类的可疑分泌蛋白,进行PSORT II Prediction(http://psort.nibb.ac.jp/form2.htmlPSORT II Prediction (experimental)Lastupdate:November24, 1999)分析,结果发现其不具有N-端信号肽,最终预测到149个N-端信号肽。占全基因组总量的6%。预测信号肽的步骤如图1。
2.1 信号肽长度及氨基酸组成
对149个分泌蛋白的信号肽长度及组成信号肽的氨基酸种类进行比较,结果见图2和图3。信号肽长度分布范围为18~50个氨基酸,主要集中分布于长度为19~26个氨基酸,约占全部信号肽的66%。其中,信号肽长度出现频率最高的为20、22、23、24和26个氨基酸,均为9%。
图1 木质部寄生属信号肽预测分析流程Fig.1 Flowchart of strategy used to predict X. fastidiosa
组成信号肽的氨基酸种类统计分析表明,组成信号肽的氨基酸中非极性氨基酸占45%,极性氨基酸占15%,酸性氨基酸占31%,碱性氨基酸占8%,最多的4种氨基酸依次为亮氨酸(L)、丙氨酸(A)、缬氨酸(T)和丝氨酸(S),分别占氨基酸总量的19%、14%、 8%和8%。而天冬氨酸(D)、谷氨酸(E)的含量极少,组成信号肽的氨基酸总量为3 752个,而天冬氨酸、谷氨酸则分别为11和12个。
2.2 信号肽的种类
依据信号肽酶的识别序列,氨基末端信号肽分为4种类型:第一类为分泌型信号肽(I型),包括分泌类信号肽(Sec-type)和双精氨酸-基序(RR-motif)信号肽。分泌类信号肽(Sec-type):N-区平均含有1~2个正电荷的赖氨酸(K)或精氨酸(R),H-domain由平均19aa构成,C-区含有SPasesⅠ酶剪切位点,即从-3位到-1位,一般序列为A-X-A,其中X代表任意氨基酸,具有Sec-信号肽的分泌蛋白;双精氨酸-基序(RR-motif)信号肽:信号肽中含有RR×##(##指疏水氨基酸)的保守序列,通过Tat途径运送。第二类为脂蛋白信号肽(Ⅱ型):通常比分泌型信号肽短,切割位点后一个氨基酸为C,这样就形成保守的L-(A/S)-(A/G)-C的lipobox。第三类是由类似前菌毛蛋白(Prepilin-like)(Ⅳ型)的信号肽组成,能被前菌毛蛋白专化的信号肽酶ComC剪切。第四类信号肽是在核糖体合成细菌素和外激素中发现,合成的细菌素和外激素是通过ABC转运蛋白运送[8],这类信号肽缺乏疏水的H-区。
图2 木质部寄生属信号肽的长度与分布Fig.2 Length distribution of predicted signal peptide in X. fastidiosa
图3 木质部寄生属信号肽的氨基酸的组成Fig.3 Frequencies of amino acid in signal peptide of X. fastidiosa
根据信号肽的分类方法,对149个分泌蛋白的信号肽进行了分类。其中146个分泌蛋白信号肽的N-区平均含有1~2个正电荷的赖氨酸(K)或精氨酸(R),其中含一个正电荷氨基酸K或R的分泌蛋白信号肽为114个,占76.5%,具双精氨酸结构的信号肽为32个,占21.5%。因此,分泌型信号肽的比例很大,约98%的信号肽为分泌型信号肽,其余3个为脂蛋白信号肽,仅为2%。没有发现Prepilin-like信号肽和细菌素和外激素信号肽。根据Xylellafastidiosa9a5c 基因注释,预测的149个信号肽中超过50%的功能未知,表1仅列出功能已知的信号肽。
表1 木质部寄生属基因组中预测的功能已知的信号肽
Table 1 List of predictedXylellafastidiosasignal peptides of known function
名称Name蛋白长度LengthofProtein切割位点PositionofCleavageS值SmeanC最大值Cmax跨膜区TM分泌途径TP描述Descriptiongi_15838025262200.9480.9950SChitinasegi_15837586603210.6370.8390SGamma-glutamyltranspeptidasegi_15837442612230.710.9991SBeta-galactosidasegi_15838324362230.8180.9550SSugar-phosphatedehydrogenasegi_15836620795240.94710SDipeptidyl-peptidasegi_15837178700250.9060.5270SMetallopeptidasegi_15837447882270.7550.5560SFamily3glycosidehydrolasegi_15837055287270.530.6621SIntegralmembraneproteinasegi_15838421727270.8850.9670STail-specificproteasegi_158384491000270.9580.6591SSerineproteasegi_15837383597240.8960.9590SLipase/esterasegi_15837151702260.7080.6780SMethionyl-tRNAsynthetasegi_15837246230200.81510SPeptidyl-prolylcis-transisomerasegi_15837440464260.7470.9381SPeptidyl-prolylcis-transisomerasegi_15837420592260.9060.9020SEndo-1,4-beta-glucanasegi_15837689652260.8570.9680SCardiolipinsynthasegi_15838205194280.9020.9851SABCtransportervitaminB12uptakepermeasegi_15838222455290.7110.7920SBeta-lactamasegi_15839297356340.8640.9970SEndo-1,4-beta-glucanasegi_15839266721300.6350.9981SL-ascorbateoxidasegi_15838432154190.9110.9110SDisulphideisomerasegi_15838341405310.8820.9991SGlucosedehydrogenaseBgi_15838342294310.7040.9910SDaunorubicinC-13ketoreductasegi_15838775374320.8280.7780SMembrane-boundlytictransglycosylasegi_15837259576390.9060.731SAlkalinephosphatasegi_15837509297220.92911SSolublelyticmureintransglycosylaseprecursorgi_15837018351230.9290.5780SLipoproteinprecursorgi_15836688184260.96711SFimbrialsubunitprecursorgi_15837448891280.9440.9691SBeta-mannosidaseprecursorgi_15836687266310.6960.9981SChaperoneproteinprecursorgi_15837361539350.5480.9980SN-acetylmuramoyl-L-alanineamidaseprecursorgi_15838519242260.8180.9821SSuperoxidedismutase[MN]precursor
续表1
gi_15837826为Sec-type信号肽;gi_15837259为RR-motif信号肽;gi_15838494为脂蛋白信号肽。
gi_15837826 was Sec-type signal peptide. gi_15837259 was RR-motif signal peptide. gi_15838494 was lipoprotein signal peptide.
3 讨论
如上所述,木质部寄生属是一类重要的植物病原菌,其基因组序列的完成对更深入地研究其生物学特性和致病特性无疑将起到巨大的推动作用。对于革兰氏阴性细菌的大量研究表明,分泌蛋白是病原细菌重要的致病因子。尽管目前的研究结果中,革兰氏阴性细菌的致病因子主要是由三型分泌途径进行分泌的。对于木质部寄生属来说,还没有发现其中有三型分泌途径(Type III secretory system)的报道,目前对于通过信号肽识别机制分泌的蛋白在致病和其他生长过程中的作用也还未知。勿庸置疑的是,这些分泌蛋白在基因组中大量存在,表明其发挥作用的主要场所是在细胞外的,是该细菌与环境,包括与寄主互作的重要蛋白。因此,对于这类蛋白的研究,有助于全面了解病原菌的生物学特性和致病特性。在对这些蛋白进行试验之前,首先通过生物信息学方法对其特性进行分析,将有助于设计试验思路和提高研究效率。本研究采用Internet信号肽分析软件SignalPv2.0 v、TargetP 1.0 v、big-PI predictor 和TMHMM v2.0预测木质部寄生属基因组中含有信号肽的分泌蛋白、分析分泌蛋白的运送途径及信号肽类型。预测结果表明,基因组中共存在149个分泌蛋白,占全基因组总基因数量的6%,与革兰氏阳性细菌Bacillussubtilis, 革兰氏阴性细菌Sulfolobussolfataricus分泌蛋白相比(表2),Sec-type分泌蛋白最多,为Sac分泌途径。Xylellafastidiosa与Sulfolobussolfataricus均为革兰氏阴性细菌,均未预测到Prepilin-like信号肽以及细菌素和外激素信号肽;而枯草芽孢杆菌有4种信号肽,4种分泌途径都有[8],这可能是革兰氏阳性细菌与革兰氏阴性细菌分泌蛋白的差异。但Xylellafastidiosa中有脂蛋白信号肽,Sulfolobussolfataricus则缺乏该类信号肽。所预测的信号肽中功能未知的有79个,占信号肽的53%。因此,快速预测基因组的信号肽,对蛋白质功能研究具有一定参考价值。从基因注释可知,预测具有分泌类信号肽的gi_15837945、gi_15838205具有ABC transporter的功能,可能属于细菌素和外激素信号肽。预测的与实际的信号肽会有一定的偏差,有待实验的验证。
表2 细菌中不同类型信号肽出现频率的比较
Table 2 Frequency of different types of signal peptides in bacteria
名称Name分泌类Sec-type双精氨酸RR-motif脂蛋白Lipoprotein类前菌毛Prepilin-like细菌素和外激素Bacteriocin&Peromone百分率Percentage/%Bacillussubtilis18027114437.0Sulfolobussolfataricus11430004.2Xylellafastidiosa114323005.4
[1] HOPKINS D L.Xylellafastidiosa: xylem-limited bacterial pathogen of plants[J].AnnualReviewsofPhytopathology, 1989, 27: 271-290.
[2] PURCELL A H.Xylellafastidiosa, a regional problem or global threat?[J].JournalofPlantPathology, 1997, 79(2): 99-105.
[3] KAMPER S M, FRENCH W J, DEKLOET S R. Genetic relationships of some fastidious xylem-limited bacteria[J].InternationalJournalofSystematicBacteriology, 1985, 35(2):185-188.
[4] POOLER M R, HARTUNG J S, FENTON R G. Genetic relationships among strains ofXylellafastidiosafrom RAPD-PCR data[J].CurrentMicrobiology, 1995, 31(2):134-137.
[5] MARTINATI J C, PACHECO F T H, MIRANDA V F O D, et al. 16S-23S rDNA: polymorphisms and their use for detection and identification ofXylellafastidiosastrains[J].BrazilianJournalofMicrobiology, 2007, 38(1):159-165.
[6] SIMPSON A J G, REINACH F C, ARRUDA P, et al. The genome sequence of the plant pathogenXylellafastidiosa[J].Nature, 2000, 406(6792):151-157.
[7] LEE S A, WORMSLEY S, KAMOUN S. An analysis of theCandidaalbicansgenome database for soluble secreted proteins using computer-based prediction algorithms[J].Yeast, 2003, 20(7): 595-610.
[8] TJALSMA H, BOLHUIS A, JONGBLOED J D H, et al. Signal peptide-dependent protein transport inBacillussubtilis: a genome-based survey of the secretome[J].MicrobiologyandMolecularBiologyReviews, 2000, 64(3):515-547.
(责任编辑 张 韵)
Prediction of signal peptide ofXylellafastidiosabased on internet softwareZHANG Zhichao1, HUANG Yong2, XU Kecheng1, SONG Hong1, YANG Junyu1, ZHANG Yu1, HUANG Qiong1,3,*
(1.KeyLaboratoryofBio-diversityforPlantDiseasesManagementofMinistryofEducation,YunnanAgriculturalUniversity,Kunming650201,China; 2.YunnanInstituteofMedicalEquipment,Kunming650034,China; 3.StateKeyLaboratoryforConservationandUtilizationofBio-ResourcesinYunnan,Kunming650201,China)
One approach to rapidly predict the functions of an entire proteome is to utilize genomic database information and prediction software. Thus, we used a set of prediction algorithms to computationally define a potential secretome. InXylellafastidiosa, the N-terminal signal peptide was predicted by SignalP version 2.0. Two hundred and four ORFs were predicted to encode proteins with N-terminal signal peptides. Among these, 173 were predicted with no transmembrane domain (or a single transmembrane domain at the extreme N-terminus). TargetP was used to eliminate proteins with 19 mitochondrial targeting signals, and 154 was predicted not to be GPI-anchored. The final computationally-predictedXylellafastidiosasecretome was estimated to consist of up to 149 ORFs. One hundred and fourteen secretary signal peptides and 32 twin-arginine signal peptides which occupied 76.5% and 21.5% of secretome respectively, and 3 lipoprotein signal peptides only occupied 2%, preplan-like, bacteriocin and pheromone signal peptides were not found.
Xylellafastidiosa; secreted protein; signal peptide
10.3969/j.issn.1004-1524.2017.03.23
2016-06-21
国家自然科学基金项目(31270067)
张志超(1992—),男,辽宁丹东人,硕士研究生,主要从事植物病理学研究。E-mail: zhangzc927@163.com
*通信作者,黄琼,E-mail: huangqiong88hs@163.com
S432.4
A
1004-1524(2017)03-0515-06
浙江农业学报ActaAgriculturaeZhejiangensis, 2017,29(3): 515-520
http://www.zjnyxb.cn
张志超,黄勇,徐可成,等. 运用计算机软件预测木质部寄生属信号肽[J]. 浙江农业学报,2017,29(3): 515-520.