不同类型植物病原物中分泌蛋白及CAZymes 对比研究*
2022-12-16夏雄飞陈云芳韩长志
夏雄飞,陈云芳,覃 悦,韩长志,3
(1.西南林业大学 生物多样性保护学院,云南 昆明 650224;2.中华人民共和国苏州海关,江苏 苏州 215000;3.云南省森林灾害预警与控制重点实验室,云南 昆明 650224)
分泌蛋白、碳水化合物活性酶(CAZymes)和次生代谢产物等致病因子显著影响真菌、细菌和卵菌等诸多植物病原物对植物的侵入、定殖和扩展等过程[1-3],其中,分泌蛋白在病原菌种间竞争和侵染寄主植物的过程中起重要作用。近年来,基于全基因组序列相关数据的公布,前人开展了植物病原物中有关分泌蛋白的诸多研究工作[4],明确了葡萄座腔菌(Botryosphaeria dothidea)[5]、香蕉枯萎病菌(Fusarium oxysporum)[6]、核盘菌(Sclerotinia sclerotiorum)[7]、梨火疫病菌(Erwinia amylovora)[8]、可可毛色二孢(Lasiodiplodia theobromae)[9]、尖孢镰刀菌(Fusarium oxysporumf)[10]、柑橘黄龙病菌(Citrus Huanglongbing)[11]、甘薯长喙壳(Ceratocystis fimbriata)[12]、小麦叶锈菌(Puccinia triticina)[13]、黄单胞菌(Xanthomonas campestris)[14]和细菌性黑斑病菌(Xanthomonas arboricola)[15]等植物病原菌中的分泌蛋白情况。CAZymes 主要包括碳水化合物酯酶、糖苷水解酶、糖基转移酶、多糖裂解酶和碳水化合物结合模块等类别,对目标细胞壁的降解具有重要意义。陈相永等[16]通过对不同营养型植物病原真菌的分泌蛋白及CAZymes 进行预测比对,明确活体、半活体和死体营养型真菌的潜在分泌蛋白数量有差异性,且非专性寄生真菌的CAZymes 数量和分泌蛋白占比显著高于专性寄生真菌。然而,目前尚未见有关不同类型植物病原物在实现其侵染植物过程中分泌蛋白及CAZymes 的对比研究。为明确不同类型植物病原物分泌蛋白及CAZymes 分布情况,本研究选择隶属于真菌、细菌和卵菌的23种具有全基因组序列的病原物作为研究对象,根据分泌蛋白信号肽、亚细胞定位和跨膜结构域等典型特征,利用多种分析工具明确不同类型病原物中的分泌蛋白数量差异性,并基于CAZymes数据库对已筛选的分泌蛋白进行比对。研究结果对于解析不同营养型病原物的入侵作用机制具有重要的指导意义,以期为深入解析不同类型植物病原物中CAZymes 的致病机制和相关验证试验等研究奠定理论基础。
1 材料与方法
1.1 蛋白序列来源
利用NCBI (美国国立卫生院数据库)搜索并下载真菌、细菌和卵菌的23 种植物病原物蛋白序列共290 884 个。经统计,这些病原物所含蛋白数量范围为2 169~26 824 个,平均含有11 635个蛋白,其中,卵菌平均含有蛋白最多(16 529个),细菌平均含有蛋白最少(4 994 个),真菌平均含有蛋白13 063 个(表1)。
表1 不同类型植物病原物的基本信息Tab.1 Basic information of different types of plant pathogens
1.2 分泌蛋白预测
根据分泌蛋白的基本特征[4],利用SignalPv5.0[17]、ProtComp v9.0[18]和TMHMM v2.0[19]分 别对23 种植物病原物进行蛋白信号肽、亚细胞定位和跨膜结构域预测分析,排除不具有分泌蛋白特征的蛋白,再通过big-PI predictor 排除具有糖基磷脂酰肌醇 (gly-cosylphosphatidylinositol,GPI)的锚定蛋白[20],最终获取23 种植物病原物的分泌蛋白。
1.3 CAZymes 预测
利用在线工具dbCAN[21]中的HMMER、DIAMOND 和Hotpep 数据库,按照CAZymes 蛋白序列之间同源比对的标准,分别对前期获取的分泌蛋白进行CAZymes 预测。
1.4 分泌蛋白功能分析
利用Microsoft Excel 2010 统计和分析分泌蛋白及CAZymes 基本情况,并采用Origin 2021 软件制图。
2 结果与分析
2.1 分泌蛋白预测
由图1 可知:真菌、细菌和卵菌中含有信号肽的蛋白数量为337~2 374 个,占比为5.20%~17.10%,平均为1 135 个,平均占比9.87%。其中,真菌、细菌和卵菌含有的信号肽蛋白数量分别为337~1 739、400~870 和589~2 374 个,平均分别为1 119、636 和1 429 个,占比分别为5.20%~13.39%、10.62%~17.10%和7.59%~10.80%,平均占比分别为9.70%、13.17%和8.22%。
图1 不同类型植物病原物中的信号肽Fig.1 Signal peptides in different types of plant pathogens
由图2 可知:在已筛选具有信号肽的蛋白中,真菌、细菌和卵菌所具有的胞外蛋白数量分别为75~537、106~232 和130~816 个,分别占总蛋白数的0.85%~4.13%、2.08%~4.00%和1.07%~3.10%,平均占比分别为2.38%、3.03%和2.07%。
图2 不同类型植物病原物中的胞外蛋白Fig.2 Extracellular proteins in different types of plant pathogens
由图3 可知:在已筛选的具有信号肽的胞外蛋白中,除隐袭腐霉(P.insidiosum)、致病疫霉(P.infestans)、烟草疫霉(P.parasitica)、大豆疫霉(P.sojae)及莴苣盘霜霉(B.lactucea)具有68、15、9、8 和7 个跨膜结构域的蛋白外,其余菌株蛋白仅有少量跨膜结构域在不具有跨膜结构域的胞外蛋白中,仅有解淀粉欧文氏菌(E.amylovora)、黄单胞菌(X.campestris)和隐袭腐霉(P.insidiosum)不具有GPI 锚定蛋白,其余病原物均具有0.94%~11.57%的GPI 锚定蛋白。
图3 不同类型植物病原物中具有跨膜结构域的蛋白和GPI 锚定蛋白Fig.3 Transmembrane domains and GPI-anchored proteins in different types of plant pathogens
由图4 可知:筛选获取分泌蛋白共计6 194个,其中真菌、细菌和卵菌分别有分泌蛋白71~510、105~227 和119~768 个,分别占总蛋白数量的0.74%~3.93%、2.05%~3.91%和0.96%~2.90%。
图4 不同类型植物病原物的分泌蛋白Fig.4 Secretory proteins in different types of plant pathogens
2.2 CAZymes 预测
HMMER 数据库对不同植物病原物中的CAZymes 预测结果显示:23 种病原物中共有433 个CAZymes,大豆疫霉(P.sojae)菌株具有的CAZymes 数量最多(55 个),其次分别为串珠镰孢(F.fujikuroi)、稻瘟菌(P.oryzae)和烟草疫霉(P.parasitica),分别为47、46 和45 个,而白锈菌(A.candida)仅具有1 个(图5 a)。进一步分析发现:上述菌株具有的CAZymes 共计99 个种类(图5b,未完全显示),除解淀粉欧文氏菌(E.amylovora)、荧光假单胞菌(P.fluorescens)、黄单胞菌(X.campestris)、发根农杆菌(A.rhizogenes)、隐袭腐霉(P.insidiosum)和白锈菌(A.candida)仅具有1~3 种CAZymes 外,其他菌株均具有5 种以上,其中PL3_2 的数量最多(52 个),其次为AA9、GH17 和GH6 等。此外,真菌、细菌和卵菌的CAZymes 数量分别为238、15 和214 个,分属于68、14 和36 种。
图5 不同类型植物病原物中的CAZymes (HMMER 数据库)Fig.5 CAZymes in different types of plant pathogens (HMMER database)
DIAMOND 对CAZymes 的查询结果显示:23 种不同植物病原物含有311 个CAZymes,尤以串珠镰孢(F.fujikuroi)具有的数量最多(54 个),其次为稻瘟菌(P.oryzae)、大豆疫霉(P.sojae)和禾谷镰刀菌(F.graminearum),分别为49、42 和40 个,而白锈菌(A.candida)、黄单胞菌(X.campestris)、隐袭腐霉(P.insidiosum)不具有CAZymes。进一步分析发现:上述菌株具有的CAZymes 共计93 个种类,其中CBM1 的数量最多(31个),其次为PL3_2、AA9 和GH28 等。真菌、细菌和卵菌的CAZymes 数量分别为204、10 和97个,分属于76、8 和24 种。Hotpep 对CAZymes 的短保守基序查询结果显示:23 种不同植物病原物含有332 个CAZymes,其中大豆疫霉(P.sojae)具有的CAZymes 短保守基序的蛋白数量最多(49 个),其次为串珠镰孢(F.fujikuroi)和稻瘟菌(P.oryzae),均为40 个,而白锈菌(A.candida)不具有CAZymes 短保守基序。进一步分析发现:上述菌株具有的CAZymes 短保守基序共计85 个种类,其中CBM1 的数量最多(72 个),其次为PL3、CBM13、AA9 和GH28 等。真菌、细菌和卵菌的CAZymes 数量分别为 164、17 和104 个,分属于62、14 和35 种。
综合HMMER、DIAMOND 和Hotpep 对CAZymes 的预测可知:23 种不同植物病原物中共含有489 个CAZymes。其中,大豆疫霉(P.sojae)、串珠镰孢(F.fujikuroi)和稻瘟菌(P.oryzae)具有的CAZymes 数量较多,分别为58、54、50 个;稻瘟菌(P.oryzae)、禾谷镰刀菌(F.graminearum)和串珠镰孢(F.fujikuroi)的CAZymes 占总蛋白数量比例较高,分别为0.38%、0.32%和0.36%;而白锈菌(A.candida)、解淀粉欧文氏菌(E.amylovora)和根癌土壤杆菌(A.tumefacines)仅有1~3 个CAZymes。由图6 可知:真菌、细菌和卵菌的CAZymes 数量分别为7~54、2~5 和5~58 个,平均数量分别为26、4 和26 个。可见,真菌和卵菌所具有的CAZymes 数量与种类均多于细菌,推测上述差异与病原物致病能力和寄生类型之间的差异有关。
图6 不同类型植物病原物中的CAZymesFig.6 CAZymes in different types of plant pathogens
3 讨论
在当前的植物病原菌相关研究中,分泌蛋白和CAZymes 等还有许多亟待研究的重点和难点[4]。随着植物病原菌全基因组序列的释放以及生物信息学分析方法的应用,已经对尖孢镰刀菌[10]、黄单胞菌[22]、柑橘黄龙病菌[23]、枯草芽孢杆菌[24]和细菌性黑斑病菌[15]等进行了大量的分泌蛋白预测和生物信息学分析,为病原菌致病基因的进一步研究夯实了理论基础。前人研究表明:不同植物的不同类型病原菌所含的分泌蛋白数量和占比不尽相同[20]。其中,不同真菌中分泌蛋白占总蛋白的3.65%~9.58%,CAZymes 的数量为64~438 个,且不同活体营养型病菌之间存在着一定差异[16,25];不同细菌中分泌蛋白约占总蛋白的5.05%~5.41%[15];不同卵菌中分泌蛋白约占总蛋白的2.96%~4.01%[16]。上述研究结果与本研究结果有一定差异,推测原因在于分泌蛋白筛选的方法不同,因此,有待于进一步深化对比分析差异蛋白的数量和种类。此外,本研究明确了不同类型植物病原物中分泌蛋白和CAZymes 的数量及种类差异,尚未明确分泌蛋白表达量差异以及冗余性问题,均有待于后续进一步开展科学研究验证。
一般而言,植物病原物在与寄主协同进化的过程中,为了克服侵染过程中的组织障碍,进化出复杂的细胞壁降解机制,包括分泌蛋白及CAZymes 的功能强化、与植物细胞壁降解相关酶类的数量扩增等,以达到侵染寄主植物的目的。例如:病原真菌在侵染寄主植物的过程中分泌多种糖苷水解酶,将植物多糖分解成寡糖或单糖,破坏细胞壁结构以突破表皮障碍,并吸收利用其繁殖所需的营养物质[4]。本研究以生物信息学为研究工具,明确真菌、细菌和卵菌等不同植物病原物中分泌蛋白和CAZymes 的数量和种类差异,为进一步解析不同病原物侵染植物过程中分泌蛋白和CAZymes 的功能及表达具有重要的理论价值,但造成CAZymes 的种类差异是否与菌株的生长环境、致病能力以及寄生类型等有关还有待于验证。此外,侵染过程中诸多植物病原物的分泌蛋白和CAZymes 功能尚不清楚,严重制约着新型农药的开发,对于CAZymes 的预测还有待进一步通过生物学试验进行验证。
4 结论
不同菌种之间、或同一类型病原物不同物种之间、或同属真菌、细菌和卵菌的不同种之间,所含有的分泌蛋白和CAZymes 存在数量和种类差异,暗示不同植物病原物在与植物协同进化过程中存在着共性化和差异化策略,从而实现其对植物的侵染及营养物质的利用。本研究为进一步开展不同物种、不同群体以及同一群体不同物种间分泌蛋白和CAZymes 的功能共性化和差异化研究提供了重要参考。