APP下载

芸薹根肿菌蛋白磷酸酶组的鉴定及生物信息学分析

2020-05-27余方伟王神云张伟王红于利李建斌

江苏农业学报 2020年2期

余方伟 王神云 张伟 王红 于利 李建斌

摘要:由蛋白激酶和蛋白磷酸酶调控的蛋白质可逆磷酸化是一种重要的蛋白质翻译后修饰,它在信号转导、细胞周期、基因转录、代谢调控等过程中起到至关重要的作用。本研究以芸薹根肿菌e3菌株的基因组为试验数据来源,采用生物信息学方法对芸薹根肿菌全基因组蛋白磷酸酶进行了鉴定和表达分析。 基于隐马尔可夫模型(Hidden markov model,HMM)搜索与SMART分析相结合,本研究在芸薹根肿菌基因组中共鉴定出54个蛋白磷酸酶基因。编码的54个蛋白磷酸酶可以进一步被分成4类,包括10个磷酸化蛋白磷酸酶(PPP),21个金属离子依赖型蛋白磷酸酶(PPM),19个酪氨酸蛋白磷酸酶(PTP),4个基于天冬氨酸的蛋白磷酸酶(APP)。这54个蛋白磷酸酶的相对分子质量为10 780~125 140,等电点为4.43~10.45。通过信号肽和跨膜结构域分析发现在这54个蛋白磷酸酶中,PBRA_007461存在信号肽,PBRA_003636、PBRA_004449、PBRA_004464、PBRA_005270、 PBRA_006854和PBRA_007201存在跨膜结构域。轉录组分析结果表明这54个蛋白磷酸酶基因在不同时期差异表达,值得一提的是在休眠孢子萌发期和休眠孢子成熟期,金属离子依赖型蛋白磷酸酶基因PBRA_001085的表达量最高,说明该磷酸酶在休眠孢子发育中起到重要作用。综上所述,本研究可为芸薹根肿菌蛋白磷酸酶功能研究和根肿病防治靶标选择提供理论基础。

关键词:根肿病;芸薹根肿菌;蛋白磷酸酶

中图分类号:Q814文献标识码:A文章编号:1000-4440(2020)02-0318-07

Abstract:Reversible phosphorylation of proteins, regulated by protein kinases and protein phosphatases is an important post-translational modification, which plays a vital role in signal transduction, cell cycle, gene transcription and metabolic regulation. In this study, bioinformatics tools were used to analyze the protein sequences from Plasmodiophora brassicae e3 strain, and the identified protein phosphatase genes were further subjected to expression profiling analysis. Based on the combination of hidden markov model (HMM) search and SMART analysis, a total of 54 protein phosphatase genes were identified in the genome of P. brassicae. These 54 protein phosphatases could be further classified into four categories, including 10 phosphoprotein phosphatases (PPP), 21 metal ion-dependent protein phosphatases (PPM), 19 protein tyrosine phosphatases (PTP), four aspartate-based protein phosphatases (APP). The molecular weights of these 54 protein phosphatases ranged from 10 780 to 125 140, and the isoelectric points ranged from 4.43 to 10.45. The results of signal peptide and transmembrane domain analysis revealed that among 54 candidate protein phosphatases, PBRA_007461 had a signal peptide, and there were transmembrane domains in PBRA_003636, PBRA_004449, PBRA_004464, PBRA_005270, PBRA_006854 and PBRA_007201. Transcriptome analysis results showed that these 54 protein phosphatases genes were differentially expressed at different stages. Notably, the expression of the metal ion-dependent protein phosphatase gene PBRA_001085 was highest during the resting spore germination and the spore maturation period, indicating that it played an important role in resting spore development. In conclusion, this study can provide a theoretical basis for the characterization of protein phosphatases and development of novel strategies against clubroot.

Key words:clubroot;Plasmodiophora brassicae;protein phosphatase

由芸薹根肿菌(Plasmodiophora brassicae Woronin)引起的根肿病对全世界十字花科作物的生产构成越来越大的威胁[1-3]。仅在中国,每年大约有3.20×106~4.00×106hm2的十字花科作物受到根肿病的影响,造成20%~30%的产量损失[3]。尽管选育抗病品种是控制根肿病最经济有效的方法[4],但新型致病小种的出现也极大地损害了抗病品种的推广应用[5-7]。因此,根肿病防治新策略的研究迫在眉睫。

蛋白质可逆磷酸化是生物体内信号传导的主要形式和重要的调控机制[8-10]。蛋白质磷酸化过程由蛋白激酶(PKs)控制。现有研究结果表明,蛋白质可以在9个氨基酸(酪氨酸、丝氨酸、苏氨酸、半胱氨酸、精氨酸、赖氨酸、天冬氨酸、谷氨酸和组氨酸)位点上发生磷酸化[11],但丝氨酸、苏氨酸和酪氨酸磷酸化在真核细胞中占主导地位并发挥关键调控作用[12]。对2 244种人类蛋白质上6 600个磷酸化位点的蛋白质组学分析结果表明,磷酸化丝氨酸(pSer)、磷酸化苏氨酸(pThr)和磷酸化酪氨酸(pTyr)分别占磷酸化氨基酸的86.4%、11.8%和1.8%[13]。对禾谷镰刀菌(Fusarium graminearum) 2 902个磷酸化肽分析发现,pSer、pThr和pTyr分别占磷酸化氨基酸的87.0%,26.0%和2.4%[14]。在白色念珠菌中(Candida albicans),对2 896个蛋白质的15 906个特异磷酸化位点鉴定分析发现,pSer、pThr和pTyr分别占磷酸化氨基酸的80.01%,18.11%和1.81%[15] 。在黄曲霉(Aspergillus flavus)中,对293个磷酸化蛋白的598个磷酸化位点进行分析发现,pSer、pThr和pTyr分别占磷酸化氨基酸的81.1%,16.4%和2.5%[16] 。蛋白质去磷酸化过程由蛋白磷酸酶(PP)控制。根据蛋白质底物特异性、结构和催化机制不同,PP可分为2个主要的大家族:蛋白酪氨酸磷酸酶(PTP)和丝氨酸/苏氨酸磷酸酶(PSP)。 PTP成员主要催化磷酸酪氨酸的去磷酸化,包括经典PTP,双特异性磷酸酶(DSP),Cdc25型磷酸酶和低分子量磷酸酶[17]。 PSP包含3个主要家族:磷酸化蛋白磷酸酶(PPP),金属依赖性蛋白磷酸酶(PPM)和基于天冬氨酸的蛋白磷酸酶(APP)[18]。已有的结果表明磷酸酶基因家族成员在不同物种中数目不同,且其生物学功能各异。如在构巢曲霉(Aspergillus nidulans)中已鉴定出28个PP,其中8个是正常生长或有丝分裂所必需的[19]。反向遗传分析结果表明,禾谷镰刀菌的磷酸酶参与菌丝生长、分生孢子形成、致病和产毒等过程[20-21]。

因为PP的功能多样性和重要性,本研究拟采用生物信息学分析方法挖掘鉴定芸薹根肿菌的蛋白磷酸酶,对其理化性质、跨膜结构域、信号肽进行分析,并通过转录组学分析这些磷酸酶在不同阶段的表达变化,为后续芸薹根肿菌磷酸酶的功能研究及根肿病新的防治策略研究提供借鉴。

1材料与方法

1.1芸薹根肿菌基因组序列

以芸薹根肿菌e3菌株的基因组为起始序列,进行后续生物信息学分析,序列下载自公共数据库NCBI(ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/001/049/375/GCA_001049375.1_pbe3.h15) 。

1.2生物信息学分析

从Pfam数据库(http://pfam.xfam.org/)中下载pfam文件(表1),利用HMMER 3.0 软件[22]搜索芸薹根肿菌的蛋白质氨基酸序列。用SMART(http://smart.embl-heidelberg.de/)对获得的氨基酸序列进行结构域分析,剔除不含磷酸酶催化结构域的氨基酸序列,再进一步剔除不完整的氨基酸序列,最后剩下的序列即为候选蛋白磷酸酶氨基酸序列。采用SignalP 4.0[23] 和TMHMM 2.0 [24]分别对候选蛋白质的信号肽和跨膜结构域进行分析。

1.3表达量分析

芸薹根肿菌的转录组数据源自Schwelm等[25]的报道:将-20 ℃保存的分离纯化后的休眠孢子置于4 ℃解冻48 h后,再转移到含有400 ng/ml特美汀的灭菌水中室温孵育24 h,以此样品提取RNA进行转录组学分析,获得的数据即为休眠孢子萌发期数据;芸薹根肿菌侵染油菜(Brassica napus)栽培种Westar 35 d后,从油菜病根中分离原生质团,提取原生质团的RNA进行转录组学分析,获得的数据即为原生质团时期数据;从芸薹根肿菌侵染35 d后的白菜(B.rapa)栽培种 Granaat病根中分离休眠孢子,以此休眠孢子提取RNA进行转录组学分析,获得的数据为休眠孢子成熟期数据;白菜栽培种Granaat、油菜栽培种Dc119 Giant rape和结球甘蓝(B. oleracea var. capitata) Jersey Queen接種芸薹根肿菌35 d后,分别取病根进行表面消毒后提取总RNA进行转录组学分析,以此获得的数据即为不同寄主的数据来源。根据Trapnell等[26]报道的方法将数据换算成FPKM(Fragments per kilobase of transcript per million mapped reads)。蛋白磷酸酶基因的表达量换算成Log2(FPKM+1)值后,利用R语言中的pheatmap包绘制热图。

2结果与分析

2.1芸薹根肿菌蛋白磷酸酶的鉴定

以Pfam文件为种子序列搜索芸薹根肿菌的蛋白质库,再结合SMART结构域分析,本研究从芸薹根肿菌基因组中鉴定到了57个蛋白磷酸酶基因,经过序列分析发现,其中3个蛋白磷酸酶基因(PBRA_000895、PBRA_000081 和PBRA_000766)的序列不完整,剔除以上3个基因后,最终选择剩余的54个蛋白磷酸酶基因(表2)。

2.2芸薹根肿菌蛋白磷酸酶理化特性分析

根据结构域预测分析结果,这54个蛋白磷酸酶可以进一步被分成4类,包括10个磷酸化蛋白磷酸酶,21个金属离子依赖型蛋白磷酸酶,19个酪氨酸蛋白磷酸酶, 4 个基于天冬氨酸的蛋白磷酸酶(表2)。如表2所示,这54个蛋白磷酸酶的氨基酸残基数目为92~1 111 aa,其中氨基酸残基数目最少的为酪氨酸磷酸酶PBRA_008356,氨基酸残基数目最多的为磷酸化蛋白磷酸酶PBRA_004449。这54个蛋白磷酸酶的相对分子质量为10 780 ~125 140,其中相对分子质量最低的为酪氨酸磷酸酶PBRA_008356,相对分子质量最大的为磷酸化蛋白磷酸酶PBRA_004449。 这54个蛋白磷酸酶的理论等电点为4.43~10.45,其中理论等电点最低的为金属离子依赖性磷酸酶PBRA_008437,理论等电点最高的为酪氨酸蛋白磷酸酶PBRA_009167。

2.3芸薹根肿菌蛋白磷酸酶信号肽和跨膜结构域的预测分析

对这54个蛋白磷酸酶进行信号肽分析发现,PBRA_007461存在信号肽,且在第19~20位氨基酸残基处存在信号肽切割位点,说明该蛋白质是一个潜在外泌蛋白质。通过TMHMM2.0分析发现,PBRA_003636、PBRA_004449、PBRA_004464、PBRA_005270、 PBRA_006854和PBRA_007201存在跨膜结构域(PBRA_004449有5个跨膜结构域,其他均为1个),说明这些磷酸酶可能是膜定位。

2.4芸薹根肿菌蛋白磷酸酶基因在不同阶段表达动态变化

通过转录组分析对这54个蛋白磷酸酶基因在不同时期的表达进行分析。如图1所示,有21个磷酸酶基因(PBRA_005571、PBRA_006854、 PBRA_007271、 PBRA_005957、 PBRA_005771、 PBRA_002157、PBRA_000495、PBRA_003208、PBRA_002428、PBRA_000135、PBRA_003636、 PBRA_003461、PBRA_002692、PBRA_008437、PBRA_006030、PBRA_007543、PBRA_001085、 PBRA_000278、 PBRA_002029、 PBRA_004449、 PBRA_003042)在各个阶段的表达量均较高,8个磷酸酶基因(PBRA_008821、PBRA_007906、 PBRA_000995、 PBRA_001432、 PBRA_005270、PBRA_008356、PBRA_005841、 PBRA_009167)在各个阶段的表达量均较低,其余基因在不同阶段差异表达。在孢子萌发阶段,表达量最高的磷酸酶基因为PBRA_001085,在原生质团阶段,表达量最高的磷酸酶基因为PBRA_000278,在孢子成熟阶段,表达量最高的磷酸酶基因为PBRA_001085。

3讨论

由芸薹根肿菌导致的根肿病严重威胁十字花科作物的可持续生产,这种病也被称为植物的“癌症”。芸薹根肿菌是细胞内活体营养型病原物,因为其无法在人工合成培养基上生长,缺乏稳定的遗传转化体系,因此常规的反向遗传操作难以在芸薹根肿菌中得到应用。随着高通量测序技术的快速发展,采用生物信息学方法进行芸薹根肿菌基因挖掘和分析已成为现实。本研究通过生物信息学分析方法从芸薹根肿菌基因组中鉴定到54个蛋白磷酸酶基因。目前研究结果表明,人和拟南芥(Arabidopsis thaliana)中分别存在148和150个蛋白磷酸酶基因[27],水稻(Oryza sativa)中有132个蛋白磷酸酶基因[28],玉米(Zea mays)中有159个蛋白磷酸酶基因[29],原生生物疟原虫(Plasmodium falciparum)中有67个蛋白磷酸酶基因[30]。芸薹根肿菌在分类上属于原生生物,因此其蛋白磷酸酶基因的数目与同为原生生物的恶性疟原虫较为接近。越来越多的研究结果表明蛋白磷酸酶在病原物生长和致病等生物进程中起到重要作用。禾谷镰刀菌的磷酸酶在菌丝生长、细胞分裂、分生孢子形成、致病性和外界胁迫响应等过程中发挥重要作用[20-21]。核盘菌(Sclerotinia sclerotiorum)的钙调磷酸酶在其菌核发育和致病性中起到重要作用[31]。弓形虫(Toxoplasma gondii)可以分泌蛋白磷酸酶2c来操纵寄主细胞[32]。在这54个蛋白磷酸酶中,PBRA_007461是一个潜在的外泌蛋白,它也可能通过与弓形虫相类似的机理来发挥效应因子的功能,当然这需要后续更多的试验证据来佐证。蛋白磷酸酶在病原物生长和侵染中扮演着重要的角色,这也为病害的防治提供了潜在的靶标[33]。有研究结果表明,MAPKK激酶抑制剂 U0126可以有效降低根肿病的发病程度[34]。受此启发,挖掘芸薹根肿菌生长和致病關键蛋白磷酸酶的特异性抑制剂可望为根肿病防治提供新的思路和切入点。

参考文献:

[1]DIXON G R. The occurrence and economic impact of Plasmodiophora brassicae and clubroot disease [J]. Journal of Plant Growth Regulation, 2009, 28(3): 194-202.

[2]HWANG S F, STRELKOV S E, FENG J, et al. Plasmodiophora brassicae: a review of an emerging pathogen of the Canadian canola (Brassica napus) crop [J]. Molecular Plant Pathology, 2012, 13(2): 105-113.

[3]CHAI A L, XIE X W, SHI Y X, et al. Research status of clubroot (Plasmodiophora brassicae) on cruciferous crops in China [J]. Canadian Journal of Plant Pathology, 2014, 36(1): 142-153.

[4]DIEDERICHSEN E, FRAUEN M, LINDERS E G A, et al. Status and perspectives of clubroot resistance breeding in crucifer crops [J]. Journal of Plant Growth Regulation, 2009, 28(3): 265-281.

[5]KUGINUKI Y, YOSHIKAWA H, HIRAI M. Variation in virulence of Plasmodiophora brassicae in Japan tested with clubroot-resistant cultivars of Chinese cabbage (Brassica rapa L. ssp. pekinensis) [J]. European Journal of Plant Pathology, 1999, 105(4): 327-332.

[6]STRELKOV S E, HWANG S F, MANOLII V P, et al. Emergence of new virulence phenotypes of Plasmodiophora brassicae on canola (Brassica napus) in Alberta, Canada [J]. European Journal of Plant Pathology, 2016, 145(3): 517-529.

[7]JIANG J, FREDUA-AGYEMAN R, STRELKOV S E, et al. Suppression of canola (Brassica napus) resistance by virulent isolates of Plasmodiophora brassicae (clubroot) during primary infection [J]. Plant Disease, 2020,104(2): 430-437.

[8]SACCO F, PERFETTO L, CASTAGNOLI L, et al. The human phosphatase interactome: an intricate family portrait [J]. FEBS Letters, 2012, 586(17): 2732-2739.

[9]COHEN P. The regulation of protein function by multisite phosphorylation-a 25 year update [J]. Trends in Biochemical Sciences, 2000, 25(12): 596-601.

[10]ARDITO F, GIULIANI M, PERRONE D, et al. The crucial role of protein phosphorylation in cell signaling and its use as targeted therapy [J]. International Journal of Molecular Medicine, 2017, 40(2): 271-280.

[11]MOORHEAD G B G, DE WEVER V, TEMPLETON G, et al. Evolution of protein phosphatases in plants and animals [J]. Biochemical Journal, 2008, 417(2): 401-409.

[12]MANNING G, PLOWMAN G D, HUNTER T, et al. Evolution of protein kinase signaling from yeast to man [J]. Trends in Biochemical Sciences, 2002, 27(10): 514-520.

[13]OLSEN J V, BLAGOEV B, GNAD F, et al. Global, in vivo, and site-specific phosphorylation dynamics in signaling networks [J]. Cell, 2006, 127(3): 635-648.

[14]RAMPITSCH C, TINKER N A, SUBRAMANIAM R, et al. Phosphoproteome profile of Fusarium graminearum grown in vitro under nonlimiting conditions [J]. Proteomics, 2012, 12(7): 1002-1005.

[15]WILLGER S D, LIU Z, OLARTE R A, et al. Analysis of the Candida albicans phosphoproteome [J]. Eukaryotic Cell, 2015, 14(5): 474-485.

[16]REN S, YANG M, LI Y, et al. Global phosphoproteomic analysis reveals the involvement of phosphorylation in aflatoxins biosynthesis in the pathogenic fungus Aspergillus flavus [J]. Scientific Reports, 2016, 6: 34078.

[17]ALONSO A, PULIDO R. The extended human PTP ome: a growing tyrosine phosphatase family [J]. The FEBS Journal, 2016, 283(8): 1404-1429.

[18]SHI Y. Serine/threonine phosphatases: mechanism through structure [J]. Cell, 2009, 139(3): 468-484.

[19]SON S, OSMANI S A. Analysis of all protein phosphatase genes in Aspergillus nidulans identifies a new mitotic regulator, fcp1 [J]. Eukaryotic Cell, 2009, 8(4): 573-585.

[20]YU F, GU Q, YUN Y, et al. The TOR signaling pathway regulates vegetative development and virulence in Fusarium graminearum [J]. New Phytologist, 2014, 203(1): 219-232.

[21]YUN Y, LIU Z, YIN Y, et al. Functional analysis of the Fusarium graminearum phosphatome [J]. New Phytologist, 2015, 207(1): 119-134.

[22]FINN R D, CLEMENTS J, EDDY S R. HMMER web server: interactive sequence similarity searching [J]. Nucleic Acids Research, 2011, 39(S2): 29-37.

[23]PETERSEN T N, BRUNAK S, VON HEIJNE G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions [J]. Nature Methods, 2011, 8(10): 785-786.

[24]KROGH A, LARSSON B , VON HEIJNE G, et al. Predicting transmembrane protein topology with a hidden Markov model: application to complete genomes [J]. Journal of Molecular Biology, 2001, 305(3): 567-580.

[25]SCHWELM A, FOGELQVIST J, KNAUST A, et al. The Plasmodiophora brassicae genome reveals insights in its life cycle and ancestry of chitin synthases [J]. Scientific Reports, 2015, 5: 11153.

[26]TRAPNELL C, WILLIAMS B A, PERTEA G, et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation [J]. Nature Biotechnology, 2010, 28(5): 511-515.

[27]KERK D, TEMPLETON G, MOORHEAD G B G. Evolutionary radiation pattern of novel protein phosphatases revealed by analysis of protein data from the completely sequenced genomes of humans, green algae, and higher plants [J]. Plant Physiology, 2008, 146(2): 351-367.

[28]SINGH A, GIRI J, KAPOOR S, et al. Protein phosphatase complement in rice: genome-wide identification and transcriptional analysis under abiotic stress conditions and reproductive development [J]. BMC Genomics, 2010, 11(1): 435.

[29]WEI K, PAN S. Maize protein phosphatase gene family: identification and molecular characterization [J]. BMC Genomics, 2014, 15(1): 773.

[30]PANDEY R, MOHMMED A, PIERROT C, et al. Genome wide in silico analysis of Plasmodium falciparum phosphatome [J]. BMC Genomics, 2014, 15(1): 1024.

[31]HAREL A, BERCOVICH S, YARDEN O. Calcineurin is required for sclerotial development and pathogenicity of Sclerotinia sclerotiorum in an oxalic acid-independent manner [J]. Molecular Plant-Microbe Interactions, 2006, 19(6): 682-693.

[32]GILBERT L A, RAVINDRAN S, TURETZKY J M, et al. Toxoplasma gondii targets a protein phosphatase 2C to the nuclei of infected host cells [J]. Eukaryotic Cell, 2007, 6(1): 73-83.

[33]CAMPBELL C O, SANTIAGO D N, GUIDA W C, et al. In silico characterization of an atypical MAPK phosphatase of Plasmodium falciparum as a suitable target for drug discovery [J]. Chemical Biology & Drug Design, 2014, 84(2): 158-168.

[34]CHEN T, BI K, ZHAO Y, et al. MAPKK inhibitor U0126 inhibits Plasmodiophora brassicae development [J]. Phytopathology, 2018, 108(6): 711-720.

(責任编辑:陈海霞)