APP下载

禾谷炭疽菌中候选G蛋白偶联受体蛋白的找寻

2022-01-26喻红稠韩长志

科学技术与工程 2022年1期
关键词:膜结构跨膜信号肽

喻红稠,韩长志,2*

(1.西南林业大学生物多样性保护学院,昆明 650224;2.云南省森林灾害预警与控制重点实验室,昆明 650224)

G蛋白偶联受体(G protein-coupled receptors,GPCR)典型的结构特征为具有7个疏水性跨膜[1-4],该跨膜结构域一般由7个相对保守的α跨膜螺旋和差异性较大的亲水环所组成[2]。该蛋白广泛存在于大多数真核生物中,参与多种不同的信号转导途径[5],主要负责跨细胞膜将胞外信号传递到胞内区域[6-7]。同时,GPCR作为真菌中G蛋白信号途径传递过程中的重要受体蛋白,参与接收外界信号,进行内部信号传导,从而实现真菌生长、发育、细胞增殖和凋亡过程等多种生理生化以及病理反应[8]。

禾谷炭疽菌Colletotrichumgraminicola(Cesati)Wilson[9]作为植物病原丝状真菌中引起许多植物炭疽病的重要病原真菌[10],可侵染玉米、小麦、高粱等禾本科植物,给世界农业生产造成了巨大损失[11-14]。20世纪70年代至今,玉米炭疽病在美国、印度等国家大流行、大爆发,严重制约着玉米产业的健康发展,引起了学术界普遍关注。基于此,前人对该菌开展了全基因组测序工作[12-13],并对其碳水化合物活性酶及分泌蛋白[15]、细胞凋亡[16]、遗传转化[17-18]、基因敲除技术[19]、基因功能[20]、小RNA[21]、启动子[22]等方面展开了深入研究工作。韩长志等[12-13]前期对该菌中G蛋白信号通路相关蛋白、分泌蛋白以及14-3-3蛋白和RGS蛋白等开展了诸多报道。目前,学术界对于真菌中候选GPCR的找寻,多基于模式生物酿酒酵母中GPCR蛋白同源比对及关键词搜索方法,也出现了构巢曲霉[23]、大豆疫霉[24]等GCPR一系列研究,为明确GPCR参与一些生理生化过程中的功能解析埋下伏笔。而关于禾谷炭疽菌的GPCR,前期明确了其仅有4个GPCR蛋白[12],显然与该菌实现其半活体营养等过程中诸多功能存在一定的差异,也与其他真菌已报道GPCR蛋白数量存在着差异。与此同时,制约了植物病原丝状真菌中GPCR相关蛋白的功能研究。

因此,现利用前人已经报道的蛋白跨膜数量预测软件TMHMM、Philius、TOPCONS对禾谷炭疽菌中全部蛋白中的跨膜数量进行预测分析,并结合SMART保守结构域分析,以期获得该菌中候选GPCR蛋白数量,同时,对该菌中的蛋白预测功能、跨膜结构域数量、氨基酸序列长度与蛋白数量之间的关系进行分析,以期为今后禾谷炭疽菌候选GPCR的理化性质分析和功能研究提供理论参考,也为后期其他炭疽菌属真菌中GPCR蛋白的找寻研究提供方法借鉴。

1 材料与方法

1.1 材料

禾谷炭疽菌M1.001全基因组数据来源于NCBI数据库(https://www.ncbi.nlm.nih.gov/genome/?term=Colletotrichum+graminicola+M1.001)。

1.2 方法

1.2.1 蛋白数量与功能

通过Microsoft Excel 2010软件对整理分析禾谷炭疽菌中的蛋白功能及氨基酸序列长度情况,并对蛋白质功能、氨基酸序列长度与蛋白数量之间的关系进行分析,并采用Origin 2018软件作图。

1.2.2 候选GPCR蛋白找寻方法

基于前期对于蛋白跨膜结构域的预测软件的对比分析(韩长志,未发表数据),利用TOPCONS(http://topcons.cbr.su.se/pred/)[25]、TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)[26]及Philius(http://www.yeastrc.org/philius/pages/philius/runPhilius.jsp)[27]等软件对禾谷炭疽菌中跨膜结构数量进行预测,筛选出具有7个跨膜结构域的蛋白(涉及含有7个跨膜结构域但不含有信号肽序列或者含有信号肽序列的具有8个跨膜结构域的蛋白)。同时,利用SMART保守结构域预测程序(http://smart.embl.de/smart/set_mode.cgi?NORMAL=1)对上述蛋白进行结构分析,最终获得禾谷炭疽菌中候选GPCR蛋白(图1)。

图1 技术路线Fig.1 Technical route

1.2.3 韦恩图绘制

通过在线工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html)[28]绘制韦恩图。

2 结果与分析

2.1 基本特征

2.1.1 预测功能主要为假定蛋白

通过对禾谷炭疽菌中12 020个蛋白开展功能归类分析,结果表明,主要功能为主要促进超家族转运体(major facilitator superfamily transporter)、糖基水解酶(glycosyl hydrolase)、细胞色素(cytochrome)、核糖体(ribosomal)、短链脱氢酶(short chain dehydrogenase)、FAD、RNA、WD结构域蛋白(WD domain-containing protein)、ATP、甲基转移酶(methyltransferase)、ABC、泛素(ubiquitin)、肽酶(peptidase)、假定蛋白(hypothetical protein)等类别,上述功能蛋白具有6 997个,居前三位的蛋白数量分别为5 484、251、173个,所占比例分别为45.62%、2.09%、1.44%(图2)。同时,发现具有其他种类功能的蛋白数量相对较少、种类较多,有1 525种功能,总蛋白数量为5 023个,所占比例为41.79%(图2)。上述结果表明,通过全基因组测序可以较好地实现蛋白功能的预测,而大多数蛋白的功能尚未得到明确,有待于进一步通过生物学试验进行验证。

图2 禾谷炭疽菌中全部蛋白预测功能的分布情况Fig.2 Distribution of all protein prediction functions in C. graminicola

2.1.2 氨基酸长度主要集中在1 000 AA以下

禾谷炭疽菌中的蛋白氨基酸序列长度范围为31~8 935 AA(AA代表氨基酸),首先以500 AA为区间进行分析,结果表明,长度主要集中在1 000 AA以下,数量为11 231个,所占比例高达93.44%,而基酸长度大于1 000 AA的蛋白数量为789个,所占比例为6.56%。进一步以100 AA为区间进行分析,结果表明,该菌中的蛋白序列长度中主要集中在301~400 AA,数量为1 971个,所占比例为16.40%,其次为101~200、201~300、401~500、501~600 AA,数量分别为1 733、1 838、1 641、1 402个,所占比例分别为14.42%、15.29%、13.65%、11.66%(图3)。

图3 禾谷炭疽菌中全部蛋白氨基酸长度的分布情况Fig.3 Distribution of lengths in all proteins of C. graminicola

2.2 候选GPCR蛋白的找寻

2.2.1 跨膜蛋白数量分析

通过TMHMM软件分析,发现禾谷炭疽菌中不具有跨膜结构域的蛋白数量较多,为9 545个,所占比例为79.41%,其次为具有1个跨膜结构域的蛋白,数量为863个,所占比例为7.18%;同时,利用Philius软件分析,得出该菌中不具有跨膜结构域的蛋白数量为9 432个,所占比例为78.47%,而具有1个跨膜结构域的蛋白数量为810个,所占比例为6.74%;此外,通过TOPCONS软件分析,得出该菌中不具有跨膜结构域的蛋白数量为9 191个,所占比例为76.46%,而具有1个跨膜结构域的蛋白数量为889个,所占比例为7.40%(图4)。通过上述三种跨膜结构数量预测软件分析,明确不同预测软件所获得的不同跨膜结构域的蛋白数量大致相同(图4)。

图4 三种预测软件预测跨膜数量情况对比分析Fig.4 Comparison of the number of transmembrane based on three kinds of prediction software

2.2.2 具有七跨膜结构蛋白数量分析

通过三种分析软件预测,明确禾谷炭疽菌中含有七跨膜结构域的蛋白数量为243个,其中,通过TMHMM分析,具有七跨膜结构不含信号肽蛋白数量为143个,具有八跨膜结构含信号肽蛋白数量为6个,共计149个;通过Philius分析,具有七跨膜结构不含信号肽蛋白数量为145个,具有八跨膜结构含信号肽蛋白数量为3个,共计148个;通过TOPCONS分析,具有七跨膜不含信号肽蛋白数量为169个,具有八跨膜结构含信号肽蛋白数量为4个,共计173个(表1)。

表1 含有七跨膜结构蛋白的数量分布情况Table 1 The number distribution of proteins containing seven transmembrane structures

进一步对上述三种软件所获得的跨膜蛋白进行分析,结果表明:共同具有的蛋白数量为82个,仅由TMHMM和Philius分析,共同得出89个蛋白;仅由TMHMM和TOPCONS分析,共同得出92个蛋白;仅由Philius和TOPCONS分析,共同得出128个蛋白。同时,50个蛋白仅由TMHMM软件预测得到,13个蛋白仅由Philius软件预测得到,35个蛋白仅由TOPCONS软件预测得到(图5)。

图5 三种跨膜结构分析软件预测跨膜蛋白数量分布情况Fig.5 The distribution of the number of transmembrane proteins based on three kinds of transmembrane structure analysis software

2.2.3 保守结构域分析

进一步利用SMART保守结构域在线分析,结果表明,在243个候选GPCR中,不具有明显保守结构域的蛋白数量为220个,具有明显保守结构域的蛋白数量为23个,可以分为10类,所涉及的保守结构域为CTNS、TLC、RING、WD40、TRP_N、Cation ATPaes_N、Solute_trans_a、acidPPc、Bac_rhodopsin和PSN(图6),最终明确禾谷炭疽菌中具有的候选GPCR蛋白数量为220个,其蛋白ID为XP_008088898.1、XP_008088940.1、XP_008088990.1、XP_008089108.1、XP_008089111.1、XP_008089154.1、XP_008089168.1、XP_008089252.1、XP_008089256.1、XP_008089263.1、XP_008089306.1、XP_008089347.1。

图6 保守结构域情况Fig.6 Conserved domains

进一步对上述所筛选出的220个候选GPCR蛋白的预测功能进行分析,发现上述蛋白多集中在假定蛋白,数量为97个,所占比例为44.09%,其次为整合膜蛋白、铁还原酶类跨膜组分,数量分别为28、10个,所占比例为12.73%、4.55%(图7)。还有RTA1类蛋白、几丁质合成酶、ZIP锌转运体、含CFEM结构域蛋白、主要促进超家族转运体的蛋白等,其数量分别为7、6、6、5、5个,所占比例分别为3.18%、2.73%、2.73%、2.27%、2.27%(图7)。

图7 候选GPCR蛋白预测功能与数量的分布情况Fig.7 The distribution of predictive function and number of candidate GPCR proteins

3 结论与讨论

GPCR作为重要的联系生物内外信号的蛋白,其典型特征是具有七跨膜结构域,在真菌生长发育、信息传递以及侵染等过程中发挥着重要作用。鉴于GPCR人工结晶存在诸多困难以及结构解析存在费用较大等问题,学术界开发了诸多用于GPCR膜蛋白预测及分析的数据库和软件,为高效实现生物中GPCR的找寻及结构分析提供了重要的工具支撑。然而,就真菌中GPCR预测而言,由于缺少明确的保守结构域,前人对其预测多采用模式生物酿酒酵母同源比对及关键词搜索等方法[12],严重影响着对其功能的深入解析。对于真菌中GPCR蛋白的预测分析,按照一种预测分析软件开展,影响到候选GPCR蛋白的找寻数量准确性。因此,无论是利用模式真菌中GPCR开展同源比对及关键词搜索,还是采用某一种跨膜结构域预测分析,都容易产生假阳性问题和真正GPCR蛋白遗漏等问题。

近期研究指出,GPCR蛋白含有一段信号肽序列,可以引导真核生物和原核生物中几乎所有蛋白质的分泌[29]。这为进一步解析GPCR蛋白功能以及找寻候选GPCR蛋白提供了特征依据。结合了GPCR所具有的典型七跨膜蛋白数量特征以及信号肽序列特征,按照具有七跨膜结构特征而不含有信号肽序列以及具有八跨膜结构域且含有信号肽序列进行筛选。同时,随着人们不断地对真菌或卵菌中GPCR研究的不断深入,发现了一些新型GPCR,在跨膜结构数量方面含有5~9个跨膜结构域[24],在保守结构域方面含有CFEM等[30]。这为未来进一步开展GPCR蛋白找寻提供了重要的特征依据。

根据经典GPCR中含有七跨膜结构域特征,通过TOPCONS、TMHMM和Philius三种跨膜结构域分析软件,对禾谷炭疽菌中具有七跨膜结构域的蛋白进行筛选,再通过SMART保守结构域分析,最终明确禾谷炭疽菌中具有243个蛋白含有七跨膜结构域,其中23个蛋白具有明显的保守结构域,220个蛋白为候选GPCR,其功能主要集中在假定蛋白,氨基酸序列长度主要集中在301~400 AA。随着人们对于真菌中GPCR蛋白跨膜结构数量预测准确性的不断提高,特别是采用生物学试验验证方法,可以较为准确地知晓禾谷炭疽菌中GPCR的数量及功能。研究为进一步开展禾谷炭疽菌中候选GPCR蛋白的理化性质分析和功能提供重要的理论依据,也对进一步开展其他炭疽菌等植物丝状病原真菌中候选GPCR蛋白找寻研究具有重要的借鉴意义。

猜你喜欢

膜结构跨膜信号肽
超滤膜法处理含油清洗废水及清洗剂回用研究
本期英文缩略语名词解释
信号肽筛选优化提高耐热α-环糊精酶在枯草芽胞杆菌中的表达
基于信号肽策略提高外源蛋白在枯草芽孢杆菌中的表达
西湖大学:首次实现跨膜孔蛋白的精确从头设计
充气膜结构找形简析
金属过渡层类型对非晶碳膜结构性能的影响
基于外泌蛋白质组的酿酒酵母信号肽元件的分析及鉴定
超滤在赤峰热电厂水处理中的应用
信号肽与分泌通路在毕赤酵母表达异源蛋白中的作用机制