不同植物半胱氨酸蛋白酶及其基因的生物信息学分析
2018-07-26李蒙
李 蒙
(西安文理学院 生物与环境工程学院,陕西 西安 710065)
半胱氨酸蛋白酶(Cysteine Protease, CP, EC3.4.22)是一类重要的蛋白水解酶,广泛参与植物机体各种生理过程[1],如种子萌发与生长、组织分化与衰老、应激反应等[2-3]。近年来发现,不同植物中半胱氨酸蛋白酶分属于五大类的不同家族,在植物生长过程中起着重要的作用[4]。
在多种植物中研究发现蛋白的贮藏与降解、对非生物与生物胁迫的响应、自然衰老和胁迫诱导的衰老过程等与CP基因的表达相关[5]。目前在GenBank数据库中登录的植物CP基因序列有1万多条。有关学者已对拟南芥[6]、烟草[7]、水稻[8]等植物中的CP基因进行了大量的研究,发现:在水稻种子发芽期间CP基因REP-1参与种子储存蛋白的降解,以供种子萌发之需[9];在逆境胁迫下,水稻CP基因OsMC5表达量的增加明显增强了抗曲霉感染的能力,当感染牛肉粘虫受伤后,CP基因OsMC6的表达量增加[10];在衰老期间,烟草不同组织器官中CP基因NTCP-23的转录水平都有提高,表明CP在植物衰老过程中参与调控作用[11]。目前在多种植物中发现了半胱氨酸蛋白酶抑制剂CPI,如水稻、拟南芥、马铃薯、番茄等[12];在植物体内CPI与CP催化位点相互作用,它们之间维持动态平衡,调节机体的各种生理生化反应[13]。因此,探讨CP基因及酶的结构功能对明确植物参与逆境应答、细胞程序化死亡等生理过程具有重要的科学意义。
随着越来越多的CP基因被鉴定出来[14],在后续基因的表达调控机理研究中,将进一步探究CP酶的理化性质对植物生长发育的影响。本文通过生物信息学方法,对不同植物CP基因及其蛋白质的组成、结构与特征进行了预测分析,有助于发挥CP的功能,从而为农业大规模生产中改良作物开辟新途径。
1 材料与方法
1.1 材料
在NCBI中查询10种不同植物的半胱氨酸蛋白酶的核酸序列及其对应的氨基酸序列,即以拟南芥(NM_120069.5)、草莓(JN979371.1)、葡萄(EU280160.1)、番茄(AJ841791.1)、小麦(AY841792.2)、烟草(EU429306.1)、菠菜(AB377534.1)、豌豆(Z68291.1)、马铃薯(AJ245924.1)、水稻(X80876.1)作为研究对象。
1.2 方法
采用DNAStar、Clustal X2和Genedoc软件对10种植物CP的核酸序列和氨基酸序列进行分析与比对。采用ProtParam (http://web.expasy.org/protparam/)分析蛋白质的分子量、等电点、半衰期和稳定性等理化性质。采用TargetP (http://www. cbs.dtu.dk/services/TargetP/)、SignalP 4.1 (http://www.cbs.dtu.dk/services/Sig nalP/)进行蛋白质亚细胞定位、分泌信号肽分析等。采用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)分析预测蛋白质的二级结构。采用NetNGlyc (http://www.cbs.dtu.dk/services/NetN Glyc/)在线分析蛋白质糖基化。采用MotifScan (https://myhits.isb- sib.ch/cgi-bin/motif_scan)在线分析蛋白质脂酰化、磷酸化、cAMP和cGMP依赖蛋白激酶磷酸化位点。采用ClustalX 2.0和TreeView进行多重序列全局比对和系统发育树构建。
2 结果与分析
2.1 CP基因与氨基酸序列的理化性质
利用DNAStar软件和ProParam进行在线分析,结果如表1所示。10种植物半胱氨酸蛋白酶基因的ORF全长在1053~1443 bp,GC含量适中(除小麦和水稻略高外),氨基酸数目在350~480,分子量大小在38.58~52.99 kD,pI值在5.13~6.75,说明CP呈酸性,与蛋白序列中酸碱氨基酸比例结果一致。对氨基酸序列的组成进行分析,发现:氨基酸Ser和Gly在所有植物CP中含量较高,分别为6.8%~11.2%和7.2%~11.6%;还有部分氨基酸如Ala、Leu在大多数植物CP中含量也较高;而氨基酸Met和Trp在所有植物CP中含量较低,分别在1.3%~2.9%和1.3%~2.3%;还有部分氨基酸如Gln和Cys在大多数植物CP中含量也较低。所有植物CP蛋白质中负电荷氨基酸残基总数高于正电荷氨基酸残基总数,疏水性氨基酸的比例高于酸性、碱性和极性氨基酸的比例;在溶液中CP的不稳定指数为26.60~44.87,除番茄和马铃薯外均低于阀值(<40为稳定蛋白),推测绝大多数植物的CP为稳定蛋白。脂肪系数为62.04~80.27,亲水性平均系数为-0.578~0.195,说明CP蛋白质总体亲水性较低。
表1 植物CP的核苷酸及氨基酸序列组成和理化性质
2.2 CP氨基酸序列的比对分析
经ClustalX 2.0和Genedoc软件比对,发现不同植物CP的氨基酸序列具有同源性,普遍具有4个活性位点相关氨基酸残基Gln-Cys-His-Asn/Asp,以及半胱氨酸蛋白酶特有的保守结构域:ERFNIN基序、GNFD基序和GCDGG基序(图1)。说明不同植物半胱氨酸蛋白酶在进化过程中在功能区域具有较好的保守性。
2.3 CP翻译后修饰与功能位点分析
NetNGLyc在线分析结果(如表2)表明,除了草莓和水稻外,拟南芥(253NFSD)、葡萄(263NFSV)、番茄(136NKTA和322NYTY)、小麦(259NFSV)、烟草(115NGTF)、菠菜(447NASK)、豌豆(117NCSA、177NISL和246NITL)、马铃薯(125NKSD)的CP蛋白含有不同的糖基化位点。MotifScan在线分析结果(如表2)表明:所有植物CP蛋白都具有酪蛋白激酶Ⅱ磷酸化修饰位点和N端肉豆蔻酰化修饰位点;蛋白激酶C磷酸化修饰位点普遍存在于不同植物成熟的CP蛋白中(除烟草外);酪氨酸激酶磷酸化位点的修饰唯有拟南芥、葡萄、小麦、马铃薯CP蛋白含有; cAMP和cGMP依赖蛋白激酶磷酸化唯有番茄(283KKRT)、烟草(226KRNS)、菠菜(117RKKS和442RKGT)、豌豆(88RRLS)、马铃薯(120RKLS和462KKSS)蛋白序列位点修饰。
黑色和灰色分别表示氨基酸的相似性;红色方框标明催化位点;黄色方框标明保守结构域。AtCP:拟南芥(Arabidopsis thaliana)CP; FaCP:草莓(Fragaria xananassa)CP; VvCP:葡萄(Vitis vinifera)CP; LeCP:番茄(Lycopersicon esculentum)CP; TaCP:小麦(Triticum aestivum)CP; NtCP:烟草(Nicotiana tabacum)CP; SoCP:菠菜(Spinacia oleracea)CP; PsCP:豌豆(Pisum sativum)CP; StCP:马铃薯(Solanum tuberosum)CP; OsCP:水稻(Oryza sativa)CP。
2.4 植物CP蛋白的亚细胞定位和二级结构预测与分析
10种植物CP蛋白经TargetP在线分析,结果如表3所示,信号肽预测分值为0.768~0.994, cutoff值为0.430,说明存在信号肽。此结果与Signal P 4.0预测的信号肽结果相符,且Signal P 4.0预测10种植物CP蛋白序列在N端的19~25位氨基酸是信号肽的切割位点。亚细胞定位分析表明,线粒体定位预测值为0.008~0.145,定位于其他位置的预测值为0.005~0.158。采用SOPMA对CP蛋白进行二级结构预测,结果表明在不同植物CP蛋白的二级结构中α螺旋占23.64%~45.00%,β折叠占8.46%~16.58%,无规则卷曲占29.58%~45.06%,延伸链占12.47%~24.46%,说明CP蛋白的二级结构以α螺旋和无规则卷曲为主。
2.5 进化分析
利用ClustalX 2.0和TreeView进行分析,结果(如图2)表明:不同植物CP在进化过程中,豆科豌豆和茄科番茄的CP与其他科植物距离较远,亲缘性较远;十字花科的拟南芥、葡萄科的葡萄和禾本科的小麦聚为一个分支,说明它们亲缘性较近;而蔷薇科的草莓、藜科的菠菜、茄科的马铃薯、茄科的烟草和禾本科的水稻聚为一个分支,说明其亲缘性较近。说明植物CP在进化过程中同一科植物也有较大的差距。
表2 植物CP翻译后修饰和结构特征性序列分析结果
注:N-端糖基化位点的Threshold等于0.5。
3 讨论
植物半胱氨酸蛋白酶主要分为Papain(木瓜蛋白酶家族,C1)、Legumain(豆类天冬氨酸蛋白内切酶,C13)、Caspase(天冬氨酸特异性的半胱氨酸蛋白酶,C14)、Calpain(钙依赖半胱氨酸蛋白酶,C2)和其他半胱氨酸蛋白酶家族,目前对其中Papain的研究最为详尽[15],其氨基酸序列从N端到C端分为信号肽序列、前体肽序列和成熟酶序列[16],信号肽引导新生蛋白转移,前体肽序列在酶发挥活性时被切除[17],其中保守结构域就可能发挥至关重要的作用。本文通过生物信息学方法对蛋白质序列进行分析,发现了不同植物中CP的保守结构域:ERFNIN基序、GNFD基序和GCDGG基序。在CP酶发挥活性时,与4个活性位点相关的氨基酸残基Gln-Cys-His-Asn/Asp共同决定CP的功能特异性。在保守结构域与活性位点中个别氨基酸的替换可能决定了不同植物CP的活性差异,这为应用半胱氨酸蛋白酶在植物育种中提供了理论依据。
表3 植物CP蛋白的亚细胞定位及二级结构预测与分析结果
注:信号肽预测分值、线粒体位置预测值以及定位于其他位置预测值的specificity均大于0.95。
图2 不同植物CP的系统进化树
随着转录组测序在不同植物中开展,生物信息学为功能基因研究提供了便利的手段。本文通过生物信息学方法对影响10种植物生长的半胱氨酸蛋白酶进行分析,发现CP蛋白分子大小相差不大,GC含量适中(除小麦和水稻略高外),这些会影响植物组织中CP的转录和翻译,也会影响基因在体外(简单原核和真核细胞中)的表达[18],进而影响其功能。蛋白质的理化性质会影响其结构和生理功能;糖基化是蛋白质的主要修饰手段,影响其在组织或细胞中的定位与活性,疾病的发生与其相关位点的变异有关[19];蛋白质磷酸化修饰能够调节细胞之间的信号传导,在机体中影响细胞的再生和分化[20];酶的二级或空间结构直接决定了其底物的特异性,为酶学性质的研究提供了依据和理论参考[21]。
大量研究已证明,CP在植物生长过程中参与了抵抗生物胁迫及非生物胁迫等过程。因此,深入探索CP在转录和翻译水平上的调控机制,可以为今后采用基因手段改良农作物的性状和提高农作物的产量提供重要的理论依据。