APP下载

三种隐孢子虫钙依赖蛋白激酶的生物信息学分析

2016-07-21张学勇简莹娜马利青

生物信息学 2016年2期
关键词:生物信息学

张学勇简莹娜马利青

(1. 青海大学畜牧兽医科学院, 西宁 810016;2. 青海省畜牧兽医科学院,西宁 810016)



三种隐孢子虫钙依赖蛋白激酶的生物信息学分析

张学勇1,2,简莹娜1,2,马利青1,2*

(1. 青海大学畜牧兽医科学院, 西宁 810016;2. 青海省畜牧兽医科学院,西宁 810016)

摘要:对三种隐孢子虫(C. parvum Iowa II、 C. hominis TU502和C. muris RN66)钙依赖蛋白激酶(Calcium-dependent protein kinases, CDPKs)进行生物信息学分析,探索该蛋白的结构并预测其功能,为其基因功能的研究提供一定的理论基础。通过隐孢子虫基因组数据库收集数据,获得三种隐孢子虫CDPKs蛋白的序列信息,通过生物信息学软件进行分析,预测该蛋白的理化性质、翻译后修饰位点、功能域、亚细胞定位、二级结构、亲/疏水性、抗原表位等。隐孢子虫CDPKs的蛋白性质不稳定,理论分子量从59.76 kDa到76.63 kDa,pI值为5.33~6.09,CDPKs不具有跨膜区和信号肽,不是跨膜分泌性蛋白,都具有蛋白激酶C 磷酸化位点、酪氨酸激酶Ⅱ磷酸化位点、酪氨酸激酶磷酸化位点、cAMP和cGMP依赖蛋白激酶磷酸化位点、N-端糖基化位点、N-端肉豆蔻酰化位点和EF-hand钙结合域,二级结构主要以α螺旋和无规卷曲为主;CDPKs主要存在虫体细胞内,均有20多个潜在的抗原表位。在隐孢子虫中,CDPKs蛋白不仅可单独发挥作用,而且还能通过相互结合发挥其生物学效应;同时,CDPKs有望成为候选疫苗及潜在药物靶点。

关键词:隐孢子虫;钙依赖蛋白激酶;生物信息学;蛋白结构;功能预测

隐孢子虫(Cryptosporidiumspp.)是一种呈世界性分布的人兽共患寄生性原虫,已成为世界范围内水源性传播疾病中的重要病原体,它们能感染人、家畜和野生动物,严重威胁着人类和动物的健康及畜牧业的发展[1]。因为隐孢子虫是机会性致病病原体,在免疫功能低下的个体中常常出现暴发性或慢性、长期性感染,严重时可引发死亡,且目前尚无有效的预防治疗方法[2]。随着三株隐孢子虫(C.parvumIowaII,C.hominisTU502和C.murisRN66)全基因组测序工作的完成[3-4],这将更有利于对其基因结构和功能的研究。

钙依赖蛋白激酶(Calcium-dependent protein kinases, CDPKs)是一种丝氨酸/苏氨酸蛋白激酶,此激酶接收并传导Ca2+信号且其活性受Ca2+的调控而不依赖钙调素和磷脂。典型的CDPK分子是由四个结构域组成的多肽链,包括N末端的可变结构域(N-terminal variable domain)、激酶活性结构域(Kinases domain)、连接结构域(Junction domain,JD)和C末端钙调素类似结构域(CaM-like domain,CLD)[5],其参与多种生命活动的调控。

由于哺乳动物中不存在CDPKs的同源蛋白,所以CDPKs是理想的抗隐孢子虫的候选药靶。为了更好地分析这类蛋白激酶的功能及对隐孢子虫的重要意义,本文对隐孢子虫CDPKs蛋白的结构和特征进行全面的生物信息学分析,为进一步研究其生物学功能及其在疫苗和药靶研究中的应用提供线索。

1材料与方法

1.1数据收集

在隐孢子虫基因组数据库(http://cryptodb.org/cryptodb/)中“Gene Text Search”信息栏输入并搜索CDPK,收集C.parvumIowaII,C.hominisTU502和C.murisRN66基因组中的CDPKs,获取各蛋白相对应的核苷酸序列及蛋白序列。

1.2结构域分析与验证

将搜索获得的蛋白序列输入到NCBI结构域数据库(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)中进行各蛋白的结构域搜索,以进一步确定分析CDPKs结构域;而后用在线搜索工具Pfam(http://pfam.xfam.org/)验证结构域搜索结果。

1.3蛋白质特性预测

将各个蛋白序列输入到ExPASy(http://www.expasy.org/)数据分析系统中,进行蛋白特性预测。采用ProtParam(http://web.expasy.org/protparam/)程序计算蛋白质的分子量、等电点和氨基酸组成等理化性质;采用TargetP(http://www.cbs.dtu.dk/services/TargetP/)和SignalP (http://www.cbs.dtu.dk/services/SignalP/)程序分析亚细胞定位序列等特征序列:分泌信号肽、质体、线粒体和过氧化物酶体等;采用Motif Scan(http://myhits.isb-sib.ch/cgi-bin/motif_scan)程序预测糖基化、磷酸化、脂酰化、cAMP和cGMP依赖蛋白激酶磷酸化位点及EF-hand钙结合域等修饰位点和模序。

1.4蛋白质的二级结构和抗原表位分析

利用DAS-TMfilter server(http://mendel.imp.ac.at/sat/DAS/DAS.html)、HMMTOP(http://www.enzim.hu/hmmtop/index.php)和TMHMM-2.0(http://www.cbs.dtu.dk/services/TMHMM-2.0/)分析蛋白的跨膜区域,应用ProtScale(http://web.expasy.org/protscale/)分析蛋白质的亲/疏水性。采用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)软件进行蛋白二级结构预测;利用Predicted Antigenic Peptides(http://imed.med.ucm.es/Tools/antigenic.pl)进行抗原表位分析。

1.5序列比对与构建系统发育树

通过NCBI提供的BLAST在线搜索服务软件获取顶复门寄生原虫弓形虫(ToxoplasmagondiiME49)、疟原虫(Plasmodiumreichenowi)、巴贝斯虫(Babesiabovis)、球虫(Eimeriatenella)及隐孢子虫(C.parvumIowaII,C.hominisTU502和C.murisRN66)CDPKs的氨基酸序列。使用MEGA5.05软件的系统发育树构建功能对这些氨基酸序列进行分析,选择邻近法(Neighbor-Joining method, NJ)构建系系统发育树,并使用自展值(Bootstrap)检验其可靠性,重复次数为2 000,分析不同顶复门寄生原虫CDPKs基因间的进化关系。

2结果分析

2.1含CDPK结构域蛋白的初筛和确定

在隐孢子虫基因组数据库的全基因组中搜索获得15个含有CDPK的结构域蛋白,根据注释描述分析发现5个假设蛋白(Hypothetical/putative protein),除去这些假设蛋白,将剩余的10个蛋白序列输入到NCBI结构域网站中搜索CDPK结构域后,只有6个蛋白是真正的CDPK蛋白,为进一步确认淘汰的是否是CDPK蛋白,将其输入到pfam结构域搜索,结果仍不是CDPK蛋白。因此,对这6个真正的CDPK蛋白进行深入分析。

2.2蛋白基本性质分析

经过ExpASy在线系统分析,如表1所示这些蛋白的基本性质:其在氨基酸长度、分子量大小和等电点上差异不大,其氨基酸长度在523~677 aa,分子量从59.76 kDa到76.63 kDa,pI值从5.33~6.09,呈现着明显的区别。带正(12.35%~14.91%)、负(14.03%~16.25%)电荷氨基酸残基数占氨基酸总数比例基本一致,且带正电荷氨基酸残基比带负电荷氨基酸残基多。假定所有的半胱氨酸都形成二硫键,CDPKs在280 nm处的摩尔消光系数:46 215~87 500 L/mol·cm及0.1%浓度(1 g/L)的Abs值:0.773~1.128;假定所有的二硫键打开时,蛋白在280 nm处的摩尔消光系数:45 840~86 750 L/mol·cm及0.1%浓度(1 g/L)的Abs值为:0.767~1.119,可见其吸光性质有所差别。CDPKs在溶液中的不稳定指数为:37.46~45.06,除Cgd5_820外均高于阈值40,推测CDPKs为不稳定蛋白。CDPKs的脂肪族指数为:84.38~87.58,亲水性平均系数:-0.397~-0.486,蛋白总体亲水性较低。

表1 CDPKs基本性质分析

注:A*:假定所有的半胱氨酸都形成二硫键,蛋白在280 nm处的摩尔消光系数值(L/mol·cm)及0.1%浓度(1 g/L)的Abs值;

B*:假定所有的二硫键打开时,蛋白在280 nm处的摩尔消光系数值(L/mol·cm)及0.1%浓度(1 g/L)的Abs值。

2.3 翻译后修饰和结构特征性序列分析

模序分析潜在的翻译后修饰位点显示(如表2),CDPKs蛋白含有糖基化位点:1~3个,糖基化位点保证CDPKs能够正确折叠且可以传导信号。蛋白激酶C 磷酸化位点:6~9个;酪氨酸激酶Ⅱ磷酸化位点:11~14个;酪氨酸激酶磷酸化位点:1~2个;cAMP和cGMP依赖蛋白激酶磷酸化位点:1~3个;这可以促进其和其他蛋白质相互作用而形成多蛋白复合体,再进一步促进蛋白质的磷酸化。N端肉豆蔻酰化位点:2~5个; EF-hand钙结合域:7~8个;EF-hand结构域能与Ca+2离子结合而改变构象,进而暴露靶结合位点而发挥生物学功能。这些结构特征性序列如表2所示,表明CDPKs具有重要的生物学功能。

2.4蛋白的亚细胞定位、抗原表位和二级结构预测与分析

对CDPKs的信号肽和信号肽酶剪切位点的预测显示(如表3), 它们的序列信号肽预测分值为:0.043~0.280,cutoff预测值均为0(< 0. 9) ,表明CDPKs序列无信号肽和信号肽酶剪切位点。CDPKs的亚细胞定位分析发现,CDPKs序列定位于线粒体的部分得分为:0.063~0.274(< 0. 9) ,而定位于其他部分的得分为:0.678~0.954(> 0. 95),说明CDPKs序列没有线粒体等定位序列,且该预测具有较高可信度。CDPKs的二级结构预测分析发现α螺旋比例为:34.62%~49.33%,β折叠比例为:7.53%~11.66%,无规则卷曲比例为:23.14%~34.17%,延伸链比例为:13.86%~21.30%,可见CDPKs的二级结构以无规则卷曲为主。对CDPKs蛋白的氨基酸序列中潜在的抗原表位做进一步分析, 显示有20~29个潜在的抗原表位,且平均抗原倾向性均大于1.000,CDPKs蛋白含有较多的优势抗原表位结构,可作为一种免疫原性蛋白。

2.5 系统发育树的构建

通过MAGE5.05软件构建的NJ 树如图1所示,其中用于构建系统发育树的3种隐孢子虫分析序列分为3个类群,有意思的是它们均与ToxoplasmagondiiME49聚为一支,可见在系统发育树上发现它们之间的进化距离最近。并且Chro.20142、cgd2_1300和Chro.70214、cgd7_1840一致性最高,可见C.parvumIowaII和C.hominisTU502的亲缘关系较近。这为后续从分子遗传学角度探索CDPKs的功能及其作为候选药靶和疫苗提供了新的思路。

表2 翻译后修饰和结构特征性序列分析

表 3 亚细胞定位和抗原表位分析及二级结构预测与分析

3讨论

CDPKs是一类属于丝氨酸/苏氨酸蛋白激酶,在各种植物和原生动物中广泛存在并参与多种生命活动的调控。如在植物中,CDPKs参与离子泵/离子通道的开合、基因转录、细胞骨架构建、基因转录和新陈代谢等过程的调控[6]。随着原生生物基因组测序工作的开展,在弓形虫、疟原虫等顶复门原虫中发现了多个CDPKs同源蛋白[5]。在弓形虫和疟原虫研究中发现,CDPKs参与调控弓形虫虫体入侵细胞、运动、分化和蛋白分泌等生理过程;疟原虫的CDPKs可调控其入侵按蚊小肠上皮细胞和在宿主体内发育等过程。Manja Etzold等实验研究表明,隐孢子虫的CDPKs具有阶段性表达特征,CDPKs在隐孢子虫的生长发育以及进化过程中均发挥了重要作用[7]。同时,研究表明在哺乳动物中不存在CDPKs,所以CDPKs可以作为有效的疫苗和药靶研究候选分子[8-9]。

图1 隐孢子虫与其他顶复门寄生原虫CDPKs的系统发育分析

通过分析发现隐孢子虫的CDPKs是不具备分泌信号肽的疏水性蛋白,推测其在细胞内合成后可以直接发挥生物学功能。蛋白的多肽链合成后,不具有生物学活性,翻译完成后需要经过一系列的加工形成相对稳定的空间结构,从而发挥生物学功能;通过预测蛋白的二级结构发现,CDPKs由α螺旋和无规则卷曲构成。多项研究表明,蛋白质的去磷酸化和磷酸化对于细胞内信号传导十分重要,可以调控多种细胞过程活动[10];对隐孢子虫的CDPKs分析发现,CDPKs具有多个磷酸化位点,如蛋白激酶C磷酸化位点、酪氨酸激酶Ⅱ磷酸化位点、酪氨酸激酶磷酸化位点和cAMP和cGMP依赖蛋白激酶磷酸化位点。同时,N-端糖基化位点与物质转运和蛋白定位粘附密切相关[11],N-端肉豆蔻酰化位点也参与蛋白的定位过程[12];对隐孢子虫的CDPKs研究发现,其具有N-端糖基化位点和N-端肉豆蔻酰化位点。同时CDPKs均具有EF-hand结构域,其能与Ca2+结合从而促使CDPKs的构象改变,从而发挥Ca2+依赖蛋白激酶蛋白的各种功能[13]。本研究对CDPKs的抗原表位预测发现,均具有20多个,可能成为抗隐孢子虫感染疫苗的有效成分之一。因此,对CDPKs的理化性质、二级结构和功能位点的预测和分析,在该蛋白功能的进一步研究具有重要意义。

4结论

本研究通过生物信息学方法分析了三种隐孢子虫的CDPKs的基本性质,蛋白翻译后的修饰和结构特征性序列,及其亚细胞定位、抗原表位和二级结构等特征;此外,通过遗传关系比较分析,三种隐孢子虫的CDPKs均与弓形虫的聚在一起,可借鉴弓形虫的相关成果来研究隐孢子虫的CDPKs。研究发现,在疟原虫(Plasmodiumreichenowi)、巴贝斯虫(Babesiabovis)、球虫(Eimeriatenella)等顶复门原虫中都存在CDPKs蛋白,同时,该蛋白与虫体对宿主细胞的粘附和入侵及其生长发育密切相关。因此,CDPKs基因有望成为研制隐孢子虫基因工程疫苗的候选基因以及抗隐孢子虫的潜在药物靶点。

参考文献

[1]O’DONOGHUE P J.Cryptosporidiumandcryptosporidiosisin man and animals[J]. International Journal for Parasitology, 1995, 25(2): 139-195.

[2]COLFORD J M J R, TAGER I B, HIROZAWA A M,et al.Cryptosporidiosisamong patients infected with human immunodeficiency virus. factors related to symptomatic infection and survival[J]. The American Journal of Epidemiology, 1996, 144(9): 807-816.

[3]ABRAHAMSEN M S, TEMPLETON T J, ENOMOTO S,et al. Complete genome sequence of the apicomplexan,Cryptosporidiumparvum[J]. Science, 2004, 304(5669): 441-445.

[4]XU P, WIDMER G, WANG Y,et al. The genome ofCryptosporidiumhominis[J]. Nature, 2004, 431(7012): 1107-1112.

[5]BILLKER O, LOURIDO S, SIBLEY L D. Calcium-dependent signaling and kinases in apicomplexan parasites[J]. Cell Host Microbe, 2009, 5(6): 612-622.

[6]HARMON A C, GRIBSKOV M, HARPER J F. CDPKs-a kinase for every Ca2+signal?[J]. Trends in Plant Science, 2000, 5(4): 154-159.

[7]ETZOLD M, LENDNER M, DAUGSCHIES A,et al. CDPKs ofCryptosporidiumparvum-stage-specific expression in vitro[J]. Parasitology Research, 2014, 113(7): 2525-2533.

[8]CASTELLANOS-GONZALEZ A, WHITE A C J R, OJO K K,et al.A novel calcium-dependent protein kinase inhibitor as a lead compound for treatingcryptosporidiosis[J]. The Journal of Infectious Diseases, 2013, 208(8): 1342-1348.

[9]KEYLOUN K R, REID M C, CHOI R,et al. The gatekeeper residue and beyond: homologous calcium-dependent protein kinases as drug development targets for veterinarian Apicomplexa parasites[J].Parasitology, 2014, 141(11): 1499-1509.

[10]JOHNSON L N.The regulation of protein phosphorylation[J]. Biochemical Society Transactions,2009, 37(4): 627-641.

[11]BUTEAU H, PEZET A,FERRAG F,et al. N-glycosylation of the prolactin receptor is not required for activation of gene transcription but is crucial for its cell surface targeting[J]. Journal of Molecular Endocrinology, 1998, 12(4): 544-555.

[12]LI L B, CHEN N, RAMAMOORTHY S,et al. The role of N-glycosylation in function and surface trafficking of the human dopamine transporter[J].The Journal of Biological Chemistry, 2004, 279(20):21012-21020.

[13]MORENO S N,DOCAMPO R.Calcium regulation in protozoan parasites[J].Current Opinion in Microbiology,2003, 6(4): 359-364.

Function analysis of Calcium-dependent protein kinases inCryptosporidiumbased on bioinformatics

ZHANG Xueyong1,2, JIAN Yingna1,2, MA Liqing1,2*

(1.TheAcademyofAnimalandVeterinarySciences,QinghaiUniversity,Xining810016,China;2.QinghaiAcademyofAnimalSciencesandVeterinaryMedicine,Xining810016,China)

Abstract:The propose of this study is to conduct bioinformatics analysis about the calcium-dependent protein kinases of Cryptosporidium(C.parvum Iowa II,C.hominis TU502 and C.muris RN66),and to explore the structures and predict the functions of the protein family for the studies of genetic function of Cryptosporidium offering theoretical basis. The protein sequences of Cryptosporidium CDPKs were obtained from the Genome Database and then the bioinformatics softwares were used to analyze and predict the physico-chemical properties of the proteins, such as post-translational modification sites, functional domains, subcellular localization, secondary structure, hydrophilicity/hydrophobicity and epitopes.The proteins had unstable physico-chemical characteristics. The theoretical molecular weight of the deduced proteins were from 59.76 to 59.76 kDa, theoretical pI from 5.33 to 6.09,no transmembrane regions and signal peptides, all had N-glycosylation sites, protein kinase C phosphorylation sites, casein kinase II phosphorylation sites, Tyrosine kinase phosphorylation sites,N-myristoylation sites,cAMP-and cGMP-dependent protein kinase phosphorylation sites and EF-hand calcium-binding domains; Secondary structure mainly were alpha helix and random coil;CDPKs mainly exist in body cells,had more than 20 potential antigen epitopes.In Cryptosporidium,CDPKs were able to work alone, but also through mutual supports exert biological effects,meanwhile CDPKs will promise to be vaccine candidates and potential drug targets.

Keywords:Cryptosporidium;Calcium-dependent protein kinases;Bioinformatics;Protein structure;Function prediction

收稿日期:2016-03-06;修回日期:2016-04-15.

基金项目:国家外专局“外专千人计划”专项基金项目(No.WQ20136300172)。

作者简介:张学勇,男,执业兽医师,硕士,研究方向:动物疫病的诊断和防治;E-mail:zhang_xyong@163.com. *通信作者:马利青,男,研究员,研究方向:动物疫病的诊断和防治;E-mail:maliq67@hotmail.com.

doi:10.3969/j.issn.1672-5565.2016.02.03

中图分类号:Q51

文献标志码:A

文章编号:1672-5565(2016)02-078-06

猜你喜欢

生物信息学
中药蛋白质组学研究策略
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
数据挖掘技术在生物信息学中的应用
生物信息学课堂危机及对策研究
案例教学法在《生物信息学》本科教学中的应用
论生物信息学研究进展及在蛋白质组学研究中的应用
农学类专业《生物信息学》课程教学改革探讨