咖啡豆α-半乳糖苷酶的同源建模及分析
2016-09-12陶佳妮沈汪洋
陶佳妮,李 赟,姚 娣,沈汪洋,2,*,陈 轩,周 坚,2
(1.武汉轻工大学食品科学与工程学院,湖北武汉 430023;2.农产品加工湖北省协同创新中心,湖北武汉 430023)
咖啡豆α-半乳糖苷酶的同源建模及分析
陶佳妮1,李赟1,姚娣1,沈汪洋1,2,*,陈轩1,周坚1,2
(1.武汉轻工大学食品科学与工程学院,湖北武汉 430023;2.农产品加工湖北省协同创新中心,湖北武汉 430023)
为进一步了解咖啡豆α-半乳糖苷酶的结构,对咖啡豆α-半乳糖苷酶的理化性质、二级结构及三级结构等进行了理论分析和预测,并在三级结构的基础上进行同源建模研究。分析表明,该酶呈酸性,亲水,稳定。二级结构以α-螺旋和无规则卷曲为主,其空间结构与大米α-半乳糖苷酶相似度较高,以此为模版构建了可靠的三维结构模型。模型的一侧是由8个α-螺旋和8个β-转角形成的球状结构,另一侧是8个β-转角。实验结果为咖啡豆α-半乳糖苷酶的空间结构和催化活性位点的研究提供了理论依据。
咖啡豆α-半乳糖苷酶,蛋白质结构分析,同源建模
α-半乳糖苷酶(α-galactosidase,EC 3.2.1.22)是一种外切糖苷酶,主要作用对象是具有α-半乳糖苷结构的碳水化合物。该酶广泛存在于植物、动物及微生物中[1-5],应用于食品工业、饲料工业、医药工业等领域。咖啡豆α-半乳糖苷酶是α-半乳糖苷酶的一种,来源于咖啡豆[6-7],咖啡豆α-半乳糖苷酶能够将半乳糖苷直接接枝到母体环糊精上,使之成为带有特殊识别糖基的环糊精衍生物,具有特殊的作用[8-12]。但对该酶在合成反应中的活性位点和空间结构的认知很有限。对咖啡豆来源的α-半乳糖苷酶结构研究不够深入。
目前在蛋白质数据库(Protein Data Bank)中α-半乳糖苷酶的晶体结构共有40个,尚未发现咖啡豆α-半乳糖苷酶的结构模型。因此,有必要对咖啡豆α-半乳糖苷酶的结构进行深入研究。同源建模是基于序列-结构相似性原则,通过模板蛋白质构建待测蛋白质的三维结构模型。当蛋白质序列的一致性大于30%,便可以利用模板蛋白质的结构来建立靶蛋白质的三维结构[13-18]。同源建模原理基于两点:蛋白质的结构由其氨基酸序列唯一决定;蛋白质的结构在进化中更稳定,结构变化比序列变化要慢得多。因此在序列一致性较高的情况下同源建模可以比较准确的预测一个蛋白质的结构模型。王海波等[19]采用同源建模法构建了紫花苜蓿蛋白质二硫键异构酶mPDI的三维结构,张远等[20]构建了嗜冷黄杆菌酰基-Acp去饱和酶的三维结构,赵斌等[21]构建了拟南芥转酮醇酶蛋白AtTKL1的三维结构。
本文通过应用多种生物信息学原理对咖啡豆α-半乳糖苷酶的一级结构、二级结构和三级结构进行了预测和分析,并构建了咖啡豆α-半乳糖苷酶的结构模型,为咖啡豆α-半乳糖苷酶结构和功能的研究提供了理论依据。
1 材料与方法
1.1材料与仪器
咖啡豆α-半乳糖苷酶序列来自欧洲生物信息学研究所(SWISS-PROT)蛋白质序列数据库(http://www.uniprot.org/),检索序列号(AC)为:Q42656。咖啡豆α-半乳糖苷酶的氨基酸序列见图5。
同源建模软件MODELLER9.14[22];分子三维结构显示软件PyMOL1.7[23]。
1.2实验方法
1.2.1咖啡豆α-半乳糖苷酶一级结构分析采用瑞士生物信息学研究所提供的ProtParam程序(http://web.expasy.org/protparam/)对咖啡豆α-半乳糖苷酶的相对分子量、氨基酸残基数目、组成、蛋白质理论等电点及疏水性平均值等参数进行分析。
采用ProtScale(http://web.expasy.org/protscale/)对咖啡豆α-半乳糖苷酶的疏水性进行分析。
采用TMHMM Server v. 2.0(http://www.cbs. dtu.dk/services/TMHMM/)对咖啡豆α-半乳糖苷酶的跨膜区域进行预测。
采用SignalP 4.0 Server(http://www.cbs.dtu.dk/services/signalP/)对咖啡豆α-半乳糖苷酶的信号肽进行预测。
采用PSORT Prediction(http://psort.hgc.jp/form.html)对咖啡豆α-半乳糖苷酶进行细胞定位进行预测。
采用ScanProsite(http://prosite.expasy.org/scanprosite/)对咖啡豆α-半乳糖苷酶的结构域进行分析。
1.2.2咖啡豆α-半乳糖苷酶二级结构预测采用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa automat.pl?page=/NPSA/npsa_sopma.html)对咖啡豆α-半乳糖苷酶的α-螺旋、延伸链、β-转角结构以及无规则卷曲等进行分析预测。
1.2.3咖啡豆α-半乳糖苷酶三级结构预测采用NCBI BLAST(http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Proteins)进行序列搜寻和比对,选出模版蛋白质。
使用专业同源建模软件MODELLER9.14来构建咖啡豆α-半乳糖苷酶结构模型,采用molpdf,DOPE score,GA341 score三种评估方法对模型进行评估[24]。
使用PyMOL软件展示咖啡豆α-半乳糖苷酶的三级结构模型。
1.2.4咖啡豆α-半乳糖苷酶三级结构评估采用Procheck、ERRAT和Verify_3D(http://nihserver. mbi.ucla.edu/SAVES/)对咖啡豆α-半乳糖苷酶的结构模型进行评估。
2 结果与讨论
2.1咖啡豆α-半乳糖苷酶一级结构分析
咖啡豆α-半乳糖苷酶由378个氨基酸组成,分子量为41.31 kDa,其分子式为C1819H2804N500O568S17,计算得到的原子总数为5708,等电点为5.60。酸性氨基酸残基总数(Asp+Glu)为43,碱性氨基酸残基总数(Arg+Lys)为37,因此咖啡豆α-半乳糖苷酶为酸性。疏水性的总平均值(GRAVY)为-0.413,为负值,该酶为亲水性。不稳定指数(II)为30.11,根据蛋白质的不稳定指数在40以下为稳定蛋白质的标准,该酶较为稳定。脂肪族氨基酸指数为71.80。该酶N端为M(Met)。组成咖啡豆α-半乳糖苷酶的氨基酸比例见表1,其中丝氨酸的含量最高为9.5%,半胱氨酸和组氨酸的含量最低,均为1.6%。
表1 咖啡豆α-半乳糖苷酶的氨基酸组成分析
对咖啡豆α-半乳糖苷酶的疏水性分析见图1,正值越大表示疏水性越强,负值越大表示亲水性越强。根据SAPS的统计结果,该酶的疏水性氨基酸数目为124个,亲水性氨基酸数目为254个。146~148区域具有较强的亲水性,其中147号氨基酸的亲水性最强;256~258区域具有较强的亲水性,其中257号氨基酸的亲水性最强。
图1 咖啡豆α-半乳糖苷酶的疏水性氨基酸分布图Fig.1 The distribution of hydrophobic amino acidsin coffee-bean α-galactosidase
对咖啡豆α-半乳糖苷酶的跨膜区域的预测见图2,图中纵坐标为概率,横坐标为氨基酸序列。从图中看,d线的纵坐标数值极低,即该酶中存在跨膜区域的概率极低,c线的纵坐标数值很低,即氨基酸在膜内的概率很低,b线的纵坐标数值很高,接近于1,即氨基酸在膜外的概率很高。同时依据图中左上方数值显示,该酶在跨膜区域中的氨基酸序列期望值为0.05234,存在跨膜区域时该数值应大于18[25]。因此该酶没有跨膜区域,378个氨基酸残基全部在膜外。
图2 咖啡豆α-半乳糖苷酶跨膜区域预测Fig.2 Transmembrane regional prediction of coffee-bean α-galactosidase注:a:N-best算法的显示线,b:在膜外的概率线,c:在膜内的概率线,d:可能出现跨膜区域。
对咖啡豆α-半乳糖苷酶的信号肽进行预测,一般来讲,信号肽在蛋白质N端,很少超过45个氨基酸残基,所以N端的序列对信号肽的分析预测具有重要作用[26]。在此分析了N端的70个氨基酸,每个氨基酸分别对应一个S、C、Y值。图3中略有波动的线为S值,若存在信号肽区域,其值会较高。下方一排竖线为C值,若存在剪切位点,C值会较高。趋近于水平的线为Y值,Y-max是综合考虑S值和C值的一个参数,比单独考虑C值更精确。图3中可清晰的看出,S值较平缓,C值基本无变化,Y值趋近于水平,由此,该咖啡豆α-半乳糖苷酶不存在信号肽。
图3 咖啡豆α-半乳糖苷酶信号肽预测Fig.3 Signal peptide prediction of coffee-bean α-galactosidase注:S:跨膜区域,C:剪切位点,Y:综合参数。
2.2咖啡豆α-半乳糖苷酶二级结构预测
通过SOPMA服务器对咖啡豆α-半乳糖苷酶的二级结构进行分析。在该酶的二级结构中:α-螺旋结构(Alpha helix,h)为33.60%,扩展长链(Extended strand,e)为21.69%,β-转角结构(Beta turn,t)为8.47%,无规则卷曲结构(Random coil,c)为36.24%。α-螺旋结构和无规则卷曲结构交替存在,是该酶整体结构中的主要组成构件,扩展长链均匀的分布在整条链中。这种分布有利于该酶结构的稳定。见图4。
图4 咖啡豆α-半乳糖苷酶二级结构预测Fig.4 Secondary structure prediction of coffee-bean α-galactosidase注:h:α-螺旋,e:扩展长链,t:β-转角,c:无规则卷曲。
2.3咖啡豆α-半乳糖苷酶三级结构预测
2.3.1选择模版以咖啡豆α-半乳糖苷酶的氨基酸序列作为查询序列,使用NCBI提供的BLAST程序进行序列搜寻和比对,得到与其最接近的1UAS的序列。结果显示,同源率(所比对序列与目标序列的相似度)为73%,覆盖率(所比对序列与目标序列的重叠度)为95%,E期望值(造成这一比对结果的随机概率)为0。1UAS是大米α-半乳糖苷酶的晶体结构,包含362个氨基酸[27],大米α-半乳糖苷酶与咖啡豆α-半乳糖苷酶具有较好的序列一致性,故选取1UAS作为模板蛋白质。
2.3.2同源建模将咖啡豆α-半乳糖苷酶的氨基酸序列录入MODELLER的脚本文件target.ali,见图5。使用脚本文件01_align.py对靶序列咖啡豆α-半乳糖苷酶与模板序列1UAS进行叠合。使用脚本文件02_model.py,以1UAS为模版,对咖啡豆α-半乳糖苷酶进行建模。采用molpdf,DOPE score,GA341 score三种评估方法对构建的5个模型进行评估,见图6。
图5 咖啡豆α-半乳糖苷酶的氨基酸序列Fig.5 Amino acid sequence of coffee-bean α-galactosidase
图6 模型的评估Fig.6 Evaluate models of coffee-bean α-galactosidase
molpdf与DOPE score的值越低越理想。GA341 score的值在1附近,则说明模型合理,其值越高越理想[24]。选出最优结构模型targ.1.pdb,经PyMOL软件展示,见图7。咖啡豆α-半乳糖苷酶的结构模型包含8个α-螺旋,16个β-转角。8个α-螺旋位于结构的一侧,形成一个球状结构,8个β-转角相互平行,位于8个α-螺旋形成球面的内部,8个β-转角位于结构的另一侧。
图7 咖啡豆α-半乳糖苷酶的同源模型结构Fig.7 Homology modelfor coffee-bean α-galactosidase
2.4咖啡豆α-半乳糖苷酶三级结构评估
使用Procheck、Verify3D和ERRAT分别对咖啡豆α-半乳糖苷酶同源模型结构targ.1从三个方面进行了评价。
Procheck程序主要用于评价模型中残基与残基之间的立体化学性质,用图8中的拉氏构象图(Ramachandran)来表示。其中89.8%的氨基酸处于最适区,7.2%处于较合适区,1.2%处于可接受区,1.8%处于不合理区。由此可见,98.2%的氨基酸残基分布在合理区域,说明模型结构合理。
图8 Targ.1的Procheck评价Fig.8 Procheck analysis of targ.1注:A、B、L为合理区;a、b、l、P为较合理区;~a、~b、~l、~P为大体可接受区;其余为不合理区。
Verify3D是用于分析三维结构(3D)与一级序列(1D)兼容性的程序。应用Verify3D对targ.1模型进行评估,结果表明至少有80%的氨基酸残基3D-1D的相容性分值大于0.2,说明这个模型通过了Verify3D检测。
ERRAT是通过统计模型结构中不同原子间非键相互作用,与高分辨率晶体结构的数据相比较,其误差值在置信区间内的区域被认为是合理区域,合理区域所占的百分比越高说明结构质量越高。图9中ERRAT计算的模型结构的百分比为85.13%,说明该模型结构具有可靠性。
图9 Targ.1的ERRAT评价Fig.9 ERRAT analysis of targ.1
3 结论
对咖啡豆α-半乳糖苷酶的结构进行了预测。分析一级结构发现,其主肽链由378个氨基酸组成,理论等电点为5.60,酸性和碱性氨基酸残基总数分别为43和37,为酸性。疏水性的总平均值(GRAVY)为-0.413,不稳定指数(II)为30.11,水溶性稳定。无跨膜区域和信号肽。包含一个由17个氨基酸组成的结构域。分析二级结构发现,主要构件为α-螺旋和无规则卷曲。以大米α-半乳糖苷酶作为模板,对咖啡豆α-半乳糖苷酶的晶体结构进行同源建模。模型包含8个α-螺旋和16个β-转角,综合评价表明其符合立体化学规则,建模结构合理。可作为分子对接和动力学模拟的基础,同时也可为该酶的空间结构和催化活性位点研究提供诸多信息。
[1]Shen Wangyang,Jin Zhengyu,Xu Xueming,et al. New source ofα-D-galactosidase:germinating coffee beans[J]. Food Chemistry,2008,110:962-966.
[2]徐海波.α-半乳糖苷酶的酶学性质分析及基因的定点突变研究[D]. 武汉:华中农业大学,2013.
[3]沈汪洋,金征宇. 植物多酚对α-半乳糖苷酶提取的影响[J]. 食品工业科技,2008(4):90-92.
[4]李楠,李苏红,徐杰,等.α-半乳糖苷酶的催化机理及底物特异性[J]. 粮油食品科技,2014,22(3):92-97.
[5]郝桂娟,张凯,王学智,等.α-半乳糖苷酶的研究进展[J]. 中国畜牧兽医,2013,40(3):149-154.
[6]Marraccini P,Rogers W J,et al. Biochemical and molecular characterization of from coffee beans[J].Plant Physiology and Biochemistry,2005,43:909-920.
[7]沈汪洋. 发芽咖啡豆α-半乳糖苷酶的制备、性质及应用研究[D]. 江南大学,2009.
[8]刘晓霞,余朝文,杨元,等. Fabry病一家系临床调查及α-半乳糖苷酶A基因突变研究[J]. 四川大学学报医学版,2012,43(6):948-951.
[9]Zhang Yangpei,Gong Feng,Bao Guoqiang,et al. B to O erythrocyte conversion by the recombinantα-galactosidase[J]. Chinese Medical Journal,2007,120(3):1145-1150.
[10]Koizumi K,Tanimoto T,Fujita K,et al. Preparation,isolation,and characterization of novel heterogeneous branched cyclomalto-oligosaccharides havingβ-galactosyl residue(s)on the side chain[J]. Carbohydrate Research,1993,238:75-91.
[11]沈汪洋,金征宇,高虹.α-半乳糖苷酶法合成α-半乳糖基-β-环糊精的研究[J]. 湖北农业科学,2011,50(19):243-245.
[12]沈汪洋,金征宇. 半乳糖基-β-环糊精的合成与结构研究[J]. 食品科学,2011,32(12):57-59.
[13]田晋红,刘琦,站丽萍,等. 耐热菌D-乳酸脱氢酶突变体的可视化建模和大肠杆菌中突变体对产苯乳酸的影响[J]. 食品工业科技,2012,33(19):173-176.
[14]郭明遗,霍再群,侯长军,等. 一株酯化功能菌分离鉴定及酶学特性研究[J]. 食品工业科技,2013,34(11):124-127.
[15]王远微,张诚民,索化夷,等. 川西北牧区传统发酵牦牛酸奶中发酵毕赤酵母菌的分离鉴定[J]. 食品工业科技,2014,35(12):184-187.
[16]王可,邵兴锋,龚一富,等. 桃果实PpAO基因的电子克隆及生物信息学分析[J]. 食品工业科技,2013,34(17):193-196.
[17]Daga P R,Patel R Y,Doerksen R J. Template-based protein modeling:recent methodological advances[J]. Current Topics in Medicinal Chemistry,2010,10(1):84-94.
[18]Webb B,Sali A. Protein structure modeling with MODELLER[J]. Methods in Molecular Biology,2014,1137:1-15.
[19]WANG Hai-bo,SHI Xiao-dong,ZHANG Mei-fen,GUO Jun-yun. Bioinformatics analysis and homology modeling study of protein disulfide isomerase(mPDI)from medicago sativa L[J]. Agricultural Science & Technology,2009,10(5):59-64.
[20]张远,茆灿泉. 嗜冷黄杆菌酰基-Acp去饱和酶(AAD)的序列分析和结构建模[J]. 生物学杂志,2014,31(5):50-54.
[21]赵斌,霍静倩,邢继红,等. 拟南芥转酮醇酶蛋白AtTKL1的同源建模及与α-三联噻吩结合作用分析[J]. 高等学校化学学报,2015,4:682-686.
[22]N. Eswar,M. A. Marti-Renom,B. Webb,M. S. Madhusudhan,D. Eramian,M. Shen,U. Pieper,A. Sali. Comparative Protein Structure Modeling With MODELLER. Current Protocols in Bioinformatics,John Wiley & Sons,Inc.,Supplement 15,2006,
5.6.1-5.6.30. Modeller 9.14(http://salilab.org/modeller/)
[23]M.A. Marti-Renom,A. Stuart,A. Fiser,R. Sánchez,F. Melo,A. Sali. Comparative protein structure modeling of genes and genomes. Annu. Rev. Biophys. Biomol. Struct.2000,29,291-325. pymol1.7(http://www.pymol.org/)
[24][EB/OL]http://salilab.org/modeller/tutorial/basic.html 2015/6/5
[25][EB/OL]http://www.cbs.dtu.dk/services/TMHMM-2.0/TMHMM2.0.guide.html#output 2015/6/5
[26]Blobel G,Walter P,Chang C N,et al. Translocation of proteins across membranes:the signal hypothesis and beyond[J]. Symposia of the Society for Experimental Biology,1979,33:9-36.
[27][DB/OL]http://www.rcsb.org/pdb/explore/explore.do?structureId=1UAS2015/6/5.
Analysis and homology modeling of Coffee-beanα-Galactosidase
TAO Jia-ni1,LI Yun1,YAO Di1,SHEN Wang-yang1,2,*,CHEN Xuan1,ZHOU Jian1,2
(1.College of Food Science and Engineering,Wuhan polytechnic University,Wuhan 430023,China;2.Hubei Collaborative Innovation Center for Processing of Agricultural Products,Wuhan 430023,China)
The primary and spatial structures of coffee-beanα-galactosidase were studied to further determine its structure and function. The results showed that the enzyme protein was hydrophilic,acidic and stable. The secondary structure was dominated byα-helices and random coils. The three-dimensional structures of coffee-beanα-galactosidase were constructed based on the template of riceα-galactosidase by homology modeling because their spatial structures were similarity.The side of the structure model was 8α-helices and 8β-turns,and the other was 8β-turns. The experimental results provided the theoretical basis for the study on the spatial structure and catalytic site of coffee-beanα-galactosidase.
coffee-beanα-galactosidase;protein structure analysis;homology modeling
2015-05-15
陶佳妮(1991-),女,硕士,研究方向:食品生物化学,E-mail:18671272080@163.com。
沈汪洋(1978-),男,博士,副教授,研究方向:食品生物化学,E-mail:whwangyangshen@126.com。
国家自然科学基金青年科学基金项目(31301415)。
TS201.7
A
1002-0306(2016)01-0000-00
10.13386/j.issn1002-0306.2016.01.000