基于氨基酸序列和模拟结构预测蛋白质稳定性的研究进展

2017-05-19易华伟唐晓峰

生物技术通报 2017年4期

关键词：突变体氨基酸准确率

易华伟唐晓峰

（武汉大学生命科学学院，武汉 430072）

基于氨基酸序列和模拟结构预测蛋白质稳定性的研究进展

易华伟唐晓峰

（武汉大学生命科学学院，武汉 430072）

稳定性是蛋白质重要性质之一，工业用蛋白质需要良好的稳定性，进化过程中蛋白质新功能的衍生也依赖于蛋白质的稳定性。提高蛋白质的稳定性，尤其是提高未知结构蛋白质的稳定性是一项非常具有挑战性的工作——传统的蛋白质改造方法如定向进化费时费力，传统的理性设计则难以被其他研究者复制。虽然目前有很多蛋白质稳定性预测工具，但这些预测工具大多都需要预先测定蛋白质的三维结构，因此结构未知的蛋白质的稳定性预测受到了限制。近年来，人们开发了一些利用蛋白质的氨基酸序列和模拟结构来预测突变对结构未知蛋白质稳定性影响的预测工具。介绍该方面的研究进展，以期为蛋白质工程研究提供参考。

蛋白质稳定性；预测工具；氨基酸序列；蛋白质结构模拟

蛋白质包括各种酶，在食品、清洁剂、造纸、冶金、生物燃料等工业生产和应用中发挥着重要的作用［1］，而良好的稳定性是蛋白质在应用中必须具备的重要性质。结构的稳定往往意味着蛋白质能够在不利条件下依然具备优良的性能［2］。例如，嗜热蛋白酶由于其结构刚性较强，因此其除热稳定性较嗜温蛋白酶好外，在含有变性剂的条件下嗜热蛋白酶也比嗜温蛋白酶更具稳定性，具有更高的活性。在蛋白质工程研究中，稳定性好的蛋白质更适合蛋白质功能方面的改造，因为和稳定性较差的蛋白质相比，具有良好稳定性的蛋白质更能耐受大量的氨基酸突变［3］。此外，在进化过程中，蛋白质是通过氨基酸序列的修饰（包括替换、删除和插入氨基酸残基）从一个共同的祖先演化而来的［4］，很多学者认为，当蛋白质突变增加新功能的时候其稳定性会降低［5］，所以蛋白质的稳定性在蛋白质进化过程中也发挥着重要的作用。

在传统的蛋白质工程研究中，主要有定向进化和理性设计两种方法来获得更稳定的蛋白质。通过定向进化［6］提高蛋白质的稳定性是指在蛋白质的氨基酸序列中引入随机突变，构建一个突变体库，然后在这个突变体库中筛选出稳定性提高的突变体。定向进化是提高蛋白质稳定性很有效的方法，但也有不足之处——为了得到合适的突变体往往需要建立很大的突变体库，然后从成千上万个突变体中筛选出合适的突变体，这是一个耗时、费力并且价格昂贵的过程，当缺乏合适的高通量筛选方法时，定向进化就显得不够高效。通过理性设计来获得更稳定的蛋白质是一种完全不同于定向进化的方法，传统的理性设计需要研究者在非常了解目的蛋白结构与功能之间关系的前提下，在特定的位点引入突变。和定向进化相比，理性设计不需要构建大量的突变体，但其结果极大地取决于研究者的专业知识，而且整个过程难以被其他的研究者复制［7］。

通过生物信息学的方法预测突变对蛋白质稳定性的影响是目前研究的热点之一，预测的方法主要分为4类［8］：（1）物理势能方法；（2）统计势能方法；（3）经验势能方法；（4）机器学习方法。人们利用以上方法开发了一系列与蛋白质稳定性预测相关的软件/服务器，然而这些软件/服务器绝大多数都是根据蛋白质结构来进行预测的。随着高通量测序技术的发展，蛋白质序列的数量和蛋白质实验解析结构的数量之间的差距正在被进一步拉大［9］，蛋白质结构未知极大地限制了这些预测软件/服务器的使用，而仅依赖蛋白质的氨基酸序列或模拟结构来预测蛋白质稳定性的软件就能解决这一难题。下面分别对目前常用的基于氨基酸序列和基于模拟结构预测蛋白质稳定性的生物信息学方法进行介绍。

1 基于氨基酸序列预测蛋白质稳定性

随着ProTherm（Thermodynamic Database for Proteins and Mutants，http://www.abren.net/protherm/）等数据库中收录的越来越多的关于蛋白质及其突变体稳定性的实验数据，通过机器学习的手段来预测蛋白质稳定性的方法应运而生［10］。机器学习的方法可以分为基于氨基酸序列预测和基于蛋白质结构预测两种方式，首先介绍基于氨基酸序列预测蛋白质稳定性的机器学习方法。

1.1 预测过程及原理

机器学习方法通常是利用蛋白质的序列、结构特征直接从数据入手建立计算模型，从而进行预测［11］。主要过程如下：给出待测蛋白质的氨基酸序列和氨基酸替换信息，其主要目的是预测该替换能否改变蛋白质的稳定性。通过利用现有的实验研究数据构建一个分类器来预测氨基酸替换能否使蛋白质稳定性发生变化，即通过自由能的改变（ΔΔG）以及改变的方向预测稳定性的变化——当ΔΔG ＞ 0时，稳定性提高；当ΔΔG ＜ 0时，稳定性降低［12］。机器学习方法利用的蛋白质实验数据主要包括突变信息（野生型和突变体残基）、残基的位置（根据二级结构和溶剂可及性的预测结果）［13，14］、实验的条件、邻近的残基信息、氨基酸性质［12，15］和进化信息［10，16］等。

1.2 相关软件介绍

人们已经开发出不少基于氨基酸序列的蛋白质稳定性预测软件/服务器，目前应用较多、已获得一定认可的有以下几种：

I-Mutant2.0［17］。I-Mutant2.0是在2005年开发的第一款可以利用氨基酸序列来预测点突变对蛋白质稳定性影响的软件，该软件也可以利用蛋白质的三维结构预测蛋白质稳定性。I-Mutant2.0既可以作为一个分类器来预测点突变对蛋白质稳定性的改变方向，也可以用来估算相关的自由能变化值。从交叉验证的结果可知，该软件利用结构信息和序列信息预测的结果与实验数据的结果相比准确率分别为80%和77%。

Mupro。Mupro是Cheng等在［8］2006年开发的一款利用支持向量机预测蛋白质稳定性的在线服务器，该服务器只需要知道蛋白质的序列信息，直接将序列信息作为输入信号，然后利用机器学习的方法提取对蛋白质稳定性起关键作用的序列元件。该服务器也可以通过蛋白质三维结构信息获得更准确的预测结果，但Cheng认为仅仅依赖于氨基酸序列的预测精度已经达到了和依赖于蛋白质结构预测相近的程度，预测的准确率分别为84.1%和84.5%。

INPS。Fariselli等［18］在2015年开发的软件INPS是利用支持向量机回归的方法，通过预测蛋白质单点突变后热力学自由能的变化来预测突变对蛋白质稳定性的影响。该软件只需利用蛋白质序列信息，并不需要蛋白质三维结构。在非冗余数据集上进行交叉验证和在含有大量肿瘤抑制蛋白质p53突变体数据库中测试结果表明，INPS和最好的基于结构的预测方法，如mCSM、PoPMuSiC和Duet（见后）预测精度非常接近。

EASE-MM。Folkman［13］团队在近几年发表了一系列关于基于氨基酸序列预测蛋白质稳定性的文章［13，14，16］，并开发了一款基于序列的预测软件EASE-MM，该软件包含了5种专业的支持向量机模型，先利用氨基酸序列预测出突变氨基酸残基位点附近的二级结构和溶剂可及表面区域，然后将这些信息作为预测的依据。EASE-MM在10倍交叉验证和独立测试中皮尔逊相关系数达到了0.53-0.59，这一结果优于其他的预测软件，如I-Mutant2.0、Mupro、FoldX、PoPMuSiC2.1等（见后），这些软件在测试中皮尔逊相关系数为0.32-0.57［13］。

MuStab。MuStab［12］通过支持向量机利用自由能的变化来预测突变对蛋白质稳定性的影响。为了准确预测蛋白质的稳定性，其通过利用不同的序列特征来预测氨基酸替换导致的蛋白质稳定性变化，这些序列特征可以分为生物化学特征、结构特征、经验特征和其他生物学特征4类，该软件预测的准确率高达84.59%。

Scpred［19］。Scpred是一款蛋白质稳定中心（stability centers）分析软件，所谓稳定中心即对蛋白质稳定性起关键作用的氨基酸残基，发生在稳定中心的氨基酸突变会降低蛋白质的稳定性。Scpred只需要利用蛋白质序列信息，通过神经网络方法预测起稳定作用的氨基酸残基。

1.3 准确率分析

过去人们普遍认为基于氨基酸序列要比基于蛋白质三维结构的预测软件准确率低［8］，但是Khan等［20］在2010年系统地分析了11种与蛋白质稳定性预测有关的软件，其中包含了3种基于氨基酸序列的预测软件，分别是I-Mutant2.0、Mupro和Scpred［19］（前两个软件也可以利用结构信息）。结果表明，在预测的准确率上，这3款基于氨基酸序列的软件和其他8款基于蛋白质结构的预测软件没有太大差别，这几款基于氨基酸序列和基于蛋白质结构预测软件的准确率分别是37%-49%和44%-64%，近两年有些研究者更是声称其开发的基于序列的预测软件如INPS和EASE-MM等有着和基于蛋白质结构预测软件相近甚至更好的表现。

2 基于模拟结构预测蛋白质稳定性

目前大多数和蛋白质稳定性预测有关的软件都是基于蛋白质的三维结构，对那些未知结构的蛋白质来说，可以先利用相关软件模拟出蛋白质的三维结构，然后将模拟出的三维结构用于基于结构预测稳定性的软件。

2.1 蛋白质三维结构模拟

目前蛋白三维结构模拟的依据是基于以下两点：（1）在进化过程中，蛋白质的结构比序列更加保守；（2）有证据表明，现在已知的蛋白质折叠方式是有限的，数量约1 000-10 000［21］。蛋白质三维结构预测经过30多年的发展，目前预测的方法主要有：利用基于能量或者经验的能量函数模拟折叠法；从已知结构的小片段构建模型；利用类似能量函数的线串法；依赖模板的模拟法［21］。目前被广泛使用的蛋白质三维结构模拟网络服务器有Phyre2［21］、i-TASSER［22］、SWISS-MODEL［23］、HHpred［24］、PSIPRED［25］、Robetta［26］、Modeller［27］和Raptor［28］等，从蛋白质结构预测标准评估法［29］（Critical assessment of methods of protein structure prediction，CASP）的结果可知，这些预测软件的准确率没有很大的差别，但是对那些模拟难度较高的蛋白质来说，i-TASSER会有更好的表现［21］。在最新的CASP11［30］中，这些模拟的结构不仅精度很高而且能用于解答相关的生物学问题，如研究者不但准确模拟出人的类异戊二烯合成酶（human isoprenoid synthase）结构，而且还利用该模拟结构准确预测该酶结构域内部的突变会导致单基因遗传疾病。

2.2 基于结构预测蛋白质稳定性的方法

蛋白质的三维结构能有效用于蛋白质稳定性预测，从结构信息中可以获得各种不同的能量函数和势能，如接触势能、距离和扭转势能、经验能量函数等，利用这些能量函数和势能可以预测蛋白质的稳定性［31］。目前被广泛使用的基于结构预测蛋白质稳定性的软件主要有CUPSAT［32］、FoldX［33］、I-Mutant2.0、mCSM［34］、PoPMuSiC［35］、Duet［36］、iStable［37］、Eris［38］等。

2.3 相关实例

将模拟结构用于依赖于三维结构的蛋白质稳定性预测软件来获得更稳定的蛋白质已经有一些成功的案例。Khan等［39］通过计算机预测了一个和直肠癌相关的nsSNPs突变体（Lys25Arg）的生物学功能和结构意义，他们将该突变体中和直肠癌相关的区域称为CRAPD，利用i-TASSER服务器［22］模拟了CRAPD的三维结构，并用基于结构的预测软件PoPMuSiC2.1预测出该点突变（Lys25Arg）降低了CRAPD的稳定性，Khan认为CRAPD的稳定性降低和直肠癌存在一定的联系。Berliner等［40］开发了一种新的机器学习方法来预测突变对蛋白质稳定性和与其他蛋白质亲和力的影响。Mosca等［41］的研究发现，很多人体蛋白结构可以利用PDB数据库中的同源蛋白的结构为模板从而被大范围地模拟，即使在模板与目的序列的一致性很低的情况下也可以模拟，所以Berliner等为了在整个蛋白质组水平进行预测，采取了同源模建方式模拟了人体蛋白质的三维结构，发现基于这些模拟结构可以预测蛋白质稳定性以及该蛋白与其他蛋白质的亲和力，虽然基于模拟结构的预测准确率略低于基于实验结构预测的准确率，但是作者认为通过提高模拟技术和优化模拟结构可以进一步提高准确率。一些蛋白质结构评估软件如ProSa［42］和VADAR［43］等，常常被学者们［39，44］用来评估模拟出来的结构是否可靠。

2.4 可行性分析

就目前的蛋白质结构模拟过程来说，在模拟过程中难免引入结构上的偏差，那么这些结构上的偏差对蛋白质稳定性预测会造成什么样的影响，以及低质量的模拟结构能否用于蛋白质稳定性的预测呢？Gonnelli等［1］在这方面进行了比较系统的研究，一般来说，在蛋白质同源模建的过程中，被模拟的蛋白质序列与模板的序列一致性越高，那么该模拟结构越可靠，所以作者选取与目的蛋白具有不同序列一致性（20%-100%）的且结构已经解析的蛋白质作为结构模拟的模板（值得注意的是：这些被模拟的蛋白质本身结构也已经解析了），然后用Modeller软件（http://salilab.org/modeller/）共模拟出了391个蛋白质结构，并通过计算模拟结构和实验结构Cα坐标的均方根偏差（rmsd）来衡量模拟结构的质量，在391个模拟结构中，绝大部分模拟结构都有很高的质量（rmsd：1.65Å-5.52Å），并且这些模拟结构的质量和序列一致性成正相关。最后用这些模拟出来的结构以及利用蛋白质稳定性预测软件PoPMuSiC2.1来计算氨基酸突变所导致的折叠自由能的改变（ΔΔG），并将这些结果与利用实验解析结果得出的ΔΔG值进行比较，两者ΔΔG值的差异为0.01-0.05 kcal/mol，结果表明：利用高质量的模拟结构能够与利用蛋白质实验解析结构达到相同的预测准确率，并且即使是利用低质量的模拟结构，预测的表现也没有明显地减弱。此外，作者将利用模拟结构的预测表现与基于序列的预测软件（I-Mutant2.0、Mupro等）的预测结果作比较，结果表明：基于模拟结构的预测结果要好于基于氨基酸序列的预测结果。

常用的蛋白质稳定性预测软件/服务器总结，见表1。

3 结语

随着人们对基于氨基酸序列预测蛋白质结构稳定性软件的逐渐重视和预测方法的不断优化，目前基于氨基酸序列预测软件的准确率已经和基于蛋白质结构的预测软件没有明显差距，有些研究者甚至声称其开发的基于氨基酸序列的预测软件具有更好的表现；而基于模拟结构预测蛋白质的稳定性是先通过氨基酸序列模拟出蛋白质的三维结构，然后再将模拟的结构应用于预测蛋白质稳定性的软件。随着蛋白质结构模拟技术的不断发展，模拟结构与蛋白质实际结构的差距正在不断缩小，而且即使是利用低质量的模拟结构，预测蛋白质稳定性的准确率和利用实验解析结构的准确率相比也没有明显的差异。因此基于模拟结构的预测方法目前已被很多科学家所认可。

利用生物信息学的方法预测氨基酸突变对蛋白质稳定性的影响是当前生物信息学研究的热点之一，而随着后基因组时代的到来，已知的蛋白质序列越来越多，但就目前的实验技术水平来说，解析蛋白质的结构仍旧存在一定的困难，蛋白质结构解析的速度远远比不上蛋白质氨基酸序列增加的速度，这将进一步拉大蛋白质序列的数量和蛋白质结构的数量之间的差距，所以基于氨基酸序列来预测氨基酸突变对蛋白质稳定性的影响具有更大的使用范围和更好的发展前景。

表1 蛋白质稳定性预测软件/在线服务器

［1］Gonnelli G, Rooman M, Dehouck Y. Structure-based mutant stability predictions on proteins of unknown structure［J］. Journal of Biotechnology, 2012, 161（3）：287-293.

［2］Wijma HJ, Floor RJ, Janssen DB. Structure- and sequence-analysis inspired engineering of proteins for enhanced thermostability［J］. Current Opinion in Structural Biology, 2013, 23（4）：588-594.

［3］ Tokuriki N, Tawfik DS. Stability effects of mutations and protein evolvability［J］. Current Opinion in Structural Biology, 2009, 19（5）：596-604.

［4］Todd AE, Orengo CA, Thornton JM. Evolution of function in protein superfamilies, from a structural perspective［J］. Journal of Molecular Biology, 2001, 307（4）：1113-1143.

［5］Tokuriki N, Stricher F, Serrano L, et al. How protein stability and new functions trade off［J］. PLoS Computational Biology, 2008, 4（2）：e1000002.

［6］Lanio T, Jeltsch A, Pingoud A. Towards the design of rare cutting restriction endonucleases：using directed evolution to generate variants of EcoRV differing in their substrate specificity by two orders of magnitude［J］. Journal of Molecular Biology, 1998, 283（1）：59-69.

［7］Suplatov D, Voevodin V, Svedas V. Robust enzyme design：bioinformatic tools for improved protein stability［J］. Biotechnology Journal, 2015, 10（3）：344-355.

［8］Cheng J, Randall A, Baldi P. Prediction of protein stability changes for single-site mutations using support vector machines［J］. Proteins, 2006, 62（4）：1125-1132.

［9］刘建国, 刘建荣, 刘明, 等. 基于进化信息改进蛋白质定点突变稳定性预测准确率［J］. 生物物理学报, 2009, 25（5）：343-348.

［10］Folkman L, Stantic B, Sattar A. Towards sequence-based prediction of mutation-induced stability changes in unseen non-homologous proteins［J］. BMC Genomics, 2014, 15（Suppl. 1）：1-12.

［11］欧阳玉梅, 方若森. 氨基酸突变对蛋白质稳定性的影响预测及其在线工具［J］. 免疫学杂志, 2013（11）：997-1001.

［12］Teng S, Srivastava AK, Wang L. Sequence feature-based prediction of protein stability changes upon amino acid substitutions［J］. BMC Genomics, 2010, 11（Suppl. 2）：S5-12.

［13］Folkman L, Stantic B, Sattar A, et al. EASE-MM：Sequence-based prediction of mutation-induced stability changes with feature-based multiple models［J］. Journal of Molecular Biology, 2016, 428（6）：1394-1405.

［14］Folkman L, Stantic B, Sattar A. Feature-based multiple models improve classification of mutation-induced stability changes［J］. BMC Genomics, 2014, 15（Suppl. 4）：S6-S16.

［15］Liu J, Kang X. Grading amino acid properties increased accuracies of single point mutation on protein stability prediction［J］. BMC Bioinformatics, 2012, 13（1）：44-54.

［16］Folkman L, Stantic B, Sattar A. Sequence-only evolutionary and predicted structural features for the prediction of stability changes in protein mutants［J］. BMC Bioinformatics, 2013, 14（Suppl. 2）：S6-14.

［17］Capriotti E, Fariselli P, Casadio R. I-Mutant2. 0：predicting stability changes upon mutation from the protein sequence or structure［J］. Nucleic Acids Research, 2005, 33（Web Server issue）：W306-W310.

［18］Fariselli P, Martelli PL, Savojardo C, et al. INPS：predicting the impact of non-synonymous variations on protein stability from sequence［J］. Bioinformatics, 2015, 31（17）：2816-2821.

［19］Dosztanyi Z, Fiser A, Simon I. Stabilization centers in proteins：identification, characterization and predictions［J］. Journal of Molecular Biology, 1997, 272（4）：597-612.

［20］ Khan S, Vihinen M. Performance of protein stability predictors［J］. Human Mutation, 2010, 31（6）：675-684.

［21］Kelley LA, Mezulis S, Yates CM, et al. The Phyre2 web portal for protein modeling, prediction and analysis［J］. Nature Protocols, 2015, 10（6）：845-858.

［22］Yang J, Yan R, Roy A, et al. The I-TASSER Suite：protein structure and function prediction［J］. Nature Methods, 2015, 12（1）：7-8.

［23］Biasini M, Bienert S, Waterhouse A, et al. SWISS-MODEL：modelling protein tertiary and quaternary structure using evolutionary information［J］. Nucleic Acids Research, 2014, 42（Web Server issue）：W252-258.

［24］Söding J, Biegert A, Lupas AN. The HHpred interactive server for protein homology detection and structure prediction［J］. Nucleic Acids Research, 2005, 33（Web Server issue）：W244-248.

［25］McGuffin LJ, Bryson K, Jones DT. The PSIPRED protein structure prediction server［J］. Bioinformatics, 2000, 16（4）：404-405.

［26］Kim DE, Chivian D, Baker D. Protein structure prediction and analysis using the Robetta server［J］. Nucleic Acids Research, 2004, 32（Web Server issue）：W526-531.

［27］Webb B, Sali A. Comparative protein structure modeling using Modeller［M］// John E, Ben M, David W, et al. Current protocols in bioinformatics. New York：John Wiley & Sons Press, 2006, Chapter 5：Unit 5. 6.

［28］Kallberg M, Wang H, Wang S, et al. Template-based protein structure modeling using the RaptorX web server［J］. Nature Protocols, 2012, 7（8）：1511-1522.

［29］Moult J, Fidelis K, Kryshtafovych A, et al. Critical assessment of methods of protein structure prediction（CASP）--round x［J］. Proteins, 2014, 82（Suppl. 2）：1-6.

［30］Moult J, Fidelis K, Kryshtafovych A, et al. Critical assessment of methods of protein structure prediction（CASP）- progress and new directions in Round XI［J］. Proteins, 2016, doi：10. 1002/prot. 25064.

［31］Gromiha MM, Anoosha P, Huang LT. Applications of protein thermodynamic database for understanding protein mutant stability and designing stable mutants［M］// Carugo O, Eisenhaber F. Date mining techniques for the life sciences. 2nd ed. New York：Humana Press, 2016：71-89.

［32］Parthiban V, Gromiha MM, Schomburg D. CUPSAT：prediction of protein stability upon point mutations［J］. Nucleic Acids Research, 2006, 34（Web Server issue）：W239-242.

［33］Guerois R, Nielsen JE, Serrano L. Predicting changes in the stability of proteins and protein complexes：a study of more than 1000 mutations［J］. Journal of Molecular Biology, 2002, 320（2）：369-387.

［34］Pires DEV, Ascher DB, Blundell TL. mCSM：predicting the effects of mutations in proteins using graph-based signatures［J］. Bioinformatics, 2014, 30（3）：335-342.

［35］Dehouck Y, Kwasigroch JM, Gilis D, et al. PoPMuSiC 2. 1：a web server for the estimation of protein stability changes upon mutation and sequence optimality［J］. BMC Bioinformatics, 2011, 12（1）：151-162.

［36］Pires DE, Ascher DB, Blundell TL. DUET：a server for predicting effects of mutations on protein stability using an integrated computational approach［J］. Nucleic Acids Research, 2014, 42（Web Server issue）：W314-W319.

［37］Chen CW, Lin J, Chu YW. iStable：off-the-shelf predictor integration for predicting protein stability changes［J］. BMC Bioinformatics, 2013, 14（Suppl 2）：S5-18.

［38］Yin S, Ding F, Dokholyan NV. Eris：an automated estimator of protein stability［J］. Nature Methods, 2007, 4（6）：466-467.

［39］Khan W, Abduljaleel Z, Alanazi M, et al. Evidence of colorectal cancer risk associated variant Lys25Ser in the proximity of human bone morphogenetic protein 2［J］. Gene, 2013, 522（1）：75-83.

［40］Berliner N, Teyra J, Colak R, et al. Combining structural modeling with ensemble machine learning to accurately predict protein fold stability and binding affinity effects upon mutation［J］. PLoS One, 2014, 9（9）：e107353-107364.

［41］Mosca R, Ceol A, Aloy P. Interactome3D：adding structural details to protein networks［J］. Nature Methods, 2013, 10（1）：47-53.

［42］Wiederstein M, Sippl MJ. ProSA-web：interactive web service for the recognition of errors in three-dimensional structures of proteins［J］. Nucleic Acids Research, 2007, 35（Web Server issue）：W407-410.

［43］Willard L, Ranjan A, Zhang H, et al. VADAR：a web server for quantitative evaluation of protein structure quality［J］. Nucleic Acids Research, 2003, 31（13）：3316-3319.

［44］Yang J, Li L, Xiao Y, et al. Identification and thermoadaptation engineering of thermostability conferring residue of deep sea bacterial α-amylase AMY121［J］. Journal of Molecular Catalysis B：Enzymatic, 2016, 126：56-63.

［45］Tian JA, Wu NF, Chu XY, et al. Predicting changes in protein thermostability brought about by single- or multi-site mutations［J］. BMC Bioinformatics, 2010, 11（1）：370-378.

［46］Benedix A, Becker CM, de Groot BL, et al. Predicting free energy changes using structural ensembles［J］. Nature Methods, 2009, 6（1）：3-4.

（责任编辑狄艳红）

Research Progress on the Prediction of Protein Stability Based on Amino Acid Sequence and Simulated Structure

YI Hua-Wei TANG Xiao-Feng
（College of Life Sciences，Wuhan University，Wuhan 430072）

Stability is one of the important properties of protein. Protein’s stability is not only demanded in industry，but also the prerequisite for its deriving new functions in protein evolution. Improving the stability of protein，especially protein of unknown structure，is a very challenging task，i.e.，traditional protein modification methods such as directed evolution are time-consuming and laborious，while rational design is difficult to replicate by other researchers. At present，there are many reported predictors for protein stability. However，the majority of these tools require the pre-measurement of three-dimensional structure of protein，which restricts the stability prediction of protein in unknown structure. Recently，a number of tools to predict the effects of mutations on the stability of unknown proteins have been developed using amino acid sequences and simulated structures of proteins，here we introduce the research progress on them，aiming at providing guidance for protein engineering.

protein stability；predictors；amino acid sequence；protein structure simulation

10.13560/j.cnki.biotech.bull.1985.2017.04.011

2016-09-20

国家自然科学基金面上项目（31570062）

易华伟，男，硕士，研究方向：微生物生理生化；E-mail：2014202040024@whu.edu.cn

唐晓峰，女，博士，教授，研究方向：微生物生理生化；E-mail：tangxf@whu.edu.cn