APP下载

生物信息学方法在蛋白质—蛋白质相互作用研究中的应用

2016-10-14靳皓茹李娟方慧生

医学信息 2016年7期
关键词:蛋白质

靳皓茹 李娟 方慧生

摘要:蛋白质在许多生命进程中起着关键作用,通过与其他蛋白质相互作用来发挥其生物学功能。因此,研究蛋白质-蛋白质相互作用对于探索生命的真谛、理解疾病相关机理,以及研究新药提升人们的健康水平具有重要的作用。随着生物信息学的不断发展,越来越多的计算方法被应用于蛋白质结构及功能的研究。其中,蛋白质-蛋白质对接,分子动力学模拟等技术在蛋白质相互作用中得到了较为广泛的应用。本文对蛋白质蛋白质对接及分子动力学模拟等生物信息学方法的基本原理,相关软件及其在蛋白质-蛋白质相互作用研究中的应用进行概述。

关键词:蛋白质-蛋白质对接;分子动力学模拟;蛋白质-蛋白质相互作用

Abstract:Proteins that play a critical role in many cellular processes often perform their functions by interacting with other proteins. Therefore, the studies of protein-protein interactions are vital to exploring the essence of life, understanding the mechanism of diseases and developing new drugs to improve human health. With the sustained development of bioinformatics, more and more computational methods have been applied to structural and functional research of proteins. Protein-protein docking and molecular dynamics simulation are both widely applied to the studies of protein-protein interactions. This article reviews the theory of computational methods, softwares and the application in protein-protein interactions.

Key words:Protein-protein docking; Molecular dynamics simulation; Protein-protein interactions

众所周知,蛋白质在生物进程中扮演着重要的角色。蛋白质通过与其他生物大分子(如蛋白质,DNA和RNA)相互作用介导细胞内各种重要的生理过程,如基因的复制、转录、翻译以及细胞周期调控、信号转导、免疫反应等,其中,蛋白质-蛋白质相互作用尤为常见。因此蛋白质-蛋白质相互作用的研究有助于人们探明其细胞内功能,从而了解各种疾病发生机制,为进一步的新药研发提供帮助。目前为止,研究蛋白质-蛋白质相互作用主要有酵母双杂交、免疫共沉淀、亲和色谱、质谱、核磁共振等多种实验方法,这些技术为蛋白质相互作用研究做出了重要贡献,积累了宝贵的数据资源。

随着计算机处理能力的不断提升,生物信息学的理论模拟方法得到迅速发展和广泛应用。生物信息学整合数学,物理,化学,信息学等众多学科的优势,以计算模拟手段进行生物学相关研究。自Janin和同事们[1]首次运用自动化对接算法预测牛胰蛋白酶抑制剂-胰蛋白酶复合物3D结构至今,蛋白质-蛋白质对接领域已取得很大进步。该方法常用于蛋白质结构及功能研究,分析配体与蛋白质间或者蛋白质-蛋白质间的相互作用模式,便于研究者从原子水平探究受体-配体间作用机制。分子动力学模拟在诞生至今的几十年中不断随着计算机软硬件技术的快速提升而愈加发展完善,已经成为研究蛋白质、核酸等生物大分子的结构和动力学特性的重要工具。本文将对蛋白质-蛋白质对接和分子动力学模拟的基本原理及其在蛋白质间相互作用研究中的应用进行简要概述。

1 蛋白质-蛋白质对接

准确的蛋白质-蛋白质复合物结构是进行蛋白质-蛋白质相互作用研究的基础。然而,通过实验方法测定蛋白质-蛋白质复合物结构比测定单个蛋白质更加困难。随着计算机水平的不断发展,人们开始希望用计算模拟手段来预测蛋白质复合物的真实结构,并希望从原子层面来分析蛋白质-蛋白质相互作用的内部机制。蛋白质-蛋白质分子对接是一种常用的方法。它是指利用两个单体蛋白质的三维空间结构,来预测蛋白质-蛋白质复合物结构。解决蛋白质对接问题有两个关键因素:打分函数和搜索算法[2]。打分函数应能够区分出正确的或近似正确的蛋白质对接复合物,而且搜索算法需严格地探索由相互作用的蛋白质形成的巨大构象空间。

1.1打分函数 蛋白质-蛋白质对接可以被归类为一个全局最优化问题,其主要目的是找到蛋白质分子间最稳定关联结构。使用打分函数是准确评估结合蛋白间的相互作用所必需的。打分函数有两个作用:构象采集和母板选择及精制。打分函数的根本目的是从错误的对接取向中区分出正确或近似正确的对接取向。打分函数主要有两种类型:基于物理原理的函数和基于实验知识的函数。通常,基于物理原理的能量函数用分子力场如CHARMM[3]和AMBER[4]描述蛋白质-蛋白质相互作用。

打分函数可能包括几何学与化学的互补,静电力、范德华力和氢键的相互作用以及解相关能量项。最常用的打分函數是形状互补。经常将形状互补与FFT算法联合应用于详尽的全局搜索。静电场在带电粒子或极性分子间的相互作用中扮演着重要角色。泊松-玻尔兹曼方程常被用来解决从原子水平获得溶剂化生物分子系统的静电电位问题。打分函数包括了极其重要的离散和核心相互作用,通常用范德华力相互作用来描述。

1.2搜索算法 搜索算法的主要目的就是在势能图上定位最稳定的状态。对接复合物可能解的构象搜索可通过两种不同的方案执行。第一种方案是进行全空間搜索,第二种是随机地或按一定顺序只搜索局部空间。快速傅里叶变换是最为著名的用于全空间的搜索算法之一。Katchalski-Katzi[5]和助手首次将快速傅里叶变换法用于蛋白质对接,确定受体配体间几何契合。该方法被应用于许多程序,如GRAMM[6], FTDock[7],3D-Dock[8]以及ZDock[9]。局部搜索算法包括模拟退火,蒙特卡洛法及遗传算法等。Vieth和助手们[10]发现分子动力学法最适于进行大空间搜索,而遗传算法比其他算法更适合进行小空间搜索。大多数情况下,蒙特卡洛算法和分子动力学算法都用来进行蛋白质柔性处理。

1.3对接过程 蛋白质-蛋白质对接一般通用的过程包括:①尽可能多的从全局或局部搜索中生成对接复合物;②筛选和评估复合物;③精制和重排。这三步可被细分为更多步。第一步完成刚体的全局搜索,尽可能多的生成对接蛋白质-蛋白质构象。在第二步中,采用生物或实验信息和打分函数来扫描并评估第一步得到的对接复合物。错误对接复合物的得分比接近X射线结构复合物的得分高是很常见的,许多得分高的结构并不实际存在。应过滤掉这些不实际存在的结构,将剩下的对接复合物进行评估。第三步涉及到侧链及可能骨架的柔性。柔性处理时主要进行重排侧链。

2 分子动力学模拟

分子动力学模拟是一门利用经典力学来模拟大分子体系运动的方法,它综合了数学、统计物理、化学、计算机等多门学科的内容。分子力场是分子动力学模拟的基础。它采用简单的函数来描述分子能量与结构之间的关系。分子力场的基本函数形式包括了原子之间的成键相互作用与非键相互作用。非键相互作用主要包含了范德华力与长程静电力。

2.1分子动力学模拟过程 分子动力学模拟的步骤主要包括了四步:第一步是确定初始构象,初始构象尽量选越接近模拟系统的结构越好,通常是能量较低的构象。通常采用分子力学方法对其构象进行优化;第二步平衡相过程,在前一步中已经确定的模拟体系将进行平衡相过程。在构建平衡相的过程中,须对其构象以及温度等参数进行调控并加以监控,还要判断体系是否已经达到平衡;第三步生产相过程,模拟体系中的分子以及构成分子的原子开始根据初始速度运动,此时根据牛顿力学和预先给定的粒子间相互作用势来对各个粒子的运动轨迹进行计算,并从这个过程中抽取计算分析时所需要的数据和样本;第四步将对计算结果进行深入分析处理。

2.2研究进展及常用软件 Tajkhorshid等成功的模拟了水分子通过不同通道亚型的过程[11]。Xu等在水溶液和磷脂双层中对β淀粉样多肽进行了多次长时间分子动力学模拟,发现在生物膜和有机溶剂中以α螺旋为主,在水溶液中则以无规则卷曲为主[12]。京都大学医学研究科的岩田想[13]成功分析了存在于细胞的,负责将物质运送到细胞内的一种蛋白Mhp1的构造,运用该结果通过在计算机上模拟,在分子层次上弄清了Mhp1将物质运往细胞内的机制。

目前,用于分子动力学模拟的软件越来越成熟。较为常用的主要有:GROMACS,NAMD, AMBER,CHARMM,TINKER、LAMMPS等。GROMACS[14]是用户界面友好的分子动力学模拟软件,模拟中的参数条件和基本功能已经趋于成熟,里面包含多种力场,非常适用于模拟生物大分子这种复杂体系。同时由于其速度快,在非生物体系统中也得到了广泛的应用。AMBER[15]不仅是一个程序,而是包含了从体系准备到动力学模拟,再到轨迹分析等一系列程序的集合。同时,AMBER 还是一系列力场的名称,这些力场涵盖了蛋白质、核酸、糖类、脂类等众多生物大分子。NAMD同样适用于模拟计算蛋白质、核酸等生物大分子体系,而且并行计算效率非常高。

3 展望

目前,蛋白质分子对接及分子动力学模拟等计算手段虽然已广泛用于蛋白质-蛋白质间相互作用的相关研究,但还是存在一些值得改进的地方。例如,蛋白质-蛋白质对接过程中,蛋白质柔性的相关处理,构象搜索的合理性及打分函数的准确度;分子动力学模拟中力场的种类和所研究体系的匹配度等。随着计算机技术不断的发展,这些生物信息学方法有待进一步优化和相关软件需要进一步完善,从而使其更适用于蛋白质等生物大分子的模拟研究。总之,将生物信息学方法与传统实验手段相结合来进行蛋白质间相互作用等生物大分子体系研究,是一条有待进一步发展的有效途径。

参考文献:

[1]WodakS J,JaninJ.Computer analysis of protein-protein interaction[J].Journal of molecular biology,1978,124:323-342.

[2]Taylor,J.S.and Burnett,RM.DARWIN:A program for docking flexible molecules[J].Proteins. 2000,41:173-191.

[3]Brooks,B.R.,States,D.J., S.andKarplus,M.CHARMM: a program for macromolecular energy, minimization, and dynamics calculations[J].J.Comput.Chem.1983,4: 87-217.

[4]Ferguson, D.M., Kollman,P.A.A second generation force field for the simulation of proteins, nucleic acids, and organic molecules[J]. J. Am. Chem. Soc,1995, 117: 5179-5197.

[5]Katchalski,Vakser,I.A.Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques[J].Proc.Nat.Acad.Sci.USA,1992.89: 2195-2199.

[6]Tovchigrechko, Vakser, I.A.Development and Testing of an Automated Approach to Protein Docking[J].Proteins,2005,60:296-301.

[7]Gabb,H.A.,Sternberg,M.J.E.Modeling protein docking using shape complementarity, electrostatics and biochemical information[J].JMB.1997,272:106-120.

[8]Moont, Sternberg,M.J.E.Modelling protein-protein and protein-DNA docking[J].In Bioinformatics - From Genomes to Drugs,2001,1:361-404.

[9]Chen, R.and Weng,Z.A novel shape complementarity scoring function for protein-protein docking[J].Proteins,2003,51:397-408.

[10]Vieth, M., Hirst.Assessing search strategies for flexible docking[J].J.Comput.Chem,1998,19: 1623-1631.

[11]Tajkhorshid,E, Schulten, K.,Control of the selectivity of the aquaporin water channel family by global orientational tuning[J]. Science, 2002, 296: 525-530.

[12]Xu ,Y.,Jiang, H.Conformational transition of amyloid beta-peptide[J].PNAS.USA,2005,102: 5403-5407.

[13]Shima mura,T.,Beckstein. Molecular basis of alternating access membrane transport by the sodium-hydantoin transporter Mhp1[J].Science.2010,328:470-473.

[14]E.Lindahl,D.van der Spoel, Gromacs 3.0: A Package for Molecular Simulation and Trajectory Analysis[J].Journal of Molecular Modeling,2001,7:306-317.

[15]D.Case, B.Wang,R.The Amber Biomolecular Simulation Programs[J].Journal of Computational Chemistry,2005,26:1668-1688.

編辑/金昊天

猜你喜欢

蛋白质
幼鸡怎么喂蛋白质饲料
蛋白质自由
人工智能与蛋白质结构
蛋白质虽好,但也别过量给孩子补
优质蛋白质与免疫力
优质蛋白质与免疫力
饲料营养:理解蛋白质需要
古蛋白质研究在考古学中的应用
蛋白质组学在结核杆菌研究中的应用