内禀无序蛋白构象与带电氨基酸残基排布关系
——以精氨酸和天冬氨酸组成的随机多肽为例∗
2018-03-27康文斌王骏王炜
康文斌 王骏 王炜
1)(南京大学物理学院,南京 210093)
2)(湖北医药学院数理教研室,十堰 442000)
3)(湖北医药学院Bio-X研究中心,十堰 442000)
(2017年10月17日收到;2017年12月11日收到修改稿)
1 引 言
内禀无序蛋白(下文简称为无序蛋白),在蛋白质的转录调控和信号转导方面扮演着非常重要的角色[1,2].无序蛋白不能自发折叠,原因可能在于缺乏驱动折叠的疏水驱动力.研究表明,至少75%的无序蛋白是聚两性电解质[3−10].无序蛋白或者无序多肽的序列中缺乏疏水性的氨基酸而富含极性和带电氨基酸[3],其中,赖氨酸(Lys,K)、谷氨酸(Glu,E)、精氨酸(Arg,R)和天冬氨酸(Asp,D)出现的频率都很高[11,12].近年来,研究人员用带电残基百分比(fraction of charged residue,FCR)、残基平均净电量(net charge per residue,NCPR)等特征量粗略地描述了无序蛋白序列与构象之间的关系[6,13,14].例如,2010年,Mao等[13]研究发现NCPR可以作为序参量来预测聚两性电解质倾向形成紧密的球形还是松散的无规卷曲;2013年,Das和Pappu[4]发现赖氨酸和谷氨酸组成的随机多肽的构象依赖于正负电荷的排布情况.
正是由于电荷数量和排布的重要性,自然界中无序蛋白常通过甲基化、磷酸化等化学修饰过程来改变自身的电荷分布特性[15−21](如甲基化会通过对精氨酸或赖氨酸的带电侧链的化学修饰,使得相应残基变为电中性),从而影响其结构系综,进而激活或者抑制相应的生物功能.这种现象在近来的研究中被广泛观察到[15,17−22].例如,Pappu等[21]发现,细胞周期抑制蛋白p27的磷酸化导致电荷分布的改变,进而引起p27蛋白结构的改变,最终引起细胞周期的变化等.这种通过影响多肽或蛋白质中的电荷分布来调控无序多肽或者无序蛋白构象和功能的策略也已经在多个真实体系中得到了应用[15,17−22].
蛋白质结构与序列关系的定量研究对认识无序蛋白的功能具有非常重要的意义[23−31].Das等[4]针对由谷氨酸和赖氨酸组成的随机多肽开展了相关研究.众所周知,无序蛋白中还存在很多不同种类的带电氨基酸残基.例如,精氨酸是无序蛋白发挥功能的重要调控位点,因此研究富含精氨酸的多肽有着非常重要的理论意义.同时,一些具有相同电荷的残基在局部柔性上表现出不同的特征.谷氨酸在α-螺旋结构中比较常见,天冬氨酸在β-转角中出现频率较高,两者表现出不同的二级结构倾向性.这种局部结构倾向性和静电相互作用孰强孰弱?比如由天冬氨酸和精氨酸组成的无序多肽的构象与电荷排布之间是否依然服从同样的物理规律?为了回答这一问题,我们系统研究了由精氨酸和天冬氨酸组成的链长为50的随机多肽体系.基于ABSINTH(self-Assembly of biomolecules studied by an implicit,novel,and tunable hamiltonian)模型[32],利用全原子蒙特卡罗模拟方法研究了随机多肽的构象特征.结果表明,当两种正负带电氨基酸混合均匀时,多肽倾向于形成扩展的无规卷曲形状;当正负电荷显著分离时,多肽形成的结构为紧密的类β-发卡形状.这反映了电中性的随机多肽中正负带电氨基酸的排布显著地影响着其结构特征,进一步展示了静电相互作用是离子型多肽体系中最主要的相互作用.
2 模型与方法
2.1 模式参数κ的定义
本研究中,以带正电的精氨酸Arg和带负电的天冬氨酸Asp为基本组成成分,产生了一系列链长l=50的随机序列(共30条).这里带电性质的选择对应生理条件的情形.对每一条多肽的N端和C端,分别利用乙酰基(ACE)和N甲基(NME)进行保护.这里仅对NCPR=0的序列进行研究,具体的序列清单如表1所列.这些序列涵盖了模式参数κ整个范围(0,1).序列的模式参数的定义如下[6]:
这里f+和f−分别表示带正、负电氨基酸残基的百分比.对每一条序列,可以把序列划分为Nblob个不重复的片段来计算模式参数,每个片段可以包含g=5或者g=6个氨基酸残基[33].对第i个片段电荷不对称性σi定义为(2)式,序列的整体电荷不对称性σ的方差Δ定义为(3)式.不同序列的电荷不对称性的方差Δ是不同的,其中正负电荷完全分离的状态方差最大(记为Δmax).其余序列的模式参数κ定义为该序列的方差Δ除以Δmax.当Arg和Asp完全分离时,κ为1;当Arg和Asp混合均匀时,κ接近于零.
上述公式的物理意义为:(1)式表示整条序列的电荷不对称性;(2)式表示第i个以长度为5或者6个残基为单位时片段的电荷不对称性;(3)式表示电荷不对称性的方差;(4)式反映了一条序列中正负电荷混合均匀程度.
2.2 ABSINTH模型
ABSINTH模型是一种成功用于刻画内禀无序多肽体系的隐式溶剂模型[32],形式上可以分解为
其中Utor表示二面角扭转势能;UDisp+UEV对应于修正的范德瓦尔斯相互作用势,UDisp和UEV分别表示短程吸引项和排斥项;WSolv为ABSINTH模型中的平均场相互作用;Wel表示静电相互作用的贡献.
本研究中,为了比较电荷排布情况对多肽结构的调控,考虑了一些极限情况:体积排斥极限(excluded volume limit,EV)、球形极限(Lennard-Jones,LJ)、随机线团极限(flory random coils,FRC)和完整势能(ABSINTH)模型.其中FRC极限去除了Wel;EV极限只打开体积排斥项UEV;LJ极限则仅保留Lennard-Jones势函数UDisp+UEV[6].
表1 (Arg-Asp)25多肽系统的30条代表序列,第一列表示序列标签;第二列表示序列,红色的表示天冬氨酸,蓝色的表示精氨酸;第三列对应模式参数κTable 1.Thirty sequence variants for(Arg-Asp)25system.Column 1 shows the label of each sequence variant.Column 2 shows the actual sequence,with Asp residues in red and Arg residues in blue.Column 3 shows the κ-values.
2.3 形状参量
2.3.1 回转半径和非球形性指数
对于一个特定构象的多肽,回转张量定义为
Zm表示一个分子中原子数目,ri表示第i个原子的位置矢量,表示分子中心的位置矢量,符号⊗表示张量积.用表示回转张量的本征值,相应的非球形性指数定义为
2.3.2 内部平均距离
在聚合物球形-无规卷曲转变理论中,内部平均距离可作为序参量.在我们的多肽模型中,内部平均距离给出了满足给定序列距离|i−j|的所有残基对之间距离的平均结果:
这里,rm和rn分别代表第m个原子和第n个原子的位置矢量,分别属于第i号和第j号残基;Zij表示两个残基之间的所有的独立的配对数目;序列距离|i−j|的范围是0到l+2;Z|i−j|表示求和平均归一化常数.
2.4 模拟方法
模拟采用软件包CAMPARI2.0[31]实现,应用ABSINTH模型[32]和OPLS-AA/L力场.为了提高采样的效率,利用温度副本交换采样方法(replica-exchange Monte Carlo,REMC)[33−41]和马尔可夫链蒙特卡罗方法(Markov chain metropolis Monte Carlo,MCMC).模拟的盒子为球形,半径为75 Å.采用基于原子的软球势边界条件.为了考虑溶剂离子的影响,本研究模拟了浓度为15 mM的氯化钠溶液.这一数值和生理浓度(150 mM)有差别.不过前人研究指出氯化钠的浓度对于谷氨酸和赖氨酸组成的随机多肽体系的结构特征没有显著影响[6].因此,本文选择15 mM的氯化钠浓度是合理的.氨基酸残基原子间Lennard-Jones势和静电相互作用的截断距离分别设置为10 Å和14 Å.溶液中盐离子和侧链部分净电荷之间的静电相互作用则没有采取截断设置[6].
模拟过程的温度副本交换方法(REMC)选择了从280 K到430 K的12个温度副本.模拟的总步数为4.65×107步,相邻温度副本间每隔5×104步交换一次构象.在统计分析时,将模拟初始1.5×106步舍掉.在下文中,仅仅对常温(298 K)这一温度副本的情况进行了系统讨论.
3 结果与讨论
3.1 回转半径的变化反映了多肽的构象转变
图1 (Arg-Asp)25不同序列回转半径〈Rg〉与模式参数κ的关系(EV和FRC分别表示体积排斥极限和Flory随机线团极限情况,ABSINTH表示一般情况,黑色的实线为回转半径与模式参数的线性拟合)Fig.1.Ensemble-averaged radii of gyration 〈Rg〉for sequence variants of the(Arg-Asp)25system.Two dash lines intersect the ordinate at 〈Rg〉values expected for all sequence variants modeled in the EV limit or as Flory random coils(FRC).The solid black line is the fitting line for radii of gyration and patterning parameter.
图2 (Arg-Asp)25系统,κ=0.0009和κ=1.0000时的代表构象(红色的表示带负电荷的天冬氨酸,蓝色的表示带正电荷的精氨酸)Fig.2.Representative conformation for two sequence variants of the(Arg-Asp)25system:up(κ=0.0009),down(κ=1.0000).Side chains of Asp are shown in red,and side chains of Arg are shown in blue.
图1显示了(Arg-Asp)25不同序列的平均回转半径〈Rg〉随着模式参数κ的变化趋势,图2给出了(Arg-Asp)25系统的代表构象.总体来看,平均回转半径〈Rg〉随着模式参数κ的增大而减小.也就是随着正负电荷的分离,多肽的模式参数增大,多肽由松散的结构转变到紧密堆积.我们对回转半径与模式参数进行了线性拟合,发现皮尔森线性相关系数r=−0.89,显著性为P=8.1×10−11.sv30多肽的回转半径的最小值约为16 Å,这种情况对应的模式参数κ趋近于1.当正负电荷混合均匀(κ趋近于0)时,序列sv1的回转半径的值约为32 Å.这说明了模式参数越小,多肽的结构越松散,结构类似于自回避随机行走结构;模式参数越大,多肽的结构越紧密,结构类似于密堆积球形.图1还给出了两种极限情况(EV极限和FRC极限).两者对应的多肽回转半径分别约为24 Å和10 Å.这两种极限情形中,多肽的结构显然不依赖于序列中电荷的排布.FRC极限显然给出了多肽回转半径的下限.
3.2 链末端距的变化反映多肽的结构转变
图3给出了链末端距〈Ree〉与模式参数κ之间的关系.可以看到,随着模式参数增大,多肽链末端距呈现出逐渐减小的趋势.对正负电荷完全混合均匀的情况,链末端距约为84 Å,而正负电荷完全分离的情况对应的链末端距约为30 Å.同样,链末端距随着模式参数的变化趋势和图1显示的结论是一致的.这一结果表明,随着正负电荷的分离,多肽结构由扩展的直杆状逐渐转变到紧密的球形结构.
图3 (Arg-Asp)25系统各种序列对应的多肽的链末端距与模式参数κ的关系Fig.3.Ensemble-averaged end-to-end distance 〈Ree〉for sequence variants of the(Arg-Asp)25system.
3.3 内部平均距离〈Rij〉的变化反映了多肽结构的转变
图4给出了内部平均距离〈Rij〉与序列距离|i−j|之间的关系曲线.这一曲线可以很好地反映多肽结构的转变.具体地,sv1序列对应的曲线(紫色菱形),内部平均距离〈Rij〉随着氨基酸序列距离|i−j|增大而逐渐增长,反映多肽形成了扩展或者松散的结构(类似于杆状).这一情形对应κ=0.0009,其中正负电荷混合均匀,静电相互作用相互抵消.sv30对应的曲线(红色菱形),〈Rij〉表现出先增大再减小而后又增大的变化趋势,表明多肽形成了具有弯折形状的紧密结构.这一情形对应κ=1.0000,其中正负电荷显著分离,两者相互吸引而形成紧密结构.这一趋势也反映了电荷分布变化导致多肽结构由松散结构向紧密结构转变的过程.图4还给出了EV极限(红色实线),FRC极限(黑色实线)和LJ极限(蓝色实线)的情形.很容易发现κ=0.0009时多肽结构比EV极限情况更加松散,而κ=1.0000时,多肽结构趋近于LJ极限.
图4 (Arg-Asp)25系统各种序列对应的多肽的内部平均距离〈Rij〉与模式参数κ的关系(红色实线对应EV极限情形,黑色实线表示FRC极限情形,蓝色实线表示LJ极限情形)Fig.4. 〈Rij〉profiles for the(Arg-Asp)25sequence variants.The solid red,black and blue curves denote the profile expected for(Arg-Asp)25polymers in the EV limit,in FRC limit,and in LJ limits.
3.4 非球形指数的变化展示了从非球形结构向球形结构的转变
图5给出了非球形指数δ∗与模式参数κ的关系曲线,可以看出随着模式参数κ的增加,非球形指数从0.6下降到0.2.理论上,非球形指数δ∗=1表示理想的杆状结构,δ∗=0表示理想的球形结构.非球形指数的变化反映了随着电荷的分离,多肽紧密球形结构的形成过程.伴随着正负电荷的分离,多肽左右两端形成较大的电荷积聚区域,在静电吸引的作用下,类似球形的结构将逐渐形成.非球形指数的变化趋势进一步反映了多肽从松散结构到紧密结构的转变.
图5 (Arg-Asp)25系统各种序列对应的多肽的非球形指数δ∗与模式参数κ的关系Fig.5.Plot of ensemble-averaged asphericity values δ∗ against κ for sequence variants of(Arg-Asp)25.
3.5 多肽结构转变规律的保守性
选择天冬氨酸和精氨酸组成的随机多肽为研究对象,在组分上与Pappu等研究的谷氨酸和赖氨酸组成的随机多肽不同.在蛋白质中,天冬氨酸与谷氨酸形成二级结构的倾向性有着差别.谷氨酸容易形成α-螺旋结构,但是天冬氨酸形成β-转角的倾向性比较高[42].但是,两类多肽的电荷分布性质和结构特征之间的关系却是完全相似的.这说明对这种富电荷体系,在多肽结构转变过程中静电相互作用占主导地位.因多肽中全部是带电的氨基酸,没有疏水氨基酸,多肽系统缺乏折叠为特定二级结构的相互作用.相反,正负电荷分离引起明显的静电吸引,导致多肽形成包含弯折结构的紧密结构.不过这种结构依然处于无序状态[8,10,11].因此,由于正负电荷排布属性引起的结构变化规律是相似的.
4 结 论
从两种代表性正负带电氨基酸组分出发,构建随机多肽序列,利用全原子模型、温度副本交换及蒙特卡罗模拟方法,获得了电荷排布情况如何调控随机多肽结构的规律.着重考察了强两性电解质系统,发现电荷的排布情况会调控多肽的构象.结果证实了随着正负电荷的分离,系统中出现了较强的静电相互吸引,导致了紧密球形结构的形成.我们的结论与Pappu等[6]的结果符合得很好.值得指出,目前的研究仅仅是对强两性电解质系统的研究,对含有其他疏水性氨基酸情况的研究需要进一步探索.搞清多肽序列与结构的一般性关系,对揭示多肽的功能有很大的帮助,同时厘清多肽序列结构形成过程中的物理规律,对设计或者蛋白质工程有着重要的指导意义[43−52].
感谢南京大学高性能计算中心的支持,感谢唐乾元博士的启发性讨论.
[1]Tantos A,Han K H,Tompa P 2012Mol.Cell.Endocrinol.348 457
[2]Dyson H J,Wright P E 2005Nat.Rev.Mol.Cell Biol.6 197
[3]Uversky V N 2002Eur.J.Biochem.69 2
[4]Das R K,Pappu R V 2013Proc.Natl.Acad.Sci.USA110 13392
[5]Yu J F,Dou X H,Sha Y J,Wang C L,Wang H B,Chen Y T,Zhang F,Zhou Y,Wang J H 2017BMC Bioinform.18 206
[6]Piovesan D,Tabaro F,Micetic I,et al.2017Nucl.Acids Res.45 D1123
[7]Potenza E,Di Domenico T,Walsh I,Tosatto S C 2015Nucl.Acids Res.43 D315
[8]Varadi M,Kosol S,Lebrun P,Valentini E,Blackledge M,Dunker A K,Felli I C,Forman-Kay J D,Kriwacki R W,Pierattelli R,Sussman J,Svergun D I,Uversky V N,Vendruscolo M,Wishart D,Wright P E,Tompa P 2014Nucl.Acids Res.42 D326
[9]Sickmeier M,Hamilton J A,LeGall T,Vacic V,Cortese M S,Tantos A,Szabo B,Tompa P,Chen J,Uversky V N,Obradovic Z,Dunker A K 2007Nucl.Acids Res.35 D786
[10]Sim K L,Uchida T,Miyano S 2001Bioinformatics17 379
[11]Forbes J G,Jin A J,Ma K,Gutierrez-Cruz G,Tsai W L,Wang K 2005J.Muscle Res.Cell Motil.26 291
[12]Uversky V N 2002Protein Sci.11 739
[13]Mao A H,Crick S L,Vitalis A,Chicoine C L,Pappu R V 2010Proc.Natl.Acad.Sci.USA107 8183
[14]Kumar S,Hoh J H 2004Biochem.Biophys.Res.Commun.324 489
[15]Hendus-Altenburger R,Lambrughi M,Terkelsen T,Pedersen S F,Papaleo E,Lindorff-Larsen K,Kragelund B B 2017Cell.Signal37 40
[16]Malka-Gibor E,Kornreich M,Laser-Azogui A,Doron O,Zingerman-Koladko I,Harapin J,Medalia O,Beck R 2017Biophys.J.112 892
[17]Khan S H,McLaughlin W A,Kumar R 2017Sci.Rep.7 15440
[18]Lousa P,Nedozralova H,Zupa E,Novacek J,Hritz J 2017Biophys.Chem.223 25
[19]Stakkestad O,Lyngstadaas S P,Thiede B,Vondrasek J,Skalhegg B S,Reseland J E 2017Front.Physiol.8 531
[20]Liu J J,Dai J,He J F,Niemi A J,Ilieva N 2017Phys.Rev.E95 032406
[21]Das R K,Huang Y,Phillips A H,Kriwacki R W,Pappu R V 2016Proc.Natl.Acad.Sci.USA113 5616
[22]Lange J,Wyrwicz L S,Vriend G 2016Bioinformatics32 932
[23]Arya S,Mukhopadhyay S 2014J.Phys.Chem.B118 9191
[24]Kister A E,Potapov V 2013Biochem.Soc.Trans.41 616
[25]Hoang T X,Trovato A,Seno F,Banavar J R,Maritan A 2012Phys.Rev.E86 050901
[26]Huang Y Q,Liu Z R 2010Acta Phys.Chim.Sin.26 2061(in Chinese)[黄永棋,刘志荣2010物理化学学报26 2061]
[27]Dunker A K,Lawson J D,Brown C J,Williams R M,Romero P,Oh J S,Oldfield C J,Campen A M,RatliffC M,Hipps K W,Ausio J,Nissen M S,Reeves R,Kang C,Kissinger C R,Bailey R W,Griswold M D,Chiu W,Garner E C,Obradovic Z 2001J.Mol.Graph.Model.19 26
[28]Wang J,Wang W 1999Nat.Struct.Biol.6 1033
[29]Li W F,Qin M,Tie Z X,Wang W 2011Phys.Rev.E84 041933
[30]Wang J,Wang W 2016Adv.Phys.X1 444
[31]Vitalis A,Pappu R V 2009Annu.Rep.Comput.Chem.5 49
[32]Vitalis A,Pappu R V 2009J.Comput.Chem.30 673
[33]Pappu R V,Wang X,Vitalis A,Crick S L 2008Arch.Biochem.Biophys.469 132
[34]Cragnell C,Durand D,Cabane B,Skepo M 2016Proteins84 777
[35]Venditto J G,Wolf S,Curotto E,Mella M 2015Chem.Phys.Lett.635 127
[36]Wu H H,Chen C C,Chen C M 2012J.Comput.Aided Mol.Des.26 363
[37]Liu Y,Kellogg E,Liang H J 2012J.Chem.Phys.137 045103
[38]Odriozola G,Berthier L 2011J.Chem.Phys.134 054504
[39]Turner C H,Brennan J K,Lisal M 2007J.Phys.Chem.C111 15706
[40]Kokubo H,Okamoto Y 2004J.Chem.Phys.120 10837
[41]Nakazawa T,Ban S,Okuda Y,Masuya M,Mitsutake A,Okamoto Y 2002Biopolymers63 273
[42]Uversky V N 2013Intrinsically Disordered Proteins1 e24684
[43]Childers M C,Towse C L,Daggett V 2016Protein Eng.Des.Sel.29 271
[44]Yu C,Niu X,Jin F,Liu Z,Jin C,Lai L 2016Sci.Rep.6 22298
[45]Guharoy M,Bhowmick P,Tompa P 2016J.Biol.Chem.291 6723
[46]Nagibina G S,Tin U F,Glukhov A S,Melnik T N,Melnik B S 2016Protein Pept.Lett.23 176
[47]Noivirt-Brik O,Horovitz A,Unger R 2009PLoS Comput.Biol.5 e1000592
[48]Cheng Y,LeGall T,Oldfield C J,Mueller J P,Van Y Y,Romero P,Cortese M S,Uversky V N,Dunker A K 2006Trends Biotechnol.24 435
[49]Ambroggio X I,Kuhlman B 2006Curr.Opin.Struct.Biol.16 525
[50]Meng G Z 1986Prog.Biochem.Biophys.13 3(in Chinese)[盂广震1986生物化学与生物物理进展13 3]
[51]Wang D C 2008Protein Engineering(Vol.1)(Beijing:Chemical Industry Press)p65(in Chinese)[王大成 2008蛋白质工程(北京:化学工业出版社)第65页]
[52]Deng H Y,Jia Y,Zhang Y 2016Acta Phys.Sin.65 178701(in Chinese)[邓海游,贾亚,张阳 2016物理学报65 178701]