多肽衍生物中自由基介导的选择性C—C键断裂及异构体区分
2022-01-25贾贺园陈世稆路时芳
贾贺园,姚 波,陈世稆,路时芳,曹 洁
(北京理工大学化学与化工学院,原子分子簇科学教育部重点实验室,光电转换材料北京市重点实验室,北京 100081)
生物大分子选择性C—C键活化是化学领域乃至生命科学领域的前沿课题,具有重要意义。由于化合物中活性相似的C—C键普遍存在,选择性活化其中的1个C—C键是一大难点。李纲等[1]报道了首例羧基导向的远程C(sp2)—H键的选择性活化。关于质谱法对自由基介导的选择性C—C键断裂尚未见报道。
多肽自由基离子(M·+)是一种奇电子离子,存在2个反应中心(即自由基和电荷中心),反应活性很高,因具有独特的结构及气相反应活性而受到广泛关注。与质子化多肽离子([M+H]+)相比,多肽自由基离子可同时发生自由基和电荷诱导的反应,具有多种气相解离反应途径。比如:它既可以发生自由基诱导的断裂蛋白/多肽骨架上的N—Cα键、酰胺键和Cα—C键,形成a/x、b/y和c/z系列离子,又可以断裂侧链上Cα—Cβ和Cβ—Cγ键,生成丢失完整(或部分)侧链的碎片离子[2]。氨基酸残基的质子亲和势和自由基的位置决定了碎片离子的类型与丰度。相比之下,质子化多肽的气相解离路径比较单一,主要发生电荷驱动的酰胺键断裂反应而产生b/y系列离子[3]。因此,多肽自由基离子可产生多种包含氨基酸序列信息的碎片离子,是目前蛋白测序方法的重要补充。同时,在亮氨酸和异亮氨酸等异构体区分上[4],多肽自由基离子显示了特有的优势。
产生多肽自由基离子最经典的方法是通过金属-配体(L)-多肽(M)三元复合物[CuⅡ(L)(M)]2+的碰撞诱导解离反应(collision induced dissociation, CID)获得。Chu等[5-6]在CID时最先发现三元复合物[CuⅡ(L)(M)]2+发生电子转移反应得到多肽自由基离子M·+。对[CuⅡ(L)(M)]2+的后续研究主要是通过改变金属中心、设计配体和多肽的结构来探索多肽自由基离子形成的影响因素。如Siu和Chu讨论了配体结构对[CuⅡ(L)(GGX)]2+形成自由基离子的影响[7-8];O’Hair等[9]提出三价过渡金属离子的三元复合物[MnⅢ(salen)(M)]+也可以得到自由基离子[9]。此外,修饰自由基引发剂的多肽衍生物的CID也是产生多肽自由基离子的重要方法。常用的自由基引发剂包括过氧化物[10-11]、偶氮自由基引发剂[12]、TEMPO衍生物[13]和硝酸酯前驱体[14]等。多肽与自由基引发剂在溶液中偶联后,在CID时自由基引发剂内部的弱化学键容易发生均裂,引入自由基形成自由基离子。引入的自由基最初位于特定原子上,如氨基N原子、偶氮相邻C原子,进一步CID时自由基发生迁移,诱导多肽中不同键的断裂,产生含有结构信息的产物离子。从[CuⅡ(L)(M)]2+中制备自由基离子的方法与多肽和配体结构密切相关。当多肽中含有芳香族氨基酸或碱性氨基酸、配体有大体积或强吸电子能力的取代基时,有利于生成自由基离子[15-16]。相比之下,自由基引发剂法对多肽的结构要求并不高,此方法的关键在于自由基引发剂与多肽中的靶向基团耦合。前人通常采用简单的多肽模型研究自由基离子及其前体离子的气相反应[17-19],而尚未见以非天然氨基酸组成的多肽为研究对象的报道。
本文拟采用电喷雾串联质谱(ESI-MS/MS)法,首先研究一系列自合成多肽衍生物质子化肽的气相解离反应,明确该多肽衍生物的结构特点。与此同时,尝试采用三元复合物法([CuⅡ(L)(M)]2+)和TEMPO自由基引发剂法制备气相自由基离子。最后,通过TEMPO自由基引发剂法将邻甲基苯甲酰(Bz)自由基引入多肽衍生物分子中,并将该离子应用于多肽衍生物酯基邻近C—C键断裂及异构体识别研究。
1 实验部分
1.1 仪器与装置
Agilent 6520 Q-TOF质谱仪:美国Agilent公司产品,配有电喷雾离子源(ESI)及Qualitative Analysis B.04.00数据处理系统;Bruker Amazon Speed Dual Funnel离子阱质谱仪:德国Bruker公司产品,配有电喷雾离子源及Data Analysis 5.1数据处理系统。
1.2 材料与试剂
高氯酸铜、二亚乙基三胺(dien)、L-组氨酸:均为上海阿拉丁生化科技有限公司产品;2,2′∶6′,2″-三联吡啶(terpy)、无水氯化铜、甲醇:均为上海麦克林生化科技有限公司产品。本文涉及的多肽衍生物:由北京理工大学化学与化工学院姚波教授课题组提供,合成路线详见文献[20]。自由基引发剂o-TEMPO-Bz-NHS(邻-[(2,2,6,6-四甲基哌啶-1-氧基)甲基]苯甲酸-N-羟基丁二酰亚胺酯)的合成及其与多肽衍生物的偶联反应参照文献[13]。
1.3 样品制备
Cu(L)(ClO4)2(L=terpy,dien)的合成及[Cu(L)M](ClO4)2溶液的配制:1) Cu(L)(ClO4)2的合成参照文献[21],用Cu(ClO4)2代替Cu(NO2)2,将Cu(ClO4)2用水溶解后,与配体溶液以摩尔比1.5∶1混合(terpy用乙醇溶解,dien用原溶液即可),反应后用冷的CH3CH2OH∶H2O(1∶1)重结晶2次,得到纯的Cu(L)(ClO4)2;2) 将多肽衍生物的甲醇-水溶液(1 g/L)和Cu(L)(ClO4)2的甲醇溶液(1 g/L)按摩尔比4∶1混合后,用注射泵以300 μL/h注入ESI离子源中,即可在一级谱图中得到[Cu(L)M]2+。
[Cu(His)M]Cl2溶液的配制:将多肽衍生物的甲醇-水溶液(1 g/L)、无水氯化铜的水溶液(1 g/L)和组氨酸的水溶液(1 g/L)按摩尔比2∶1∶2混合后,用注射泵以300 μL/h注入ESI离子源中,即可在一级谱图中得到[Cu(His)M]2+。
1.4 质谱条件
[M+H]+和[CuⅡ(L)(M)]2+的质谱实验在Agilent Q-TOF质谱仪上完成;TEMPO-Bz-M的质谱实验和其他多级质谱实验均在Bruker离子阱质谱仪上完成。
Agilent Q-TOF质谱条件:电喷雾离子源;正离子模式;干燥气N2;干燥气温度300 ℃;干燥气流速10 L/min;雾化气压力206 kPa;毛细管电压3 500 V;碎裂电压85 V;锥孔电压60 V;隔离宽度m/z1.3;质量扫描范围m/z50~3 000。
Bruker离子阱质谱条件:电喷雾离子源;正离子模式;毛细管电压4 500 V;端盖补偿电压500 V;雾化气压力50 kPa;干燥气N2;干燥气温度180 ℃;干燥气流速4 L/min;隔离宽度m/z1;自动增益时间10 ms;碰撞气He;质量扫描范围m/z50~3 000。
1.5 计算方法
本文所有计算应用Gaussian 09程序,采用密度泛函理论(DFT)方法,使用6-31+g(d,p)基组进行结构优化,所有结构都进行了频率校正。
2 结果与讨论
2.1 自合成多肽衍生物的结构表征
本研究合成了6种由非天然氨基酸组成的多肽衍生物(A1~A6),结构式示于图1,其中A3和A4是同分异构体。采用ESI-MS/MS结合量化计算方法对其结构进行表征,并探索区分同分异构体的方法。6种二肽衍生物[M+H]+的CID质谱图示于图2,二肽衍生物离子[M+H]+的解离均以电荷诱导的酰胺键断裂反应为主,生成a1+(m/z162.127 6)和[y1+2H]+(m/z118.093 1(M=A1),m/z146.117 9(M=A2),m/z160.120 8(M=A3),m/z160.119 8(M=A4),m/z194.117 9(M=A5))产物离子。A1~A5中只存在1个酰胺键,且主要结构差异在于C-端氨基酸侧链不同。A1~A5的气相裂解反应呈现较好的规律性,以质子化三肽A6为例,其气相反应机理示于图3。A6的第1个酰胺键断裂时发生的亲核反应是由N-端氨基N原子参与[22],示于图3a。首先,质子转移到酰胺键的N原子上,被质子化的N原子会增加酰胺键的键长,削弱酰胺键的键能;然后,氨基N原子对酰胺键中的羰基C原子进行亲核进攻,同时酰胺键断裂形成含有内酰胺环丙烷结构的质子二聚体(proton-bound dimer Ⅰ),其解离碎片取决于2个碎片质子亲和势(proton affinity, PA)的相对大小。对于A1~A5,N-端碎片侧链均是含有苯环的叔丁基结构,其PA值大于C-端碎片,进而形成b1+。由于具有内酰胺环丙烷结构的b1+很不稳定,容易失去CO得到a1+,所以[M+H]+形成的a1+丰度远大于[y1+2H]+。A1~A5中,C-端氨基酸侧链的取代基会直接影响[y1+2H]+的相对丰度,酰胺键断裂形成的N-端和C-端碎片PA值的计算结果列于表1。A5的C-端氨基酸侧链R1=CH2C6H5,其PA值最大,[y1+2H]+的相对丰度最高;相反,A1的R1=CH3,其PA值最小,[y1+2H]+的相对丰度最低。A6第2个酰胺键断裂是由第1个酰胺键中的羰基O原子对第2个酰胺键的羰基C原子进行亲核进攻,同时酰胺键断裂形成含有恶唑酮环结构的质子二聚体(proton-bound dimer Ⅱ),通过对质子的竞争形成[y1+2H]+和b2+,示于图3b。与反应a不同的是,具有质子化恶唑酮环结构的b2+可以稳定存在,也可以进一步丢失CO得到a2+。在三肽A6中,3个氨基酸侧链都是C原子数为3或4的烷基链,对PA值的贡献相近,酰胺键断裂形成的竞争产物离子的相对丰度主要取决于碎片离子中所含氨基酸的个数,即二肽的PA值大于单体氨基酸的PA值。
图1 多肽衍生物A1~A6的结构、化学式和相对分子质量Fig.1 Structures, formulas and relative molecular mass of the polypeptide derivatives A1-A6
图2 [M+H]+的CID质谱图Fig.2 CID spectra of [M+H]+
注:a.第1个酰胺键断裂;b.第2个酰胺键断裂;c.C-端酯基键断裂;图中箭头表示亲核进攻方向
表1 [M+H]+ (M=A1~A5)酰胺键断裂的N-端和C-端碎片的PA值Table 1 PA of N-terminal and C-terminal fragments by amide bond cleavage in [M+H]+ (M=A1-A5)
2.2 自由基介导的选择性C—C键断裂及异构体区分
通过观察异构体A3和A4的结构,发现其主要差异来源于C-端氨基酸侧链的不同,一个是i-C4H9,另一个是s-C4H9。由于电荷只参与多肽骨架上的酰胺键断裂反应,不涉及侧链,所以本研究的设计思路是将自由基引入多肽离子结构使其形成自由基离子。多肽自由基离子具有自由基和电荷2个反应中心,与质子化分子相比,其解离途径更丰富。更重要的是,自由基可以诱导多肽丢失部分侧链的反应,为异构体识别提供理论支持。
自由基离子的第一种制备方法是由金属-配体-L-多肽组成的三元复合物[CuⅡ(L)(M)]2+通过多肽和金属离子间的电子转移反应。Chu等[23-24]在研究中发现,多肽在三元复合物中大多以两性结构存在。通过三元复合物的气相裂解反应[CuⅡ(dien)(YGW)]2+→[CuⅠ(dien)]++YGW·+制备多肽自由基离子要经历电子转移、从N-端到C-端的质子转移和电荷分离3个反应历程。本课题组[25]对[CuⅡ(4Cl-tpy)(Ac-YGW-OMe)]2+体系的研究表明,三元复合物中三肽的非两性结构有利于三元复合物的电子转移过程。对于化学修饰型多肽Ac-YGW-OMe来说,其只能以非两性结构存在于三元复合物中,多肽自由基离子的产率会显著提高。将6个多肽衍生物与Cu2+和3种配体L=His,terpy和dien组成三元复合物[CuⅡ(L)(M)]2+,通过三元复合物的气相解离反应制备M·+,结果发现,M·+没有出现在质谱图中,表明M·+的稳定性极差,主要是因为M·+缺乏共轭结构。但在相应的CID谱图中观察到另一个与M·+互补的电子转移产物离子[CuⅠ(L)]+(m/z217.997 6,相对丰度(RA) 18%(L=His);m/z296.025 2,RA 100%(L=terpy);m/z166.039 9,RA 20%(L=dien)),示于图4(6个多肽衍生物的[CuⅡ(L)(M)]2+气相裂解反应相似,以A3、A4为例进行说明,A1、A2、A5、A6的[CuⅡ(L)(M)]2+质谱图示于附图1、2、3,可登录《质谱学报》官网http:∥www.jcmss.com.cn下载)。与此同时,当L=His和dien时,还观察到“配体”和金属离子间的氧化还原反应,对应的反应产物为[CuⅠ(M)]+(m/z411,RA 100%(L=His),RA 18%(L=dien))。根据[CuⅠ(L)]+/[CuⅠ(M)]+的比值可大致判断L与Cu2+的络合能力顺序为:terpy>dien>His。需要说明的是,His作为弱配体存在于三元复合物中,其存在形式可以通过量化计算得到。以A3为例,由量化计算得到的3种不同配体形成的三元复合物[CuⅡ(His)(A3)]2+、[CuⅡ(terpy)(A3)]2+和[CuⅡ(dien)(A3)]2+的最稳定结构示于图5。在[CuⅡ(His)(A3)]2+中,His以两性结构存在于复合物中,CuⅡ在正方形平面上形成4个强的金属-配体配位键:CuⅡ与His的氨基N原子、羧基O原子分别形成2个强配位键(键长分别为1.909 Å和1.994 Å),与A3的氨基N原子、第2个羰基O原子形成2个配位键。这一结论与Siu等[19]对[CuⅡ(L)n(His)]2+的研究结果相符,即在[CuⅡ(丙酮)2(His)]2+中His是以两性结构形式存在,原因是丙酮这类“弱配体”会使其中的氨基酸以两性结构存在于复合物中[19]。当L=含氮配体terpy和dien时,CuⅡ与L形成3个强配位键,与A3形成一强一弱2个配位键,其中4个强配位键在一个平面内,另一个弱配位键位于该平面的轴向位置。遗憾的是,在图4所示的CID谱图中未直接观察到His·+、dien·+和M·+,表明它们在气相中均不稳定。但检测到了2个次级碎片离子[His-CO2]·+(m/z111.076 5,RA 16%)和[His-CO2-NH=CH2]·+(m/z82.053 1,RA 84%),间接表明了His·+离子的存在,这些特征碎片离子表明,由复合物离子[CuⅡ(His)(M)]2+氧化还原反应直接得到的、呈两性结构的His·+相当不稳定,它可以连续丢失CO2和甲亚胺分别得到[His-CO2]·+和[His-CO2-NH=CH2]·+碎片离子。由此看来,在三元复合物[CuⅡ(His)(M)]2+中,“配体”与“多肽”的界限并不明确,M也可作为CuⅡ的“配体”。由图4还可以看出,[CuⅡ(L)(M)]2+的CID谱图均出现较强的a1+碎片离子(m/z162,RA 38%(L=His),RA 55%(L=terpy),RA 84%(L=dien)),这种现象以M=三肽衍生物(A6)、L=dien时最为突出。A6的CID谱图示于附图4,生成了a1+(m/z86.097 5,RA 12%)、a2+(m/z199.182 5,RA 42%)、b2+(m/z227.177 9,RA 100%)和[y1+2H]+(m/z146.119 0,RA 48%)碎片离子,根据质子化多肽的气相裂解反应,判断它们都是由[M+H]+产生的次级碎片离子,质子的来源是His和dien配体。此外,L=terpy时,[CuⅡ(terpy)(M)]2+的气相解离反应还出现1个丢失M完整侧链的离子峰,如[CuⅠ(M-H-133)]·+(m/z235.014 8(M=A1),m/z263.044 1(M=A2),m/z277.061 3(M=A3),m/z277.061 0(M=A4),m/z311.044 5(M=A5)),[CuⅠ(M-H-57)]·+(m/z376.128 9(M=A6)),其产生机理示于附图4,这些离子系前驱体[CuⅡ(M-H)]+的次级碎片,其互补离子是[terpy+H]+(m/z234.103 3),表明质子转移反应也是[CuⅡ(terpy)(M)]2+主要的气相裂解反应类型。
图4 [CuⅡ(His)(A3)]2+(a), [CuⅡ(terpy)(A3)]2+(b), [CuⅡ(dien)(A3)]2+(c)和[CuⅡ(His)(A4)]2+(d), [CuⅡ(terpy)(A4)]2+(e), [CuⅡ(dien)(A4)]2+(f)的CID质谱图Fig.4 CID spectra of [CuⅡ(His)(A3)]2+ (a), [CuⅡ(terpy)(A3)]2+ (b),[CuⅡ(dien)(A3)]2+ (c), and [CuⅡ(His)(A4)]2+ (d), [CuⅡ(terpy)(A4)]2+ (e), [CuⅡ(dien)(A4)]2+ (f)
图5 [CuⅡ(His)(A3)]2+, [CuⅡ(terpy)(A3)]2+, [CuⅡ(dien)(A3)]2+的气相最稳定结构(键长单位为Å)Fig.5 Optimized gas-phase lowest-energy structures of [CuⅡ(His)(A3)]2+, [CuⅡ(terpy)(A3)]2+, [CuⅡ(dien)(A3)]2+
自由基离子的第二种制备方法是自由基引发剂法。Oh课题组将自由基引发剂o-TEMPO-Bz-NHS与多肽的氨基偶联,通过断裂TEMPO与邻甲基苯甲酸之间的C—O键,将邻甲基苯甲酰自由基(Bz·)引入多肽骨架,生成的自由基离子在气相中发生自由基迁移,从而诱导多肽主链和侧链键的断裂[13,26]。对于含有分子内二硫键的多肽,该方法可以实现C—S键和S—S键的优先断裂[27]。本研究采取同样策略将非天然氨基酸二肽衍生物与o-TEMPO-Bz-NHS耦合,以制备相应自由基离子。为便于区分A3和A4异构体,合成了其结构类似物B1和B2,以缩短侧链与自由基初始中心的距离,使自由基更容易诱导侧链丢失反应,达到区分异构体的目的。将o-TEMPO-Bz-NHS和异构体(B1和B2,以下统称M)通过一步法制备TEMPO-Bz-M,其结构式示于图6,[TEMPO-Bz-M+H]+、[Bz-M+H]·+以及[M+H]+的CID谱图示于图7。由图7a、7d可知,[TEMPO-Bz-M+H]+可产生较强的碎片离子峰[Bz-M+H]·+(m/z390,RA 100%(M=B1),RA 72%(M=B2))和[M+H]+(m/z273,RA 58%(M=B1),RA 100%(M=B2))。[Bz-M+H]·+是断裂[TEMPO-Bz-M+H]+中TEMPO与邻甲基苯甲酸之间的C—O键,失去TEMPO自由基而形成的。TEMPO自由基的稳定性降低了该自由基离子的反应能垒。[Bz-M+H]·+属于自由基离子,B1和B2显示出相似度较高、但碎片离子[Bz·-a1]+丰度明显不同的CID谱图(m/z203,RA 40%(M=B1),RA 60%(M=B2)),示于图7b、7e。
注:图中虚线内为TEMPO-Bz基团
图7 [TEMPO-Bz-B1+H]+(a)、[Bz-B1+H]·+(b)、[B1+H]+(c)和[TEMPO-Bz-B2+H]+(d)、[Bz-B2+H]·+(e)、[B2+H]+(f)的CID谱图Fig.7 CID spectra of [TEMPO-Bz-B1+H]+ (a), [Bz-B1+H]·+ (b) ,[B1+H]+ (c) and [TEMPO-Bz-B2+H]+ (d), [Bz-B2+H]·+ (e), [B2+H]+ (f)
注:a.C-端酯基键断裂;b.第2个酰胺键断裂;c.第1个N-Cα键断裂;图中全箭头表示亲核进攻方向,半箭头表示单电子转移
3 结论
本研究使用电喷雾串联质谱法对一系列自合成多肽衍生物(A1~A6)进行结构表征,使用TEMPO自由基引发剂法将邻甲基苯甲酰自由基引入多肽分子,在气相中成功制备出[Bz-M+H]·+自由基离子。通过串联质谱实验发现,该离子相对于质子化多肽分子([M+H]+)显示出更高的反应活性,具有更丰富的气相解离反应路径,分别生成[Bz·-a1]+(m/z202.97)、[Bz·-b1]+(m/z231.03)、[Bz·-c1+H]+(m/z133.95)和[(Bz-M(H)-HCOOEt]·+(m/z316.18,RA 100%)等碎片离子;相比之下,[M+H]+的气相解离途径比较单一,只产生以断裂酰胺键为主的碎片离子[y1+2H]+(m/z160.134 0,RA 100%)、a1+(m/z86.097 2,RA 74%)和[(M+H)-HCOOEt]+(m/z199.181 5,RA 52%)。其中,[(M+H)-HCOOEt]+的产生机理是由失去EtOH和CO两步反应完成。更重要的是,[Bz-M+H]·+自由基离子产生的[Bz·-a1]+和[(Bz-M(H)-HCOOEt]·+产物离子可成为异构体区分和选择性C—C键断裂的灵敏探针,为质谱区分多肽异构体和选择性C—C键断裂提供了方法参考。
致谢感谢布鲁克(北京)科技有限公司的仪器支持;感谢姚波教授合成多肽衍生物和TEMPO-Bz-多肽衍生物,以及富有启发和帮助的讨论;感谢陈世稆教授对量化计算给予的帮助和支持。