毛细管电泳-质谱联用技术及其在蛋白质组学中的应用
2020-09-18张丽华张玉奎
梁 玉, 张丽华, 张玉奎
(中国科学院大连化学物理研究所, 中国科学院分离分析化学重点实验室, 国家色谱研究分析中心, 辽宁 大连 116023)
毛细管电泳-质谱联用(CE-MS)技术具有上样体积小、分离效率高、分析速度快、灵敏度高等优势,目前已被广泛用于分离分析研究领域。蛋白质组学研究旨在“系统地分析生物体内蛋白质结构、功能及其相互作用和动态变化”,在生物学、精准医学研究等方面发挥着举足轻重的作用[1,2]。目前其主要研究策略包括基于蛋白质酶解肽段分离-质谱鉴定的“自下而上(bottom-up)”技术[3-5]、基于整体蛋白质分离-质谱鉴定的“自上而下(top-down)”技术[6-8]和非变性质谱(native-MS)技术[9,10]。然而,研究面临的最大挑战是生物样品极其复杂,具有蛋白质动态分布范围宽、数目巨大、性质差异显著等特点[11,12],因此亟须发展更好的分离技术以与高分辨质谱技术联用[13]。随着CE-MS技术的发展,其在蛋白质组学研究领域逐渐受到关注[14,15]。本文首先报道了CE-MS技术的研究进展,其中重点突出了实用性强并得到广泛应用的商品化接口,并概述了与质谱联用的CE分离模式;然后分别介绍了CE-MS技术在蛋白质组学“bottom-up”分析、“top-down”分析以及native MS分析中的应用,其中重点突出了与其他分离鉴定技术相比的优势;最后探讨了CE-MS技术的应用潜力。
1 毛细管电泳-质谱联用技术研究进展
1.1 接口
图 1 基于电渗流控制鞘流液流速的低流速鞘流液CE-MS接口[24]Fig. 1 Electrokinetically pumped sheath-flow CE-MS interface[24]
毛细管电泳与质谱联用的关键部件是接口[16,17],其必须在保证电泳分离的同时实现电喷雾过程,主要包括鞘流液和无鞘流液两种接口。鞘流液接口通过鞘流液施加喷雾电压,操作简单,实用性强;并且可以通过鞘流液改变电喷雾条件从而提高电泳缓冲液和质谱的兼容性。但是鞘流液接口存在的最大问题是鞘流液稀释样品从而影响检测灵敏度。Chen等[18]设计了连接分离毛细管、不锈钢喷针和加压鞘流液的接口,其中分离毛细管插入不锈钢喷针内部直至尖端,并分别在分离毛细管进样端及不锈钢喷针上施加分离电压和喷雾电压,而鞘流液储液池和质谱接地;鞘流液的流速由压力控制。此接口不仅实现了电泳分离和电喷雾过程,而且可以将鞘流液流速降低至0.1 μL/min,从而减少样品稀释程度、提高检测灵敏度,目前已被推广应用到肽段、蛋白质、抗体等分离分析[19-21]。Dovichi等[22-24]研制了基于四通的鞘流液接口(见图1a),分别连接了分离毛细管、石英电喷雾针、鞘流液、冲洗管路,其中分离毛细管延伸入石英电喷雾针的尖端附近,并分别在分离毛细管进样端和鞘流液储液池中施加电压,而质谱接地;鞘流液的低流速由电渗流控制,无需机械泵或者压力控制。为了进一步解决鞘流液稀释样品导致灵敏度降低的问题,Dovichi等通过缩短分离毛细管末端与喷针的距离(见图1b),研制了三代接口,连接Q-Exactive肽段检测灵敏度可达zmol级[23],使用寿命可达3.5天,连续运行127次[24],目前已经被美国CMP Scientific公司和深圳市永道致远科学技术有限公司商品化(EMASS-Ⅱ),并得到广泛应用[25-29]。
图 2 基于多孔层的无鞘流液CE-MS接口[32]Fig. 2 Sheathless porous-tip CE-MS interface[32]
无鞘流液接口避免了样品稀释从而提高了灵敏度,其面临的主要挑战是要维持CE稳定流量,同时在CE分离和ESI喷雾之间生成稳定的电接触。目前文献报道的电接触方法主要基于导电镀层[30,31]、多孔层[32-34]以及毛细管壁的细小裂缝[35,36]等,其中多孔电喷针的稳定性和实用性相对较好。最有代表性的工作是,Moini等[32,33]采用氢氟酸刻蚀法将分离毛细管末端刻蚀成5~10 μm的多孔层,然后将多孔尖端穿过充满溶液的金属喷针,利用少量离子穿过多孔层从而产生稳定的电接触(见图2)。此多孔电喷针制备简单,重现性好,电喷雾稳定。尽管这种接口存在多孔层可能发生堵塞影响使用寿命的问题,但是已被美国贝克曼公司商品化(CESI 8000),并应用于肽段、蛋白质及蛋白质复合物的高灵敏度分析[37-41]。
Neusüß等[42]系统比较了多种接口的性能,结果表明低流速鞘流液接口和基于多孔电喷针的无鞘流液接口的灵敏度相当,都比传统鞘流液接口灵敏度高,但低流速鞘流液接口的使用灵活性更好。随着CE-MS接口的发展及商品化,CE-MS技术日趋成熟,给分离分析科学注入了新的生命力。
1.2 分离模式
在众多的CE分离模式中,毛细管区带电泳(CZE)与质谱的联用最为普遍,已被广泛用于小分子、肽段、蛋白质、核酸等样品的分离分析[43-46]。其联用接口既可以采取鞘流液接口也可以采取无鞘流液接口。为了提高与质谱的兼容性,通常选用易挥发、对质谱友好的缓冲液,比如甲酸、乙酸、醋酸铵等。目前研究者们主要通过发展进样技术[47-49]、毛细管涂层技术[50-52]、在线富集技术[53,54]等方式提高CZE-MS的分离鉴定性能。近年来毛细管等电聚焦(CIEF)通过鞘流液接口与质谱实现了在线联用[20,27,28,55],并用于肽段、蛋白质和抗体的高分辨分离分析。但是由于CIEF的缓冲液中添加的两性电解质抑制质谱信号,并且操作复杂(包括进样、聚焦、区带迁移等步骤),因此应用受到限制。毛细管电色谱(CEC)兼具分离选择性好和分离效率高的优点,其与质谱的联用被用于小分子的分离分析[56,57],而在肽段、蛋白质鉴定方面的应用少有报道。适合CEC高效分离且与质谱兼容的分离柱有待进一步开发。
2 CE-MS技术在蛋白质组学研究中的应用
2.1 在蛋白质组“bottom-up”分析中的应用
目前被广泛采用的蛋白质组学研究策略主要是“bottom-up”策略[3],即先将蛋白质样品酶解成肽段,然后进行分离鉴定,最后通过鉴定到的肽段获得蛋白质信息。CE-MS在此领域中的优势是其分析速度快、灵敏度高。Dovichi等[23]采用自主研制的鞘流液接口及内径为10 μm的涂层毛细管构建了CZE与Q Exactive MS联用系统,在10 min内分析了16 pgE.coli酶解产物,鉴定到256±9个肽段,对应于105±17个蛋白质;从400 fgE.coli酶解产物中仍能鉴定到9条肽段,对应于4±1个蛋白质。据报道,基于内径为20 μm的CZE分离毛细管与Qq-TOF Impact质谱联用系统,肽段检出限可达260 zmol[58];基于10 μm的涂层CZE分离毛细管与Q-Exactive HF质谱联用系统,肽段检出限可低至1 zmol[59]。
单细胞蛋白质组学目前主要基于“bottom-up”策略,其有望获得不同细胞个体特征的蛋白质全景信息,从而深入了解细胞异质性[60,61],然而由于样品量极少,因此对分离鉴定的灵敏度提出了更高的要求[62]。而CE-MS具备样本需求量少、检测灵敏度高的优势,可以满足单细胞蛋白质组学分析的需求[63]。Nemes等[64]采用CZE-MS分析了瓜蛙胚胎细胞有丝分裂成16个细胞后的细胞异质性(见图3),分别从中线ventral-animal细胞(称为V11)、中线ventral-vegetal细胞(称为V21)和中线dorsal-animal细胞(称为D11)中鉴定了1 070、884和853个蛋白质;通过GO分析,揭示了鉴定的蛋白质的不同生物学功能,且丰度跨越6个数量级;通过串联质谱标签(TMT)标记实现了V11、V21、D11中蛋白质的相对定量。此外,他们进一步改进了样品预处理方法和CE-MS系统,实现了单细胞蛋白质组的无标记定量分析[65,66]。尽管他们采取的单细胞是卵细胞,仍展示出CE-MS在单细胞蛋白质组学分析中的应用潜力。
CZE基于分析物的质荷比的不同而分离,与基于分析物疏水性质不同而分离的反相液相色谱(RPLC)互补,为强极性的肽段和疏水性质相近的肽段(尤其是翻译后修饰肽段)的分离鉴定提供了新的途径。Lindner等[67,68]采用CZE-MS分析了组蛋白酶解肽段。组蛋白酶解肽段亲水性好,在反相色谱上保留弱甚至无保留导致无法有效分离鉴定,而CZE-MS可以实现其分离鉴定,包括乙酰化、磷酸化等翻译后修饰位点的鉴定。Dovichi等[69]结合RPLC和CZE,分离鉴定了完整糖肽:通过RPLC,能够将肽段骨架结构相似的糖肽分离;再通过CZE,能够将骨架结构相似但糖苷不同的糖肽分离。从鉴定结果可以看出,仅通过RPLC分离鉴定了197条完整糖肽,仅通过CZE分离鉴定了159条,两者结合可以鉴定268条。由此可见,CE-MS技术以独特的优势与LC-MS技术互为补充,从而提高酶解肽段鉴定的覆盖度。
2.2 在蛋白质组“top-down”分析中的应用
由于基因突变、RNA可变剪切、蛋白质翻译后修饰等原因,一个蛋白质编码基因可能会产生多个蛋白质变体(proteoforms)[70]。虽然同一基因产生的不同蛋白质变体的一级结构高度相似,但是其生物学功能却有明显差异[71]。因此,蛋白质变体的深度鉴定将是下一代蛋白质组学研究的发展趋势[72]。与“bottom-up”策略不同,“top-down”策略,即将蛋白质分子直接进行分离、质谱鉴定,可以获得更精准、更丰富、更完整的蛋白质变体信息[6,7,72,73]。蛋白质变体的深度鉴定面临的巨大挑战仍然来自生物样品的复杂性[12],因此发展高效的完整蛋白质分离技术和高灵敏度的蛋白质鉴定技术至关重要。
在完整蛋白质分离鉴定方面,CE-MS技术的优势尤为明显[45,74]。早在1996年,Mclafferty等[75]利用CZE与傅里叶变换离子回旋共振(FTICR)用于完整蛋白质的分离检测,其灵敏度高达amol级;Smith等[76]也报道了CZE-FTICR MS对于8~20 kDa蛋白质的检出限可达30 zmol。Yates等[77]比较了CZE-MS和RPLC-MS的蛋白质分离鉴定效果。与RPLC-MS相比,CZE-MS灵敏度提高了100倍,仅需2.5 ng(约12 amol)样品量。分析其主要原因是:与RPLC相比,CZE对于蛋白质分离具有更高的分离效率和回收率。Kelleher等[78]采用Gelfree方法按照相对分子质量大小进行预分级,然后收集馏分进行CZE-MS分析。从P. aeruginosa样品中鉴定到30个30~80 kDa的蛋白质,其中30~50 kDa的蛋白质分离半峰宽为24~57 s; 48~60 kDa的蛋白质分离半峰宽约为24 s,充分显示了CE在大分子分离方面的优势。
图 3 基于CE-MS分析瓜蛙胚胎单细胞的(a)示意图和(b)鉴定结果[64]Fig. 3 (a) Schematic diagram and (b) results of CE-MS proteomic analysis of single embryonic cells[64]
随着质谱技术及数据解析方法的发展,CE-MS技术被用于复杂样品“top-down”规模化分析。Sun等[79]采用基于聚丙烯酰胺涂层的分离毛细管和基于电渗流控制鞘流液流速的低流速鞘流液CE-MS接口提高分离效率和灵敏度,并采用动态pH界面堆积的方法提高上样量,从1 μgE.coli样品中单针鉴定到200个蛋白质和约600个蛋白质变体;其分离窗口增加至90 min,峰容量达到280(见图4)。采用构建的CZE-MS/MS系统对斑马鱼脑Teo区和Cb区进行了整体蛋白质水平上的定量分析[80]:从Cb区和Teo区单针分别鉴定了1 730个和2 024个蛋白质变体,合并6针鉴定结果,鉴定了4 000个蛋白质变体;采取无标定量的方法,定量到了2 000个蛋白质变体,其中786个蛋白质变体存在明显差异。
图 4 基于CZE-MS/MS技术对E. coli蛋白质组“top-down”分析的分离鉴定结果[79]Fig. 4 Data about top-down proteomics of E. coli using CZE-MS/MS[79]
由于CE分析速度快,且与LC分离正交性好,因此CE-MS结合LC能够进一步提高蛋白质分离峰容量和鉴定覆盖度[81,82]。Sun等[82]将E.coli蛋白质先进行尺寸排阻色谱(SEC)和RPLC分级,再将100个级分分别用CZE-MS/MS分析,三维的峰容量高达4 000,总共鉴定了850个蛋白质和5 700个蛋白质变体。此外,CE与新型裂解模式的结合也被尝试用于提高蛋白质变体的鉴定深度。活化离子电子转移(AI-ETD)裂解模式和紫外光裂解模式(UVPD)为产生更多的匹配片段从而提高蛋白质的序列覆盖率和鉴定准确性提供了新的手段[83-85]。Sun等[86]基于SEC预分级-CZE分离-AI-ETD鉴定,从E.coli样品中可信地鉴定到3 028个蛋白质变体,其中包括丰富的翻译后修饰信息及N端信息;同时CZE-MS与UVPD技术的结合也被尝试用于分析斑马鱼脑样品[87]。CE-MS技术的优势结合质谱技术的不断革新以及数据解析方法的逐步完善,从而推进了“top-down”蛋白质组学的发展。
2.3 在蛋白质复合物native MS分析中的应用
蛋白质通常与其他分子(如核酸、药物分子、辅助因子、配体、其他蛋白质等)相互作用形成复合物从而在特定的时间和空间内完成特定的功能[88]。研究蛋白质复合物的组成和结构对理解生物系统具有重要意义,而传统的质谱技术通常无法从完整蛋白质复合物水平上进行分析。Native MS基于电喷雾电离技术,使用接近生理条件的缓冲溶液,使蛋白质复合物维持天然状态下的四级拓扑结构,能够获得蛋白质复合物的精确相对分子质量、亚基组成及空间排列、化学计量比等,为蛋白质复合物的结构解析提供了更多的信息[9,89,90]。
蛋白质复合物的native MS分析通常需要结合分离纯化方法[90-92]。相比于LC、凝胶电泳等分离方法,CZE可以采用近生理条件的缓冲液从而能够更好地维持蛋白质复合物的结构,且在大分子分离方面分辨率高,此外与质谱联用的检测灵敏度高。因此,CZE-MS技术在蛋白质复合物native MS分析中备受关注。Nguyen等[33]采用CZE与Q-TOF联用,实现了在非变性条件下血红细胞中蛋白质-蛋白质和蛋白质-金属复合物的分离检测,包括碳酸酐酶II-Zn复合物、碳酸酐酶I-Zn复合物和血红蛋白四聚体,丰度范围跨越3个数量级。Gahoual等[93]采用CZE与Q-TOF质谱联用,分离检测了445~1.34 MDa的血蓝蛋白复合物。Belov等[41]采用CZE与EMR orbitrap联用,在非变性条件下分离鉴定了标准蛋白质复合物和E.coli核糖体样品,并通过二级碎裂实现了其中蛋白质变体的鉴定。为了提高分离能力,Sun等[92]使用SEC对提取的蛋白质样品进行预先分级,搭建了SEC-CZE-Native MS平台分析E.coli样品(见图5),总共鉴定到144种蛋白质、672个蛋白质变体和23个蛋白质复合物,其中包括4个蛋白质二聚体、16个蛋白质-金属复合物、2个蛋白质-[2Fe-2S]复合物和一个蛋白质-谷氨酰胺复合物。然而由于使用的质谱受m/z扫描范围的限制,没有鉴定到更大相对分子质量的复合物。
图 5 E. coli蛋白质组通过SEC-CZE-Native MS分析的示意图及分离鉴定结果[92]Fig. 5 Schematic diagram and results of SEC-CZE-Native MS analysis of E. coli proteome[92]
CE-MS将高效分离和native MS联合起来,为蛋白质复合物分析提供了有力工具。在未来的研究中,CE-native MS方法也有望通过与不同的预分离方法相结合、质谱仪器的进一步改进和鉴定解析方法的突破,对复杂体系中蛋白质复合物进行更有效的表征。
3 总结与展望
灵敏度高、喷雾稳定的CE-MS接口的发展及商品化使CE-MS技术在蛋白质组学研究领域逐渐被关注,并以其独特的优势在肽段、蛋白质、蛋白质复合物的分离鉴定中发挥着重要的作用。首先,CE-MS技术具有进样体积小、灵敏度高、分析速度快的优点,结合高通量的样品预处理技术及自动化的上样技术将有望实现高通量、高灵敏度的单细胞蛋白质组学研究;其次,CE-MS技术与LC-MS技术互为补充,可以提高蛋白质组分离鉴定的覆盖度;第三,与液相色谱相比,毛细管电泳技术在蛋白质大分子的分离方面具有分离效率高、回收率高的优势,其与质谱的联用在整体蛋白质的分离鉴定领域的应用越来越广泛;最后,CE-native MS在蛋白质复合物的分离鉴定方面具有很大的应用潜力。