高效液相色谱-质谱联用技术在蛋白质检测中的应用
2021-11-29刘佳音安洋苏俊杜光光王佳董庆海刘继华
刘佳音,安洋,苏俊,杜光光,王佳,董庆海,刘继华
(吉林大学药学院,吉林 长春 130021)
对于大分子蛋白质及多肽的分析研究是目前生命研究中重要的课题之一,蛋白质的复杂性以及结构的多样性对于表现不同的食品功能和药品特性来说十分重要:其功能特性和结构的变化对食品质量影响很大,在食物的成分检测与鉴定中也起着重要的作用;蛋白质药物目前在生物技术药物中发展得十分迅猛,已经成为医药产品中的重要组成部分,主要包括生长因子、单克隆抗体、重组抗体等,具有较高的活性和特异性,毒性很低,针对蛋白质药物的研究对于人类的健康与社会的发展都具有着重大的意义[1]。
在大分子的各项分析中,质谱技术有着快速、超微量、高灵敏度、高特异性等许多优点。由于实验要求的不同,高效液相色谱仪可以和不同的质谱、检测器联用,高分辨质谱等在定性方面有着明显的优势,可以用于组学研究初期的全谱扫描分析;高灵敏质谱在定量方面优势明显,可以很好地解决精确测量蛋白质等生物大分子的分子量和掌握分子结构的信息等问题。高效液相色谱-质谱联用(HPLC-MS)技术在医药、食品、生物等各个领域的应用有着重要的地位,满足了现代各类物质分析中高通量和高精度的要求,且已经成为大多数实验室中蛋白质组学研究的首选生物分析工具,本文综述了高效液相色谱-质谱在蛋白组学中的应用以及在蛋白质的鉴定分析与含量测定中的应用。
1 蛋白组学研究及定性鉴别
蛋白组学本质上就是大规模水平的研究蛋白质的特征,通过蛋白组学可以获得在蛋白质水平上的关于疾病发生,细胞代谢等过程的认知以及对生命的复杂结构和活动进行解释,也是多种疾病机理阐述的重要途径。蛋白组学有大概3种研究策略,其中自底向上的方法又被称为鸟枪蛋白组学方法,将变性的蛋白质用蛋白酶酶解,在特定位点将多肽链降解为小肽段,由于得到的肽段具有很好的稳定性和特异性,能够快速鉴别复杂样品中的组分,因此成了大规模研究蛋白质的首选技术之一。
在以前对蛋白质的鉴定中,主要采用的是从头测序的传统方法和双向电泳来完成,随着序列数据库规模的增长,利用质谱将样品分子离子化,根据分子离子间荷质比的不同来分离并生成图谱,可以快速、高效地对目的蛋白进行鉴定分析,且使用的样品量小。Sha等[2]用HPLC-LTQ/Orbitrap高分辨率质谱技术准确地区分牛皮明胶,猪皮明胶和驴皮明胶,仅在驴皮中检测到血红蛋白,并分别发现了牛明胶、猪明胶和驴明胶的49、50和55个理论独特序列片段,在单个明胶中检测到28、27和14个唯一峰分别代表牛的明胶,猪的明胶和驴的明胶,在混合物中,可检测的标记肽很容易识别,而没有强烈的峰干扰。潘晓东等[3]基于自下而上的蛋白分析策略,用Tris-HCl提取虾中的蛋白后用胰蛋白酶水解,采用超高效液相色谱仪Vanquish LC分离后用Q-Exactive四极杆静电场轨道离子阱质谱测定,通过蛋白数据库和软件搜索鉴别过敏蛋白,得到了4种典型的肽段,原肌球蛋白、精氨酸激酶、血蓝蛋白和肌浆钙结合蛋白,它们的肽段覆盖率分别为53%、36%、12%和12%,并且氨基酸的翻译后修饰没有明显的规律,主要修饰位点为天冬氨酸的甲基化、天冬酰胺和谷氨酰胺的脱酰胺化以及蛋氨酸的氧化。
房芳等[4]用Nano-HPLC-Q-TOF-MS结合鸟枪蛋白组学的方法比对蛋白酶解后的特征肽段序列,在Uniprot数据库检索相关蛋白数据库并导入Protein Pilot 5.0软件进行蛋白质的鉴定,找到了4条驴、牛和猪特征肽段和两条马特征肽段,采用MRM方法对3种胶原蛋白的理论特征肽进行了验证,证实了4条理论特征肽的存在,解决了在肽段层面上鉴别阿胶中异源性物种的问题。Bargen等[5]用AB SCIEX TripleTOF 5600系统与Eksigent nanoLC偶联,Orbitrap系统与Accela HPLC系统连接,分别在色谱柱上进行分离,通过使用肌纤维蛋白和肌浆蛋白质提取物的胰蛋白酶消化的鸟枪蛋白质组学方法鉴定特异性的生物标志物肽,在Orbitrap上鉴定出了约400种蛋白质中的约4 000~4 500个肽,而在TOF仪器上针对相同样品鉴定了约500种蛋白质中的约5 500种肽;并且开发了一种MRM3方法检测牛肉基质中最敏感的生物标记物肽的污染的LOD约为0.55%,该方法显示出的灵敏度与最敏感的PCR和ELISA相当。李莹莹等[6]将样品用胰蛋白酶消化后用液相色谱-质谱联用高分辨系统对种属特征肽进行筛选,鉴定到各个物种相对于其他物种专属性的多肽条数,筛选出目标肽段,再使用液相色谱-质谱联用三重串联四极杆质谱SRM模式,进行多肽的定性及定量分析,最终选择了羊肉多肽8 条,鸭肉多肽10条作为定性离子的母离子,得到总离子流图,该方法体系检出限为0.5%鸭肉定性判别,定量限为1%鸭肉掺假判别,基本实现了羊肉中掺假鸭肉的量化鉴别。
2 蛋白质结构鉴定中的应用
传统的物种鉴别大多都是在蛋白水平上进行检测的,通常包括4个步骤:蛋白质的分离、消化,所得肽段的质谱分析以及将观察到的肽段与数据库中的肽段进行比较。在鉴定蛋白质的大部分实验中,质谱是一种能够检测分子量、碳骨架与结构信息的技术手段,与高效液相色谱法结合起来被视为是分析复杂蛋白质和肽段必不可少的工具,构成了蛋白质鉴定分析的一套高效流程。在定性鉴定中,HPLC-MS技术可以进行多种分析,蛋白质的相对分子质量,一级结构氨基酸序列和对翻译后修饰的蛋白质进行鉴定等。
2.1 对翻译后修饰的蛋白质进行鉴定 蛋白质的翻译后修饰可以在蛋白质的特定氨基酸位点上引入不同的基团,比如磷酸化、糖基化、乙酰化、甲基化等,这是调控蛋白质功能的重要方式[7],随着生物质谱技术的发展,用高效液相色谱与质谱联用检测技术可以对蛋白质的翻译后修饰进行准确的鉴定和表征。
碘乙酰胺(IAA)可以进行蛋白质的烷基化修饰,使得蛋白质的酶切高效进行,王继峰等[8]用牛血清白蛋白(BSA)作为研究对象,比较适量和过量的IAA对酶切结果的影响,用Agilent 1100毛细管液相色谱系统,梯度洗脱出的组分经ESI离子源进入LTQ-FT质谱进行定性分析,一级全扫描在FT-ICR中进行,得到的最强的10个离子进入离子阱进行二级质谱分析,用Maxquant软件进行鉴定,最终得到半胱氨酸的烷基化比例最大,其次容易发生烷基化的是肽段N端氨基酸,为46%;一共鉴定到46条多烷基化肽段,并且表明了过量的烷基化修饰对蛋白质的定性与定量分析都可能会产生较大影响。Blöchl等[9]用HPLC-MS研究了小鼠的单克隆免疫球蛋白,确定了小鼠IgG中的SpeB切割位点,用离子对反相HPLC联用高分辨率质谱分析得到的不同亚类特征的FC/2部分和N-糖基化变体,它们二者均可以影响IgG效应子功能。Geng等[10]将鸡蛋清蛋白用胰蛋白酶和胰凝乳蛋白酶消化后,用高性能液相色谱/串联质谱法分析其糖基化结构,用MASCOT处理后从MS/MS数据获得N-糖苷,共鉴定出了88种独特的糖肽,这些肽含有71个N-糖苷类,属于26个蛋白,在26个已鉴定的蛋清N-糖蛋白中,约46%携带一个N-糖链,其中卵黏蛋白N-糖基化最严重,其次为卵糖蛋白。Kisrieva等[11]用HPLC-MS/MS技术与无标记比较蛋白质组分析方法,研究了脑缺血(CI)患者和健康人血浆样品中蛋白质翻译后修饰(PTM)之间的相对差异,并在Mascot数据库中使用了多个MS/MS搜索查找,最终在CI血浆样品中观察到有PTM的肽比例有所增加包括丝氨酸,苏氨酸和酪氨酸的磷酸化,赖氨酸的乙酰化和蛋白N末端,赖氨酸的泛素化以及谷氨酰胺脱酰胺。
2.2 蛋白质氨基酸序列的测定 蛋白质的一级结构也就是蛋白质的氨基酸序列,也包括二硫键的位置上,是蛋白质生物功能的基础。通过HPLC-MS技术可以得到许多的肽段信息,在数据库中进行检索,可以准确地鉴定多肽和蛋白质的一级结构。Shen等[12]将卵转铁蛋白超声处理酶促水解后经阳离子交换色谱分离,收集到4个馏分,再进一步用Waters 600 HPLC反相色谱进一步分离前两个活性最高的馏分,用LC-Q-TOF-MS对其中来源于卵转铁蛋白的14种肽进行了表征鉴定,对已鉴定的肽从头测序并且研究了它的抗氧化性能,并得出最有效的、ORAC值最高的肽序列是WNIP。张萍等[13]在对冬虫夏草及相关的发酵虫草类样品的特征肽段进行序列鉴定,联用了EASY-nLC1000超高效液相色谱仪与四极杆-静电场轨道阱-线性离子阱三合一组合式 Orbitrap Fusion质谱仪对真菌蛋白的酶解产物进行分析,建立了6种样品的酶解质谱肽图,寻找各样品的特征肽段,一级质谱采用Orbitrap检测器,二级质谱采用离子肼检测器,结合数据库对特征肽段进行序列鉴定,鉴定出了冬虫夏草2个特征肽段及序列,发酵冬虫夏草菌丝体3个特征肽段及序列等。Cheng等[14]用ESI+电离模式的超高效液相色谱-四极杆飞行时间质谱(UPLC/Q-TOF-MS)方法鉴定胰蛋白酶消化后的五种明胶得到5种离子峰强度色谱图,将3D LC/MS数据转换为精确质量保留时间的2D矩阵之后进行无监督的主成分分析,可以检查出明胶之间的异常值和分类趋势,识别出重要的标记肽,通过在数据库中获得各来源的蛋白质的序列,使用Biopharmalynx 1.2鉴定了每个明胶标记肽。
2.3 相对分子质量的测定 蛋白质的相对分子质量在蛋白质的分析中是一个很重要的参数,目前比较常用的有MALDI-TOF-MS,结合了MALDI离子化技术和TOF质谱技术,可以直接对分子量进行测定,效率很高且对极微量的样品液可以分析;另一种是ESI-MS,结合了电喷雾电离ESI和质谱技术,可以得到多电荷峰,获得精确的分子量数值。这两种方法各有其优点及适用的领域。MALDI离子化效率非常高,可以对极微量的样品进行分析。桂萌[15]对鲟鱼特定腐败菌产生的N-酰基高丝氨酸内酯类(AHLs)提取物用HPLC-Trap-Ms进行三级碎片结构分析,由于丢失高丝氨酸内酯环,可以通过特征碎片鉴定出两种AHLs化合物;用HPLC/QqQ-Ms鉴定得出了除上面两种之外的第三种;用HPLC-QTOF-Ms和串联全信息数据扫描功能,可以得到母离子和碎片离子的精确质量数,所测得的各峰精确分子量和计算得到的理论值均小于5 mDa,共鉴定出4种AHLs:C6-HSL、3-oxo-C8-HSL、3-OH-C8-HSL和C8-HSL。乐复能是一种相对分子质量为19300的基因工程类药物,李萌等[16]用HPLC-ESI-Q-TOF-MS绘制乐复能经胰蛋白酶酶切后的液质肽图,并定位二硫键;用电喷雾四级杆飞行时间质谱(ESI-Q-TOF-MS)测定其精确相对分子质量,找到了12个酶切肽段,检测到的相对分子质量为19 311.63,将肽图与相对分子质量结合分析,推测氨基酸序列是正确的。Wang等[17]将芝麻蛋白水解物用3种蛋白酶水解,再用固定的金属亲和色谱法从胰蛋白酶水解产物中分离出金属螯合肽并用反相(RP)-HPLC和质谱(LC-MS/MS)鉴定出6种锌螯合肽,分别得到了它们的分子量,与理论值相符。Mojica等[18]将13种豆类蛋白分离物用SDS-PAGE和蛋白质凝胶内消化HPLC/MS识别,主要有菜豆素、凝集素、蛋白酶和α-淀粉酶抑制剂;用HPLC-MS/MS鉴定出丰富的肽,分子质量范围为300~1 500 Da,重要的序列为 SGAM、DSSG、LLAH、YVAT、EPTE和KPKL。α-淀粉酶抑制剂被鉴定为条带J/K/L,分子量分别为18、16和14 kDa。凝集素(F带和H带)分别为33和25 kDa,胰蛋白酶抑制剂在20 kDa(I带),BBI在10 kDa以下(M带)。
3 定量测定中的应用
蛋白质的定量分析是在蛋白质水平上通过比较样品中目标蛋白的信号强度来完成的,对样品中的蛋白质进行准确可靠的定量分析,是经常进行的一项非常重要的工作,在生物制品、食品、药品的质量监测中扮演着重要的角色,它可以用来确定样品中蛋白质的总量,也可以测某种单一蛋白成分的含量,是寻找治疗靶标分子和疾病标志物的有效工具。
3.1 定量蛋白组学研究 细胞蛋白的表达范围很广,定量所需的信息质量远远超出了蛋白质鉴定的质量,因此目前的质谱技术通常仅对样品中蛋白的一部分进行采样,在鉴定出的蛋白质中只有一小部分可以可靠地定量,通常需要在实验之间比较每种单独的肽。Bhat等[19]将乳清中的蛋白质分离成高丰度和低丰度用胰蛋白酶消化后在C18超高效液相色谱色谱柱上分离肽,用基于高分辨率Q-TOF质谱的定量蛋白质组学技术的来区分比较泽西和克什米尔牛的牛奶蛋白质组水平,使用搜索引擎寻找肽段光谱进行鉴定,得到克什米尔和泽西岛牛之间180种蛋白质的差异表达,共有81种高丰度和99种低丰度蛋白质表达,通过通路分析进行生物学解释,unique和razor peptides进行定量,结果得到克什米尔人的牛乳中表达最上调的为免疫相关蛋白和药物代谢酶;泽西牛奶蛋白质组则呈现更高浓度的酶调节剂和水解酶表达。
目前常用的有两种定量蛋白质组学方法,一种是使用二维聚丙烯酰胺凝胶电泳(2D-PAGE),另一种涉及液相色谱/串联质谱(LC-MS/MS)和稳定同位素标记。由于凝胶电泳法与常用的染色程序结合使用时,对于蛋白质检测的动态范围有限,而液相色谱/串联质谱的方法有着很宽的动态范围,能够检测到几乎所有的蛋白质,因此可以运用质谱仪识别标记的和未标记形式的肽之间的质量差异,比较它们各自的信号强度来实现定量。Mori等[20]将牛血清蛋白用胰蛋白酶消化后用18O单标记方法标记肽片段的C末端羧基,使用配备了NanoFrontier LD的纳米级液相色谱电喷雾电离质谱(nano LC-ESI-MS)来分析18O标记肽,用nano LC-ESI-MS/MS分析未标记肽与标记肽的任意比例混合物,结果证明单标记需要较高的PH条件,加入MEA有助于产生18O单标记,在产物离子中使用y离子的同位素比能提供丰富的丰度比,观察到的5个肽片段的同位素比在理论值的2倍以内;还通过分析溶菌酶的丰度比将18O单标记与iTRAQ方法比较,在此实验中,18O单标记得到的值更接近,表明了目前的方法对结合nano LC-ESI-MS/MS的定量蛋白质组学是有效的。
Yang等[21]采用体外标记相对定量技术(iTRAQ),用不同的标记试剂标记牛、水牛、山羊和骆驼奶中的乳清蛋白质,利用强阳离子交换色谱和反相nano色谱分离后通过使用串联质谱MS/MS测量报告离子的峰强度,结合蛋白质组学方法鉴定出211种,计算标记样品中鉴定出的肽段的相对比例进行肽定量,并且通过基因本体论对113种蛋白进行功能表征将其分成3个功能组,根据PCA结果得出的动物物种间的差异蛋白177种,鉴定比较后可以得出乳清蛋白中的主要成分α-乳清蛋白在骆驼奶中丰度最高,牛乳、山羊乳中不存在,表征了不同物种中蛋白质组模式的差异。iTRAQ技术相对于其他的蛋白质组学定性定量技术来说,重复性好,适用于低丰度蛋白的研究。冯培民等[22]利用同位素标记的相对和绝对定量(iTRAQ-4plex)与液相色谱和质谱串联结合的蛋白质组学定量分析技术,对慢性乙肝证候差异蛋白组学进行对比研究,鉴定出蛋白质501个,其中可以用来定量的有491种,比较了肝郁脾虚证与脾胃湿热证、肝胆湿热证和健康人组之间上调蛋白和下调蛋白的数量,从蛋白的功能分析来看,各组间均有差异蛋白的不同功能特点,各组间均有差别的通路。Affolter等[23]用3种策略对富含乳脂小球膜(MFGM)的两种浓缩物的蛋白质组进行定性定量分析,将强阳离子交换色谱与反相C18分离相结合并配备了nano ESI来源的Orbitrap MS系统用2D-2L方法实现了鸟枪蛋白组学分析,其次将消化液用高效液相色谱分离然后重新注入Orbitrap MS系统进行无标记的半定量分析,最后通过稳定的同位素稀释MS与在三重四极杆MS系统上的多反应监测相结合而实现了对所选7种蛋白的绝对的定量分析,分别揭示了WPC中的244种蛋白质和BMP中的133种蛋白质身份,对前34种蛋白进行指纹分析与相对定量,产生了有价值的蛋白质指纹图谱,并提供了这两个馏分中蛋白质含量的广泛表征。
3.2 其他定量研究 除了用蛋白组学方法,也有许多对蛋白质进行绝对定量和相对定量的研究。RAD是一种基于还原胺化和二甲基化的蛋白质糖基化定量方法,即先用NaBH3CN或NaBD3CN还原样品使产生1 Da的质量偏移并稳定早期蛋白质糖基化,Tong等[24]将样品用胰蛋白酶消化后用二甲基化试剂还原胺化,RAD标记后的样品用MALDI-TOF-TOF-MS进行分析,根据糖基化肽和非糖基化肽的质量变化,识别出同位素峰,在蛋白质和肽水平上都实现了定量,得到了R(L/H)低于1的39个肽段和高于上述3个肽段的3个肽段。Casado-Vela等[25]描述了两种样品4-protmix和8-protmix适用于使用iTRAQ进行相对蛋白质定量,ChipLC与6530 Q-TOF联用和1200 nano-HPLC-LTQ Orbitrap联用对3个复制品进行分析,成功鉴定和定量了样品中的所有蛋白质,使用4-protmix,可以测量高达24倍的相对蛋白质变化;8-protmix可以定量蛋白质混合物中相对蛋白质变化的浓度,浓度范围为两个数量级,相对丰度差异十倍。Alexia等[26]用胰蛋白酶消化人肝和肠道微粒体后获得肽,并通过高效液相色谱和加热的电喷雾电离串联质谱使用两个蛋白型肽对14种主要的CYP450亚型进行绝对蛋白质定量,对于所有蛋白型肽,在适当的校准范围内是线性,LLOQ浓度为0.1 nmol·L-1,确定此方法是可行的并用于分析了市售人肝微粒体中的12种CYP450,检测到的CYP4F2为(20±1)pmol·mg-1;CYP3A7为(2.3±1.5)pmol·mg-1;CYP2J2为(2.1±0.6)pmol·mg-1。
本篇综述探讨了HPLC-MS在大分子蛋白质检测中的应用,主要介绍了鉴定与定量中的一些内容,由于篇幅有限,还有许多定性鉴定的方法以及多种类型药物的定量问题并没有详细介绍。蛋白组学在一定程度上推动了液质联用检测技术的发展,这项技术也同时推动着生物大分子领域的研究。不同种类的质谱仪有着各自的特点,分析不同的物质时可以选择不同的方法以达到最好的分析效果,但也存在着一些困难,有些对于低含量的物质的检测的准确性要较差一些。综上所述,液质联用技术不仅在各种小分子化合物的检测中发挥着重要的作用,以后将会在大分子物质的分析中发挥着更重要的作用,在掺假物质鉴别、靶蛋白表征和生物标记物的发现等中起到重要的作用[27]。随着时代的发展,液质联用技术将会为分析科学的发展做出更大的贡献。