肽组学分析技术及其在食品研究中的应用进展
2023-09-09范丽琪郁晓艺刘磊李武许思盈李晓敏徐巨才
范丽琪,郁晓艺,刘磊,李武,许思盈,李晓敏,*,徐巨才*
(1.五邑大学生物科技与大健康学院,江门市大健康国际创新研究院,广东江门 529020)(2.完美(广东)日用品有限公司,广东中山 528400)
近年来,基于质谱技术的组学研究进展非常迅速。以蛋白质组学、代谢组学、脂质组学等为代表的组学研究正在生物、医药、食品等多个领域中发挥着重要的引领作用[1]。多肽组学(Peptideomics)是基于蛋白质组学衍生发展起来的一门科学。但与蛋白质组学研究不同的是,多肽组学主要以小分子多肽为研究对象,重点关注样品中多肽的组成及变化规律,而非大分子蛋白质的组成及变化规律[2]。与多肽组学研究随之兴起的是多肽组学分析技术的快速进步。目前,多肽组学分析技术发展了一系列包括样品前处理、高效分离、快速鉴定、活性分析、可视化处理等[3]在内的新兴技术,为多肽组学研究提供了重要支撑。
多肽在结构序列上的差异可使其具有不同的功能特性[4],是多肽组学研究和关注的重点。早期,多肽组学主要应用于生物、医药等领域标志物的发掘与药品研发[5],关注度较低。但近年随着质谱技术、多肽药物和食源性生物活性肽的发展,多肽组学研究进展迅速。尤其在食品领域,受益于更灵活的市场机制,基于多肽组学技术研究与制备新型食源性活性肽成为了当下食品科学研究的热点之一[6]。食品蛋白原料中含有丰富的活性多肽片段,利用生物酶解或发酵技术释放这些活性多肽是制备功能性食品的重要途径[7]。目前,国内外科研学者报道了一系列具有抗氧化、降血糖、降血脂、增强机体免疫力、抑制血管紧张素转化酶(Angiotension Converting Enzyme,ACE)和抑制二肽基肽酶IV(Dipeptidyl Peptidase-4,DPP-IV)等活性的多肽或蛋白质酶解产物,因纯天然、安全无副作用而受到消费者的广泛青睐[8]。基于多肽组学研究食品中活性多肽的释放机制及活性作用机理正在推动多肽产业的快速发展。
1 多肽组学分析技术
图1 肽组学分析流程Fig.1 Workflow of general peptidomic analysis
多肽组学分析一般遵循以下流程:样品前处理、色谱分离、质谱检测、结构鉴定及活性评价等,对应发展了一系列包括在线脱盐、亚2 μm颗粒色谱柱、电喷雾质谱检测、多肽组学鉴定、活性匹配及构效分析等技术,为大规模生物活性肽分析提供了一套有力的工具和方法[9]。尤其随着高分辨质谱的逐渐普及和相关数据处理算法和软件的不断发展,肽组学技术已成为食品生物分析领域最重要的分析技术之一[10]。
1.1 样品的前处理
食品肽组学分析的对象常为各种蛋白质酶促水解/发酵产物、动物组织/血液等样本[11],组成成分较为复杂,通常在上机分析前需进行一定的前处理,包括精滤、膜分离、萃取、脱盐等。其中,膜过滤主要是利用半透膜对不同粒径分子的选择性从而实现样品净化和多肽富集[12]。研究发现食源性多肽样本常含有较多的小分子亲水性多肽,在反相色谱中的分离表现欠佳,采用膜分离对样本进行前处理,可有助于对亲水性组分实施差异化的色谱分离。萃取主要利用样品中各组分在萃取剂或萃取头中的溶解度或吸附性质差异而实现样品中杂质的分离或多肽组分的富集[13]。脱盐是多肽组学样品分析前处理中最为重要的步骤之一,尤其对于酱油、血液等盐分含量较高的样品,如不经脱盐直接注入质谱极易导致离子源污染[14]。近年来,自动阀切换在线脱盐、柱脱盐等技术的发展,大大提升了脱盐和分析的效率。Wang等[15]开发了一种基于纳升级高效液相色谱的在线脱盐方法,其脱盐率可达98.5%,高于常规离线操作83.1%的脱盐率,大大提升了分析效率。这些前处理技术的在线化和自动化发展,极大地便利了肽组学分析技术在食品、生物医药领域中的应用[16]。
1.2 色谱分离技术
近年来,色谱柱填料、分离设备性能、自动化程度等不断提升,发展了包括超高压液相(Ultra High Performance Liquid Chromatography,UHPLC)、纳升级液相(Nano Liquid Chromatography,Nano-LC)、亚2 μm颗粒、在线多维色谱、核壳(Core-shell)色谱柱等各型新色谱分离技术。其中,超高压分离技术通过提升输液泵最大耐受压力并缩小系统死体积,搭配亚2 μm颗粒色谱柱,在10 min内即可快速获得优于传统高效液相色谱(HPLC)40 min的分离效果,性能优异[17]。纳升级液相在超高压液相的基础上,采用超低纳升级流速和亚毫米内径色谱柱进行分离,显著降低进样量的同时大幅提升了质谱的灵敏度,10 min即可实现鉴定2 600条蛋白,被誉为组学分析标配[18]。Rocchi等[19]将配备了新型亚2 μm颗粒色谱柱的纳升液相色谱用于398种对映体的分离,发现化合物的分离可在3 min内完成,且分辨率高达5.11。在线二维液相色谱(Two-Dimensional Liquid Chromatography,2D-LC)主要是通过一个自动多通阀将两种相互独立的单维液相色谱连接在一起,使得样品的每一个组分都能同时经历两种不同的分离,从而获得远优于传统单维液相色谱的分离效果[20](图2)。Attoma等[21]构建在线反相色谱(RPLC)×亲水性色谱(HILIC)用于多肽的分离,峰容量较传统单维液相色谱提高了10倍以上。Ilario等[22]通过将二维液相色谱与质谱联用,从意大利奶酪水解物中鉴定出了45条抗菌肽段,有效弥补了单一色谱柱分离的局限性。这些新型色谱分离技术在食源性蛋白酶解产物分析中的应用,将有助于突破当前复杂多肽成分分离的瓶颈。尤其,综合利用超高压液相、纳升级液相、亚2 μm颗粒色谱柱等构建超高效多维液相色谱,将是未来多肽分离技术的重要发展方向之一。
图2 二维液相色谱分离示意图Fig.2 A schematic diagram of two-dimensional liquid chromatography
1.3 质谱检测技术
质谱电离技术的发展,尤其是软电离技术的诞生,如基质辅助激光解吸电离(Matrix-Assisted Laser Desorption Ionization,MALDI)和电喷雾电离(Electron Spray Ionization,ESI)快速推动了蛋白质、多肽的鉴定分析[23]。其中,MALDI离子源主要利用瞬时高强度激光脉冲能量作用于样品,使分子直接呈气态离子化进入质谱检测器中,研究发现,这种离子源倾向于产生单电荷离子,且分子结构完整性保持较好[24]。在科研实践中,研究人员通常将MALDI离子源与高分辨质谱检测器,如静电场轨道阱(Orbitrap)、飞行时间质量分析器(Time of Flight,TOF)等联用,应用于蛋白、多肽的分子量测定或指纹图谱分析[25]。与MALDI不同,ESI离子源主要在高压下对样品进行喷雾,利用库伦爆炸来实现分子的离子化[26]。该技术在液相色谱与质谱检测器之间架起了桥梁,应用广泛,是当前多肽组学分析的主流方法。尤其纳升级离子源(Nano-ESI)配备1~2 µm的喷雾针,以20 nL/min的超低流速对离子传输孔进行水平线性喷雾(图3),可获得极高的灵敏度[27]。
图3 不同软电离技术示意图Fig.3 Schematic diagrams of different soft ionization techniques
图4 肽组学数据的分析与处理Fig.4 Analysis and process of peptidomic data
图5 硅降解分析示意图Fig.5 A schematic diagramof in-silico digestion analysis
1.4 数据分析与处理技术
数据处理是质谱组学分析中最为关键的步骤之一。多肽分子在经过质谱一级与二级信息的采集后,需将上述质荷比信息分析转换为多肽的序列结构信息,即多肽的鉴定[28]。目前,科研学者利用序列搜库、从头测序、枚举匹配等方法,发展了一系列蛋白质/多肽组学分析鉴定工具,如Mascot、ProteinDiscoverer、MaxQuant、PepNovo、PEAKS、PepOS等[29]。但与蛋白质组学聚焦于蛋白组成不同,多肽组学分析主要关注多肽的组成。对于食源性蛋白酶解物而言,因食品酶制剂通常位点较为广泛且纯度较低,样品中通常包含较多的非特异性长肽与短肽,是组学分析的重点与难点[30]。Serena等[31]研究发现,Mascot、Proteome Discoverer、MaxQuant等蛋白质组学工具对食品中非特异性长肽和短肽的分析效果不太理想,尤其缺乏对短肽的鉴定支持。PepNovo、PEAKS和PepOS作为专注于多肽结构鉴定的方法和工具[32,33],在食源性多肽分析鉴定方面的适用性更强。此外,ProteoWizard为各型号质谱数据提供了格式转换工具[34],PeptideShaker[35]、Skyline[36]等则提供了针对Mascot、Andromeda、X!Tandem等多肽鉴定结果可视化及非标定量分析技术的支持,进一步丰富了质谱数据的多元化处理。近年来,针对食源性生物活性肽,研究人员还构建了多种活性多肽数据库(包括BIOPEP-UWM、AHTPDB、ExPASy等),并发展了一系列多肽生物活性评价方法(如PeptideRanker、UDSMProt等)[37,38]。这些多肽活性预测分析技术与多肽鉴定技术的有机结合,共同推动了多肽组学分析技术的快速发展。
表1 常见的肽组学分析鉴定工具Table 1 Common peptidomic analysis tools
2 多肽组学分析技术在食品中的应用
多肽组学在食品中的应用主要集中于生物活性肽的分离鉴定、引导制备、质量控制、预测挖掘等方面[43],在引领食源性生物活性肽的快速发展中发挥着重要作用。
2.1 天然活性肽及生物标志物的分离鉴定
天然活性肽的分离鉴定一直以来是食品与药物研究的重点,而肽组学技术的发展则大大加速了这一进程。国内外研究人员已经成功从自然界的各种复杂样品中获得了多种生物活性肽,如梁佳明[44]采用一种纳升级超高效液相色谱-串联质谱的组学分析技术,从牛肝菌酶解物中鉴定了3条鲜味肽:Thr-Lys-Glu-Val-Tyr-Glu-Gly-Glu-Val,Ile-Val-Pro-Arg-Phe-Glu和Phe-Gly-Leu-Asp-Phe。姜云松等[45]利用肽组学分析从酒糟发酵和酶解产物中鉴定出了7种新型ACE抑制肽,其中肽段AVQ呈现出强抑制活性,潜在功能价值极高。杨晨等[46]采用这种方法,发现了4种具有强ACE抑制活性的南瓜多肽(IFH、IFF、LAAF、DFHPR)。类似地,Fernanda等[47]将多肽组学分析与生物活性分析相结合,从开菲尔酸奶中鉴定出265条乳清肽,并发现这些肽可有助于改善脂肪细胞和骨骼肌细胞的脂质积累和代谢。肽组学技术的运用极大地便利了样品的高通量多肽鉴定与数据筛选分析,这对推动天然活性肽的高效挖掘起到了重要作用。
特异性多肽是食品功能特性、来源等信息的重要标志物,肽组学分析技术在这些肽类标志物的发掘中亦扮演了重要角色。Michelle等[48]从12种常见谷物的面筋蛋白提取物中筛选鉴定出4种谷物标记肽,实现了谷物麸质残留的准确识别和定量监测。陆玉娇[49]研究了AM真菌侵染后不同时期玉米根部多肽组的变化,发现多条肽段可作为作物受真菌侵染情况的生物标志物,有助于了解微生物与植物体的相互作用机制。Teixeira等[50]从5种动物肉制品中发现了20种热稳定肽能够作为熟制加工肉类的品种鉴别指标,且其中的18种为首次报道。这些发现充分展示了肽组学技术在挖掘生物标记肽方面的重要作用。未来,随着肽组学技术的不断发展和应用,将有越来越多的特异性多肽被鉴定、发掘出来。
2.2 食源性生物活性肽的引导制备
采用不同原料或不同工艺制备的食源性活性肽,在多肽组成和生物活性方面常呈现较大差异。为提高活性肽的研发效率,近年来,研究人员[51]发展了基于肽组学的计算机模拟酶解分析方法(简称硅降解)。硅降解(In-Silico Digestion)主要是利用蛋白酶的作用位点信息对蛋白质进行模拟降解,以实现对活性肽的释放预测和制备方案评估。目前,PeptideCutter、BIOPEP等均具有模拟酶解功能,可基于蛋白序列和酶等信息分析理论降解产物,并匹配或预测可能的活性肽段[52]。Meisam等[53]采用BIOPEP对乳蛋白原料进行模拟分析,发现100 g牛奶理论上可最大产生6 700.241 μmol的抗消化肽,且其中1 880.434 μmol具有降血糖活性,充分表明牛奶是降血糖肽的潜在优质原料。Yang等[54]提出的一种基于深度学习的硅降解方法(称为Deep Digest),该方法可计算蛋白质序列上各潜在切割位点的概率并以此预测酶解产物,拟合系数可达0.956~0.982。这些方法为活性肽的制备提供了有力的导向评估支持,但值得注意的是,当前大多数硅降解方法尚缺乏对碱性蛋白酶、风味蛋白酶等广谱性酶制剂的支持,仍有待进一步完善和发展[55]。此外,肽组学分析技术还可在多肽研发过程中提供实时引导,为活性多肽的释放提供实践依据。
2.3 食源性多肽产品的质量控制
食源性多肽产品鱼龙混杂,如何建立有效的质量控制方法是近年来研究的热点。指纹谱是蛋白质酶解产物在液相或质谱上所检测到的具有一定分布特征的谱图,常被用于多肽样品的特异性鉴别区分与加工储藏稳定性研究[56]。Sweeny等[57]利用肽组学分析和机器学习技术研究植物蛋白酶解物分别经过喷雾和冷冻干燥后肽谱的变化情况,发现二者之间相似程度极高,反映了样品中多肽具有良好的热稳定性。对于发酵食品,利用肽组学技术分析产物中肽谱及多肽组成的变化,亦可有助于了解发酵过程中蛋白质的降解机理和风味形成机制,为关键发酵技术开发提供方向[58]。此外,利用肽组学技术对食品中特异性多肽的检测分析,亦可实现对食品品质的动态监测、掺伪分析及产品溯源。陈李品等[59]从太平洋牡蛎中发现多条特异性肽段可作为其鲜活品质评价指标。Hu等[60]研究鉴定了22条特征性多肽可用于市售23种虾的品质评判和真伪识别。借助肽组学技术快速、高效、准确的特点,将其应用于食源性多肽产品的精准质控将是未来的多肽研究的重要方向之一。
2.4 新型活性肽的快速挖掘
采用体外化学分析或生物模型实验来进行生物活性肽的挖掘和强度评估是传统实验方法普遍的策略[61],但是该流程耗时长且成本高昂。肽组学分析技术提供了一种更为经济高效的方案,该技术利用数据库和构效预测模型,不仅可进行已知活性肽的快速筛选,还可预测未知肽的生物活性[62,63]。Peptide Ranker(http://distilldeep.ucd.ie/PeptideRanker/)通过整合多个活性肽数据库的信息,并对未知肽序列的活性概率进行评分和排序,提供了一种多肽潜在生物活性的预测方法[64]。值得注意的是,专用数据库的构建以及检索策略的开发是肽段构效表征的关键。程凯等[65]构建了一种包含蛋白质的磷酸化位点注释信息的数据库并开发专用的检索方式,从组织细胞中鉴定了933条磷酸化修饰肽段,鉴定数目比采用通用数据库的分析增加了19.4%,初步实现了对磷酸化肽段快速而准确的鉴定。梁潇等[66]通过提取的23种常见抗癌肽的序列特征构建了基于序列信息的抗癌肽预测集成学习模型ACPredStackL可有效预测序列是否为抗癌肽。这些研究体现了肽组学技术在快速评价和挖掘未知活性肽方面的突出优势,有望打破现有传统技术所面临的瓶颈,但这一进展过程将有赖于活性肽数据库与构效预测模型的不断发展和完善。
3 总结与展望
近年来,多肽组学分析技术发展迅猛,已逐渐成为一项集样品前处理、分离、检测、鉴定和活性评价等为一体的综合技术。现阶段,多肽组学分析技术不仅被应用于食品中多肽组成的快速分析,还被广泛应用于生物活性肽的快速挖掘、引导制备和质量控制等,在推动食品多肽产业的快速发展中发挥了重要作用。未来,随着多肽组学分析技术在食品中的进一步发展和应用,尤其是肽组学鉴定方法、多肽活性预测/评价/作用机制、蛋白质概率性降解模型、活性肽数据库等的不断发展和完善,生物活性肽产业的发展前景将更为广阔。同时,多肽组学分析技术将逐步实现引领下一代多肽产业技术的升级与变革,在多肽行业中占据重要地位。