质谱技术在多组学研究和医学检验中的应用前景及挑战*
2021-11-30于海涛综述审校
于海涛,王 洪 综述,张 钧△ 审校
1.浙江大学医学院附属邵逸夫医院检验科,浙江杭州 310016;2.浙江大学医学院广科安德质谱中心,浙江杭州 311200
检验医学在临床诊断和治疗监测方面发挥着至关重要的作用,基因组学、转录组学、蛋白质组学和代谢组学等多组学研究成果促进了全新诊断标志物的研究发现和临床应用。质谱技术以其高灵敏度、高特异度和高通量的能力满足组学对复杂的生物标本分子组成及相互关系研究的需求,近年来以质谱分析技术为核心的多组学研究发现极大拓展了质谱在医学检验中的应用范围,可以预见基于质谱技术的疾病诊断方法将成为重要的临床检验诊断技术[2]。
1 以高性能质谱为核心的组学研究已成为发现检验生物标志物的主要来源
生物标志物是指用于疾病诊断、风险评估及预后判断的生物分子,组学领域的扩展和检测技术手段的进步不断拓展了生物标志物的范畴。目前生物标志物不仅涵盖了传统的核酸、蛋白质、糖类及代谢物等标志物类型,还囊括细胞遗传学和细胞动力学参数,以及体液中的外泌体、细胞等。在过去的几十年里,研究者用各种组学技术致力于生物标志物的发现和疾病的早期诊断,质谱技术作为组学研究的核心技术,其在生物标志研发策略方面的科学价值和优势越来越受到检验医学的重视[3]。
1.1质谱技术正成为蛋白质组学研究和临床应用的关键技术 蛋白质作为直接参与细胞生物学过程的大分子,是生理功能的执行者和生命现象的直接体现者,蛋白质水平的变化直接反映了生命在生理或病理条件下的变化,可以精准地预测疾病的状况和进展。临床蛋白质组学中有2种策略可以识别生物标志物,一是经典策略,使用电泳技术分离蛋白质和多肽混合物然后进行质谱鉴定;二是利用质谱技术分析样品的完整质谱图,以获得可以用作疾病“指纹”的完整蛋白质/肽谱[4]。组织、器官、体液和细胞培养物等生物样品均可被用作为蛋白质类生物标志物的研究,但从临床诊断的角度来看,体液无疑是寻找生物标志物的最佳材料。蛋白质组学研究的一个重大挑战是蛋白质数据库的多样性分析及蛋白质、多肽鉴定,质谱技术较好地解决了这些难题,满足了蛋白质组学对技术平台的需求。ESI和MALDI 2种“软”电离方法使基于质谱的蛋白质组学蓬勃发展,MALDI通过激光辐射将与基质共结晶的蛋白质电离,而ESI将蛋白质样品电离出溶液,可以很好地保存目标分子的完整性,从而实现高灵敏度和高准确度的质量分析。MALDI通常与飞行时间联合用于蛋白质鉴定,而ESI的优势在于可以直接与液相色谱对接,用于从高度复杂的混合物中分析蛋白质[5]。不同类型的质谱仪根据需要可以用于蛋白质的鉴定和定量分析、蛋白质翻译后的修饰研究、蛋白质相互作用分析等[6]。
病变细胞或微环境产生的蛋白质或蛋白质片段可以在疾病发生和发展过程中扩散到循环系统中,通过质谱法测定其浓度,利用生物信息学工具进行数据分析后用于诊断。在过去的二十多年中,以质谱为核心的蛋白质组学成为分子临床医学研究的重要平台,并发现了一批涉及各种疾病的生物标志物[7]。通过对不同类型癌症患者的血浆、血清及尿液蛋白质组学分析,发现了一系列与癌细胞形成和发展相关的蛋白质标志物,用于许多类型的癌症诊断,包括卵巢癌、前列腺癌、乳腺癌、膀胱癌、肾癌、肺癌、胰腺癌、星形胶质瘤等[8-15],这些标志物不仅可以对癌症进行筛查、诊断和预后监测,同时还可以对癌症的亚型进行分类。
外泌体蛋白质组学成为发现癌症标志物的一个新研究方向,外泌体蛋白标志物不仅可以区分组织中肿瘤与非肿瘤细胞,而且还可以确定肿瘤的原发灶[16]。通过对胰腺癌患者血浆及血浆中外泌体的蛋白质组学分析,发现了外泌体携带的与胰腺癌相关的蛋白会引起体内的免疫反应并由此产生自身抗体,其中M2-型丙酮酸激酶和人可溶性半乳糖凝集素3结合蛋白产生的自身抗体可以比较好地区分早期胰腺导管腺癌与健康人群、早期胰腺导管腺癌与胰腺炎[14]。
对于一些特殊类型疾病,如阿尔茨海默病(AD)、帕金森病(PD)、系统性硬化症(SSc)等,由于不完全清楚发病机制,其诊断和治疗面临巨大挑战,蛋白质组学的发展和质谱技术的进步促进了这些疾病新标志物的发现。PATERSON等[17]利用质谱-蛋白质组学分析脑脊液中54种蛋白质的表达水平,并在2个独立的队列中予以验证,结果显示苹果酸脱氢酶、总载脂蛋白E、几丁质酶3样蛋白1、骨桥蛋白和胱抑素C 5种蛋白可以较好地区分AD患者和非AD患者,这5种蛋白的联合检测的曲线下面积为0.88,显示了较高的临床诊断价值。SHI等[18]在蛋白质组学分析和生物信息学分析的基础上,从14 000个肽段中筛选出126个肽段,然后通过高精度和灵敏度的多重反应监测技术进行定量验证,结果显示SPP1、LRP1、CSF1R、EPHA4和TIMP1等五肽组合可以用于诊断PD;TIMP1和APLP1 2个肽段组合可以用于评估PD严重程度。SSc是一种临床表现为纤维化引起的皮肤增厚,内脏纤维化和血管纤维性增生的系统性疾病,目前认为其与免疫系统异常(细胞、体液免疫反应与自身抗体的合成)相关。多个研究组采用质谱技术对患者的血清、唾液、支气管肺泡灌洗液的蛋白质组成进行研究,发现钙离子通道家族成员、钙调蛋白、网状局部蛋白1和网状局部蛋白3等可作为其诊断的候选生物标志物[19]。糖尿病是一种以慢性高血糖症为特征的代谢性疾病,SHAO等[20]通过质谱蛋白质组学辅助技术发现糖尿病视网膜病变患者中存在一些差异表达的眼泪蛋白,可能作为糖尿病性视网膜病变的诊断生物标志物。
对蛋白类生物标志物的临床诊断强烈依赖以抗原-抗体反应为核心的各种免疫分析方法,放射免疫分析因放射性污染而被淘汰,电化学发光目前仍是主流的分析平台。免疫分析法有不可避免的局限性:一次分析只能检测到一种蛋白或有不同转录后修饰形式的蛋白;检测结果受所使用的抗体特异性和稳定性的限制,抗体对目标蛋白不能完全地识别而导致测定结果的偏差。与之相比,质谱可以在蛋白质组层面对某种疾病进行整体而全面地分析,包括蛋白翻译后修饰和源自基因组畸变的变体,一次质谱分析可以同时准确测定数十种蛋白,实现多项指标联合检测的目的;质谱通过测定目标蛋白的特异性肽段(即一段氨基酸序列)的水平来准确地表征目标蛋白的水平,其特异度更好。这些优势不仅巩固了基于质谱的临床蛋白质组学在标志物开发方面的优势,而且还加速了其向常规分析和临床实践的转变[21]。利用质谱检测这些标志物并推广到临床还面临诸多挑战:(1)样品一般需要酶解消化、同位素标记等复杂的前处理过程,耗时较长,且亟须建立严格的标准操作程序;(2)多种仪器平台、电离技术并存,各有优势和局限性,难以形成如基因组研究比较一致的方法;(3)目前的技术瓶颈导致特征肽段分析并不能完全代表蛋白质的水平,且单次质谱分析仅能分析1个标本,限制了临床检测通量;(4)质谱分析产生的大型数据库需要更完备的数据分析策略,不同研究组间的结果的可比性及重复性较差,需要大量的样本验证。
1.2质谱技术是代谢物类标志物检测的最佳平台 代谢组学研究生物体中相对分子质量<1×103的所有代谢物,如激素、氨基酸、多糖等。代谢物可作为生理或病理状态的重要指标,并有助于了解疾病的发生和进展,有可能成为疾病早期诊断、评估治疗效果和生存率的有效指标。代谢组学研究主要有2种策略,即靶向分析和代谢物图谱分析。靶向分析是指对特定分析物的鉴定和量化;代谢物图谱分析又称为非靶向或整体分析,是比较相似样品中未量化的代谢谱对疾病或外来刺激下的不同反应特征。靶向分析和代谢物图谱分析在生物标志物的发现中是相辅相成的,首先利用代谢物图谱分析确定样品之间代谢谱的差异,然后选择关键的代谢物作为潜在的生物标志物进行目标代谢物定量,并在临床标本中进行验证[22]。质谱技术与气相色谱、液相色谱、毛细管电泳等分离技术结合提高了代谢组学靶向和非靶向分析的灵敏度、可靠性和分析效率,从而被广泛地用于代谢组学研究。气相色谱-质谱因为价格便宜、可操作性强曾被广泛应用,但只有酮和醇等挥发性化合物(沸点低于300 ℃)才能直接用气相色谱-质谱法进行检测,对氨基酸和脂类等半挥发性化合物的分析需要额外的化学衍生化过程,另外一些带电荷的大分子不能被分析。利用电喷雾化的“软”电离方法,可以实现液相色谱-质谱的无缝对接,适合于非挥发性代谢物的直接分析,可以检测范围更广的代谢物。毛细管电泳与质谱串联通常可以获得比液相色谱-质谱更高的分离效率,可用于处理挥发性和非挥发性代谢物,是一种非常有前景的代谢组学研究工具[23]。
◆参加学术会议,先看地点是否有吸引力;无论会期长短,经常要在一天内解决问题,其他时间则用于“考察”、“参观”.上网浏览一下,某些会议的征稿通知已经明码标价给出了“主席台就座”、“大会发言15分钟”各需资助多少钱.
肝脏是重要的代谢相关器官,基于质谱技术研究肝脏疾病代谢物的差异是重要的方向。GONZALEZ等[24]采用基于质谱的代谢组学方法来发现急性肝损伤的潜在生物标志物,结果显示包括葡萄糖、氨基酸和膜脂在内的几种代谢物的血清水平均发生了显著改变,其中一些与肝脏损伤程度高度相关。WANG等[25]使用非靶向代谢组学方法鉴定出44种标志物代谢物可以将黄疸综合征与健康人群进行鉴别,这些代谢物可以作为其诊断的潜在生物标志物。
代谢改变也是肿瘤发生的重大特征。XIAO等[26]使用基于液相色谱-质谱的代谢组学方法比较了肝癌患者和肝硬化患者血清中的代谢物水平,结果显示甘醇酸,甘脱氧胆酸水平差异有统计学意义(P<0.05)。WANG等[27]研究了13种潜在的生物标志物参与肝癌患者的关键代谢途径,同时糖基去氧胆酸被认为是肝癌诊断和疾病预后的重要指标。CHEN等[28]研究显示1-甲基腺苷为肝癌的特征代谢物,将1-甲基腺苷与甲胎蛋白结合的诊断模型用于肝癌的诊断显示出更高的灵敏度。HORI等[29]对肺癌患者进行了质谱代谢组学分析,表明代谢物模式的变化对于评估肺癌的临床特征比较有效,可以据此建立新型诊断工具。HUANG等[30]研究了乳腺癌诊断的关键代谢通路特征,开发了基于代谢途径的疾病诊断代谢组学模型,早期诊断模型的曲线下面积为0.934。WANG等[31]分析了258例新确诊的乳腺癌患者及159例良性乳腺疾病患者的血液代谢物来筛选具有乳腺癌诊断潜力的代谢标志物,建立了由6个血液参数组成的诊断模型,该模型区分乳腺癌和非乳腺癌的灵敏度和特异度分别为92.2%和 84.4%。质谱平台能对生物体中数百至数千种代谢物进行灵敏且可重现的检测,基于质谱的代谢组学检测超出了常规化学分析和代谢表型分析的范围,是代谢物类标志物检测的最佳平台,其在疾病发病机制研究和临床诊疗中有广阔前景。
1.3质谱技术将在基因组学研究、核酸类生物标志检测和质谱影像分析中发挥重要作用 基因组学研究是现代生物科学的基础,人类基因组计划发现了32 000个人类基因,其中测序技术功不可没,更高通量的二代测序、三代测序技术在测序速度、精度、准确度和成本方面仍在不断进步。质谱技术能对DNA、RNA的核苷酸及核苷酸/蛋白质的非共价复合体进行全面的检测,为研究配体、核酸和蛋白质之间的相互作用提供了重要信息。尽管在上世纪九十年代质谱技术也被用作测序的分析平台,但与测序技术相比缺乏竞争力。质谱技术在遗传标记的基因分型[单核苷酸多态性(SNP)、短串联重复序列及其组合测定],合成寡核苷酸的质量控制,脱氧核糖核酸、核糖核酸分子、核酸之间非共价相互作用及核酸、药物和蛋白质相互作用的研究等方面显示了强大的分析潜力[32]。与基因组比较,转录组直接反映了在特定条件下活跃表达于细胞中的基因信息,并且与蛋白质组的变化密切相关,相对而言质谱技术在转录学研究中的应用较少,但基于DNA微阵列的转录组学和基于质谱的蛋白质组学的结合,可以在系统水平上增强对细胞转录功能的认知[33]。
美国食品药品监督管理局于2014年批准基质辅助激光解析串联飞行时间质谱(MALDI-TOF MS)可用于临床核酸检测。与传统的核酸分析技术比较,MALDI-TOF MS技术不仅可以准确地鉴定寡核苷酸序列,还可以快速、有效、准确地鉴别寡核苷酸所携带的修饰类型及修饰位点。SNP在遗传疾病的诊断、筛查、用药种类及剂量指导等方面有着极其重要的作用,临床最为常用的SNP检测手段主要为Sanger测序、荧光定量PCR、低密度基因芯片和焦磷酸测序等,这些方法不能进行多基因、多位点的检测(如耳聋基因检测涉及4个基因20个位点)。MALDI-TOF MS可同时检测多达52个SNP位点,极大地提高多基因多位点的检测效率。常见的DNA甲基化检测方法主要有测序、甲基化特异性PCR、荧光定量PCR等,而质谱DNA甲基化检测,在引物设计、检测成本及数据分析等方面更加便捷、快速和准确,可检测低至5%的甲基化水平,特异性良好[34]。此外,质谱分析可通过SNP等位基因比例对待测标本中目标基因的拷贝数变异进行定量分析,其原理是检测待测拷贝片段中存在的SNP,计算峰面积,得出该位点2种基因型的比值,然后推测含不同SNP基因型拷贝的相对比值。
核酸质谱分析是一种在PCR基础之上加入单碱基延伸步骤的方法,由于质谱检测采用的是多重PCR方法,同一反应体系内引物数量多,需要格外注意引物间出现互补的情况,避免SNP延伸引物3′端与其他引物超过3个碱基的互补,干扰检测结果。此外,设计的引物与基因组中其他序列应无明显同源性,否则可能会出现错误的检测结果。与传统二代、三代高通量测序及芯片等方法比较,核酸质谱具有检测报告周期短、高效率、单样本检测费用低等显著优势。随着质谱技术和分离纯化技术的进一步发展,未来利用质谱技术分析核苷酸/修饰化产物的研究会获得更广而详细的数据,并显示出在医学领域的应用潜力。
质谱影像(MSI)是对组织标本中的代谢物、脂类、蛋白质及多肽直接进行分析,并将采集到的信号在组织标本中的空间分布以影像的形式呈现出来[35]。目前用于组织影像分析的电离方式有2种:MALDI和解吸电喷雾离子化(DESI)。用于病理分析的组织切片包括新鲜组织、冷冻组织和石蜡包埋组织,均可以用作MSI分析。药物的MSI分析可以确定药物分子在组织的空间分布、药物分子的代谢产物及相互作用的分子[36]。MSI分析可以精确地确定生物标志物在组织切片的位置,从而判断肿瘤组织的边缘和肿瘤组织是否切割完全。在一张组织切片上同时对多种肿瘤标志物进行原位MSI定量分析为癌症的病理分析增加了新的维度,并且可以更精准地分析肿瘤的异质性。DESI-MSI主要分析组织中的小分子(代谢物和脂类);MALDI-MSI可以分析组织中的多肽和蛋白分子;可以对每个患者的肿瘤分子特征进行分析,实现个性化治疗[37]。
2 质谱技术是检验科未来发展的重要亚专业
与传统诊断技术比较,质谱技术有灵敏度、特异度、准确度均高的优势,单次分析可同时精确地检测出几十个甚至上百个生物标志物,并可检测出多种传统诊断技术无法检测到的生物标志物。质谱技术在医学检验中的应用涵盖了产前检查、新生儿遗传筛查、激素和维生素检测、微生物诊断和药物浓度检测等领域。在美国,质谱技术服务于临床检测的项目已达400余项,涉及新生儿筛查、遗传代谢性疾病检测、滥用药物监测、代谢物检查(氨基酸、脂肪酸)、类固醇激素检测(内分泌)、神经递质类物质、维生素检测及微生物鉴定等领域。国内质谱技术临床应用主要集中在中大型三甲医院和第三方检验所,开展的项目还不多,主要是集中在微生物鉴定的MALDI-TOF MS、新生儿遗传代谢性疾病筛查、治疗药物监测和维生素测定等[38]。
新生儿遗传代谢性疾病筛查包括氨基酸代谢异常、糖类代谢异常、脂肪酸氧化障碍、尿素循环障碍、有机酸代谢异常、核酸代谢异常、金属元素代谢异常、内分泌代谢异常和骨代谢病等,液相色谱-质谱已成为新生儿遗传代谢病筛查的金标准并广泛用于各种类型代谢病的临床诊断[39]。
韩丽乔等[40]综述了液相色谱-质谱在临床类固醇激素、维生素、代谢小分子定量检测、药物浓度监测及参考方法/参考物质研制等方面的发展和应用。最近国内也已发表了包括微量元素质谱检测的一些专家共识[41]。
与传统的临床微生物检测方法比较,质谱技术的优势在于准确且快速,在采集患者标本的当天就可以对标本中的包括细菌、真菌和病毒等微生物进行筛查和鉴定,以便临床及时有针对性的进行抗微生物治疗。MALDI-TOF MS在微生物的临床应用主要是细菌培养后的鉴定,有多中心研究结果显示MALDI-TOF MS鉴定各类细菌的准确率高达90%以上[42]。从无菌体液(如尿液、腹水、脑脊液)中直接或增菌后通过MALDI-TOF MS检测细菌、真菌或分枝杆菌,可以缩短培养时间,加快细菌检测周期。此外,全自动PCR ESI-MS应用于全血标本中的微生物检测,该技术采用广谱的PCR引物以达到检测全谱微生物的目的,ESI-MS测定PCR扩增后的核苷酸序列,可在8 h内完成血中微生物全谱的分析鉴定,并且无需对细菌进行培养[43]。
近年来随着质谱技术在临床上的应用越来越广泛,许多基于质谱的蛋白大分子检测如胰岛素样生长因子-1精准检测、淀粉样变性分型检测等被临床广泛应用[6-7]。另外,检测多个基因SNP的核酸质谱技术也正在被广泛评价和应用中[44]。
3 大力提升质谱技术的质量管理意识和手段,进行多组学的有效整合研究,使质谱技术更好地服务于检验医学
质谱技术在标志物的发现和临床诊断方面取得了长足的进步,然而将该技术应用于医学检验和临床检测还受到一些限制,如缺乏质量管理及量值溯源、多组学数据系统的整合、自动化水平有待提升、缺乏简化数据分析方法等。
3.1提升质量管理和量值溯源 目前绝大多数质谱检测方法为实验室开发方法,虽然国内外已有部分的参考指导性指南与共识,但临床质谱检测仍然存在仪器多元化、质谱电离方式的多样化、质量分析器的差异性、缺乏量值溯源系统、检测方法缺乏规范化和标准化、缺乏法规和监管措施等问题。现有的质谱项目的全国调研数据显示,质谱方法的优点并未真正体现出来,组内变异系数较大,不同实验室结果的可比性差,尤其是儿茶酚胺类激素、17-羟基黄体酮等检测难度较大的项目。高质量的质谱实验室的检测结果,需要严格的质量管理和量值溯源,推动参考方法和室间质量评价项目的改进,可有效促进临床质谱检测结果的标准化,这是一个长期复杂的任务,需要多方共同努力。做好质谱检测项目的质量评价,建立全国性的临床质谱实验室间质量评价体系,才能有效做好质量控制与质量保证工作,更好地促进临床质谱项目的开展和推广。
3.2多组学的有效整合 疾病本身是生物体因为遗传及外界环境的改变而试图调整、修复和保持自身健康所发生的一系列系统应答反应。以质谱为核心的多组学技术的快速发展推进了对疾病(如癌症)的发生和进展在分子和细胞水平上的研究,在改进医学检验水平和提升精准医学方面发挥了关键的作用[45]。每一种组学侧重于研究疾病发生和进展的复杂病理生理学的某一个部分,由此导致各种组学的实验结果往往不能相互关联。因此,整合多组学实验结果进行多维度、高分辨的系统生物学研究对揭示疾病的产生、进展、抗治疗性、复发的关键机制和发现精准标志物对疾病进行早期检测至关重要[46]。
但目前并没有很好的多组学在临床中的应用范例,当前有2种方式的整合多组学用于精准医学研究:一是根据已知的分子通路和机制,分析各种检测到的分析物包括转录产物、蛋白质、代谢物等。该方法需要预先了解疾病发生过程的一些关键分子通路,从而将各种组学研究发现的信使RNA、蛋白质、代谢物、非编码RNA、长链非编码RNA、遗传序列变异体、DNA甲基化和组蛋白甲基化变体与这些分子通路关联。二是首先分析各种组学数据的关联度,由此发现在各种组学研究中关联度高的分子。该方法的优势是能够发现新的与疾病过程相关的分子和通路,其挑战是各种组学数据量的不对称性[47]。
整合多组学技术将有助于疾病的精准医学研究,SCHUSSLER-FIORENZA等[48]采用临床评估、多组学技术及可穿戴设备等手段,对109例有二类糖尿病风险的参与者进行了长达8年(中位数2.8年)的纵向研究,对收集的数据进行个性化综合分析,推导出预测长期健康结果的模型。该项研究成果表明所建立的模型可以应用于不同科室对疾病的预测和治疗方案的确定,包括心血管科、传染病科和肿瘤科等,这也是首次展示了整合多组学技术在健康结果预测中发挥的重要作用[48]。随着多组学发展日趋成熟,其将成为医学检验和精准医学领域的主要研究平台并由此发现全新的疾病早期诊断标志物、预后监测标志物,从而制订高效个性化精准治疗。
3.3临床质谱的自动化和信息化 对于临床诊断而言,质谱相对于传统技术的主要优势包括开发速度快,可同时测定单个样品中的多种分析物,单次测定成本低,特异性高,适合小分子分析物测定。但也存在仪器成本较高,操作复杂,学习周期长,缺乏技术人员等问题。不同的生物基质前处理方法不同,样品中遇到的蛋白质、盐和脂质水平较高,需要特殊的仪器设备,实现自动化难度较大。质谱仪器产生的数据量大,一般不能直接与现有的实验室(检验科)信息系统进行数据交互,需要专业的技术人员通过厂商软件处理数据后才能转化为临床检验可报告的结果,这也是限制质谱技术在临床推广的又一因素。质谱仪器系统较为复杂,对实验室技术人员的能力要求远高于常规医学检验系统,加之业内缺乏系统学习和相关技术背景人才储备,从事临床质谱技术人才的市场缺口较大。这些因素都是目前质谱技术在常规临床诊断工作流程中应用相对有限的原因,所以实现临床质谱的自动化和信息化、加快人才培养才能更好地推动质谱技术在临床检验中的应用。
4 小 结
尽管面临质量管理和量值溯源,以及标准化等诸多问题,但通过各方面努力,临床质谱技术正在朝着自动化、小型化、人工智能识别模式化等方向发展,质谱技术在实现精准检测方面有着强大的潜力和优势。生命科学研究的重心逐渐转向基因功能,即由测定基因的DNA序列、解释生命的遗传信息转移到鉴定有生物学功能的蛋白类分子、探索人类健康和疾病奥秘的多组学研究中。临床质谱检验正进入到基因组学、蛋白质组学、代谢组学等多组学整合分析阶段。贯彻和执行国家精准医疗战略,推动临床质谱技术应用的规范化、标准化,引领中国临床质谱产业的发展,更好地服务于检验医学,为人类健康事业做出更多的贡献,是医学检验人员面临的重大机遇。