蛋白质组学技术在呼吸系统疾病研究中的应用进展
2021-03-26孟霄,管艳
孟 霄,管 艳
潍坊医学院 医学检验学院,山东潍坊 261053
呼吸系统疾病是影响公共健康的重大问题,严重威胁着人类健康。肺癌是临床最常见的呼吸系统疾病之一,其发病率和病死率均居各类型肿瘤之首,受到广泛关注[1]。此外,肺结核、慢性阻塞性肺病、肺炎等呼吸系统疾病给患者的家庭和社会带来了巨大的经济负担。因此,揭示呼吸系统疾病的发生机制、寻找特异性生物标志物以及发现新治疗靶点是改善现有诊疗状况的重要策略。1995年,Wilkins 等首次提出蛋白质组学(proteomics)的概念——由基因组、细胞或组织类型表达的全部蛋白质成分[2]。几十年来,蛋白质组学技术迅速发展,已成为基因组技术的重要补充,凭借独特的技术方法和研究策略,为呼吸系统疾病病因、诊断、治疗和耐药性等方面的研究提供了更加全面的依据。本文简述了蛋白质组学技术,并对近年来蛋白质组学技术在呼吸系统疾病研究中的应用进行了总结。
1 定量蛋白质组学技术
1.1 双向凝胶电泳(two-dimensional gel electrophoresis,2-DE) 和荧光差异凝胶电泳(difference in gel electrophoresis,DIGE)2-DE 技术可根据蛋白质的等电点和分子量将复杂的蛋白质混合物分解为单个的蛋白质点,从而实现蛋白质的大规模分析[3]。2-DE 的缺点是重复性差及敏感度有限。2DDIGE 是2-DE 的一种进化,用不同的荧光染料标记蛋白质样品,在同一块胶上共同电泳,通过扫描不同波长的最终图像,检测凝胶上不同样品的斑点,从而克服了2-DE 的缺点[4]。
近年来,流行病学数据显示肺腺癌的发病率极高,已成为最常见的肺癌病理类型[5],为了寻找肺腺癌的生物标志物,Liu 等[6]分离了A549 和16HBE 的细胞线粒体,提取线粒体总蛋白并进行2-DE,采用液相色谱-串联质谱(liquid chromatography-tandem mass spectrometry,LC-MS/MS)进行鉴定,发现AAA-TOB3 在肺腺癌线粒体中显著上调,该研究提示AAA-TOB3 表达增高可能与肺腺癌的发生、发展有关。Li 等[7]使用2D-DIGE 技术分析肺腺癌患者的肿瘤标本,发现PRDX6型蛋白表达与肿瘤反应密切相关,可作为化疗不良反应的预测性生物标志物。Ciereszko 等[8]采用2DDIGE 技术对肺癌患者化疗前后的血液样本进行比较分析,发现对照组与肺癌组的转铁蛋白和血清转铁蛋白水平差异有统计学意义,这可能反映了化疗诱导贫血后铁代谢的紊乱,此外腺癌(adenocarcinoma,ADC) 患者与鳞状细胞癌(squamous cell carcinoma,SCC)患者的血浆蛋白差异也有统计学意义,这一发现提示蛋白质组学可用于区分ADC 与SCC。
1.2 数据非依赖性采集定量技术(data independent acquisition,DIA)该技术是将质谱整个全扫描范围分为若干个窗口,高速、循环地对每个窗口中所有离子进行选择、碎裂、检测,从而无遗漏、无差异地获得离子的全部碎片信息[9]。连续窗口全理论碎片离子采集质谱(sequential window acquisition of all theoretical fragment ions mass spectra,SWATHMS)是DIA 的一种特殊变体,该方法在快速扫描混合质谱仪上进行测量,通常采用四极杆作为第一质量分析仪,TOF 或Orbitrap 作为第二质量分析仪。在SWATH-MS 模式下,先记录一个前驱体离子光谱,然后记录具有宽前驱体隔离窗口的碎片离子光谱,通过在一个确定的质量范围内重复循环连续前驱体隔离窗,记录一个全面的数据集。与经典的靶向蛋白质组学方法平行反应监测(parallel reaction monitoring,PRM)相比,SWATHMS 对肽的定量敏感度低3~ 10 倍,其优势是支持覆盖1 000 种蛋白质的多肽的定量分析,将深度覆盖能力与精准定量分析相结合,适合复杂样品的大规模定量[10]。
Ortea 等[11]采用DIA 技术对支气管肺泡灌洗液(bronchoalveolar lavage fluid,BALF) 进行定量蛋白质组学研究,证实了CO4A、HPT 和GTSP1是潜在的肺癌生物标志物。Yang 等[12]从健康对照者、2型糖尿病患者、肺腺癌患者和2型糖尿病合并肺腺癌患者中共采集20 份样本进行SWATHMS 分析,用PRM-MS 分析和酶联免疫吸附剂测定法(enzyme-linked immunosorbent assay,ELISA)进行了验证,发现妊娠区带蛋白(pregnancy zone protein,PZP)可作为一种新的血清生物标志物用于2型糖尿病合并肺腺癌的辅助诊断和早期治疗。Ma 等[13]对肺癌患者和健康人群的呼出气冷凝液(exhaled breath condensate,EBC) 样本进行DIA 分析,共鉴定出1 151个蛋白质,与健康对照组相比,肺癌组有10 种蛋白表达显著上调,其中S100A11、ANXA1、ENO1、和FABP5 可能是肺癌的新型生物标志物。Geary 等[14]在肺肿瘤手术过程中采集血液,用以鉴定从肿瘤流至肺静脉的蛋白质,发现与健康肺静脉血相比,肿瘤引流静脉血中40 种蛋白质的丰度增加,使用SWATHMS 对这些蛋白质进行分析后,发现AQR、C9、EPPK1、F13B、GPI、GPX3、LAMC1、LDHA、MTA2、NAMPT、P4HB 和SCP2 均与肺腺癌有关。以上研究表明DIA 技术有利于肺癌的早期筛查和临床诊断,可作为发现肺癌生物标志物的重要工具。
1.3 非标记定量蛋白质组学技术(label-free quantitative proteomics,LFQP)LFQP 技术是对蛋白质酶解肽段进行质谱分析,通过比较肽段的质谱信号或肽段数量完成相应蛋白质的定量。该技术对质谱分析高度敏感,不容易出错,因此能够从体液(血液、血浆、唾液和尿液)、细胞系和组织等复杂样本中鉴定数千种蛋白质,适用于生物样本的大规模分析,并且具有成本低、耗时短等优势,在生物医学研究领域得到了广泛认可[15]。
结核性胸腔积液(tuberculous pleural effusion,TBPE)和恶性胸腔积液(malignant pleural effusion,MPE)在渗出性胸腔积液中较为常见,二者的鉴别诊断在临床上备受关注[16],LFQP 技术有助于发现二者潜在的鉴别诊断标志物。Pan 等[17]对TBPE 和MPE 进行非标记定量蛋白质组学分析,用Western blot 和ELISA 对其进行验证,发现AGP1、ORM2、C9 和SERPING1 这4 种蛋白可能是TBPE 与MPE的鉴别诊断标志物。此外,LFQP 技术也为结核分枝杆菌感染机制的研究和生物标志物的发现提供了重要数据。Li 等[18]采用LFQP 技术鉴定儿童活动性肺结核(active tuberculosis,ATB)与潜伏结核感染(latent tuberculosis infection,LTBI) 的血浆蛋白差异,选择4 种蛋白用qPCR 和Western blot 进一步验证,发现与LTBI 相比,ATB 组中XRCC4、PCF11 和SEMA4A 的表达呈上升趋势。
1.4 同位素亲和标签技术(isotope-coded affinity tags,ICAT)ICAT 技术是用带有生物素半分子的同位素标签标记样品中蛋白质的半胱氨酸残基,标记后的蛋白样品经过酶解成为肽段后,经过亲和层析,进行质谱分析鉴定[19]。该方法只标记蛋白质的半胱氨酸残基,而生物素帮助捕获含有半胱氨酸的多肽,因此大大降低了样品的复杂性,从而简化了之后的质谱分析过程。ICAT 的主要缺点是连接区中的氘原子改变反相色谱过程中轻肽和重肽的洗脱时间,导致了肽的鉴定困难,而ICAT 的新变种——可裂解同位素亲和标记(cleavable isotope-coded affinity tag,c-ICAT),用13C、13C9或12C9来代替氘原子,解决了这一问题[15]。
非小细胞肺癌 (non-small cell lung cancer,NSCLC)约占肺癌的80%。由于大多数NSCLC 患者在就诊时已属晚期,故总体的治疗效果不理想[20]。利用ICAT 技术可发现用于预测NSCLC 药物疗效的新型生物标志物,对于开发新的治疗途径有重要作用。Qu 等[21]使用ICAT 和串联质谱技术比较了NSCLC 细胞系H460 及其吉西他滨耐药亚系H460/GEM 的蛋白质组特征,并用免疫组织化学方法进行验证,结果显示66.1%的NSCLC 肿瘤表达抗药蛋白SORCIN,该蛋白的过度表达与吉西他滨耐药和预后不良有关。
1.5 同位素标记相对和绝对定量技术(isobaric tags for relative and absolute quantification,ITRAQ)和串联质谱标签法(tandem mass tag,TMT)ITRAQ 技术是由AB SCIEX 公司开发的基于其公司生产的质谱的体外同位素标记技术。该技术可分析多达4个(iTRAQ 4-plex)或8个(iTRAQ 8-plex)不同的生物样本,与无标记质谱技术相比,增加了统计相关性和结果准确性[22]。TMT 是用等压标签标记不同样本中的多肽,将其混合后以反相高效液相色谱仪结合串联质谱仪进行分析。其流程包括蛋白质消化、TMT 反应、样品纯化、分离、高效液相色谱-质谱分析和数据分析[23]。TMT 试剂最初能够同时定量6个样本,之后进一步扩展到10~ 11个样本,最近开发的16-plex TMT pro(TMT16)试剂将通道扩展到了16个,实现了一次性对16个样品的量化,在多达16个不同的生物样本中,可对超过10 000个蛋白质和翻译后修饰同时进行定量分析,为基础和临床研究提供了有力工具[24]。
为寻找新型冠状病毒肺炎(COVID-19)潜在的治疗靶点,Shu 等[25]采用22 份新冠肺炎患者感染高峰期血浆和8 份健康人血浆,经TMT 标记定量分析、基因本体论(gene ontology,GO)分析和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG) 分析,发现差异蛋白高度富集于炎症、免疫细胞迁移/脱颗粒、补体系统凝血级联和能量代谢过程,最终确定了11个宿主蛋白和1 组生物标志物组合。慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是全球病死率和发病率较高的疾病之一,严重影响患者身体健康和生活质量,为全球第四大死亡原因[26],TMT 为探究COPD 的生物标志物提供了技术方法。Sun 等[27]采集19例COPD 患者和19例对照者的EBC 样本进行TMT 分析,共鉴定出257 种蛋白质,与对照组相比,COPD 患者有24 种蛋白表达存在差异,经过GO 和KEGG 分析,发现这些蛋白可能是COPD 中EBC 的新型生物标志物。此外,Zhang 等[28]收集了1例接受HER2 定向治疗和化疗并存活了7年的转移性肺腺癌患者的肿瘤组织,采用Super-SILAC 和TMT10plex 定量蛋白质组学方法对不同转移瘤进行磷酸化蛋白质组学分析,经靶向多反应监测(multiple reaction monitoring,MRM)技术检测,发现cdk12-g879v 突变可能与肺转移部位的化疗易感性有关。为了研究雷公藤甲素(triptolide,TP)诱导肺癌细胞凋亡的分子机制,Li 等[29]使用iTRAQ 技术分析了TP 处理NSCLC 的A549 细胞后蛋白谱的变化,经GO 与KEGG 分析,发现TP 对A549 肺腺癌细胞有抗肿瘤作用。该发现揭示了可作为肺癌治疗潜在靶点的候选蛋白。
1.6 细胞培养稳定同位素标记技术(stable isotope labeling by amino acids in cell culture,SILAC)SILAC技术是高通量定量蛋白质组学的有力手段,使用稳定同位素标记的氨基酸对整个细胞蛋白质组进行代谢编码,从而实现高精度的蛋白质定量[30]。该技术将同位素标记的氨基酸掺入细胞的所有蛋白质中——轻型(1H、12C、14N)细胞的蛋白质组成可以与重型(2H、13C、15N)细胞的蛋白质组成进行比较[31],其主要优点是能够在单个仪器运行中同时检测同位素标记的肽,从而保证大量肽的相对定量[32]。
SILAC 技术已被用于研发肺癌的新疗法。Duan 等[33]利用SILAC 定量蛋白质组学方法,从小细胞肺癌细胞系中鉴定出82个去整合素金属蛋白酶12(a disintegrin and metalloproteinase domain 12,ADAM12S) 调控蛋白,通过生物信息学分析、基因操作和体外实验,揭示了ADAM12S 可促进小细胞肺癌细胞的增殖、集落形成、迁移和侵袭,为小细胞肺癌的治疗干预研究提供了有价值的信息。Wang 等[34]采用SILAC 技术对肺癌细胞中6-O-angeloylenolin(6-OA) 调节蛋白进行了鉴定,发现6-OA 通过产生活性氧(reactive oxygen species,ROS) 发挥抗癌作用,提示6-OA 可用于肺癌的治疗。Wang 等[35]采用SILAC 技术结合生物信息学分析,发现异去氧苦地胆素(isodeoxyelephantopin,ESI) 可以通过Nrf2-p62-Keap1 反馈环激活保护性自噬以维持细胞存活,靶向此调控轴结合ESI 治疗可作为肺癌治疗的新策略。
2 定性蛋白质组学技术
鸟枪法(shotgun)是一种高通量的蛋白质鉴定技术,其原理是将蛋白质混合物酶解成肽段,引入质谱仪对这些肽进行分析,数据集生成后,与数据库中的理论肽进行匹配[36]。该技术的特色是基于肽段水平而非完整的蛋白质,可实现自动化、快速、高通量的蛋白组学分析。
鸟枪法已被用于研究多种呼吸系统疾病的发病机制和诊断方法。Rahman 等[37]采用鸟枪法在肺癌患者的气道上皮细胞中鉴定出2 869个蛋白,选择其中312个显著改变的蛋白进行WebGestalt途径分析,在这些蛋白质中,有48个代谢酶在支气管上皮细胞调节中表现为失调,这一发现为研究肺癌的分子发病机制提供了新的思路。Heyder等[38]采用鸟枪法对慢性肺部疾病患者支气管肺泡灌洗液和血清中的Fc 多糖进行检测,发现IgG4 Fc 段半乳糖基化与慢性肺部疾病有关,该发现有助于解释潜在肺部疾病的病因。Rivera 等[39]采集了10 份用于诊断COVID-19 的口咽拭子样本,其中5 份为核酸检测阳性标本,5 份为核酸检测阴性标本,用鸟枪法鉴定这些样本中的蛋白质,所有的阳性标本中均检测到SARS-CoV-2 核蛋白的特异性肽段。
3 结语
迄今为止,蛋白质组学的各种分析技术不断完善与革新,其研究的广度和深度也在迅速发展,使我们对于蛋白质的组成、表达和功能有了更加深刻的理解。利用蛋白质组学技术,已成功筛选出很多较为特异的新型潜在生物标志物,为肺癌等呼吸系统疾病的早期诊断和治疗提供了可能的靶点。将来,蛋白质组学凭借已取得的重大进展及其独特优势,会在探索呼吸系统疾病发病机制、诊断、寻找有效治疗靶点等方面发挥更大作用。