蛋白质组学在结核分枝杆菌感染研究中的应用进展
2020-02-10冯峰汤凤珍姚明媚程璐杜利军
冯峰 汤凤珍 姚明媚 程璐 杜利军
世界卫生组织(WHO)[1]2019年报道,全球约有1/4的人口感染了结核分枝杆菌(MTB),2018年新发患者约为1000万例。中国是全球结核病高负担国家之一。耐药MTB的出现又增加了结核病防控和治疗的难度。基因组学、转录组学和蛋白质组学等新技术的出现,为结核病的病原、诊断、治疗和耐药性方面的研究提供了更加全面和完整的视角。笔者就蛋白质组学在结核病防治领域的研究进展做一综述。
一、蛋白质组学技术介绍
1.基本概念:蛋白质组这一概念最初由澳大利亚学者Wilkins和Willian在1994年首先提出。蛋白质组指在一定生物范围内所表达的全部蛋白质,如一个基因组、一个细胞、单个组织或个人和特定人群。蛋白质组学是以蛋白质组为研究对象,研究其组成成分、表达水平和修饰方式,了解蛋白质之间的相互作用及对表型的影响,最终在整体水平把握蛋白质组的生理特性和作用规律。
2.主要技术:蛋白质组学技术包括基于色谱和质谱的蛋白质的分离、鉴定和定量,以及基于生物信息学的蛋白质功能和修饰特征的研究。常见蛋白质分离技术有二维凝胶电泳技术(two-dimensional gel electrophoresis,2-DE)[2]和基于色谱的高效液相色谱(high performance liquid chromatography,HPLC)[3]技术。质谱技术处于蛋白质组学研究中的核心位置,其基本原理是通过改变环境电场和磁场,识别带有不同质量和电荷的粒子的运动轨迹,来判断粒子的物理特性。根据蛋白质粒子化方法的不同,分为基质辅助激光解吸电离飞行时间质谱(matrix-assisted laser desorption ionization-time of flight-MS, MALDI-TOF-MS)和电喷雾电离质谱(electrosprayionization-MS,ESI-MS)。根据质量分析的方法不同,分为轨道离子阱质谱和四极杆飞行时间质谱(quadrupole time-of-flight,Q-TOF)技术,分辨率可小于2 ppm[4]。利用质谱技术获得的蛋白质指纹图谱,可结合各种生物学信息平台或数据库进行解析,可确定样本中含有的蛋白质种类及修饰特征。随着技术改进,还出现了同位素标记相对和绝对定量结合二维液相色谱-串联质谱技术[5]。现今,部分医院检验科微生物实验室配备了适用于微生物种类鉴定的MALDI-TOF-MS,可直接快速检测样品中的微生物,具有高通量、敏感度好和特异度高的特点。
二、蛋白质组学在MTB研究中的作用
1.MTB与巨噬细胞相互作用的蛋白质组学研究:巨噬细胞是MTB在人体内主要的寄生场所,也是其增殖和触发机体免疫反应的主要环境[6],从蛋白质组学的角度了解MTB与人体巨噬细胞的相互作用有助于理解结核病的病理机制和MTB的免疫逃避作用。Menon等[7]使用定量蛋白质组学技术识别感染了具有活性的MTB、加热杀死的MTB和未感染MTB的人体巨噬细胞的蛋白质组,发现感染活菌的巨噬细胞内的胞质脂滴的蛋白质丰度增加,并伴随有脂质代谢、蛋白质合成和囊泡运输功能的改变。利用生化方法和显微镜技术,证实了ADP核糖基化样因子8B(ARL8B)在MTB感染的巨噬细胞的脂滴表面增加,且ARL8B是胞质脂滴蛋白之一。这一研究为MTB在肺部形成干酪样肉芽肿损伤提供了病理机制的理论依据。除了会影响所寄生的巨噬细胞的脂质代谢,MTB还会影响细胞内蛋白质表达水平与修饰特征。Budzik等[8]通过研究MTB感染的巨噬细胞蛋白质翻译后修饰发生的变化,确定了数百个动态调控的磷酸化和泛素化位点,表明了在感染期间,细胞内发生的预见和未预见的多种宿主通路的重构的显著变化。这些变化大部分没有从mRNA的角度反映出来,包括泛素介导的自噬激活。该分析还揭示了一种特殊的自噬受体蛋白TAX1BP1,介导了泛素化MTB的清除,且将细菌定位在LC3阳性的吞噬泡。这为了解巨噬细胞如何通过调节蛋白质组的修饰应对感染提供了线索。
2.不同MTB菌株毒力的蛋白质组学研究:MTB菌株H37Rv和H37Ra经常用于MTB毒性和病理学机制的研究[9-11]。Verma等[12]使用高分辨傅里叶变换质谱发现了265个新的磷酸化位点。通过定量分析,发现H37Rv菌株的毒性相关Ⅶ型细菌分泌系统的蛋白表达量是H37Ra表达量的5倍以上,并且在其他84个蛋白表达量上也有差异。这些蛋白集中在脂肪酸生物合成和双组分调节系统通路上。这为两种菌株的毒性差异提供了理论依据。分枝杆菌属中不同种的病原菌,甚至同种病原菌的不同菌株具有高度的基因组保守性,但不同菌种或菌株间的表型和相关的临床特征迥异。为了考察一些菌种或菌株在蛋白质水平的表型是否稳定,以及蛋白质水平的变化是否为造成不同临床表现的原因,Peters等[13]使用液质联用串联质谱(LC-MS/MS)从蛋白质定性和定量角度研究了7个不同的临床相关的分枝杆菌菌株的蛋白质组(含有4株分枝杆菌菌株、牛分枝杆菌、牛分枝杆菌BCG菌株和鸟分枝杆菌),并用双压线性离子阱高分辨率组合型质谱仪进行了分析。该研究鉴定出MTB特异的4023个理论蛋白中的3788个蛋白,并且在前6个菌株的每个菌株中平均鉴别出3290个特异的蛋白质(占各菌株理论蛋白质组的82%),还鉴定出4250个鸟分枝杆菌的特异蛋白(占该菌种理论蛋白质组的80%)。数据分析显示,所有主要类别的蛋白在每一菌株中均有表达,但菌株间表达水平有明显差异。再使用靶向选择反应监测(SRM)试验定量观察23个蛋白亚群的表达情况,这些蛋白是通过与基因表达数据对比确定的,与各菌株的毒力相关。该分析可能揭示了不同菌株间相对蛋白丰度对菌株毒性、耐药性和传播性的影响,为结核病病理、治疗和防治研究提供了理论依据。
3.MTB中具有特定功能蛋白质组的研究:尽管对MTB已有较多的蛋白质组和转录组的研究,但对于转录组调控的方式和动力学研究仍然较少,所以有必要针对MTB转录组调节蛋白的组成和功能进行研究[14-15]。Pociński等[16]使用4-硫脲标记RNA的方法,绘制了微生物RNA结合蛋白质组,并鉴别了降解体的相关酶,包含:多核苷酸磷酸化酶(PNPase)、ATP依赖性RNA解旋酶(RhlE)、核糖核酸酶E(RNase E)和核糖核酸酶J(RNase J)为主要成分。经过对增强绿色荧光蛋白标记的重组构建物进行亲和纯化,以识别蛋白质之间的相互作用,进一步证明了冷休克蛋白和新K同源(K-homology)结构域蛋白的相互作用。通过生物工程设计,降低菌株核糖核酸酶表达水平,为该酶在分枝杆菌RNA代谢中的多效作用提供了证据,提示其可作为潜在的药物靶点。
激酶调节在MTB适应性反应中起着关键作用[17-18]。然而,对于MTB中参与每个磷酸化事件的特异性酶和功能特征的确认仍然滞后,其中,丝氨酸苏氨酸蛋白激酶(PknG)参与了多种MTB的代谢功能和致病性。因此,有必要识别菌中PknG的底物和作用位点。Gil等[19]使用了一种吸附纯化质谱策略,逐步揭示了PknG的底物和相互作用因子,以识别PknG的自发磷酸化位点。经鉴定,获得了7个假定底物和66个直接或间接的配体,说明PknG调节了氮和能量代谢,细胞壁合成和蛋白翻译等多种生理代谢作用。其中,包括2个之前报道的PknG底物GarA和50S核糖体蛋白L13。使用比较蛋白质组学分析了野生型和pknG缺失型MTB菌株,证明了2种激酶相互作用因子,包含FHA-结构域的蛋白GarA和谷氨酰胺合成酶确实是PknG的内源性底物,进一步证明了PknG的氮代谢调节作用。以上结果证明了PknG在体外对谷氨酰胺合成酶和FhaA蛋白特定残基的磷酸化作用,且这一过程也在菌内发生,为理解MTB生理过程和药物开发提供了理论依据。
4.蛋白质组学对耐药和休眠MTB的蛋白质组研究:尽管临床上已有多种用于治疗MTB感染的药物,结核病的治疗仍然是一个临床难题。治疗效果不佳和耐药菌的出现增加了结核病治疗的难度。因此,有必要使用蛋白质组学的方法理解结核病治疗的特征。
MTB的耐药性与细菌具有一定的生理特征联系,蛋白质组学的方法可以帮助我们理解这种生理特征,并为开发新的药物奠定基础。Sharma等[20]使用蛋白质组学技术分析了MTB对阿米卡星和卡那霉素2种抗生素的耐药性,发现了20种过度表达的耐药蛋白,并进行了鉴定。其中,有6种蛋白的功能未知或未被鉴定过,包含Rv3208A、Rv2623、Rv1360、Rv2140c、Rv1636和Rv2185c。对接结果表明,阿米卡星和卡那霉素可以结合于这些假设蛋白的保守结构域,且这些蛋白的过度表达会中和或调整药物分子的效应。在使用TBPred预测服务器和原核类泛素化位点预测工具GPS-PUP 分别预测了这些已鉴别的蛋白质的胞质性质和蛋白的原核类泛素蛋白化位点以后,蛋白质相互作用数据库STRING分析表明蛋白过表达及其配体可能参与了氨基糖苷类药物的耐药。这些过表达蛋白的积累效应可能通过减轻毒性、抑制药物靶点和中和作用而参与阿米卡星和卡那霉素的耐药性。以上研究为MTB抗阿米卡星和卡那霉素的诊断和治疗方法提供了一定的理论基础。MTB也对对氨基水杨酸产生了耐药性。Wei等[21]通过筛选和建立了对氨基水杨酸耐药的folC变异和非变异株,利用多组学分析了MTB的对氨基水杨酸抗性,以分析其耐药性的机制。发现通过S-腺苷甲硫氨酸依赖的甲基转移酶的促进和抑制一些药物转运相关膜蛋白对氨基水杨酸转运的降低,是folC突变株耐药的两条主要途径。而folC未突变株的耐药性是通过外源性蛋氨酸的摄取缓解了抑制剂的作用,并且促进了DfrA、ThyA和FolC的表达。除了以上结果,该课题组还发现对氨基水杨酸耐药可能与苯丙氨酸代谢途径的增加有关。这些结果为folC变异株和非变异株的对氨基水杨酸耐药性和随后的治疗方案的开发提供了线索。MTB的治疗不止可以使用单一药物,也可以进行联合用药,提高治疗效果。de Keijzer等[22]使用蛋白质组学的方法考察了用于治疗精神病症状的药物硫醚嗪治疗MTB的蛋白质组,发现了MTB中与细胞膜通透性相关的蛋白表达的丰度的变化。进一步通过对病原菌内荧光染色所经过的时间积累的分析,确认了MTB长时间暴露于硫醚嗪可增加细菌细胞膜的通透性,从而开发抗结核药品与硫醚嗪合用,以更有效地治疗结核病的新方法。潘稚芬等[23]利用比较蛋白质组学技术,将临床获得的耐多药MTB菌体蛋白与标准株H37Rv进行比较,发现了重复性较好的耐多药MTB菌株差异蛋白点11个,鉴定出其中8个蛋白,其中还原型辅酶Ⅰ(NADH)脱氢酶I B链(NuoB)在耐多药MTB表达上调。通过对NuoB的分子生物学表达和随后的酶联免疫吸附试验(ELISA)检测不同人群血清中IgG对NuoB结合特征的观察,发现耐多药MTB感染者血清中的IgG阳性率为43.86%,在药物敏感MTB感染者中为15.62%,在正常对照者中为10.00%,差异具有统计学意义(P<0.05),为耐多药MTB感染的诊断提供了理论基础。
除了分析不同药物的使用对结核病治疗结果的影响,分析MTB在不同生理状态下的表型特征,也可以为治疗结核病,特别是潜伏性结核感染提供理论依据。Trutneva等[24]利用2-DE和MALDI-TOF-MS分析的方法,分析了存储了1年以上处于休眠状态停止分裂的MTB,这些细菌全部耐药且发生了形态的改变。尽管有蛋白质发生降解,休眠1年的MTB的蛋白质组仍保有很大程度的完整性。蛋白质的稳定性可能与大量参与蛋白质保护的酶的存在有关,这些酶涉及氧化应激(katG/Rv1908,sodA/Rv3846,sodC/Rv0432,bpoC/Rv0554),分子伴侣(dnaJ1/Rv0352,htpG/Rv2299,groEL2/Rv0440,dnaK/Rv0350,groES/Rv3418,groEL1/Rv3417,HtpG/Rv2299c,hspX/Rv2031)和DNA稳定性蛋白。此外,休眠细胞蛋白质组包含参与了特定代谢通路的酶,如糖酵解反应,缩短三羧酸循环(tricarboxylic acid cycle,TCA循环)和降解过程,从而能形成低水平代谢状态,或者这些酶在休眠状态下长期保存,以在重新活化的过程中发挥生物活性。这些对休眠状态下MTB的观察有利于理解其生理特征,为开发进一步的诊断和治疗方法提供依据。Schubert等[25]使用了一种无标签的,基于SWATH(sequential windowed acquisition of all theoretical fragmentions)质谱的方法评估了绝对细胞蛋白浓度,考察了MTB指数生长期,缺氧诱导的休眠和复苏过程中的蛋白质重组。结果覆盖了超过2000个蛋白质,揭示了蛋白质分子质量在这些过程中的分布特征。应激诱导的休眠存活调节子(dormancysurvival regulator,dosR)占有休眠期间20%的蛋白表达量,而核糖体蛋白的量维持在5%~7%不变。蛋白质的绝对浓度还可以进一步将蛋白质的转变理解为最大酶促反应速率的转变,从而进一步提高对代谢适应的理解。而对MTB的全面蛋白质的测量可以提供一个定量描述病菌状态的标准,从而为结核病治疗的发展提供理论依据。
三、蛋白质组学在结核病诊断和治疗研究中的作用
MTB培养是结核病诊断的金标准,然而其一般耗时2~6周。痰涂片镜检快速,但敏感度较低。血清学诊断易被交叉感染影响。结核菌素皮肤试验(TST)易被卡介苗的接种所影响,对免疫缺陷人群的敏感度较差[26]。而γ干扰素释放试验(IGRA)和结核感染T细胞斑点试验(T-SPOT.TB)的假阴性或假阳性反应较多,且成本较高[27]。因此,仍需要筛选更加可靠的结核感染诊断标志物。
MTB感染的早期发现与否与患者临床结局密切相关,因此,建立MTB感染早期诊断标准具有重要临床价值。Bark等[28]观察了104例HIV阴性MTB感染者的血清和血浆样本,分为活动性结核病患者,潜伏性结核感染者,TST阳转者和TST阴性者。在所有比较中,有289个蛋白的表达量差异有统计学意义(纠正错误发现率P<0.05)。与细胞免疫和脂质代谢相关的蛋白质在MTB早期感染中被诱导表达。使用质谱对159种选定的蛋白进行试验,对来自52个TST阳转及保持阴性者的一系列纵向研究样本进行分析,经过多因素logistic回归分析鉴定的特定蛋白质组合可以预测TST检测者的变化,其受试者工作特征曲线曲线下面积(AUC)值大于0.85。
通过血清中的蛋白标志物,区分活动性肺结核和肺结核患者密切接触者,在结核病诊断和防治中具有重要的作用。Chen等[29]使用蛋白质组微阵列方法研究了36例活动性结核病患者和18名健康对照者血清中的抗MTB的IgG和IgM抗体。结果显示,多种抗原能诱导结核病患者血清中更高滴度的IgG或IgM应答,在这些抗体中,进一步通过ELISA从 221个样品中验证了Rv2026c和Rv2421c的存在,并通过多因素logistic回归分析显示其在结核病临床分类中具有较好的表现。此外,通过受试者工作特征曲线(ROC),得到组合的诊断条件的敏感度和特异度分别是82.5%和88.12%,优于单一抗原的诊断。此外,Rv2026c和Rv2421c的抗体的反应性与患者的临床背景有关(如性别和个体差异等)。这些结果表明,不同类型抗原和抗体的组合为血清学检测结核病提供了进一步的理论支持。Mateos等[30]使用串联质谱10-plex同位素标签的定量蛋白质组学区分了活动性结核病患者,及其潜伏感染者和未感染的家庭接触者,每组15个独立血清样本,重复5次试验。使用液相色谱-离子肼质谱仪进行肽段分析,和Proteome Discoverer 2.1处理原始数据后,共定量418个蛋白质。结果显示,活动性肺结核患者的蛋白质特征与补体激活,炎症和免疫调节有关,并通过减少一部分蛋白,包括载脂蛋白A和血清载铁蛋白,表明了脂质转运和铁同化在疾病过程中的作用。这些特征通过ELISA和浊度测定法进行后续的靶向测定队列研究得到了进一步确定。该研究为区别潜伏感染者和活动性结核病患者提供了理论依据。
结核病治疗期间,因为治疗作用会使患者痰量减少,且痰培养对长期治疗效果预测的准确性降低。因此,有必要探索反映结核病治疗效果的诊断标准。Kedia等[31]使用敏感的离子淌度质谱(IM-MS)描述感染初期和利福喷丁治疗8周以后的血清蛋白质组,试图识别反映治疗效果的特异信号,且将临床治疗效果与这些信号关联起来。血清样本来自参与疾病预防控制中心结核病研究项目的289例患者,样品分别收集于每例患者的病程初期和强化治疗结束期。使用免疫亲和层析去除血清蛋白质中的高丰度成分,再将样本消化成肽段并使用液相IM-MS平台(LC-IM-MS)采集分析数据。利用线性混合模型识别血清蛋白改变,以识别患者行抗结核治疗的效果和痰培养结果的相关性。共鉴别和定量了872个蛋白质的10 137个肽段,并进行了纵向的队列分析。结果显示,在结核病治疗以后,有244个蛋白质有明显改变。通过通路/网络比较,可知上调(脂质转运、凝血级联、肽酶活性)和下调(急性期)的蛋白,和这些蛋白参与调控网络(炎症、细胞黏附、细胞外基质)的一系列通路。还发现反映肺损伤的血清蛋白质乙酰肝素酶(HPSE),在治疗期间明显下调。通过对微生物数据分析,发现了一组对治疗有所反映,且能与痰培养结果明显关联的核心血清蛋白[甲状腺素运载蛋白(TTHY)、维生素E结合糖蛋白(AFAM)、C-反应蛋白(CRP)、视黄醇结合蛋白(RET4)、血清淀粉样蛋白A(SAA1)、肽聚糖识别蛋白2(PGRP2)]。通过建立一个预测的蛋白质基线,可以预测治疗6~8周的痰培养状态。以上研究为建立结核病临床治疗效果监测提供了理论基础。
四、应用前景
MTB的感染、发病和治疗涉及到宿主和MTB内多种生理反应和信号通路的作用。蛋白质组学能从更宏观更整体的角度上对这些现象进行观察和分析。目前,MTB相关的蛋白质组学研究集中在MTB生理特征的阐述及其造成的病理反应机制,结核病不同阶段诊断标准的制定及MTB对治疗药品耐药性的研究和新的治疗方法的探索。在潜伏性结核感染的发现和耐药结核病的治疗方面,蛋白质组学可以获得一定范围内人群的瞬时MTB蛋白质组学信息,但这些信息的变化特征依然不明确。在接下来的研究中,希望能建立基于蛋白质组学的多地区,多人群的纵向动态MTB数据库,以求减少空间、时间和人群特征的限制,更加动态立体地描述MTB的生理特征及病理特征。