慢性阻塞性肺疾病不同种类标本的蛋白质组学研究
2019-03-17帅迪全王筠李水明陈成水金美玲盛司潼
帅迪全 王筠 李水明 陈成水 金美玲 盛司潼
1深圳大学生命与海洋科学学院518055;2温州医科大学附属第一医院呼吸与危重症医学科325000;3复旦大学附属中山医院呼吸科,上海200032
最新流行病学调查(2018年)结果显示,目前我国COPD患病总人数高达9 990万,约占全球患者的1/4,而40岁以上人群的患病率达13.7%,给社会和家庭带来了沉重的负担[1]。若无进行早期针对性治疗,患者气流受限会逐步加重并呈不可逆改变,因此,COPD致残率及致死率均较高。当前,COPD在全球致死性疾病中已排名第四。据统计学预计,到2020年该病将上升为第三大死因,是人类健康卫生面临的一个严峻问题[2]。
COPD是遗传和环境交互作用的复杂疾病,已公认的高风险因素有:香烟烟雾和生物燃料中所含的有害颗粒与气体,它们可导致呼吸系统发生不同程度的炎症反应和组织损伤[3]。近年来,国内很多地区PM2.5(空气动力学直径≤2.5μm 的颗粒物)污染严重,也可致成人的呼吸系统受损[4]。但是,它能否成为COPD的一个高风险因素,仍有待于研究确认。
高通量检测技术和生物信息分析技术的快速进步,极大地推动了COPD蛋白质组学的研究进展,特别是对新的多肽/蛋白质靶标的深度挖掘,有助于发现新的风险因子,科学评估环境因素的影响、调控发病机制以及进行个性化诊治。
1 蛋白质组学及相关技术
1994年,Wilkins和Williams首次提出蛋白质组的概念[5],其定义为“一种细胞/组织的基因组所表达的全部蛋白质”,可从宏观与微观层面上对蛋白质的组成成分、分类鉴定、表达水平、蛋白质翻译后修饰、以及蛋白质与核酸、蛋白质和代谢产物相互作用等进行全方位的研究。蛋白质组学不仅对蛋白质可进行定性或定量的检测与差异比较,还可动态分析蛋白质的定位和修饰,以及特定蛋白质与其它蛋白质、核酸、基因等的互作关系,进而揭示特定蛋白质的生物学功能,以及其与疾病发生、发展的关联性[6-7]。
蛋白质组学技术目前是由蛋白质分离技术、蛋白质鉴定技术、生物信息学分析技术和蛋白质验证技术组成。(1)蛋白质分离技术:包括样品总蛋白质的提取制备、双向凝胶电泳分离、比较差异蛋白质以及高效液相层析定性/定量读取单一多肽并拼接等技术;(2)蛋白质鉴定技术:主要运用质谱技术快速鉴定和高效筛选,包括双向凝胶电泳质谱技术、表面增强激光解吸离子化飞行时间质谱、基质辅助激光解吸离子化飞行时间质谱、电喷雾离子化质谱和液相色谱串联质谱(LC-MS/MS)等,后者的应用范围比较广泛;(3)生物信息学分析技术:可运用pFind、MASCOT和SEQUEST 等多个软件,在SWISS-PROT、Uniport、NCBI、GenBank和EMBL 等蛋白质数据库中进行数据检索,采用Omicsbean、Spectronaut、Skyline、TPP 和Scalffold平台/软件对数据进行分析与预测,并对候选蛋白质进行生物过程、细胞成分、分子功能、信号通路和互作关系等进一步的分析与评判;(4)蛋白验证技术:将经生物信息学技术筛查出的候选蛋白质,进行样本的可靠性验证(包括扩大样本的预测验证,以及在细胞和动物模型上的功能验证)。这项技术包括现今运用较广泛的酶联免疫吸附试验(enzyme linked immunosorbent assay,ELISA)、蛋白质免疫印迹(Western blot)、免疫组织化学、SRM/MRM、PRM、 DIA、PCT-SWATH 等。其中PCTSWATH 是Guo等[8]基于DIA 发展的一项新技术,可对大量临床样本进行高重复高通量的质谱分析,不仅可以应用于疾病的生物标志物的研究,而且还可以有助于蛋白组学检测技术推广应用于临床检验。Kusebauch等[9]使用SRM技术在肝细胞和前列腺癌细胞上进行研究,实现对20 277个注释的人类蛋白质中的99.7%进行定量检测,并报告了166 174种蛋白质肽段信息,还以此建立了SRMAtlas数据库。在疾病的生理和病理研究中,蛋白质及肽段的定量检测实现了革命性的突破。
近年来,已有不少关于COPD蛋白质组学的研究报道,并发现了一批与病变紧密相关的、具有潜在应用价值的、高灵敏和高特异的候选蛋白质[10]。它们可以弥补现有临床检测手段和传统病理观察方法的不足。例如:以蛋白质为靶标的临床检测,既可减少或避免支气管镜检等创伤性检查对患者的伤害,还可动态观察与该病相关的信号通路的网络调控及疾病的发生、发展。尤其当经过临床大队列大样本群的预测验证,然后再通过细胞和动物模型的功能验证,基本可以挖掘出一批新的分子标志物,以用作临床对COPD的早期诊断与鉴别诊断、新药研发、疗效监控与评估,以及预后判断等的指导。
2 不同种类COPD标本的蛋白质组学研究
COPD的蛋白质组学研究,可以从患者的血液、支气管肺泡灌洗液、诱导痰、气道上皮衬里液、呼出气冷凝液、肺病变组织、外泌体和其它多种类型的标本中,筛选与该病发生、发展相关的蛋白质标记物,进行定性或定量的检测与分析,并动态地反映COPD的异质性病灶和不同病期致病性蛋白质的种类和数量的变化[11]。以下着重回顾近年来采用蛋白质组学技术在COPD不同来源的标本中筛查和验证蛋白质标志物的研究进展。
2.1血液标本 血液标本中的蛋白质检测与分析在COPD蛋白质组学研究中最为常用。因为外周血标本中含有丰富的、能反映疾病状态与特征的多种蛋白质,且采集方式只是微小创伤,并可多次重复操作。此类标本在COPD的研究中分为4个亚类:(1)血细胞中的蛋白质;(2)血浆中的蛋白质;(3)血清中的蛋白质;(4)外泌体中的蛋白质。可依据研究需求决定采集哪一类或多类血液标本检测。筛查和利用血清中的生物标志物,既能更准确地阐述COPD的发病机制和分类,还能有效地开发COPD的特异性疗法[12]。但是,在进行血清/血浆蛋白质组学研究中,由于血液中富含多种高丰度的基础与结构蛋白质,有可能会遮盖一些低丰度蛋白质的检测,故需先执行去除高丰度蛋白质这一关键步骤。
Okano等[13]采用基于iTRAQ 标记的二维差异凝胶电泳质谱技术,比较11例肺鳞状细胞癌患者、7例COPD患者和7例健康吸烟者血清中蛋白质表达水平的不同,发现COPD患者血清中AACT 蛋白质水平与健康吸烟者相比是降低的。此结果与另一篇关于COPD发病与AACT 基因的突变和多态性有关的报道一致[13-14]。由此表明,AACT 可作为与COPD发病相关的蛋白质标志物。Bozinovski等[15]使用表面增强激光解吸离子化飞行时间质谱技术发现血清淀粉样蛋白A 在急性发作的COPD中呈上调表达,故该蛋白有可能在COPD的急性发病机制中发挥作用。Baralla等[16]采用2-DE联合基质辅助激光解吸离子化飞行时间质谱技术对43例患有轻中度COPD的患者与43例正常对照受试者的血浆进行比对分析,发现了29个组间表达差异的蛋白质。再经Western blot验证,证实了抗纤维蛋白原α链和维生素D 结合蛋白在COPD呈上调表达,提示它们有可能成为COPD早期监测的生物标记物。Diao等[17]利用iTRAQ 标记的LC-MS/MS 技术,对健康吸烟者和COPD加重期患者的血浆进行比对,共识别出41个显著差异性表达的蛋白质,其中13 个呈上调表达,28 个呈下调表达。而后经过ELISA 验证,证实甲状腺素结合球蛋白在COPD患者血浆中高水平表达,表明它具有该病血浆生物标志物的潜能。Leung 等[18]使用多反应监测质谱法对多队列COPD加重期和恢复期的患者血浆进行检测与分析,也发现5个可能成为COPD加重期和恢复期生物标志物的蛋白质(APOA4、CO9、FINC、APOC2、LBP)。
2.2支气管肺泡灌洗液标本 来源于支气管肺泡灌洗液的标本含有的蛋白质主要是由血浆渗出的,也可能是由气道上皮细胞和炎症细胞脱落或分泌。基于支气管肺泡灌洗液的COPD蛋白质组学的研究,有助于对COPD发病机制和机体对该病防御反应的深入了解[19]。
Pastor等[20]采用双向凝胶电泳联合基质辅助激光解吸离子化飞行时间质谱,比较分析了正常对照组、COPD组、肺癌组和COPD合并肺癌组(各15例)的支气管肺泡灌洗液样本。COPD组与正常对照组比较,发现28个表达差异的蛋白质;COPD合并肺癌组与正常对照组比较,发现33个表达差异的蛋白质。这些与COPD疾病相关的蛋白质所涉及的信号通路主要与炎症、自由基清除、氧化应激反应和糖酵解/糖异生途径有关。经过Western blot验证,确认了PRDX1和HSP70 2个蛋白质在COPD患者支气管肺泡灌洗液呈高表达,表明它们极有可能是潜在的COPD标志物。Tu等[21]运用基于离子电子流的鸟枪法蛋白质组学技术对COPD患者和健康对照者的支气管肺泡灌洗液样本进行比对分析,定量获得423种差异蛋白质,其中76种蛋白质的表达存在显著性改变。Western blot 法证实其中ADH1B、ALDH3A1、ALDH2、CTSD、FGB、LGALS3、APCS和TAGLN2这8个蛋白在COPD中均高水平表达。结果表明了定量蛋白质组学技术在COPD研究中的可靠性和特异性,也为疾病防治所需的生物标志物研发提供了新途径和新工具。Yang等[22]采用基于iTRAQ 的鸟枪法蛋白质组学技术对从不吸烟健康者与肺功能正常吸烟者的支气管肺泡灌洗液的细胞蛋白质进行研究,定量得到了506种差异蛋白质,富集于15条信号通路上。其中在吞噬体和白细胞反式内皮迁移这2条通路中的蛋白质与激活的细胞毒性T 细胞(CD69+)和吸烟者的气道阻塞水平(第一秒用力呼气容积与用力肺活量比值)具有显著相关性,为已公认的COPD发病高风险因子-吸烟相关的分子机制研究提供了新视野。
2.3诱导痰标本 COPD患者的痰液多位于肺泡或小支气管,不易排出。诱导痰是经吸入高渗盐水诱导产生的,含有气道中的炎症细胞和介质,能在一定程度上反映疾病的表型特征,故可用于筛查COPD特异性蛋白质标记物[23]。
Titz等[24]采用基于Tandem Mass TagTM6-plex标记的LC-MS/MS技术,对无病症吸烟者、早期COPD的吸烟者、曾吸烟者和从不吸烟者共4组受试者的诱导痰上清液进行比对研究。通过对比COPD患者与无病症吸烟者,发现了TIMP1、APOA1、LEG1和BPIFB1等13种差异蛋白质,证明经诱导痰的分析可揭示由香烟烟雾暴露引起的COPD病变复杂的生理反应。Gao等[25]采用双向凝胶电泳质谱技术对不吸烟者、吸烟无COPD者和吸烟伴COPD者3组的诱导痰进行比对研究,发现COPD患者与不吸烟者,或与吸烟无COPD者比较,具有杀菌与通透性作用的含褶皱蛋白B1 的表达水平均上调,并经过 Western blot、ELISA 和免疫组织化学实验验证。由此提示,含褶皱蛋白B1可能参与了COPD吸烟者的发病机制。为了探讨使用电子烟对气道的影响,Reidel等[26]采用无标记定量蛋白质组学技术对吸烟者、吸电子烟者和非吸烟者的诱导痰样品进行比较,共鉴定出大约1 000种蛋白质。与非吸烟者相比,吸电子烟者的诱导痰含有大约81种具有显著性改变的蛋白质,其中在COPD中起天然防御作用的弹性蛋白酶和基质金属蛋白酶9呈明显表达上调。结果警示电子烟可改变气道分泌物中的天然防护蛋白质,产生与吸香烟类似的变化。说明其作为香烟的替代品,也会对人体组织细胞造成伤害。为了研究气道中蛋白酶底物和蛋白酶活性与COPD的关联,Mallia-Milanes等[27]运用基于底物末端胺同位素标记联用质谱的蛋白质组学技术,检测了COPD稳定期和加重期的诱导痰样品,共鉴定出299 种蛋白质,包括蛋白酶、蛋白酶抑制剂、黏蛋白、防御素、补体和其他先天免疫蛋白。再经过Western blot分析表明,COPD加重期的气道弹性蛋白酶较稳定期的表达呈明显增加,为COPD有关蛋白酶研究提供了基础实验数据。
2.4气道上皮细胞 气道上皮细胞由杯状细胞、纤毛细胞、小颗粒细胞、刷细胞及其他细胞组成,覆盖在气道管壁上。气道上皮细胞被感染或结合某些有害物质(如烟雾、粉尘、大气污染)后,完整性被破坏,进而诱发COPD等慢性气道疾病的产生[28]。
Ghosh等[29]采用LC-MS/MS 技术,对不吸烟者、吸烟者和吸电子烟者的气道上皮细胞进行了分析,鉴定出292 种蛋白质。吸电子烟者对比不吸烟者,CYP1B1、MUC5AC和MUC4的表达水平上升。使用丙二醇/植物甘油单独雾化人气道上皮细胞和鼠鼻上皮细胞,再经Western blot验证,证实了MUC5AC 呈显著增加,表明它可能是COPD病变的一个潜在标志物。Pang 等[30]采用Label-free LC-MS/MS技术在大鼠气管上皮细胞、脂多糖处理大鼠气管上皮细胞和脂多糖与重组CC16 蛋白共处理的大鼠气管上皮细胞进行研究,鉴定出12种差异蛋白质。这些差异蛋白与细胞增殖、细胞骨架、炎症、基因调控、药物代谢及解毒有关。采用反转录实时定量聚合酶链式反应对11种差异蛋白质对应的mRNA 进行验证,均有与蛋白质相似的趋势,揭示了CC16蛋白抗炎作用的分子机制,为COPD等气道炎症疾病的研究提供了新思路。
2.5气道上皮衬里液标本 上皮衬里液是衬在气道黏膜和肺泡表面上的上皮细胞所产生的液体层,含有分泌的蛋白质,在宿主防御中发挥着重要作用,还能反映如空气污染物、香烟烟雾的有毒成分和过敏原等外部污染因子,所以这类样本也可用于COPD蛋白质组学研究[31]。
Franciosi等[32]使用基于iTRAQ 标记的定量蛋白质组学方法对年轻正常对照者和年老COPD患者在抽了3支卷烟后24 h收集的上皮衬里液进行分析,发现吸烟后COPD患者的PRDX1/SERPINB3 和ALDH3A1 均增加。ELISA证实了SERPINB3的变化,免疫组织化学实验在肺组织上SERPINB3和ALDH3A1 的染色结果也与iTRAQ 数据结果一致,这提示上述2种蛋白在COPD病变中可能参与了分子调控机制。Franciosi等[31]采用基于微流体的nano LCMS/MS技术对COPD患者与健康对照者的上皮衬里液进行了对比研究,共鉴定出193种蛋白质,其中乳转铁蛋白、高迁移率族蛋白B1、α1-抗胰凝乳蛋白酶和cofilin-1 在COPD患者上皮衬里液中的表达显著高于健康对照者。并进一步通过免疫组织化学实验加以验证,为利用人气道上皮衬里液标本进行nano LC-MS/MS研究提供了实验的可行性和可靠性。
2.6呼出气冷凝物标本 呼出气冷凝物是通过无创方法收集的呼出气冷却凝固物质,目前呼出气冷凝物作为寻找COPD呼吸道生物标志物的一种样品类型已被公认[23]。
López-Sánchez等[33]采用LC-MS/MS,对健康对照、吸烟、COPD和肺癌4组共192个呼出冷凝物样品进行分析,共鉴定出348种蛋白质,并通过随机森林算法建立了一个稳定的模型。在模型中通过受试者工作特征曲线分析得出待鉴定蛋白质的信息。COPD中DCD 和HRNR 蛋白质的受试者工作特征曲线下面积>0.75,具有诊断价值。Kononikhin等[34]采用高效LC-MS/MS,对健康对照、肺炎和COPD3组共79个呼出气冷凝物样本进行比较研究,发现PRDX1蛋白质在COPD与对照组比较中呈差异性表达,但尚缺验证试验。Fumagalli等[35]采用LC-MS/MS,对20例吸烟者、25例不吸烟者、15 例无肺气肿的COPD患者及23例α1-抗胰蛋白酶缺乏症患者的呼出气冷凝物进行了相关研究,发现与不吸烟对照组相比有17 个蛋白质在COPD组呈特异性差异表达,其中α1-抗胰蛋白酶、钙粒蛋白A 和B通过表面增强激光解吸离子化飞行时间质谱和Western blot实验被验证有显著性差异,可成为COPD的诊断标志物。
2.7肺病变组织标本 在疾病的蛋白质组学研究中,病变局部的组织样本不仅具有较多的疾病特异性蛋白质,且可检测到原位蛋白质的分布和共定位的形态学信息[36]。Zhu等[37]采用PCT-SWATH 技术在肝癌冷冻组织上进行研究,共鉴定出高置信且高重复2 579个蛋白质、11 787个蛋白质肽段,并用免疫组织化学法验证了MCM7蛋白质的表达。这证明PCT-SWATH 技术可对冷冻组织样品进行快速蛋白质组学分析,为辅助临床医学诊断提供新途径。
Ahrman 等[38]采用无标记定量蛋白质组学联合SWATH-MS分析方法,对COPD肺组织和特发性肺纤维化肺组织进行比较分析后共鉴定出3 369种蛋白质。经免疫组织化学验证分析发现金属蛋白酶抑制剂3和基质金属蛋白酶28这2种蛋白质在COPD患者中的表达明显高于特发性肺纤维化患者,说明它们可能与COPD的气道重塑有关。Ohlmeier等[39]采用双向凝胶电泳质谱技术,对不吸烟者、吸烟者、COPDⅠ~Ⅱ期吸烟者、COPDⅢ~Ⅳ期吸烟者、α-1-抗胰蛋白酶缺乏症和特发性肺纤维化患者共51例的肺组织进行鉴定,找出159个蛋白质斑点,从属于82种蛋白质。Western blot分析认为,其中CTSD、DPYSL2、TGM2和TPP1可能是与COPD疾病相关的特异性蛋白质。经ELISA 验证进一步表明TGM2在COPDⅡ~Ⅲ期患者痰和血浆中的表达水平显著性升高。因而,TGM2被认为可作为COPD诊断和治疗的潜在新靶标。
2.8外泌体标本 外泌体是由机体多类细胞分泌的胞外囊泡(直径为30~100 nm),内含细胞的代谢产物,也可携带疾病的特定分子信息(包括DNA、RNA、蛋白质、脂质和代谢物等各类大小分子),穿梭于细胞间与各种体液中,介导着细胞间的通讯和运输,并调控靶细胞的功能[40-41]。Zhang等[42]通过不对称流场分流分离,将外泌体分为40~120 nm 的大外泌体和60~80 nm 的小外泌体。蛋白质组学的分析进一步揭示:小外泌体中含有内体、多泡体、液泡和吞噬囊泡等,为经典的外泌体;大外泌体则含有质膜、细胞连接、次级内体和反式高尔基体网络等,为非经典的外泌体。这两种外泌体中均富含大量的蛋白质,在机体的生理与病理过程中发挥着重要的作用,也是疾病液体活检诊治的重要参数,目前日益受到极大的关注。
Gupta等[43]采用无标记定量蛋白质组学技术,对原发性气管支气管细胞(human tracheobronchial epithelial cell,HTBE)和培养的气道上皮细胞系(Calu-3)的分泌物进行了研究。先将HTBE细胞分泌物中分离出的外泌体转移至Calu-3细胞,再收集其共分泌物;同时,还将Calu-3细胞分泌物中分离出的外泌体转移至HTBE 细胞,再收集其共分泌物。进而,将这4种分泌物进行了比较蛋白质组学实验和分析。结果发现HTBE 细胞分泌物中主要含有MUC5B等天然性蛋白质,而Calu-3 细胞分泌物中主要包含MUC5AC等病理性蛋白质。在进行外泌体转移后,分泌物中大约有20%蛋白质(包括MUC5AC和MUC5B)发生了显著的变化,这表明气道上皮细胞间外泌体的转移可改变黏蛋白的分泌情况。这一机制可能对上皮细胞重塑发挥了作用,为COPD发病机制的研究提供了新思路。
2.9其他 尿液等其他标本在COPD的蛋白质组学研究中也占有一定的地位。Carleo等[44]采用毛细管电泳联用质谱对COPD含α-1 抗胰蛋白酶(Pi MM)患者和COPD不含α-1抗胰蛋白酶(PiZZ)患者的尿液进行了相关研究,共鉴定出36 种蛋白质。在逻辑回归模型中COL1A1 和COL5A3的敏感度和特异度较高,可对PiMM 和PiZZ 进行区分。此外,载脂蛋白A-I和C4、视黄醇结合蛋白4和前列腺素-H2D-异构酶在PiZZ患者中呈现低水平表达;虽然凝溶胶蛋白和血红蛋白α 在PiZZ 患者中表达,但在PiMM 患者中不表达。因此,该研究证实了PiMM 患者和PiZZ患者尿液中蛋白质的含量不同,有望为个性化治疗提供实验数据。但是,尿液标本中蛋白质成分与含量在很大程度上受肾功能(特别是肾小球与肾小管上皮细胞的分泌与吸收功能)影响,故其应用具有相当的局限性。
3 结语
近年来,医学科学家们利用蛋白质组学的先进检测技术,对受试者多种类型样本中的COPD蛋白质标记物进行了较全面的筛查,发现了一大批与病变关系密切的新靶标,后续大量的功能验证实验正在逐步展开。另外,如何提高分子标志物的敏感度和特异度,如何扩大与补充样本库和数据库,如何更新和完善数据分析软件,以及如何推进蛋白质组学的临床转化应用等瓶颈问题仍亟待解决。我们认为只有联合基因组学、转录组学、代谢组学、表观遗传学、离子组学等多组学技术的应用,才能真正找到特异度更强、敏感度更高、应用性更广的蛋白质标志物,使它们在COPD疾病的系统性和动态性研究中发挥出更大的作用。
利益冲突所有作者均声明不存在利益冲突