BioID技术在肿瘤蛋白质组学中的发展与应用
2020-05-11王晓飞丁明
王晓飞 丁明
摘 要:蛋白质通过形成复合物或蛋白-蛋白相互作用来执行生物学功能,蛋白-蛋白相互作用是细胞生命活动的基础,也是整个生物学领域研究的核心问题之一。传统的互作蛋白筛选方法包括酵母双杂交和串联亲和纯化等,但这些方法具有一定的局限性,很难适用于实时和动态蛋白相互作用分析。邻近依赖生物素鉴定(BioID,proximity-dependent biotin identification)是筛选活细胞中发生的蛋白相互作用的独特方法,利用修饰过的生物素连接酶BirA与感兴趣的蛋白融合表达,生物素化近端内源蛋白质,生物素化的蛋白可以被选择性分离并用生物质谱鉴定出目标蛋白的候选相互作用物。BioID已成功应用于不溶性蛋白及瞬时或弱相互作用蛋白的研究,也逐渐应用于肿瘤等疾病发生机制及药物靶点筛选的研究。文章针对该技术进行了详细总结,并讨论了其在肿瘤蛋白质组学中的应用。
关键词:BioID;邻近蛋白标记;蛋白-蛋白相互作用
Abstract: Proteins perform biological functions by forming complexes or protein-protein interactions. Protein-protein interaction is not only the basis of cell life activities, but also one of the core issues in the whole biological field. Traditional protein screening methods include yeast two-hybrid and tandem affinity purification, but these methods have some limitations and are difficult to be applied to real-time and dynamic protein interaction analysis. Proximity-dependent biotin identification (BioID) is a unique method for screening protein interactions in living cells. Using the fusion expression of modified biotin ligase BirA with proteins of interest, biotinylated proximal endogenous proteins and biotinylated proteins can be selectively isolated and candidate interactions of target proteins can be identified by mass spectrometry. BioID has been successfully applied to the study of insoluble proteins and transient or weakly interacting proteins, and also gradually applied to the pathogenesis of tumors and other diseases as well as drug target screening. In this paper, this technique is summarized in detail, and its application in tumor proteomics is discussed.
前言
在生命体中,蛋白质是发挥作用的主体。细胞中各种复杂的生理活动以及细胞对外部环境的反应均基于蛋白质之间的相互作用,从而形成复杂的信号转导网络。蛋白质相互作用(PPI)包括形成比较稳定的蛋白质复合物或瞬时相互作用,一些蛋白质之间的瞬时相互作用往往具有重要的生理功能。PPI大多是一种动态的过程,会随着时间、细胞周期进程或组织类型而改变,并且可能受到如翻译后修饰,蛋白质的构象变化等许多因素的影响,具有瞬时性、弱相互作用和受多因素调节等特点[1]。目前已开发了许多方法以研究PPI,例如酵母双杂交和串联亲和纯化等[2,3]。对于稳定的PPI,依赖于亲和纯化的生物化学方法可靠并被广泛使用,串联亲和纯化使用两个标签经过两步连续的亲和纯化,提高了纯化产物的特异性,但缺点是有些瞬时性及弱相互作用难以检测到[3]。基于PPI亲和力,还开发了一些高通量筛选方法,最广泛使用的酵母双杂交系统可用于鉴定给定靶蛋白的候选相互作用配体。这种基于酵母的方法也已经升级以适应哺乳动物细胞中的应用,然而酵母双杂交系统也存在着高假阳性率和阴性结果[2]。
通过修饰酶进行邻近标记是一种新的PPI筛选方法,可以实现对瞬时和弱相互作用的检测。将修饰酶与感兴趣的蛋白质进行融合,修饰酶就能对目的蛋白附近及潜在相互作用的蛋白质进行标记。此类技术的实例包括使用辣根过氧化物酶(HRP,horseradish peroxidase),抗坏血酸过氧化物酶(APEX,engineered ascorbate peroxidase)和邻近依赖生物素标记(BioID)的选择性蛋白质组邻近标记[4]。BioID技术相比传统的蛋白相互作用发现方法具有显著优势,适用于鉴定瞬时性、弱相互作用、不溶性细胞结构以及机体内动态过程。本文主要对BioID邻近依赖生物素鉴定进行总结归纳,阐述了其原理和方法及其在肿瘤疾病中蛋白相互作用鉴定的应用。
1 BioID技术的策略
1.1 生物素连接酶(BirA)
2001年,Parrott等人[5]提出BirA可用于生物素化蛋白質,并将其应用在分泌蛋白或膜结合蛋白上。BirA属于生物素连接酶的一种,来源于大肠杆菌,大小约为35.5 kDa,包含三个结构域:N-末端DNA结合结构域,中心催化结构域和C-末端结构域,其中心催化结构域负责结合ATP并与靶蛋白相互作用[6]。de Boer等人[7]首次成功应用了基于BirA的体内生物素化,利用BirA检测到了能与目标蛋白GATA-1(红系特异核蛋白转录因子)相互作用的分子,从而找到其潜在的分子靶点。2004年,Choi-Rhee等人[8]对生物素连接酶BirA进行突变研究,通过筛选得到一种BirA的突变体BirA*(R118G)。2012年,Roux 等人[6]将这种利用BirA的突变体BirA*(R118G)在细胞内标记相互作用蛋白的方法称为BioID。该一系列的工作奠定了将BirA蛋白用于邻近相互作用坚定的工作基础。
1.2 BioID的技术原理
BioID通过生物素连接酶BirA来筛选生理相关的蛋白质,野生型BirA仅能标记一个蛋白,BioID利用大肠杆菌BirA*(R118G)的突变形式,促进近端蛋白的生物素化[6]。野生型BirA生物素化是一个两步反应,先是BirA催化生物素和ATP生成活化的biotinoyl-5'-AMP中间体,并将其保持在自身的活性位点上,即中心催化结构域上;随后与靶蛋白上的特定赖氨酸反应,在生物素和赖氨酸侧链之间形成酰胺键,形成生物素化的靶蛋白,释放出AMP。BirA需要特异性识别一段15个氨基酸的序列来生物素化目的蛋白,这样的要求大大减少了潜在的目标蛋白质的数量。相反,BirA的突变形式BirA*,在活性位点携带R118G突变,且活性比BirA高,对biotinoyl-5'-AMP的亲和力显著降低并提前释放,从而导致活化的biotinoyl-5'-AMP脱离催化中心,非特异性地与邻近蛋白质上的伯胺进行共价结合,即突变的BirA*不需要识别特定的氨基酸也能使其周围的分子生物素化[9,10]。但BirA*的标记半径仅为10nm左右,在目的蛋白附近10nm范围内的蛋白都会被生物素化而被鉴定出来。因此只能对邻近蛋白质实现非特异性的标记,需要谨慎解释阴性结果,因为在分析中可能遗漏了一些已知的相互作用伴侣[11]。
在2016年,Kim和Roux等人[12]對BioID进行了改进,提出了BioID2,基于来自超嗜热菌(A. aeolicus)的BirA(R40G),缺乏DNA结合结构域,分子量更小(27kDa),有利于准确定位融合蛋白及与靶蛋白结合,且需要加入的生物素少于第一代BioID,生物素化标记效率更高。与 BioID 相比,BioID2的生物素化范围和效率显著增强,因此能够检测到第一代连接酶难以生物素化的蛋白质[12]。
1.3 BioID的技术流程
BioID分析过程可分为:(1)在哺乳动物(或其它)表达载体中生成和表征BioID 融合蛋白以稳定表达细胞系;(2)使用该细胞系用于大规模 BioID pull down并通过质谱鉴定蛋白质候选物。BioID 技术的操作主要包括以下流程:(1)构建BioID融合蛋白的表达载体,稳定表达融合BirA的目的蛋白;(2)在特定条件下添加生物素诱导,生物素化目的蛋白附近的蛋白;(3)提取总蛋白并将其与链霉亲和素磁珠结合孵育,富集被生物素化的蛋白;(4)利用Western-blot以及质谱分析的方法,对富集到的生物素化蛋白进行鉴定[13]。
2 BioID在肿瘤蛋白质组学中的应用
BioID技术通过BirA*形成融合蛋白来鉴定蛋白相互作用,而蛋白相互作用在肿瘤等疾病的发生过程中也是时刻存在的,利用BioID技术对肿瘤发生过程中的蛋白进行标记,再结合高分辨质谱技术,就有可能找到相关的靶点蛋白,解释肿瘤发生的机制。因此,BioID技术逐渐被应用于肿瘤机制的研究及药物靶点的筛选。
Ras蛋白是Ras基因表达产物,分子量为21kDa,属于单体GTP结合蛋白,具有GTPase活性。野生型Ras受到机体严格的调控,其与GTP结合时为活性状态,而与GDP结合时为非活性状态,形成一种动态平衡,但平衡会被Ras的突变所打破。在大约三分之一的人类癌症中发现了三种主要Ras亚型HRAS、NRAS和KRAS的突变,但由于Ras的结构和复杂的调控机制,靶向治疗仍然是一个挑战[14]。以往的蛋白质组学分析受到实验工具的限制,无法捕捉Ras在细胞中相互作用的动态过程及瞬态性质。Kovalski等人[15]将BioID技术与CRISPR筛选相结合,鉴定Ras依赖癌细胞生长所需的Ras近端蛋白质。该实验对野生型Ras蛋白和三种突变型Ras蛋白均进行了BioID实验,将BirA*与野生型Ras蛋白及三种突变型Ras蛋白融合,通过质谱分析鉴定出了690个Ras近端蛋白,其中150个蛋白在3种Ras突变型中均存在,进而确定了活性Ras和mTOR复合物2(mTORC2)之间的相互作用,活性Ras能刺激mTORC2激酶活性。Ras-mTORC2相互作用激活下游促增殖转录程序,促进Ras依赖性肿瘤在体内的生长。
正常B细胞发育所必需的转录因子经常在B系急性淋巴细胞白血病(B-ALL)中发生突变,其中突变频繁的蛋白质包括转录因子PAX5,这些突变通常导致转录因子功能的部分丧失。虽然PAX5的功能与人类恶性肿瘤有明显的关系,但是没有足够的证据表明PAX5的杂合子缺失对B细胞祖细胞的发育和功能有显著影响,因此PAX5可能是B-ALL靶向的转录因子网络的一个组成部分[16]。Okuyama等[17]为了研究与PAX5相关的功能网络,他们使用BioID技术在活细胞中分离与该转录因子相关的蛋白质,将生物素连接酶BirA*与PAX5融合,融合蛋白在小鼠Abelson病毒转化的Pre-B细胞系中表达,通过质谱鉴定出239种蛋白质,其中几种蛋白在人类B-ALL中发生了突变,包括IKZF1和RUNX1,通过BioID与ChIP-Seq两种方法的应用证明了PAX5是淋巴白血病靶向功能性转录因子网络的一部分,经常被B-ALL中的多个突变所靶向,从而揭示白血病细胞中的分子相互作用。
作为去泛素酶,泛素羧基端水解酶UCH-L1属于UCH亚家族,主要在脑组织中表达,在其他组织中的表达水平较低,但在一些癌症中发现了UCH-L1的过度表达,比如骨髓瘤、前列腺癌及神经母细胞瘤等[18]。然而,UCH-L1在乳腺癌侵袭中的作用尚不清楚。Luo Y等人[19]研究发现UCH-L1在具有更高侵入能力的癌细胞中表达水平显著增高。虽然异位UCH-L1表达未能改变MCF-7(人乳腺癌)细胞中的细胞增殖,但它引起细胞侵袭的能力显著上调。此外,siRNA介导的UCH-L1敲低导致UCH-L1过表达MCF-7细胞的侵袭抑制。为了研究这些观察结果的分子机制,Luo Y等人通过BioID技术将BirA*与UCH-L1蛋白的N-末端融合,形成融合蛋白BirA*-UCH-L1,然后,我们在MCF-7细胞中表达了BirA*-UCH-L1,通过质谱鉴定显示UCH-L1可以与MCF-7细胞中的Akt相互作用。用His标记的重组UCH-L1蛋白和MCF-7细胞裂解液进行pull down实验进一步证明UCH-L1优先结合Akt2用于Akt的活化。该实验证明UCH-L1的过表达导致Akt的激活,也表明UCH-L1能促进乳腺癌细胞的侵袭,因此可以作为治疗乳腺癌的潜在治疗靶标。
肺癌是导致全球癌症死亡的主要因素之一,鳞状细胞癌(SQCC)是肺癌中比较常见,属于非小细胞肺癌的一种。SQCC被认为起源于支气管基底细胞,通过吸烟引起的损伤反应导致该干细胞群体发生增生性鳞状病变。经实验统计证明,在94%的SQCC中3q26-28区域中SOX2的拷贝数增加,并通过稳定干细胞的初始鳞状损伤反应和促进浸润性癌的生长在疾病进展的早期和晚期起作用[20]。因此抗SOX2靶向策略可以帮助治疗鳞状细胞癌,Kim等人[21]使用BioID技术表征体内SOX2的相互作用组,以期找出能够间接干扰SOX2活性的新策略。该方案确定了82个高丰度的SOX2互动蛋白,随后在基底细胞和SQCC中都验证了SOX2与共激活因子EP300的相互作用,证明了EP300对于基底细胞中的SOX2活性是必需的,EP300拷贝数在SQCC中也是增加的,因此EP300可以作为治疗鳞状细胞癌的潜在治疗靶标。
3 结束语
自BioID技术问世以来,其在PPI的鉴定中广泛应用,也为肿瘤等疾病机制的研究和药物靶点的发现提供了一种新的方法。BioID的优势在于它能够识别与目标蛋白质间接或弱相互作用的蛋白质,实现蛋白质相互作用中動态过程及瞬时相互作用的鉴定。重要的是,这种方法的应用非常简单,输出信息丰富。但BioID技术也存在一些不足:(1)在BirA*的标记范围内,位于目的蛋白附近的蛋白质都会被生物素化而被鉴定出来,这是一种非特异性的标记,可能会产生阴性结果,某些候选蛋白与目的蛋白之间并不存在相互作用;(2)通过BioID和质谱方法鉴定出的候选蛋白的丰度不能代表候选蛋白与目的蛋白生物相关性的强弱;(3)BirA*本身具有一定的尺寸大小,可能会影响一些分子质量较少的目的蛋白的功能及定位。2017年Munter等人[22]提出了Split-BioID,该方法将BirA*分成两个片段,N端的BirA*和C端的BirA*,它们单独存在时并不能发挥功能,但将N-BirA*和C-BirA*分别与两个目的蛋白融合,当这两个融合蛋白质因为相互作用而靠近时,N-BirA*和C-BirA*才能形成有功能的完整的BirA*,从而可以特异性地标记目的蛋白复合物的相互作用蛋白。该方法将蛋白质片段互补技术与BirA*邻近标记技术结合,有效解决了BioID非特异性标记的问题。2018年Stewart等人[23]开发了一种新型的双组分BioID技术(2C-BioID)用于鉴定蛋白质的相互作用,先将生物素蛋白连接酶与目标蛋白分开表达,然后通过添加诱导二聚化试剂诱导二聚化形成BirA*与目标蛋白的复合体,达到标记邻近相互作用蛋白的目的。在该方法中,将未诱导聚合样品同样进行蛋白质组学分析,作为整个方案的对照组,来消除假阳性率,提高BirA*标记的特异性。随着BioID技术不断的改进与优化,BioID技术将广泛应用于蛋白质相互作用的鉴定、肿瘤机制的研究及药物靶点的筛选中。
参考文献:
[1]Ngounou Wetie A G, Sokolowska I, Woods A G, et al. Investigation of stable and transient protein-protein interactions: Past, present, and future[J]. Proteomics, 2013,13(3-4):538-557.
[2]Mehla J, Caufield J H, Uetz P, et al. The yeast two-hybrid system: a tool for mapping protein-protein interactions[J]. Cold Spring Harbor protocols, 2015:425-430.
[3]Puig O, Caspary F, Rigaut G, et al. The Tandem Affinity Purifica- tion(TAP)method:a general procedure of prot ein complex purifica- tion[J]. Method, 2001,24:218-229.
[4]Rees J S., Li X W, Perrett S, et al. Protein neighbors and proximity proteomics[J]. Mol. Cell. Proteomics, 2015,14:2848-2856.
[5]Parrott M B, Barry M A. Metabolic biotinylation of secreted and cell surface proteins from mammalian cells[J]. Biochem Biophys Res Commun, 2001,281:993-1000.
[6]Roux K J, Kim D I, Raida M, et al. A promiscuous biotin ligase fusion protein identifies proximal and interacting proteins in mammalian cells[J]. J. Cell Biol., 2012,196:801-810.
[7]de Boer E, Rodriguez P, Bonte E, et al. Efficient biotinylation and single-step purification of tagged transcription factors in