融合标签在蛋白质可溶性表达中的应用进展
2014-06-11吴珊珊朱芸陈珊珊何冰芳
吴珊珊,朱芸,陈珊珊,何冰芳
(南京工业大学生物与制药工程学院,江苏 南京 211816)
随着基因组学、蛋白组学以及生物信息学迅速发展,重组蛋白技术日渐成熟,重组蛋白已广泛应用于生物、医药等领域。然而,大规模生产性状确切的活性蛋白仍是重组蛋白技术中的瓶颈问题。重组蛋白质异源表达中有超过半数以上是以包涵体形式存在的。使用真核表达体系如酵母、昆虫、哺乳类动物细胞表达体系是一种通用的解决方法,但是过程繁琐,周期较长。而大肠杆菌以其背景清晰、生长快速、表达量大,易于操作仍为最常用的宿主。采用低温诱导表达重组蛋白可以减少包涵体的形成,但是很多情况下并不适用。20世纪末,融合标签技术的兴起为重组蛋白质的生产带来了福音。新融合标签的开发和利用使融合标签技术不仅局限用于蛋白质的纯化和检测,而且在提高重组蛋白质的可溶性表达中得到广泛应用。
融合标签能增加重组蛋白表达量或在蛋白质折叠过程起作用,增强重组蛋白质的可溶性表达[1],这些融合标签大多是蛋白质,仅有少数是多肽片段(见表1)。研究表明某些高度可溶的蛋白质在与其它易形成包涵体的蛋白质融合后会促进融合蛋白质以可溶形式表达,这类蛋白主要有谷胱甘肽S-转移酶(GST),麦芽糖结合蛋白(MBP),硫氧还蛋白A(TrxA),转录终止抗终止因子(NusA),蛋白二硫键折叠异构酶(DsbA)等(表1)。GST和MBP是发展最早的融合标签,1988年 Smith等[2]和Duplay等[3]分别使用GST和MBP融合表达重组蛋白并使用亲和层析实现一步纯化。后续研究表明GST提高重组蛋白溶解性能力有限,导致不溶性的因素尚不清楚,而不溶性的蛋白融合 MBP后常以可溶形式表达[4]。研究者在平行比较中发现,大多数情况下,MBP提高重组蛋白溶解性能力是最强,NusA与 MBP提高溶解性能力相当[5-6],有些研究认为 TrxA也具有相当的提高重组蛋白溶解性的能力[5]。另外,对于一些含有二硫键的蛋白, DsbA能够发挥很好的作用[1]。
近几年来一些新的提高重组蛋白溶解性的融合标签崭露头角。2004年,Malakhov等[7]研究发现SUMO(泛素相关小修饰蛋白)能够促进蛋白正确折叠和结合稳定,从而提高蛋白溶解性。虽然SUMO不能作为纯化标签一步纯化,但是其优势在于它本身是一个专一性的蛋白酶,能将SUMO标签除去。Invitrogen公司在2004年开发了一种新型的增强可溶性表达的多肽标签(SET),该标签可能是通过静电排斥来防止新生多肽相互聚集[8]。同样通过静电排斥作用的超酸性融合标签(yjgD,rpoD,和 msyB)被发现能作为分子内伴侣帮助蛋白质正确折叠,从而提高易发生聚集的牛肠激酶,烟草腐蚀病毒蛋白酶等蛋白溶解性[9]。另一值得注意的融合标签是Lee等[10]报道的大肠杆菌磷酸甘油酸酯激酶的N域,融合易发生聚集的乘客蛋白后融合蛋白的溶解性增加,切除该标签后乘客蛋白仍然表现出增强的可溶性。同年,Santner等[11]报道了以本质无序蛋白(intrinsically disordered proteins,IDPs)为基础的新型提高重组蛋白可溶性表达的标签。由于IDPs富含极性氨基酸,使得整个融合蛋白的可溶性氨基酸比例增加,同时蛋白之间形成间隙减少蛋白质的聚集。人工设计的具有IDPs特性的肽链表现出了比常用融合标签GST、MBP、NusA优秀或是相当的特性。该研究为开发设计提高重组蛋白溶解性融合标签提供了新方向。
表1 提高蛋白质产量和溶解性的融合标签
1 提高蛋白可溶性表达机理
蛋白质折叠是一个复杂的过程,尽管融合标签技术的研究有了很大的进展,但是融合标签在蛋白质折叠中的作用尚不明确[12-13]。目前对提高蛋白溶解性的机制已提出5种模型[12,14-15],从不同的角度阐述融合标签在蛋白折叠中的作用。但是这些模型仅能够解释某些特定的融合标签发挥作用的机制,并不适用于所有此类标签[12]。这可能由于不同的融合标签作用方式也有所不同,如MBP一般融合在N端才会很好地发挥作用,而SET-tag融合在C端才能起作用。
(1)“electrostatic shields”模型 通过带电载客蛋白间的静电排斥力减少乘客蛋白分子间的聚集[8],被称作“electrostatic shields”。这些标签通常带有很强的负电荷,如 Invitrogen公司开发的多肽标签 SET[8]以及一些超酸性融合标签(如 yjgD,rpoD,和msyB)[9,16-17],因其富含酸性氨基酸而带有大量负电荷,增加了新生肽之间的排斥力,使得蛋白与蛋白之间空间距离增大,聚集难以发生,从而使得乘客蛋白有足够的时间正确折叠。Su等[18]在比较一组特殊的蛋白质融合标签时发现蛋白酸度在增加目的蛋白溶解性中起着重要作用,酸性强的融合标签提高蛋白溶解性的能力也更强。其实,这类标签直接参与了帮助蛋白质正确折叠,也相当于具有一定的分子伴侣作用。
(2)“micelle”模型 融合蛋白因在细胞内形成以不完全折叠的以疏水性乘客蛋白为中心,亲水性载客蛋白包裹在外的微囊体(micelle)而表现为可溶性蛋白。亲水性载体蛋白保护疏水性乘客蛋白与溶剂接触,防止乘客蛋白的聚集,但是在切除标签后疏水性乘客蛋白是否能够正确折叠而具有活性是未知的。研究表明,人体乳头瘤病毒E6融合MBP表达形成了此类微囊体而以可溶性蛋白的形式表达[19],但是乘客蛋白人体乳头瘤病毒 E6并没有活性。
(3)“entropic-anchor”模型 载客蛋白作为一个锚定蛋白“entropic-anchor”,限制缓慢折叠的乘客蛋白运动,减少乘客蛋白的聚集,使乘客蛋白在适宜的熵环境下折叠[20]。根据此模型解释,融合在蛋白N端或C端所产生的熵作用应当相近因此提高蛋白可溶性表达作用也相近,然而,融合在蛋白的不同末端的作用效果往往有很大差异。因此,这种模型并不能很好的解释提高蛋白可溶性表达的机理。
(4)“chaperone magnet”模型 载客蛋白通过与分子伴侣相互作用,引导分子伴侣帮助乘客蛋白折叠,这种类似于磁体作用的融合标签被称作“chaperone magnet”。铁蛋白重链(FTN-H)含有特殊的序列能被分子伴侣DnaK识别并结合,从而引导DnaK帮助乘客蛋白折叠[21]。
(5)“Chaperone-like”模型 融合标签本身作为一种分子伴侣,与乘客蛋白作用。据报道麦芽糖结合蛋白(MBP)是一种分子伴侣型融合标签[14]。由图1所示,新生的融合蛋白其载客蛋白MBP已折叠而乘客蛋白未折叠,此时它有两种不同的去向,如果乘客蛋白形成天然构象,就产生可溶性的融合蛋白;或者,乘客蛋白不完全折叠自我聚集形成不溶性包涵体。折叠中间态去向在很大程度上取决于细胞内浓度,高浓度容易产生聚集形成包涵体;而单分子折叠通常发生在低浓度条件下。麦芽糖结合蛋白(MBP)结合乘客蛋白形成隔离折叠中间态,通过折叠中间态和隔离折叠中间态的动态平衡调整细胞内浓度,阻止蛋白分子的聚合。据报道 Trx等[7,13,22]也是作为分子伴侣帮助蛋白质正确折叠从而提高蛋白质的溶解性,目前研究表明此类作用机制的标签能够较好地促进蛋白质的可溶性表达[5-6]。
图1 MBP促进乘客蛋白正确折叠机制[14]
另外,mRNA的二级结构和蛋白质的翻译起始在蛋白质表达中起着至关重要的作用,mRNA形成的发夹结构使得核糖体无法结合到对应的 SD序列,从而减缓翻译起始速率。同时核糖体结合位点附近的 mRNA二级结构的稳定性使得蛋白质的表达量有很大差异[23]。融合标签通常是可溶性表达量较高的蛋白质或是多肽,核糖体能有效的结合其mRNA,因此重组蛋白N端加上融合标签有利于改变mRNA的二级结构使得核糖体能够高效结合,从而提高重组可溶性蛋白的产量。研究表明大多N端标签能增加重组蛋白的产量(见表1)。另一方面,N和C末端影响蛋白质的降解[24],融合标签也可以通过减少蛋白质降解而增加产量。
2 组合标签技术
单个融合标签很难满足大规模生产可溶性蛋白质过程中多方面的要求,组合标签能使融合标签技术发挥最大作用。组合纯化标签的使用极大地方便了许多没有亲和吸附能力或是亲和力较弱的增溶性标签(如TrxA,NusA,MBP)的纯化[25];融合蛋白包含抗原表位或是绿色荧光蛋白串联纯化标签His-tag常被用于评估重组蛋白的表达情况[26]。大分子晶体学实验室(NCI Frederick)[27],伯克利的结构基因组学中心[28]和真核生物结构基因组学中心常组合His-tag和MBP融合表达生产蛋白质。MBP提高重组蛋白的产量和溶解性,His-tag则方便纯化,融合蛋白通过两次固定化金属离子亲和层析纯化(IMAC)和带组氨酸标签的烟草蚀纹病毒蛋白酶(His6-TEV)酶切,最终得到高纯度的目的蛋白。这个系统避免了切除标签所使用的蛋白酶的污染(见图2)。
串联亲和纯化(TAP)是 1999年 Rigaut和Seraphin[29]开发了新型纯化系统,经过两步连续的亲和纯化得到更接近自然状态的蛋白复合物。TAP包含2个亲和标签,钙调蛋白结合肽(CBP)和蛋白A的IgG结合域(ProtA),中间由1个烟草蚀纹病毒(TEV)蛋白酶切位点连接。将目标蛋白与CBP端相连在细胞内融合表达在生理条件下目标蛋白和内源性与其相互作用的蛋白质形成复合体。首先使用免疫球蛋白 G(IgG)亲和柱分离纯化蛋白复合体,采用TEV蛋白酶切割标签获得含有CBP的目标蛋白复合体;再使用偶联钙调蛋白的亲和柱结合 CBP标签在过量螯合剂作用下纯化得到复合体进一步分析鉴定。TAP方法首先在酵母细胞中获得成功后迅速被应用到其他细胞和组织中。除了最早使用的 CBP-TEV-ProtA目前应用的串联亲和纯化标签还有S3S(串联S-tag和Strep-tagⅡ)和PTP(串联ProtC-TEV-ProtA)等[30]。
3 标签的去除
图2 使用融合标签His6-MBP表达蛋白的纯化原理图
表2 重组蛋白表达和纯化常用酶切位点和蛋白酶
融合标签可能会使蛋白质的结构和性质上产生某种不可预知的变化,因此,切除标签对保证蛋白质的性质是必要的。常用的蛋白酶有肠激酶、烟草蚀纹病毒蛋白酶(TEV)、SUMO蛋白酶、凝血酶等(如表 2)。蛋白酶的位点专一性不同,有些蛋白酶位点专一性高,而有些蛋白酶可能发生非特异性切割,酶切效率通常可以通过使用更多的酶或更长的时间或在蛋白酶识别位点添加多个丙氨酸来改进。一些高位点专一性的蛋白酶,如TEV和人鼻病毒蛋白酶(PreScission)很大程度上减轻非特异性问题。但是通常目的蛋白上会留下几个氨基酸残基。许多蛋白质要获得生物活性以及结构稳定性都需要特定的N端氨基酸,尤其是很多用于结构研究以及医疗用途的蛋白质。TEV的酶切位点左边的甘氨酸可以换成其他氨基酸,但是会导致切割效率下降。Xa因子(IEGR/)和肠激酶(DDDDK/)酶切能够形成蛋白质天然的N端结构,但是偶尔会在其他位置酶切[31-32]。在正确识别酶切位点的前提下,如何避免产生非天然N端氨基酸是很多蛋白酶使用过程中所面临的一个挑战。比起去除N端融合标签,C端标签问题更多。用来切除融合蛋白的所有蛋白酶的识别位点都在易于断开键的左边,因此切除C端标签后,仍会留下4~6个氨基酸残基。某些情况下,可以使用羧肽酶消化C端的短标签,但羧肽酶的序列专一性还有待进一步改进。Chong等[33]使用不需要蛋白酶参与的内含肽系统表达重组蛋白,在有二硫苏糖醇、β-巯基乙醇或半胱氨酸存在的条件下,能利用其可诱导的自切割活性将靶蛋白质从融合标签上切除,切除后形成的蛋白质不带有任何额外的非天然残基。另外还有泛素修饰蛋白质(SUMO)以及泛素融合系统(Ub)利用蛋白酶识别三级结构切割得到天然结构的蛋白。
4 结论与展望
融合标签技术的发展为可溶性蛋白质的生产包括一些难以表达的蛋白药物表达提供了便利,许多融合标签系统已作为实现可溶性表达和纯化的常用方法。尽管如此,融合标签的应用尚存在问题:①许多提高蛋白溶解性的融合标签只适用于某些蛋白,对于不同的蛋白,提高溶解性的能力也不同,目前很难准确地预测融合标签对某一易聚集的目的蛋白的作用,只有通过大量比较实验而选择,工作量较大;②许多融合标签功能单一,很难满足蛋白质大规模生产中多种需求;③融合标签增加可溶性表达的机理尚未完全了解,很难有目的性地开发,改造和选用融合标签。可以预见,在解决了以上 3个关键问题的基础上,人们将得到高效多功能的融合标签满足蛋白质的可溶性表达和纯化等多方面要求。这将为可溶性蛋白质的生产,特别是合成生物学的发展提供强大的支撑作用。因此开发高效的多功能融合标签,探究融合标签机理以及融合标签技术的改进已是迫在眉睫。作者实验室致力于开发新型的多功能融合标签,目前研究表明该标签具有提高蛋白可溶性表达的作用,并正对其纯化方法和作用机理进一步研究。
[1]Young C L,Britton Z T,Robinson A S. Recombinant protein expression and purification:A comprehensive review of affinity tags and microbial applications[J]. J. Biotechnol.,2012,7(5):620-634.
[2]Smith D B,Johnson K S. Single-step purification of polypeptides expressed in Escherichia coli as fusions with glutathione S-transferase[J]. Gene,1988,67(1):31-40.
[3]di Guan C,Li P,Riggs P D,et al. Vectors that facilitate the expression and purification of foreign peptides in Escherichia coli by fusion to maltose-binding protein[J]. Gene,1988,67(1):21-30.
[4]Dyson M R,Shadbolt S P,Vincent K J,et al. Production of soluble mammalian proteins in Escherichia coli:Identification of protein features that correlate with successful expression[J]. BMC.Biotechnol.,2004,4(1):32.
[5]Dummler A,Lawrence A M,de Marco A. Simplified screening for the detection of soluble fusion constructs expressed in E. coli using a modular set of vectors[J]. Microl. Cell Fact.,2005,4(1):34.
[6]Schrodel A,Volz J,de Marco A. Fusion tags and chaperone co-expression modulate both the solubility and the inclusion body features of the recombinant CLIPB14 serine protease[J]. J.Biotechnol.,2005,120(1):2-10.
[7]Malakhov M P,Mattern M R,Malakhova O A,et al. SUMO fusions and SUMO-specific protease for efficient expression and purification of proteins[J]. J. Struct. Funct. Genomics,2004,5(1-2):75-86.
[8]Zhang Y B,Howitt J,McCorkle S,et al. Protein aggregation during overexpression limited by peptide extensions with large net negative charge[J]. Protein Expr. Purif.,2004,36(2):207-216.
[9]Zou Z,Cao L,Zhou P,et al. Hyper-acidic protein fusion partners improve solubility and assist correct folding of recombinant proteins expressed in Escherichia coli[J]. J. Biotechnol.,2008,135(4):333-339.
[10]Song J A,Lee D S,Park J S,et al. The N‐domain of Escherichia coli phosphoglycerate kinase is a novel fusion partner to express aggregation‐prone heterologous proteins[J]. Biotechnol. Bioeng.,2012,109(2):325-335.
[11]Santner A A,Croy C H,Vasanwala F H,et al. Sweeping away protein aggregation with entropic bristles:Intrinsically disordered protein fusions enhance soluble expression[J]. Biochemistry,2012,51(37):7250-7262.
[12]Raran-Kurussi S,Waugh D S. The ability to enhance the solubility of its fusion partners is an intrinsic property of maltose-binding protein but their folding is either spontaneous or chaperone-mediated[J].PLOS ONE,2012,7(11):e49589.
[13]Nallamsetty S,Waugh D S. Solubility-enhancing proteins MBP and NusA play a passive role in the folding of their fusion partners[J].Protein Expr. Purif.,2006,45(1):175-182.
[14]Kapust R B,Waugh D S. Escherichia coli maltose-binding protein is uncommonly effective at promoting the solubility of polypeptides to which it is fused[J]. Protein Sci.,1999,8(8):1668-1674.
[15]Nallamsetty S,Waugh D S. Mutations that alter the equilibrium between open and closed conformations of Escherichia coli maltose-binding protein impede its ability to enhance the solubility of passenger proteins[J]. Biochem. Biophys. Res. Commun.,2007,364(3):639-644.
[16]Zou Z,Fan Y,Zhang C. Preventing protein aggregation by its hyper-acidic fusion cognates in Escherichia coli[J]. Protein Expr.Purif.,2011,80(1):138-144.
[17]Sangawa T,Tabata S,Suzuki K,et al. A multipurpose fusion tag derived from an unstructured and hyperacidic region of the amyloid precursor protein[J]. Protein Sci.,2013,22(6):840-850
[18]Su Y,Zou Z,Feng S,et al. The acidity of protein fusion partners predominantly determines the efficacy to improve the solubility of the target proteins expressed in Escherichia coli[J]. J. Biotechnol.,2007,129(3):373-382.
[19]Nomine Y,Ristriani T,Laurent C,et al. Formation of soluble inclusion bodies by HPV E6 oncoprotein fused to maltose-binding protein[J]. Protein Expr. Purif.,2001,23(1):22-32.
[20]Fox J D,Kapust R B,Waugh D S. Single amino acid substitutions on the surface of Escherichia coli maltose‐binding protein can have a profound impact on the solubility of fusion proteins[J]. Protein Sci.,2001,10(3):622-630.
[21]Ahn J-Y,Choi H,Kim Y-H,et al. Heterologous gene expression using self-assembled supra-molecules with high affinity for HSP70 chaperone[J]. Nucleic Acids Res.,2005,33(12):3751-3762.
[22]Jurado P,de Lorenzo V,Fernández L A. Thioredoxin fusions increase folding of single chain fv antibodies in the cytoplasm of Escherichia coli:Evidence that chaperone activity is the prime effect of thioredoxin[J]. J. Mol. Biol.,2006,357(1):49-61.
[23]Kudla G,Murray A W,Tollervey D,et al. Coding-sequence determinants of gene expression in Escherichia coli[J]. Science,2009,324(5924):255-258.
[24]Flynn J M,Neher S B,Kim Y I,et al. Proteomic discovery of cellular substrates of the ClpXP protease reveals five classes of ClpX-recognition signals[J]. Mol. Cell.,2003,11(3):671-683.
[25]Cabrita L D,Dai W,Bottomley S P. A family of E. coli expression vectors for laboratory scale and high throughput soluble protein production[J]. BMC Biotechnol.,2006,6(1):12.
[26]Liu H,Naismith J H. A simple and efficient expression and purification system using two newly constructed vectors[J]. Protein.Expr. Purif.,2009,63(2):102-111.
[27]Tropea J E,Cherry S,Nallamsetty S,et al. A generic method for the production of recombinant proteins in Escherichia coli using a dual hexahistidine-maltose-binding protein affinity tag[J]. Methods Mol.Biol.,2007,363(1):1-19.
[28]Nguyen H,Martinez B,Oganesyan N,et al. An automated small-scale protein expression and purification screening provides beneficial information for protein production[J]. J. Struct. Funct. Genomics,2004,5(1-2):23-27.
[29]Rigaut G,Shevchenko A,Rutz B,et al. A generic protein purification method for protein complex characterization and proteome exploration[J]. Nat. Biotechnol.,1999,17(10):1030-1032.
[30]Walls D,Loughran S T. Tagging recombinant proteins to enhance solubility and aid purification[J]. Methods Mol. Biol.,2011,681(9):151-175.
[31]Liew O W,Ching Chong J P,Yandle T G,et al. Preparation of recombinant thioredoxin fused N-terminal proCNP:Analysis of enterokinase cleavage products reveals new enterokinase cleavage sites[J]. Protein Expr. Purif.,2005,41(2):332-340.
[32]Jenny R J,Mann K G,Lundblad R L. A critical review of the methods for cleavage of fusion proteins with thrombin and factor Xa[J].Protein Expr. Purif.,2003,31(1):1-11.
[33]Chong S,Mersha F B,Comb D G,et al. Single-column purification of free recombinant proteins using a self-cleavable affinity tag derived from a protein splicing element[J]. Gene,1997,192(2):271-281.
[34]LaVallie E R,DiBlasio E A,Kovacic S,et al. A thioredoxin gene fusion expression system that circumvents inclusion body formation in the E. coli cytoplasm[J]. Biotechnology(N Y),1993,11(2):187-193.
[35]Davis G D,Elisee C,Newham D M,et al. New fusion protein systems designed to give soluble expression in Escherichia coli[J].Biotechnol. Bioeng.,1999,65(4):382-388.
[36]Sabin E A,Lee-Ng C T,Shuster J R,et al. High-level expression and in vivo processing of chimeric ubiquitin fusion proteins in Saccharomyces Cerevisiae[J]. Nat. Biotech.,1989,7(7):705-709.
[37]Chatterjee D K,Esposito D. Enhanced soluble protein expression using two new fusion tags[J]. Protein Expr. Purif.,2006,46(1):122-129.
[38]Zhang Y,Olsen D R,Nguyen K B,et al. Expression of eukaryotic proteins in soluble form in Escherichia coli[J]. Protein Expr. Purif.,1998,12(2):159-165.
[39]Thapa A,Shahnawaz M,Karki P,et al. Purification of inclusion body-forming peptides and proteins in soluble form by fusion to Escherichia coli thermostable proteins[J]. BioTechniques,2008,44(6):787-796.
[40]Carter P,Wells J A. Engineering enzyme specificity by“substrate-assisted catalysis”[J]. Science,1987,237(4813):394-399.
[41]Kapust R B,Tozser J,Fox J D,et al. Tobacco etch virus protease:Mechanism of autolysis and rational design of stable mutants with wild-type catalytic proficiency[J]. Protein Eng.,2001,14(12):993-1000.
[42]Cordingley M G,Callahan P L,Sardana V V,et al. Substrate requirements of human rhinovirus 3C protease for peptide cleavage in vitro[J]. J. Biol. Chem.,1990,265(16):9062-9065.
[43]Karpeisky M,Senchenko V N,Dianova M V,et al. Formation and properties of S-protein complex with S-peptide-containing fusion protein[J]. Febs. Letters,1994,339(3):209-212.