基因编码非天然氨基酸技术及其在生物医学领域的应用
2022-09-07朱银雪王德祥陆文捷郝海平
朱银雪,王德祥,孔 影,陆文捷,叶 慧,郝海平
(中国药科大学药物代谢动力学重点实验室,南京 210009)
蛋白质是生命活动的基础,参与生命体内运输、催化、调节等多种过程,而这些生物学功能与蛋白质的序列密切相关。为了探究蛋白质的序列与功能的关联,将特定的氨基酸定点突变成其他氨基酸,研究蛋白质相应的功能改变,是研究该问题的经典手段[1-2]。但是,氨基酸的突变通常局限于20 种常用的氨基酸,而天然氨基酸自身携带的功能基团有限,难以满足改变、甚至赋予蛋白质以更加丰富的、多样的生物学功能的需求[3-4]。
近年来,通过基因密码子拓展技术,向蛋白质中引入非天然氨基酸,赋予目标蛋白以新的生物学功能的研究取得了重要进展[5]。基因编码的非天然氨基酸种类繁多,携带的官能团包括烯基、卤代烷烃、磺酰基、炔基、叠氮、醌甲基、喹啉基、磷酸基、乙酰基等[6]。这类化学基团能够通过亲核取代、光激活、点击化学等多种反应赋予蛋白质以新的特性,帮助阐明蛋白质及其特定结构域和位点的理化性质和生物学功能。现有的非天然氨基酸已被编码插入不同类型的活细胞(比如大肠埃希菌、酵母、哺乳细胞等[7-9])中,可用于增加靶蛋白的光、热稳定性,定位蛋白质在体内的分布,揭示未知的蛋白质-蛋白质相互作用,研究翻译后修饰对蛋白质功能的调节等[10-11]。值得一提的是,向目标蛋白质位点特异性地引入含有化学反应性或光激活交联基团的非天然氨基酸能够使得目标蛋白与其相互作用的靶标蛋白在互作区域形成共价键,从而获得与靶标蛋白亲和力更强的类似物,在生物药物研发领域具有极大的转化价值。这是由于相较于传统的小分子,高反应活性的共价生物药物对靶标蛋白具有更高的选择性,能够显著降低脱靶的副作用[12-13],为具有明确结合靶标的生物药物设计带来了新的机遇。
目前已有超过200 种非天然氨基酸能够通过基因密码子拓展技术引入到蛋白质中[14-15]。本综述根据其结构和功能大致分为4 类(图1):化学反应型(1 ~ 10)、光交联型(11 ~ 16)、荧光标记型(17 ~ 19)以及翻译后修饰型(20 ~ 21),并举例说明了基因编码的非天然氨基酸如何改变蛋白质的生物学活性及其在生物医学领域中的应用。
图1 基因编码的非天然氨基酸的分类及结构示意图
1 基因密码子拓展技术
基因密码子扩展技术指的是利用生物正交的氨酰tRNA 合成酶和tRNA 分子对,将非天然氨基酸定点插入到蛋白质中的技术。该技术首先通过进化出特异性识别非天然氨基酸的氨酰-tRNA 合成酶和正交的tRNA,合成出结合了非天然氨基酸的氨酰化tRNA,随后,该氨酰化tRNA 识别mRNA上的无义密码子,在目标蛋白质的特定位点插入非天然氨基酸[5](图2)。
图2 基因密码子拓展技术示意图
2 化学反应型非天然氨基酸
将化学反应型非天然氨基酸引入目标蛋白质能调控目标蛋白与其互作蛋白的亲和力,影响互作介导的信号传递,具有转化为治疗疾病的生物药物的潜力,并且能够用于揭示未知的蛋白质互作关系。常规的化学交联剂多依赖于与靶标蛋白的氨基酸的氨基、巯基等活性基团发生反应。这种非特异性的交联作用会导致目标蛋白产生脱靶并结合其他蛋白的风险;使用邻近激活的非天然氨基酸则能够保证只有当靶蛋白的特定区域与插入了非天然氨基酸的目标蛋白足够接近时,才会触发共价交联反应。这种赋予目标蛋白共价结合靶标蛋白能力的基因编码非天然氨基酸的技术在蛋白质药物研发方面已经展现出巨大的转化潜力。
2.1 靶向半胱氨酸
Xiang 等[16]首次将非天然氨基酸Ffact(p-2′-fluoroacetylphenylalanine)(1)引入ZSPA拟抗体(affibody)蛋白,利用弱亲电性的C 原子与邻近的强亲核性半胱氨酸的亲核取代反应(图3),在体外实现对Z 蛋白的共价交联。此外,Ffact还被引入哺乳细胞的1 型促肾上腺皮质激素释放因子受体(corticotropin-releasing factor receptor type 1,CRF1R)中,用于研究CRF1R 与内源性配体尿皮质素蛋白质复合物的拓扑结构,为理解受体的活化机制提供了独特的结构信息,有助于针对CRF1R的药物设计[17]。
图3 非天然氨基酸Ffact靶向半胱氨酸的反应示意图
为了得到可调控的半胱氨酸反应性的非天然氨基酸,一系列含有不同卤素原子与不同长度脂肪链的卤代烷类非天然氨基酸Haloalkane Uaas(unnatural amino acids)(2)被设计出来。这些卤代烷非天然氨基酸能够与目标半胱氨酸残基形成距离远超过天然二硫键的共价键,其稳定性也超过天然的二硫键,显著提升了蛋白质的稳定性,为蛋白质的结构研究和蛋白质工程提供了多样性[18]。Yang等[19]在卤代烷类非天然氨基酸的基础上引入了生物正交反应性的炔烃基团,获得了EB3(3)。以Z蛋白和拟抗体为模型,发现通过EB3交联的肽段可借助点击化学反应进行富集,富集后的交联肽段的质谱响应比未富集的质谱响应提高了近30倍,提示EB3 有助于提高基于质谱检测的交联蛋白、肽段的灵敏度和准确性。该方法已成功运用于捕获微弱、瞬时以及未知的蛋白质的相互作用,已识别出泛素结合酶(ubiquitin conjugating enzyme E2 D3,UBE2D3)与增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)的弱相互作用,并鉴定出71 个与硫氧还蛋白-1(thioredoxin-1,Trx1)具有相互作用而未见报道的蛋白质。
2.2 靶向赖氨酸
部分靶蛋白的结合界面或位点缺乏可供反应的半胱氨酸,为实现共价结合这类靶标蛋白,Furman等[20]设计了3 种能与赖氨酸发生迈克尔加成反应 的 非 天 然 氨 基 酸AcrK(Nε-acryloyl-(S)-lysine)、AcrF(p-acrylamido-(S)-phenylalanine)和VSF(p-vinylsulfonamido-(S)-phenylalanine)(4~6)。以ErbB2(receptor tyrosine kinase 2)抗原结合片段-受体为例,研究发现当ErbB2抗原结合片段插入了含有乙烯基磺酰胺的VSF 后,能够在生理条件下与ErbB2 受体的赖氨酸发生高效的交联,进而干扰ErbB2 受体的二聚化,诱导抗体依赖的细胞毒性作用,干扰细胞增殖,发挥抑制肿瘤生长的作用。此外,Xuan 等[21]利用芳香基异硫氰酸酯合成了非天然氨基酸pNCSF(para-isothiocyanate phenylalanine)(7),可以在温和的条件下与赖氨酸的侧链氨基发生亲核加成反应(图4),亦能高效地形成蛋白质的分子间、分子内的交联。
图4 非天然氨基酸pNCSF靶向赖氨酸的反应示意图
2.3 靶向多种氨基酸
鉴于部分靶标蛋白质参与结合的位点不含有半胱氨酸和赖氨酸,因此研究能够靶向多种氨基酸的非天然氨基酸具有重要价值。Xuan等[22]设计出携带芳基氨基甲酸盐基团的非天然氨基酸FPheK(8),具有交联邻近的赖氨酸、半胱氨酸以及酪氨酸的能力。然而,FPheK需要在碱性条件下与赖氨酸、酪氨酸反应,并且具有中度至重度的细胞毒性,因此主要适用于体外实验。Wang 等[23-24]通过将芳基氟硫酸盐基团引入到酪氨酸和赖氨酸的侧链,设计出基于硫(Ⅵ)-氟置换反应与邻近的赖氨酸、组氨酸以及酪氨酸反应的非天然氨基酸FSY(fluorosulfate-L-tyrosine)和FSK(fluorosulfonyloxybenzoyl-L-lysine)(9 ~ 10)。这类非天然氨基酸没有明显的细胞毒性,具有广泛应用到活细胞的潜力。此外,相比于FSY,FSK 具有更长且柔韧的侧链,增加了交联邻近蛋白质的可能性。Li 等[25]将FSY 引入人类程序性细胞死亡蛋白-1(human programmed cell death protein-1,PD-1),发 现PD-1(FSY)能够共价结合人类程序性细胞死亡-配体1(human programmed cell death 1 ligand 1,PD-L1),阻断PD-L1/PD-1 的结合和信号通路的激活,逆转肿瘤细胞对T 细胞的免疫抑制作用,促进T 细胞增殖并增强细胞因子的释放,更加有效地杀伤肿瘤细胞(图5)。该研究提示:应用基因编码的非天然氨基酸技术可以将各种生物药物与靶标蛋白的非共价亲和作用转化为共价结合,增强常规生物药物的治疗效果。
图5 共价生物药物PD-1(FSY)抑制肿瘤生长的原理图
3 光交联型非天然氨基酸
通过向基因编码的非天然氨基酸引入光激活基团与邻近氨基酸残基产生反应,能够实现光控的交联反应的发生,可用于捕捉瞬时、动态变化的蛋白质相互作用,有助于生物过程的研究和可控的药物设计(图6)。
图6 残基非选择性的(A)和残基选择性的(B)光交联非天然氨基酸的结构和反应示意图
3.1 残基非选择性的光交联非天然氨基酸
芳基叠氮化物是应用最广泛的光交联剂。Chin 等[26]通过对詹氏甲烷球菌的酪氨酰tRNA 合成酶进行突变,筛选出一种新的正交氨酰tRNA 合成酶/tRNA 对,能选择性地将非天然氨基酸AziF(p-azido-L-phenylalanine)(11)引入到蛋白质中,获得产率较高的重组蛋白。目前已成功运用于谷胱甘肽-S-转移酶(glutathioneS-transferase,GST)二聚体拓扑结构的研究。此外,Chin 等[27]将另一种非天然氨基酸pBpa(p-benzoyl-L-phenylalanine)(12)基因编码至大肠埃希菌表达的蛋白质中,利用pBpa的二苯甲酮基团共价交联邻近的氨基酸残基,拓展了光交联反应性非天然氨基酸的多样性。Hino 等[28]将pBpa 引入生长因子受体结合蛋白2(growth factor receptor-bound protein 2,Grb2)的SH2 结构域,并在中国仓鼠卵巢(Chinese hamster ovary,CHO)细胞中进行表达。在波长365 nm紫外光照射下,Grb2-pBpa 成功交联了表皮生长因子受体(epidermal growth factor receptor,EGFR)以及内源性酪氨酸激酶受体ErbB2,充分证明了pBpa 在研究体外、体内蛋白质间相互作用的价值。
上述两种以苯丙氨酸为模板衍生的非天然氨基酸,其光激活基团与蛋白质的骨架距离较短,只能在较近的范围共价交联相互作用的蛋白质。基于该局限,Yanagisawa等[29]设计并合成了一种赖氨酸 衍 生 物TmdZLys(Nε-[((4-(3(trifluoromethyl)-3H-diazirin-3-yl)benzyl)oxy)carbonyl]-L-lysine)(13),其双吖丙啶基团与Cα的距离为15 Å,而pBpa与Cα距离仅为7.9 Å。以Grb2为模型蛋白,发现插入TmdZLys 后,Grb2 可以共价交联EGFR的103 ~106 和112 位点,而插入pBpa的Grb2 仅能与上述位点形成弱交联甚至无交联。TmdZLys 这种长侧链的非天然氨基酸增加了蛋白质之间交联的机会,有助于识别蛋白质更广泛的结合伴侣。因此,不同长度的交联剂能够相互补充,共同勾勒出蛋白质相互作用的拓扑结构。
3.2 残基选择性的光交联非天然氨基酸
上述传统的光交联非天然氨基酸对邻近的氨基酸残基不具有选择性,最近发展起来的残基选择性的光交联非天然氨基酸则能与特定氨基酸残基发生光交联反应。Tian 等[30]报道了系列的2-芳基-5-羧基四唑-赖氨酸类似物,其中含有甲基吡咯四唑基团的类似物mPyTK(N-methylpyrroletetrazole-lysine)(14)在紫外光激发后生成的羧腈亚胺可与邻近谷氨酸的羧基反应。因此,当mPyTK被引入哺乳细胞的Grb2 中,能够通过光控瞬时交联其相互作用的蛋白EGFR。此外,Hu 等[31]设计合成了邻硝基苯甲醇类赖氨酸衍生物o-NBAK(o-nitrobenzyl alcohol derived lysine)(15),发 现o-NBAK 经过光异构化生成芳基亚硝基中间体后,能选择性地与邻近的赖氨酸交联,并用于捕获酶与底物蛋白之间的相互作用。
上述两种残基选择性的光交联非天然氨基酸仅能与特定氨基酸残基反应,限制了其靶向蛋白质的范围。Liu 等[32]设计出FnbY((2R)-2-amino-3-fluoro-3-(4-((2-nitrobenzyl)oxy)phenyl)propanoic acid)(16),通过光激活生成的甲基活性醌可共价交联体内9 种天然氨基酸残基。以大肠埃希菌中的GST 为模型,在103 位点插入FnbY 后,发现GST除了与其二聚体界面邻近的107位赖氨酸反应,还与亲核性的组氨酸、酪氨酸、半胱氨酸、色氨酸、甲硫氨酸、精氨酸、谷氨酰胺以及天冬酰胺反应。与传统的光交联非天然氨基酸生成的反应中间体普遍具有纳秒至微秒级别的半衰期相比[33-34],甲基活性醌半衰期可达到秒级别[35-36],大大提高了蛋白质的交联效率。FnbY的这一特性有助于实现活细胞中目标蛋白的高效共价交联,在化学生物学、生物疗法和蛋白质工程方面具有应用价值[37]。
这类光交联非天然氨基酸借助瞬时控制以及不同的残基反应性,为研究时间分辨的蛋白质-蛋白质相互作用奠定基础,对理解生物学过程和开展转化蛋白质相互作用为共价蛋白质药物的研究具有推动作用。
4 荧光标记型非天然氨基酸
对蛋白质的荧光标记有助于探索生物大分子在细胞环境中的动态过程,实现细胞内生理过程的可视化。Chatterjee 等[38]报道了一种带荧光基团的非天然氨基酸Anap(3-(6-acetylnaphthalen-2-ylamino)-2-aminopropanoic acid)(17),可借助常规的荧光显微镜观察基因编码Anap的蛋白质的荧光强度,已成功用于定位哺乳细胞中表达的组蛋白H3。Charbon 等[39]以香豆素为原型,设计了非天然氨基酸CouAA(coumarin-derived amino acid)(18),以FtsZ 蛋白为模型,发现带荧光的CouAA 能够在不影响FtsZ 蛋白功能的基础上,确定FtsZ 蛋白的亚细胞定位。
基因密码子拓展技术除了可以引入本身带有荧光基团的非天然氨基酸,还可以位点特异性地插入携带点击化学基团的非天然氨基酸,再通过点击化学反应引入荧光基团。例如,Jagadish 等[40]将携带叠氮基团的非天然氨基酸AziF(11)引入环肽MCoTI-I 中,利用叠氮与带有荧光基团的二苄基环辛炔(dibenzylcyclooctyne,DBCO)的衍生物进行环加成反应,使得环肽携带荧光,用于后续研究活细胞中环肽与蛋白质的相互作用。Alamudi 等[41]对荧光探针做了筛选优化,根据探针脂溶性、水溶性以及范德华表面积电荷确定探针的细胞通透性和非特异性结合的强弱,最终选择分别含有环辛炔、叠氮化物基团的BODIPY 探针CO-1 和AzG-1,分别用于标记活细胞中插入了AziF(11)和CoK(Nε-(cyclooct-2-yn-1-yloxy)carbonyl)L-lysine)(19)的靶蛋白,并进行活细胞成像。
5 翻译后修饰型非天然氨基酸
翻译后修饰是调控蛋白质功能的关键要素之一,影响着细胞中基因转录、增殖、信号转导、免疫调控等生命过程。因此,翻译后修饰的水平和失调与多种疾病密切关联[42-44]。基因密码子拓展技术通过向目标蛋白质定点的引入翻译后修饰及其模拟物,有助于阐明翻译后修饰诱导的底物蛋白发生的结构和功能的变化。针对最重要的翻译后修饰之——蛋白质磷酸化,Hoppmann 等[45]通过基因编码引入pTyr(phosphotyrosine)的类似物(20),通过酸处理切除保护基团,高效地获得特定位点酪氨酸磷酸化的目标蛋白质。聚丙烯酰胺凝胶电泳以及质谱数据证明了该方法成功地向钙调蛋白和绿色荧光蛋白位点特异性地引入了pTyr。此外,向泛素中59位酪氨酸引入磷酸化后,发现该位点与51 位谷氨酸的氢键被破坏,从而影响了Tyr59-Glu51环区,引起泛素的构象改变,降低其与UBE2D3 结合的能力,揭示了泛素的59 位酪氨酸磷酸化在泛素化过程中的负性调节作用。
由于体内存在多种移除翻译后修饰的酶,Venkat 等[46]设计出一种有效模拟赖氨酸乙酰化、同时不能被去修饰酶识别的乙酰化赖氨酸类似物——硫代乙酰化赖氨酸TAcK(Nε-thioacetyl-Llysine)(21)。以苹果酸脱氢酶为模型,研究人员发现插入TAcK的苹果酸脱氢酶可以被乙酰化赖氨酸的特异性抗体所识别,并且其酶活性与乙酰化形式相似。同时,该修饰不会被去乙酰化酶移除。
目前,赖氨酸泛素化、脂酰化、丝氨酸磷酸化等修饰皆通过基因密码子拓展技术被设计和引入到目标蛋白质中[47-50],成为揭示翻译后修饰调控蛋白质的有力工具。但是,复杂的翻译后修饰的合成和插入仍旧充满挑战,最著名的例子是糖基化修饰。糖基化是最重要和复杂的蛋白质翻译后修饰之一,也是影响抗体药物的稳定性、安全性和生物活性的重要因素。我们期待在不久的将来能够实现定点引入糖基化修饰,生成均一性修饰的蛋白质,用于生物药物的药学性质的理性设计和优化。
6 结 论
非天然氨基酸通过引入反应性基团、荧光基团和翻译后修饰基团等,赋予了蛋白质新的特性。其中,化学反应型和光交联型的非天然氨基酸借助反应性官能团与邻近氨基酸残基发生共价结合,可用于靶向目标蛋白结合的靶标蛋白,不仅具有发现目标蛋白的新互作伴侣、阐明生物学过程的潜力,还能够用于构建具有共价结合靶标蛋白能力的目标蛋白的衍生物,从而转化开发出新的生物药物。荧光标记型和翻译后修饰型非天然氨基酸则为阐明蛋白质的功能提供了新的手段。根据研究的科学问题,多种非天然氨基酸被不断的优化、改进和创新。我们期待基因密码子拓展技术与不同性质的非天然氨基酸的融合能够用于设计出丰富多样的生物大分子,为生物疗法、生物学研究和蛋白质工程等多个领域带来重要的突破。