调控质粒拷贝数优化生物催化效率的研究进展
2024-04-03李业严豪刘梦婷白仲虎
李业,严豪,刘梦婷,白仲虎*
1(江南大学 生物工程学院,江苏 无锡,214122)
2(江南大学,粮食发酵工艺与技术国家工程实验室,江苏 无锡,214122)
3(清华大学,深圳国际研究生院生物医药与健康工程研究院,广东 深圳,518000)
质粒是细胞染色体外的双链闭合环状DNA分子,具有独立的自主复制能力,广泛存在于细菌和真菌。质粒本身在生物进化过程中发挥着作用[1]。作为载体,质粒被现代基因工程、合成生物学等领域利用来研究新基因的功能[2-3]。利用质粒作载体携带外源基因,通过转化的方法将其转入微生物细胞,相比将外源基因整合到宿主基因组来说更加便捷方便。大量研究发现,质粒在微生物宿主细胞内拷贝数与所携带基因的表达量关系密切[4-7],优化质粒拷贝数这一方法广泛在生物化工领域用于优化关键基因表达,提高生物催化效率[8]。基于天然质粒构建的优化体系存在诸多局限,近年来已有众多研究,利用前沿合成生物学手段构建出了更先进的质粒调控优化系统。为此,本文对调控质粒拷贝数优化生物催化效率展开综述,并探讨了通过合成生物学手段进一步优化系统的新研究方向。
1 质粒复制及拷贝数简介
质粒的复制大致包括复制起始、延伸和终止。复制的起始从复制起点 (origin of replication,replicon) 开始,涉及复杂的蛋白—蛋白、蛋白—DNA相互作用。不同的复制起点序列具有不同的序列结构特征。质粒复制的分子生物学机理已经研究的较为透彻,详见相关综述总结[9]。
质粒拷贝数是指每个微生物细胞中质粒相对于染色体的个数[10-11]。对于给定宿主、固定的生长条件,具有特定复制起点序列的质粒通常具有特征拷贝数(或一定拷贝数范围),这是特定质粒系统通过调节其复制相关元件来实现的。控制系统通过纠正单个细胞中平均拷贝数的偏差,将复制速率维持在稳定状态,进而决定了质粒拷贝数。相关研究表明,质粒复制起始起作用的负调节因子(抑制剂)参与此调控,主要调控机制包括:a)利用反义RNA (antisense RNA);b)利用转录抑制(transcription repression);c)利用复制起点上的迭代子序列(iterons)[12-13]。
质粒拷贝数可以利用基于荧光定量PCR (qPCR)的方法进行绝对定量[14]。拷贝数测量结果表明,可以将质粒大致划分为高拷贝质粒、低拷贝质粒、单拷贝质粒。a)高拷贝数质粒是指拷贝数较大的质粒,在每个细胞中可达到几十乃至上千份拷贝,其复制与宿主染色体不同步,仅与质粒本身复制子的控制有关,也称为松弛型复制控制的质粒[15]。高拷贝质粒一般用作表达目的基因的载体,因为高拷贝的基因通常能导致获得较高产量的目的基因产物[16];b)低拷贝数质粒是指拷贝数较低的质粒,少到在每个细胞中只有一到几份拷贝[17],与染色体的复制同步进行,受质粒本身复制子和宿主染色体的双重调控,也称为严谨型复制控制的质粒,在宿主细胞中表达效率较低,甚至可能导致质粒分配到子细胞失败[18],因而低拷贝质粒在实际应用中使用较少;c)单拷贝质粒的研究及应用很少。除此之外,宿主的不同、生长条件不同 (培养基成分、温度),也会影响质粒拷贝数[19-21]。
研究者们对模式原核生物大肠杆菌(Escherichiacoli)和模式真核微生物酿酒酵母 (Saccharomycescerevisiae)的质粒系统研究最为透彻。大肠杆菌及酿酒酵母常见的复制起点、质粒拷贝数以及常用质粒分别如表1及表2所示,其他非模式微生物的质粒系统常以它们为参照开发构建。
表1 大肠杆菌常见复制起点及拷贝数
表2 酵母常见复制起点及拷贝数
2 天然质粒系统在优化生物催化的应用
大量研究发现,质粒在宿主细胞内拷贝数与所携带基因的表达量关系密切[4-7]:一般来说,目的基因的表达量随重组质粒在宿主细胞中拷贝数的增加而提高,进而提高了目标蛋白的表达量。这种对应关系甚至在质粒拷贝数>300仍存在[9]。不过,当质粒拷贝数超过某个阈值,会严重影响系统稳定性,反而使得目标蛋白表达量及目标小分子化合物合成效率降低[22]。上述研究也表明,并非质粒(或目标基因)的拷贝数越高,生物催化的效率也越高。测定不同质粒拷贝数的影响(优化质粒拷贝数),是一种简单、有效且已经被广泛应用的优化生物催化效率的策略[8](表3)。
表3 优化天然质粒系统提高生物催化效率
2.1 调控质粒拷贝数原核系统生物催化
2.1.1 在大肠杆菌中调控质粒拷贝数的应用
腈水合酶是一类重要的金属酶,可以催化腈类化合物水合生成相应的酰胺,在合成酰胺已广泛应用。但是,目前腈水合酶的数量较少,催化效率低下[23]。为提高腈水合酶的表达量,史悦等[24]在大肠杆菌BL21(DE3)中利用质粒pET28a(+)异源表达诺卡氏菌来源的腈水合酶,比活性可高达450 U/mg,远高于野生诺卡氏菌,说明了异源多拷贝表达相比野生天然宿主表达具有明显优势。王丽燕等[25]在BL21(DE3)中表达Klebsiellaoxytoca来源的腈水合酶,考察了不同拷贝数质粒对腈水合酶表达的影响,发现蛋白浓度(g/L)和粗酶活力(U/L)随着拷贝数的提高具有增加。使用pCDFDuet或者pETDuet质粒(拷贝数15~20)比使用pACYCDuet质粒(拷贝数10~12) 单位蛋白的粗酶活力(U/g)也随质粒拷贝数增加而提高,但是使用高拷贝质粒pRSFDuet (拷贝数100~200) 却对提高酶表达效果并不明显。因此,优化质粒拷贝数是提高酶异源表达量的简单可行的办法。
脑钠肽(brain natriuretic peptide,BNP)在诊断心力衰竭、调节血压等方面有很大的医学作用,尤其是在诊断是否为心力衰竭患者方面,已成为公认的诊断心力衰竭的血浆标志物[26]。异源宿主表达是一种简便高效合成BNP的有效方法。易俊波等[27]在大肠杆菌DH5α和BL21(DE3)中利用质粒pCW111异源表达了BNP。作者在pCW111上分别克隆单个和两个BNP的基因表达盒。SDS-PAGE分析发现BNP的表达量随着目标基因拷贝数增加,菌体总蛋白占比从单拷贝的8.12%增加到两拷贝的9.94%,这也预示了利用多拷贝质粒进一步增加BNP的潜力。
紫黄素 (violaxanthin) 是一种存在于高等植物和微藻中重要的天然叶黄素,且被证实具有抗氧性、抗癌等生物活性,因而该物质在化妆品、药品等邻域具有潜在的应用[28]。紫黄素在微藻中的含量可变的,它会受到外部环境(如光照强度)的影响[29]。将合成紫黄素关键合成途径引入工程菌,通过代谢工程改造构建高产菌,则可以克服上述缺点。DONG等[30]发现尝试将催化合成紫黄素的玉米黄质环氧化酶(zeaxanthin epoxidase,ZEP)基因克隆到不同拷贝数的质粒上转入大肠杆菌表达,发现低拷贝质粒(pSC101 ori)效果最好,紫黄素产量相比用高拷贝质粒(pMB1 ori)提高了195%(图1)。该研究说明了并非质粒拷贝数越高目标产物产量越高,这可能跟高拷贝质粒引起的细胞负担有关[31]。
A-紫黄质合成途径;B-使用不同的质粒表达ZEP并应用于类胡萝卜素的合成
2.1.2 在谷氨酸棒杆菌中调控质粒拷贝数的应用
紫色杆菌素是一种蓝紫天然色素,具有抗肿瘤、抗致病菌等多种活性,在食品、印染、化妆品和医药行业都有重要的潜在应用价值[32]。产生该色素的天然菌种多为条件致病菌且难于培养,由于紫色杆菌素的前体物质为色氨酸,利用高产氨基酸的异源谷氨酸棒杆菌合成该色素成为一种很好的选择。卢丹妮等[33]在谷氨酸棒杆菌中构建了紫色杆菌素的合成途径。研究发现,基于pTET3的低拷贝重组质粒 (p15A复制子,拷贝数~6) 比基于pEC-XK99E的高拷贝重组质粒 (rep/ColE复制子,拷贝数~360)能够使谷氨酸棒杆菌生产紫色杆菌素的产量提高35.1%。该结果也可能跟前述高拷贝质粒引起的细胞负担有关。
血红蛋白广泛存在于大豆、玉米等植物中,该含有血红素的蛋白质可被用作颜色增强剂[34]、色素添加剂[35]等。植物血红蛋白在作为食品添加剂方面具有巨大的价值,且利用微生物可持续生产血红蛋白是一种有效途径。WANG等[36]在谷氨酸棒杆菌中实现了植物来源血红蛋白的高效合成。该研究者们对调控质粒拷贝数相关的起始蛋白编码基因copA进行了突变,获得了pXMJ19质粒拷贝数提高的突变体:copAC1033T,copAC1033 del,copAC1032A,copAC1033G,对应测定出的拷贝数分别为107、107、250、318;而表达野生copA时pXMJ19质粒拷贝数仅为11。蛋白表达实验表明,在一定范围内蛋白表达量与拷贝数呈正相关,当质粒拷贝数从11增加107,血红蛋白表达量增加约2倍,但继续增加质粒拷贝数反而导致产量下降。
2.2 调控质粒拷贝数在真核生物合成生物学中的应用
2.2.1 在酿酒酵母中调控质粒拷贝数的应用
三乙酸内酯 (triacetic acid lactone,TAL) 是一种简单的聚酮化合物,可在酵母中通过非洲菊III型2-吡喃酮合酶 (2-PS)从乙酰-CoA和丙二酰-CoA合成,被认为是一种可转化为多种高价值化合物的大宗化学品[37]。YOCUM等[38]通过酵母过氧化物酶体表面展示技术,将TAL合成相关3个酶锚定于细胞质一面,充分利用过氧化酶体流出的乙酰-CoA代谢流合成TAL。研究表明同时利用高拷贝质粒(2 μm)携带的自由酶加上低拷贝质粒(CEN/ARS4)携带的锚定酶,比仅利用高拷贝自由酶或者低拷贝锚定酶,TAL产量分别提高了3.2倍和5.9倍。
色醇是一种源自L-色氨酸的代谢产物,表现出广泛的生物活性,并且作为一种关键的药物前体,色醇及其衍生物化学方式转化为众多具有药用价值的化合物。我们的研究表明色醇可以通过酿酒酵母以葡萄糖为碳源合成。分别用基因组整合、低拷贝质粒(CEN/ARS4)或高拷贝质粒(2 μm)表达限速步骤 (TRP2S65R,S76L),发现低拷贝质粒效果最好,基因组整合次之,高拷贝质粒效果最差。这说明色醇的最终产量是基因表达量和细胞负担两个因素平衡的结果 (未发表数据)。
2.2.2 在毕赤酵母中调控质粒拷贝数的应用
乙型肝炎表面抗原(HBsAg)是HBV的主要特征蛋白,可以作为感染HBV的诊断指标,在减少HBV感染率且消灭乙肝方面作用很大[39]。乙肝疫苗生产成本高,构建多拷贝质粒并在毕赤酵母中高效表达乙型肝炎表面抗原能减低疫苗成本。实验表明,乙型肝炎表面抗原在毕赤酵母中的表达量与质粒拷贝数呈正相关,质粒拷贝数从4增加到6,HBsAg在菌体破碎液的含量增加了30%,且拷贝数的提高并未对毕赤酵母的生长产生影响[40]。
3 通过合成生物学手段改造质粒以精确调控拷贝数范围
综上研究表明,利用天然复制子序列,可以构建具有不同拷贝数的质粒。构建起一系列不同拷贝数的质粒合集,可以广泛用于优化关键基因表达量,进而提高生物催化效率,提高目标产物产量。前述研究进展也表明,并非质粒拷贝数越高,目标产物也越高,这也凸显出优化表达系统质粒拷贝数的必要性。
然而,利用天然复制子构建的质粒,拷贝数并不是均匀分散的,还存在着动态调控范围小等问题。特别是对于真核酵母体系,常用的复制起点只有CEN6/ARS4和2 μm,其拷贝数上限仅为30左右 (表1)。为了克服上述局限,近年来,国内外研究者充分利用合成生物学及分子生物学的前沿技术手段,构建出了质粒拷贝数调控分布更均匀、拷贝数上限更高、可调控范围更大的系统。这些系统应用于优化生物催化,显著提高了生物合成的催化效率 (表4)。
表4 利用合成生物学技术优化质粒拷贝数系统提高生物催化效率
3.1 调控质粒拷贝数在真核生物合成生物学中的应用
大肠杆菌中应用广泛的、含有ColE1复制起点的质粒,其拷贝数的控制通过两种RNA实现:a)引发RNA (RNA-p),它以顺式方式充当复制起点附近的引物;b)抑制RNA (RNA-i),其转录为RNA-p的反义序列,并通过在原点附近杂交之前与引发 RNA 结合而发挥反式作用,RNA-p/RNA-i的比例决定着质粒拷贝数[9]。根据上述机制,ROUCHES等[8]通过调控RNA-p或RNA-i的表达量,构建起了拷贝数可变的2个ColE1质粒系统。在第一个系统中,研究者将Ptet启动子设置于RNA-p基因前,通过添加无水四环素 (aTc) 控制RNA-p表达量;而RNA-i的表达受ColE1复制子序列自带启动子Pi控制。实验测定在aTc添加浓度为0~100 ng/mL,该系统质粒拷贝数为1.4~50/细胞。在第二个系统中,研究者以ColE1质粒上控制RNA-p的天然启动子Pp和控制RNA-i的天然启动子Pi的-35和-10盒子上引入定点和随机突变,构建出了1 194个RNA-p/RNA-i比例不同(质粒拷贝数不同)基因文库。序列及拷贝数测定表明质粒拷贝数范围为1~800/细胞,并且此系统还避免了外源添加aTc。该系统被用于测定质粒拷贝数与细胞负担的相关性,表明每个质粒会给细胞带来0.063%的代谢负担。上述2个系统还被应用于了优化生物合成途径提高紫色杆菌素产量。第一个系统因为拷贝数变化范围小、拷贝数较低,紫色杆菌素产量随aTc添加量的增加而增长;第二个系统由于过高质粒拷贝数带来的代谢负担逐渐加重,紫色杆菌素的产量在质粒拷贝数~300时出现峰值。
p15A复制子和ColE1复制子机制类似。LI等根据p15A的复制原理,巧妙设计一套基因回路,构建了受p-香豆酸诱导调控拷贝数的质粒系统。实验数据表明,该系统能够动态调控代谢通路中关键基因拷贝数,平衡细胞生长与合成目标产物p-香豆酸的代谢通量。与质粒拷贝数不变的静态系统相比,该动态调控系统p-香豆酸摇瓶产量提高78%,达到1.69 g/L[42](图2)。
A-RNAI影响质粒复制机理;B-基因拷贝动态控制在p-香豆酸生物合成中的应用
JOSHI等[45]近期开发了原核系统中灵活的、能随时间变化的动态质粒拷贝数的新系统TULIP (TUnable Ligand Inducible Plasmid)。TULIP的设计基于pSC101复制起点的自动调节机制设计,与前述ColE1复制机制不同。pSC101复制子通过RepA调控蛋白单体-二聚体的平衡使质粒拷贝数控制在3左右。该研究者们利用RepA突变体,设计了新的基因回路,使pSC101固定拷贝数系统变成了受异丙苯酸诱导调控、拷贝数动态调控范围达到20倍 (3~60拷贝/细胞)的新系统。进一步的表征表明,TULIP在常用的大肠杆菌菌株(NEBStable、DH10B、NEBExpress、BW25113和MG1655) 和生长培养基(M9-葡萄糖、M9-甘油、Lysogeny Broth和Super Optimal Broth)中表现稳定。除了异丙苯酸诱导系统,TULIP也被改造为由其他小分子诱导体系,如N-(3-氧代-己酰基)-L-高丝氨酸内酯[N-(3-oxododecanoyl)-L-homoserine lactone,AHL)],香草酸,异丙基-β-D-硫代半乳糖苷。
3.2 利用合成生物学技术优化真核质粒拷贝数系统
二氢青蒿酸能通过独立且自发的代谢途径形成青蒿素[46],且由于青蒿素的医药价值不断被发现,对于青蒿素合成的研究不断深入。其中利用二氢青蒿酸在酿酒酵母中异源表达,从而进一步合成青蒿素在提高产量方面取得了较好的效果。曾薄轩研究发现,用传统的2 μm多拷贝质粒表达的关键基因ADS、CYP71AV1和DBR2不够稳定高效,进而影响二氢青蒿酸产量[42]。可以复制2 μm多拷贝质粒的酵母自身还含有内源性的野生2 μm质粒 (wt 2 μm质粒),两者相比wt 2 μm质粒拥有更高的拷贝数,且在不含任何酵母生长必须基因的前提下,能随细胞分裂稳定遗传。因此,在不破坏稳定遗传所需必须基因的基础上,作者基于wt 2 μm质粒,设计了利用CRISPR/Cas9基因编辑技术将外源基因插入STB与RAF1基因之间,开发出了pE 2 μm多拷贝质粒系统,可以方便进行外源基因克隆。实验结果表明,利用pE 2 μm多拷贝质粒表达关键基因,相比传统2 μm质粒系统,在有筛选压力和无筛选压力的条件下,二氢青蒿酸产量分别提高到了65%和 3.4倍。类似的,YANG等[47]利用传统克隆方法在wt 2 μm质粒REP1启动子和RAF1启动子之间插入了多克隆位点,方便进行外源基因克隆。研究者们将酪醇合成途径基因引入该系统,酪醇相比基于传统2 μm质粒的体系也有提高。
酿酒酵母常用质粒系统具有拷贝数较低、动态变化范围窄的缺点,很大程度上限制了更多的应用。相关基础研究发现,酵母质粒拷贝数可以调控其筛选标记基因/蛋白的表达量。CHEN等[43]发现通过将泛素/N-降解决定子标签 (ubi-tag)融合到筛选标记N可以破坏标记蛋白的稳定性,进而增加载体的拷贝数和同一载体目标蛋白的表达量。这种增加质粒拷贝数的方法使报告蛋白LacZ的活性最高增加100%,将广藿香醇合成途径构建进该体系,其产量提高了3倍。
LIAN等[14]随后系统性利用截短筛选标记基因启动子的方法来弱化标记蛋白表达量,进而增加质粒拷贝数。他们发现对某些筛选标记 (HIS3,URA3,KanR,HygR),2 μm多拷贝质粒随筛选标记启动子截短而增加;但是对另外一些筛选标记 (TRP1,LEU2)则无此相关性,最高拷贝数达到了100 拷贝/细胞。KanR和HygR的系统随即被用作胡萝卜素及n-丁醇代谢途径的优化,产量较野生型最高增加10倍和100倍。类似通过弱化筛选标记基因表达、进而增加筛选压力来提高质粒拷贝数的方法还用于了重要天然产物灵芝酸[44]。
近期,本课题组将上述拷贝数增加且可调控的方法应用到了双质粒表达真菌I型聚酮合酶的体系中,用于优化产量极低的间苯二酚类聚酮,因为该类化合物极具药用价值[32]。通过组合优化,我们将新发现的化合物产量提高最高10倍(图3)。这加速了此类微量产物的分离纯化和结构鉴定,进而促进了结构新颖的非天然真菌聚酮的合成以及加深了对I型真菌聚酮合酶催化机制的理解。
A-组合拷贝数工程优化非天然产物合成;B-通过组合调节还原性聚酮合酶以及非还原性聚酮合酶的质粒拷贝数来优化生产非天然产物
同时有实验证明,在截短启动子前提下,不同浓度的抗生素也会影响质粒的拷贝数,且启动子截短程度较高的对抗生素浓度变化更加敏感[14]。结合启动子截短工程和抗生素的不同浓度,可以构建拷贝数变化梯度更大的质粒系统。
4 总结与展望
综上,天然复制子、拷贝数不同的质粒,已经广泛用于优化关键基因表达量,进而提高生物催化效率。然而,天然复制子系统也具有拷贝数分布区间不均匀、动态调控范围小等局限,这些问题对于真核酵母体系尤为突出。近年来,为了克服上述局限,国内外研究者充分利用合成生物学及分子生物学的前沿技术手段,设计并构建出了质粒拷贝数调控分布更均匀、拷贝数上限更高、可调控范围更大的系统。这些系统应用于优化生物催化,显著提高了生物合成的催化效率。但总体而言,目前相关研究不是很多,尤其在真核生物合成生物学领域,这需要对质粒复制机制更深入研究和理解。可以预见,上述领域的进一步进展,可以为合成生物学提供更多解决方案。