通过重构来激活沉默的次级代谢产物生物合成基因簇
2020-01-13关丹丹赫卫清
关丹丹,赫卫清
作者单位:100050 北京,中国医学科学院北京协和医学院医药生物技术研究所卫健委抗生素生物工程重点实验室
抗生素是临床上应用非常广泛的一类药物,许多感染性疾病因此得到有效控制。但是致病菌的耐药性也越来越普遍,已经给人类健康带来极大挑战,所以研发出新的抗感染药物刻不容缓。现在已知的抗生素大部分来源于放线菌,这类菌可以产生大量具有抗感染、抗肿瘤和抗氧化等生物活性的次级代谢产物,约 40% 的临床药物都是来源于这些次级代谢产物或其衍生物。然而,在放线菌中大多数生物合成基因簇(biosynthetic gene clusters,BGCs)在正常的实验室培养条件下无法表达,这就需要新的技术来开发这些沉默 BGCs 的生物合成潜力。
微生物在实验室中的纯培养是研究微生物的基础,微生物培养条件的优化是发掘微生物次级代谢产物最基本的方法[1]。随着生物信息学和合成生物学的发展,已经出现多 种激活沉默 BGCs 的方法,包括在培养基中添加化学诱导物[2]、共培养[3]、核糖体工程和转录因子激活[4-5],还有正调控基因或者途径特异性激活基因的过表达法[6-8]。对于难以利用生物信息学预测的 BGCs 可以通过随机构建基因文库的方法发掘次级代谢产物[9]。除此之外,天然产物生物合成途径的异源表达在药物发现中受到越来越多的关注[10-11]。虽然异源表达能绕过原有的调控网络来激活沉默基因簇,但是由于多种原因,在异源宿主中的表达产物的产量通常较低。本文总结了利用重构生物合成基因簇来激活沉默基因簇及提高其表达水平的方法,包括 DNA 组装、启动子工程等方法。
1 DNA 组装
DNA 组装技术是完成人工组合生物元件和模块化的关键环节,包括基于限制酶的组装技术、体内外同源重组和重叠延伸 PCR 等。在酵母和芽孢杆菌体内的重组可以用于更复杂的 BGCs 组装[12]。自 DNA 组装技术发明以来,可以进行 BGCs 中多个基因的突变、插入和缺失,从而提高次级代谢产物产量和获得新的衍生物等[13]。下面从生物合成途径的重构和修饰两个方面介绍在放线菌中激活沉默基因簇的最新进展。
1.1 途径重构
1.1.1 “自上而下”的途径重构 许多微生物的次级代谢产物都是非核糖体肽合成酶(non-ribosomal peptide synthetase,NRPS)/聚酮合酶(polyketide synthase,PKS)类型的化合物,其 BGCs 的大小可达 100 kb 以上。利用酶切连接方法往往无法直接对完整的 BGCs 进行有效克隆,于是人们开发了一种由 DNA 小片段组装成大片段的重构方法,并且称之为“自上而下”的途径重构方法。埃博霉素(epothilone)是一种由 6 个基因构成的 NRPS/PKS 类型化合物。2006年,Mutka 等[14]将前 5 个基因进行途径重构,并且在大肠杆菌中产生了埃博霉素 C 和 D。2012年,通过 DNA 组装技术重构了来自 Sorangium cellulosum 的全长为 56 kb 的埃博霉素的 BGCs,重构过程包括将第六个基因 epoF,引入独特的限制性酶切位点、从序列中消除其他限制性酶切位点、进行路径组装和模块交换,最终通过异源表达产生埃博霉素 A 和 B[15]。Schimming 等[16]通过“重叠延伸PCR-酵母同源重组(ExRec)”方法重构了 NRPS/PKS 类型化合物的 BGCs,在异源宿主中成功表达出两种新型肽 ambactin 和 xenolindicin。这种由较小的 DNA 片段组装成 BGCs 的技术已经广泛使用,但是对于复杂 BGCs 的组装仍然存在很大限制。因此又开发出一种基于 IIS 内切核酸酶的新的 DNA 组装策略,该策略可用于复杂的 BGCs 的组装[17]。通过该策略,将 5 种天然的 myxochromide(A、B、C、D 和 S)的 BGCs 经过设计后组装成 30 多种不同 myxochromide 的人工 BGCs;并且通过交换来自不同 myxochromide BGC 的 NRPS 编码基因产生了新的脂肽结构。
1.1.2 其他途径的重构方法 克隆 BGCs 的首选方法是构建插入大片段的基因文库。在构建基因文库时,人工染色体(BAC)很难直接捕获次级代谢产物完整的 BGCs,需要重组技术进行无缝拼接和组装才能获得完整的 BGCs 进行异源表达。Kallifidas 和 Brady[18]将基因文库中较小的重叠片段进行重组,进而组装成新的大型基因簇,产生了 3 种新的 fluostatins 类似物。为了直接克隆 BGCs,Jiang 和 Zhu[19]提出用 CRISPR/Cas9 技术精确地切割基因组 DNA,然后利用 Gibson 组装技术将目的基因组插入载体中。基因编辑技术虽然可以精确地切割 BGCs,但是步骤 繁琐。为了进一步简化 BGCs 的捕获,Greunke 等[20]开发了一种新的 BGCs 捕获方法——直接克隆生物合成途径(DiPaC),该方法主要包括长片段 PCR 和 HiFi 组装技 术。通过对其目的 BGCs 进行设计,用最先进的高保真 DNA 聚合酶进行 BGCs 的长片段扩增;然后将扩增后的DNA 长片段进行体外组装来进行 BGCs 的途径重构,进而在异源宿主中成功激活了吩嗪类小分子化合物的生物合成。
1.2 途径修饰
对于沉默的 BGCs 的重构设计,需要在组装的同时还要进行途径修饰,这样才能使 BGCs 的重构设计更加完善有效,因此在多数情况下途径修饰也是激活沉默基因簇的重要策略。Ongley 等[21]把一种非核糖体肽的 BGC 通过同源重组技术,将诱导型启动子和新的核糖体结合位点替代原生物合成途径中的天然启动子和调节区,从而在新宿主大肠杆菌中成功异源表达出 lyngbyatoxin。Coates 等[22]对不同吩嗪的 BGCs 进行途径重构、组装、合成以及路径修饰,不仅在大肠杆菌中激活了吩嗪的 BGCs,而且产生结构新颖的吩嗪化合物。
2 启动子工程
随着启动子分析方法的日益成熟以及利用基因工程优化启动子的研究进展,可以利用人工合成的启动子代替基因簇中天然启动子从而激活沉默的 BGCs。目前可用的合成启动子包括组成型启动子和诱导型启动子,这些启动子可将转录活性提高 1000 倍,从而可以调节基因转录水平[23]。另外,双向启动子也应用到启动子工程中,它可以克服单向启动子在多基因共表达方面的限制,在 BGCs 中可以进行有效基因共表达,更高效地激活沉默基因簇[24]。
2.1 利用同源重组技术替换天然启动子
2.1.1 Red/ET 重组 Red/ET 重组是在大肠杆菌中的一种基于 λ 噬菌体 Red 操纵子(Redα/Red-β/Redγ)和 Rac 噬菌体 RecE/RecT 系统介导的 DNA 同源重组技术。该重组技术可以进行 DNA 大片段重组、突变以及异源表达[25]。同样,通过替换天然启动子也可以激活沉默的 BGCs。Dangel 等[26]通过 Red/ET 重组将四环素诱导型启动子 tcp830 替换新霉素生物合成中的天然启动子,同时删除新霉素的两个特异性正调控基因,重构了新霉素的 BGC,为 BGC 提供了一个稳定且易于转录的表达系统,使之在异源宿主中激活。Horbal 等[27]首先通过构建基因文库来克隆目标基因簇,然后通过 Red/ET 重组用组成型启动子代替基因簇中的天然启动子,最后将重构后的基因簇进行异源表达。该方法明显提高了大环肉毒霉素的产量。
2.1.2 转化相关重组 转化相关重组技术是一种基于酿酒酵母内的重组系统。Shao 等[28]利用转化相关重组技术开发了一种重构沉默基因簇的方法。利用转化相关重组技术将人工合成的启动子与生物合成途径中的基因模块以及辅助模块进行重组,然后将重构的 BGCs 进行异源表达,成功激活了来自 Streptomyces orinoci 的 pectinabilin 生物合成。Montiel 等[29]将合成启动子和 TAR 技术结合,进行多个天然启动子的替换得到重构基因簇,并且异源表达得到 lazarimides A 和 B。Luo 等[30]利用“即插即用”的合成生 物学策略激活来自 Streptomyces griseus 的沉默 BGCs。该策略通过转化相关重组技术将 6 个组成型启动子插入到 BGCs 的上游,同时进行途径重构组装,最终在异源宿主中产生 3 个新的多环四甲酸酯大环内酰胺(PTM)。2017年,Saha 等[31]也通过启动子工程和异源表达相结合激活了海洋来源链霉菌中的 PTM 的 BGCs,从而发现了 6 种新的 PTMs。
2.2 利用 CRISPR/Cas9 技术插入合成型启动子
近期开发出一种新的启动子工程策略,利用 CRISPR/Cas9 技术在天然宿主中插入人工合成的启动子以达到重构基因簇的目的。在链霉菌的不同 BGCs 中成功利用 CRISPR/Cas9 系统插入了组成型启动子,完成天然启动子的替换,从而激活链霉菌中沉默的基因簇,并产生了一种五角型 II 型聚酮化合物[32]。糖多孢菌产生的红霉素临床应用广泛,利用 CRISPR/Cas9 技术在红霉素的 BGC 中插入双向启动子来代替天然启动子,双向启动子允许基因共表达,并且结合 CRISPRi 技术对基因簇进行调控,提高了糖多孢菌中红霉素的产量[33]。这种利用 CRISPR/Cas9 插入启动子的方法可以完成天然启动子高效准确的替换,对现有的沉默基因簇激活方法进行了升级,也是对同源重组法替换天然启动子策略的优化,可以更好地发掘链霉菌次级代谢产物生物合成的潜力。
2.3 mCRISTAR 和 miCRISTAR
2.3.1 mCRISTAR 目前,利用启动子工程重构 BGCs 最新的方法是 mCRISTAR(multiplexed-CRISPR-TAR),该技术分为两步:首先,利用 CRISPR-Cas9 在酵母细胞中将 BGC 各启动子位点双链断裂形成线状 DNA 片段;然后,含有 BGC 特异性同源臂的组成型启动子在酵母细胞中利用 TAR 与这些线性 DNA 片段进行同源重组。这套多启动子插入体系为避免启动子间的同源重组需对启动子进行正交设计。Kang 等[34]首次成功利用 mCRISTAR 技术替换了 Tam 基因簇中所预测的 8 个天然启动子,从而完成 BGCs 的重构,激活了来自土壤宏基因组中的沉默的 Tam 基因簇。mCRISTAR 是一种简单通用的方法,可实现 BGCs 中每个操纵子上游启动子的多重替换,不仅绕过操纵子天然的转录调控元件,并且可以保持 BGCs 的完整转录,极大加快了微生物天然产物发现的进程。尽管如此,同时构建具有多个 sgRNA 的 CRISPR 质粒是 mCRISTAR 过程中的主要瓶颈。Kim 等[35]采用多重质粒的方法克服了这个障碍,命名为 mpCRISTAR(multiple plasmids-based CRISPR/Cas9 and TAR)。
2.3.2 miCRISTAR miCRISTAR(multiplex in vitro Cas9-TAR)是 Sean F. Brady 团队在 mCRISTAR 基础上进行的优化新策略,与 mCRISTAR 不同的是第一步在体外进行天然启动子位点的切割,省去了 CRISPR-Cas9 质粒的构建和转化,从而简化了 BGCs 重构步骤。他们使用 miCRISTAR 同样也激活了 Tam 基因簇。另外在放线菌的 ato 基因簇中含有 4 个预测的天然启动子,他们利用 miCRISTAR 在体外对 4 个天然启动子依次进行切割,并且将不同组合的启动子位点同时进行切割,再重构,经过 15 种重构尝试后,其中 8 种重构基因簇产生了 atolypenes A 和 B[36]。从而证实了 miCRISTAR 是一种比 mCRISTAR 更简单灵活的基因簇重构方法,也是启动子工程和 DNA 小片段组装的完美结合。
3 其他重构方法
3.1 删除抑制子
BGCs 的沉默通常与负调控基因或者阻遏基因的表达有关,利用重组技术删除 BGCs 中的抑制子可以将沉默基因簇激活。Yamanaka 等[37]利用转化相关重组技术将人工构建的 URA3 营养缺陷型基因替换 taromycin A 基因簇的负调控基因 tar20,然后成功实现异源表达。Adpressa 等[38]通过突变 H3K27 甲基转移酶基因 Kmt6,然后在突变菌株中分离出 fusaristatin A、gibepyrone A、fusarpyrones A 和 B。
3.2 转座子突变技术
转座子能产生单一位点的突变,且突变效率高。Mao 等[39]通过转座子突变技术激活了来自 Burkholderia thailandensis 的沉默基因簇。
3.2 定点突变和随机突变
Li 等[40]将来自 Streptomyces chatta noogensis L10 中沉默基因簇的 rpoB 基因进行定点突变,使基因转录水平上调,产生了一种类似古霉素的新抗生素——炭疽霉素。Guo 等[41]通过随机突变来产生基因组的遗传多样性,激活了贾德霉素基因簇和至今无法激活的 pga 基因簇。
3.4 密码子优化
密码子偏爱性的不匹配是外源基因在宿主系统中表达量低的主要原因之一。Chai 等[42]将微管霉素的 BGCs 进行了重构组装,但是其 BGCs 中的 tubC 的起始密码子是稀有的 TTG,为了避免重构 BGCs 在异源宿主中低效率表达,利用 Red/ET 重组技术将密码子改为 ATG,从而在异源宿主中产生了微管霉素。
4 小结
通过各种合成生物学方法的不同组合对生物合成基因簇进行重构,从而激活沉默基因簇,这区别于其他沉默基因簇的激活方法。每一种 BGCs 的重构方法往往不可独立完成沉默基因簇的激活,例如途径组装会结合启动子工程,途径重构会伴随着途径修饰,需要相互配合才能更有效地激活沉 默 基 因 簇, 采 用 CRISPR/Cas9 、 mCRISTAR 和 miCRISTAR 等新技术可以极大提高 BGCs 的重构工程的效率,可以更高效地激活沉默基因簇,获得大量的具有活性的新次级代谢产物用于新抗生素的筛选,加速抗生素等新药的研发速度。