基于合成生物学策略创制微生物天然产物
2022-09-27梁淑芳
梁淑芳
(四川大学 生物治疗国家重点实验室, 四川 成都 610041)
合成生物学是综合分子和细胞生物学、进化系统学、生物化学、信息学、数学、计算机和工程学等多学科技术体系发展起来的交叉新学科.作为21世纪初新兴的生物学研究领域,合成生物学是在阐明并模拟生物合成的基本规律之上,基于标准化、去耦化和模块化达到人工设计并构建新的、有特定生理功能的生物系统,从而建立药物、功能材料或能源替代品等的生物制造途径.随着基因组测序技术的飞跃发展,大量微生物、真菌甚至植物的基因组序列测序完成并公开共享,这也推动了合成生物学在微生物领域的应用.一系列微生物遗传操作工具和技术方法被不断发展和优化,进而靶向改造现有的微生物天然产物生物合成途径,甚至创造潜在的有特定生理功能的生物合成途径,最终实现目标产物的高效制造[1].
微生物源天然产物不仅包括抗生素(如链霉素、达托霉素)[2]、免疫抑制剂(如雷帕霉素)[3]、抗真菌药(如哈霉素)[4]、抗肿瘤药物(如博莱霉素、紫杉醇)[5]等医疗药物,还有能源、农业抗虫剂、食品、芳香剂等用途[6-7].微生物因为拥有较快的生长速度、较高的生产效率、简单的遗传操作而被广大研究者关注和研究.除此之外,微生物还拥有丰富的辅因子、天然产物前体代谢产物及复杂的翻译后修饰系统.因此,微生物被不断改造以便提供最优的天然产物合成途径.部分微生物,如大肠杆菌、酵母、枯草芽孢杆菌、链霉菌等,因其广泛的碳源利用能力、复杂的翻译后修饰系统、高效的分泌系统而被不断改造成工程菌,为高效生产高附加值的天然产物提供良好的平台[8].随着人工智能的快速发展,机器人技术和集成软件也被广泛应用于自动化标准工作流程,从而促进合成生物学工作效率的显著提升,进而推动天然产物发掘工作的飞跃发展.
本文对合成生物学在微生物领域的最新研究内容及应用案例进行了概述,并对提升微生物天然产物产量的合成生物学策略和工具进行了总结和讨论,还对人工智能应用于微生物天然产物产量的提升和发掘进行了总结和展望.
1 设计构建微生物天然产物的合成路径
1.1 理性设计天然产物生物合成通路通过文本挖掘工具进行文献挖掘、通过网络模型进行模型预测、通过合成生物学进行人工途径合理设计重构,来探索和设计有效生产所需化合物的合成途径(图1A).生物学研究前沿和路径设计中数据源的积累仍然记录在文献中,这些文献提供了大量的生物学信息.文献挖掘已经从简单的术语识别发展到相互作用关系的综合分析,并从蛋白质相互作用的单一认知扩展到路径合作的系统调控.一方面,建立了以Pubmed和Medline为主的海量文献高效处理平台;另一方面,一系列的文本挖掘工具,如Textpresso[9]、LitMiner[10]等,不仅可以识别、提取、整合和分析文献数据,还能发现新的、隐藏的或不可预测的信息.
随着基因组学及相关技术的发展,大量的微生物基因组序列分析解读用于产生高质量的基因组规模的代谢重建,可用于产生综合代谢模型.因此,一系列数据库随之兴盛,为微生物代谢谱解析及代谢重构提供参考[11].其中,antiSMASH作为一个网络服务器和独立的工具,已成为鉴定和分析细菌、真菌及植物基因簇最广泛使用的工具[12].除此之外,BIGG作为高质量基因组规模代谢模型的集中存储库,已完成了165个代谢模型(http://bigg.ucsd.edu),涵盖78种微生物[13].这些基因组规模代谢模型的应用从理论研究到实用研究都是为了弥合基因型和表型之间的差距,其收录的代谢产物及代谢反应依然为微生物的代谢重建提供参考.总之,通过文献调研、生物信息学分析、计算机建模等,合理设计科学、可行的生物合成通路.
1.2 构建和优化生物合成通路大多数次级代谢产物生物合成基因簇在常规培养条件下是转录沉默的,不利于天然产物的表达积累[14].因此,激活沉默基因簇是发现新活性天然产物的有效途径之一.天然产物的生物合成通常是包含多种基因及其控制元件完成的多步骤途径,对这些基因或操控元件进行改造优化,可实现天然产物产量的提升或新产物的发掘.基因表达的精确调控是天然产物产生的关键步骤,如通过对影响产物合成过程中关键途径关键酶的活性或表达丰度的提升以最大限度地合成目标产物.启动子、转录因子工程是实现基因精准调控的重要途径,模块化工程则是实现目标产物修饰的高效途径之一(图1B).
一方面,内源性启动子由于不能及时控制和持续最大化细胞内的转录水平而受到限制,通过位点选择突变增强启动子强度,或以核心启动子区域和上游激活序列为重点构建启动子文库,筛选高活性启动子[15].总之,启动子工程作为合成生物学不可或缺的一部分,是调节遗传回路和协调生物合成途径的关键因素.另一方面,因为启动子只能精准控制一个元件或基因,所以存在一定局限性.而转录因子因能同时控制代谢途径中多种酶的丰度或活性广泛应用于提高目标产物的产量[16].研究人员在不断寻找高效正调控因子的同时,对已有转录因子的结构域或模块进行编辑或融合来显著提高转录因子的活性[17].另外,转录因子诱饵通过模拟与负调控因子结合从而阻止负调控因子结合相关DNA靶点,以此来干扰基因调控,实现天然产物合成通路的激活[18].
此外,基于遗传操作优化生物合成通路,从而产生目标化合物的各种衍生物也成为筛选活性天然产物的重要途径之一.Kudo等[19]基于CRISPR-Cas9及Gibson组装技术对雷帕霉素(rapamycin)合成基因簇中的模块进行删除及替换,从而获得一系列活性较好、毒性较低的rapamycin衍生物.
1.3 生物合成通路异源高效表达除了通过优化生物合成途径提高天然产物合成效率,提高微生物发酵的产率也很重要.许多微生物内源次级代谢产物积累的水平不能满足工业化生产的需求,是因为部分天然产物在本宿主中没有充足的碳氮源、前体或代谢中间产物的供给来满足目标代谢途径的需求,因而产量极低.相反,生产工程菌在经过一系列的基因组优化、转录调控、蛋白质工程和代谢工程优化后,有着高效的调控系统、高性能的催化系统及丰富的前体和辅因子,还拥有最优的流向目标化合物同时降低或消除竞争途径消耗的代谢流[20].因此,适宜规模化生产的工程菌为可再生和可持续的化工替代品的生产提供了高效环保的细胞工厂(图1C).
图1 合成生物学技术挖掘微生物天然产物
工程菌在经过一系列的靶向代谢重编程后,其代谢流集中流向目标化合物.因此,众多天然产物合成基因簇在转入工程菌后,其产量被提高数倍甚至数千倍[21].例如,将灰紫红菌素(griseorhodin)生物合成通路转入变铅青链霉菌(Streptomyceslividans,S.lividans)ΔYA10工程菌后,其产量比野生型提高了5倍;而在转入白色链霉菌(Streptomycesalbus,S.albus)Del14底盘细胞后,其产量更是提高了11倍[22].不仅如此,越来越多的植物天然产物也尝试构建微生物工程菌生产,大大缩短了生产周期并提高了产量[23].例如,青蒿素、人参皂甙在转入粮酒酵母工程菌后,其产量都有了质的飞跃[24-25].
2 几种合成生物学有关的技术
2.1 基因编辑技术源源不断的基因组信息促进了一系列基因组编辑工具的发展,而这些不断更新的DNA编辑工具则进一步促进了沉默基因簇的重构和激活[26],最终提高目标产物的产量.目前,聚类规则间隔短回文重复序列(Clustered regularly interspaced short palindromic repeats, CRISPR)/CRISPR相关蛋白(Cas)系统广泛应用于众多生物体的基因功能研究.CRISPR/Cas9系统在引导RNA(Guide RNA,gRNA)的介导下,靶向基因组DNA,并招募Cas9蛋白对靶DNA进行切割形成双链断裂(Double-strand break,DSB),并以外源导入的同源DNA为模板,通过体内同源重组酶进行同源修复(Homology-direct repair,HDR),从而达到基因敲除、插入及突变的目的(图2A).
CRISPR/Cas9系统极大地促进了对微生物高效率的基因组编辑[27],但即使在减少gRNA的情况下,Cas9毒性仍然存在,并且导致Cas9逐渐丢失[28].因此,其他基因组编辑工具如Cas12a等也在不断被开发优化[26],以期获得更高的基因编辑效率和更低的毒性.通过失活Cas9的核酸内切酶活性而获得dead Cas9(dCas9)[29].dCas9应用于无DSB的、单核苷酸删除的基因组编辑系统.dCas9连接DNA脱氨酶以进行基因编辑,该系统包括一个胞苷和一个基于腺苷脱氨酶的碱基编辑器(Base editor),利用dCas9-gRNA复合物发现并结合目标DNA,胞苷脱氨酶通过胞苷脱氨基作用将目标C转化为U(图2B).类似地,该系统也能在约7个核苷酸框内将A:T碱基对转化为G:C碱基对[30].
文献[31]还发展了将多种嵌合的dCas9-DNA脱氨酶融合进行精确的基因编辑和位点特异性突变的生成,然后用于选择耐药表型.碱基编辑器降低了DSB对染色体的压力和Cas9的毒性,除了引入终止密码子使基因失活外,还具有巨大的应用潜力,如通过纠正不理想的点突变或使假基因恢复功能状态,通过在体内交换关键残基进行蛋白质工程改造,以及通过在一个结构中复用gRNAs来进行全路径工程优化[30].总之,碱基编辑器是对CRISPR-Cas基因组编辑工具技术的补充.
除此之外,将dCas9与转录增强子(如RNA聚合酶因子σ因子、bEBPs结合蛋白、AsiA)结合,在gRNA的介导下靶向目标序列,从而使转录增强子增加目标基因的转录水平[32](图2C).类似地,失活的dCas9在gRNA的介导下准确地靶向基因组DNA后,与dCas9形成复合物,在空间上阻止RNA聚合酶的进展并抑制目标基因的转录,从而达到抑制基因表达的效果(图2D).目前,dCas9与不同的酶活性蛋白联系起来,从而广泛应用至转录调控、表观遗传修饰和荧光基因组追踪等[33].
图2 CRISPR/Cas9基因编辑系统
2.2 基因簇克隆技术在一个可遗传的宿主中异源表达单个基因、一串基因甚至整个生物合成基因簇是挖掘相应天然产物的一种有效途径[34].为了将
这些天然产物生物合成基因簇引入异源宿主,快速获取这些基因簇都是必不可少的.获取生物合成基因簇的方法可归结为2种方法:一是直接克隆方法,二是体内外重构方法.
直接克隆方法中经典且广泛应用的是筛选基因组文库,即通过限制性内切酶酶切基因组,将基因组片段化,随后将基因组片段克隆至能承载大基因组片段的载体,如细菌的BAC载体系列和P1噬菌体的PAC载体系列[35]、大肠杆菌-链霉菌穿梭质粒pStreptoBAC V[36],来获得目的基因簇.BAC载体系列是基于大肠杆菌F-可繁殖质粒,能容纳长达300 kb的基因组大片段,使其适合于大多数基因簇的捕获[37].通过这种方法可建立一个基因组文库,并可通过高通量筛选新化合物(图3A).然而,这种基于限制性内切酶的基因组消化,没有靶向性,即使有高通量筛选助力,也增加了研究者的工作量.
此外,部分直接克隆方法是基于整合酶介导的位点特异性重组来克隆获得目的基因.Du等[38]开发了一种φBT1整合酶介导的位点特异性重组系统,并应用该系统克隆了链霉菌中长达157 kb的基因簇.尽管该方法可抓取大的DNA片段,获得较高的克隆效率,然而,该方法需要经过一轮单交叉和一轮双交叉,耗时耗力.文献[39]结合限制酶和RecET重组(exonuclease combined with RecET recombination,ExoCET)直接将细菌和哺乳动物基因组中任何选择的区域克隆到目标质粒中(图3B).ExoCET结合了体外核酸内切酶和退火以及全长RecET同源重组(HDR)从基因组DNA制备物中提取特定区域.该方法结合限制性内切酶和同源重组,靶点明确,显著降低盲目性,且目标基因簇及载体借助RecET同源重组酶在大肠杆菌中进行同源重组,一周内就可完成一轮基因簇的克隆抓取,显著缩短工作周期,提高工作效率,但该方法往往受限制性内切酶限制.因此,该团队随后尝试结合CRISPR-Cas9酶切和RecET同源重组酶进行基因簇抓取克隆,然而这个尝试并没有获得良好的克隆效率,甚至效率很低[40].
目前也开发了多种体内外DNA组装工具以便高效、快速地重构优化生物合成通路[41](图4).Gibson assembly及其他一些基于重组酶的体外重组、体内酵母重组[42],在生物合成通路重构方面都取得好的进展.其中,基于5′外切酶、DNA聚合酶和DNA连接酶协同作用的Gibson assembly,已被用于组装高达900 kb的DNA片段[43](图4A).体内重组,主要是基于酵母及大肠杆菌体内的重组酶介导具有相同同源臂的DNA片段连接成环状DNA(图4B).iCOPE则是基于Cas12a突变体及其gRNA、T4连接酶、可在一个反应中编辑或组装DNA片段的方法.Cas12a突变体拥有广泛的识别位点,在体外转录的一对相应gRNA的引导下,在特定位点上切割靶DNA,随后在T4连接酶作用下,将具有相同黏性末端的DNA片段链接,从而将DNA片段组装成环状DNA(图4C).iCOPE不仅高效,且在操作大质粒方面也很有前景[44].
随着DNA组装工具的不断发展,开发了众多体外重组试剂盒且应用广泛.酵母作为高效且广泛应用的体内重组系统,用于天然产物合成通路的重组及优化.如基于酵母重组,利用即插即用方法激活多个沉默天然产物基因簇[45].除了将基因簇各元件扩增后再重组而激活目标基因簇,在原始基因组或者直接克隆的带有目标基因簇的载体上进行修饰进而优化通路,同样可以达到激活基因簇的目的.除此之外,通过在宿主基因组的主要结构基因前插入强启动子、激活通路特异性正向调控因子等措施同样可以有效提高天然产物的产量[46-47].
2.3 酶工程蛋白质是生命活动的主要承担者,在自然界中发现的蛋白质传统上是最常用的生物催化剂,用于生产从商品化学品到药物等多种天然产物.酶工程在代谢工程的发展中,特别是在天然产物的生物合成中,已经成为一个强大的生物技术工具箱.近年来,酶工程已成为天然产物生物合成中提高酶活性、提高酶稳定性、扩大产物谱的一种有效方法[48].
从蛋白活性方面入手激活天然产物.天然产物生物合成的主要瓶颈之一是涉及的催化或合成酶活性有限.将外源酶整合到微生物底盘中可能会降低其催化活性,甚至导致功能丧失.提高酶活性以加速生产过程是这一领域的主要目标.通过随机突变提高酶对特定底物的催化活性是蛋白质工程中使用的典型策略.如通过随机突变,酿酒酵母异戊烯基二磷酸异构酶的催化活性提高了2.53倍,从而使番茄红素产量(1.24 g/L)比野生型提高2.1倍[49].然而,这种随机突变策略产生的酶库通常是巨大的,而且大多数变异体已降低到无活性,使得筛选工作耗时耗力且效率低下.因此,首选的方法是分析目标酶的结构,并在结合位点或活性域附近设计位点定向突变,以提高其催化活性.
酶活性固然重要,酶稳定性依然不可忽视.酶的稳定性是多方面的,包括热稳定性、pH耐受性、溶解度以及对盐和有机溶剂的耐受性.提高热稳定性可以使酶在高温下发挥作用[50].分子分析表明,热稳定性的提高是由于表面电荷增加和结构柔韧性降低所致[51].在结构导向一致性概念的指导下,葡萄糖1-脱氢酶的热稳定变体在65 ℃下产生并显示出极大的半衰期改善(3.5 d),后来发现它也能耐受高浓度的盐和有机溶剂[52].酶也被设计来适应所需的环境pH值.例如,在木质素降解中起主要作用的漆酶,喜欢更高的温度和pH值.一种来自Botrytis aclada的真菌漆酶经过定向进化获得了更高的最适pH值,在中性pH值下其活性增加了5倍[53].
3 人工智能加速微生物天然产物创制
合成生物学技术大大提高了发掘创造活性化合物的速度.随着人工智能的快速发展,机器人技术和集成软件也被广泛应用于自动化标准工作流程,从而使合成生物学工作的效率得以显著提升.合成生物学是由多种非线性工作流程组成的“按需制造”,而生物学实验存在异质性和动态性,使得工作流程因批次间的变化而更加复杂[54].
近年来,生物铸造厂(Biofoundries)已经发展成为自动化设计—建造—测试—工程周期一体化,解决了生物工程过程中缓慢、昂贵且重复性低的几大难题[55].已有机器人系统结合机器学习算法的应用,该应用可完成完全自动化生物系统的设计、构建、测试和学习过程[56].这个全自动的机器人平台BioAutomata评估了不到1%的可能变异,比随机筛选高出77%,并且研究者利用机器人平台优化了番茄红素生物合成途径,提高其产量.
4 展望
在过去的20年,全基因组测序的突破揭示了微生物尚未开发的生物合成潜力,从而奠定了深入研究微生物和挖掘微生物天然产物的基础.蛋白质组测序则有助于找出微生物应对体内外刺激所做出的生化反应,从而为研究和揭示相关蛋白功能及生化过程提供重要参考[57-59].利用多组学数据和基因组规模的代谢网络模型进行系统分析,预测代谢工程的目标,并重新设计代谢通量,以最大限度地提高目标天然产物的产量[58,60].新的分子操作工具如DNA组装、重组和基因组编辑技术的发展减少了克隆和编辑基因簇所需的时间,提高了克隆和编辑基因簇的效率.新技术的出现也促进了异源宿主的工程化,从而使天然产物在遗传上易于产生.此外,通过合成基因的模块进行重新编程,可以生产出新的天然化合物衍生物,扩展天然产物的生物活性.
对天然或改进的基因进行模块化重构,无论是天然产物修饰还是产生新分子,都是一种非常有效的方法.这些技术的集成将有助于我们理解复杂的基因调控网络和代谢网络,从而通过基因簇编辑、通路改造、代谢通量优化、酶工程、调控电路重连和宿主修饰来发现和生产新的天然产物.随着知识和信息的增加,天然产物“谷歌地图”也将随之产生,类似于Lee等[61]报道的“生物化学地图”,突出了单个或多个生化反应的策略和途径,为设计和生产特定的感兴趣的天然产物提供重要依据.
近年来,人工智能技术和集成软件也逐渐拓展到生命科学研究.机器人的应用,避免了人为因素导致的误差或低效率,在节约成本的同时,快速精准地完成项目内容.尽管目前还未广泛应用机器人等人工智能系统,但随着人工智能的快速发展,相信在不久的将来,人工智能系统会被广泛应用于天然产物的发掘和生产,更多更优的天然产物来源产品更快地问世,以满足人们的需求.
总之,代谢工程和合成生物学技术的进展将为发现和生产多种有价值的活性化合物提供强大的解决方案,并有望开启天然产物发掘的新黄金时代.合成生物学技术及产品因其高效性、精准性已被广泛应用于市场,其对人口健康、生物医药等领域将产生深远影响[62-63].
致谢本文得到四川大学生物治疗国家重点实验室和四川省人民医院张丹博士在图片构思编辑上的大力协作,在此一并致谢.