底盘-回路耦合:合成基因回路设计新挑战
2021-03-18储攀朱静雯黄文琦刘陈立傅雄飞
储攀,朱静雯,黄文琦,刘陈立,傅雄飞
(1 中国科学院深圳先进技术研究院,深圳合成生物学创新研究院,中国科学院定量工程生物学重点实验室,广东省合成基因组学重点实验室,广东 深圳 518055;2 中国科学院大学,北京 100049)
本世纪初两项创造性的工作——拨动开关[1]和压缩振荡子[2]——利用工程化的思想设计了人工基因回路并使其实现特定的生理功能。秉承这一思想,合成生物学在众多学科的交叉中诞生,在生命科学领域的研究中逐渐受到广泛的关注。近20 年来该学科出现许多重要的突破:一方面,通过对基因组的挖掘,人类得到大量定量刻画的生物元件[3-5],并设计出了越来越复杂的基因逻辑回路[6-7],它们能响应特定的外界信号并输出预期的结果;另一方面,利用合成生物学工具,人类对生命系统的工作机理有了更深层次的认识,例如揭示细胞生长、分裂的普适机制[8-9];利用化学合成技术合成细胞基因组[10-11]为实现从头设计合成生命打下物质基础。另外,在产业方面,大量具有高价值的复杂产物通过合成基因回路实现了工业化生产,有望取代传统化工合成,降低对环境的破坏和对化石能源的依赖性[12-13]。
尽管如此,我们对基因的解读能力仍处在较低的水平:DNA 序列提供的信息高度复杂,通过人工组合、设计的复杂基因回路放入到底盘细胞后,底盘细胞对特定信号的响应往往出乎我们的预期[14-15]。细胞在执行命令的过程中存在许多细节我们仍不清楚或难以定量描述,但这些细节却也是基因回路功能实现的重要环节。基因回路同底盘细胞之间存在种种联系,回路功能实现依赖细胞的DNA 复制系统、转录和翻译系统以及各种代谢产物前体。不同的菌株、不同的生长条件,都会对基因的表达量产生影响[16-17],而基因回路中不同基因的表达量决定了回路的输出结果;同时,外源的基因回路的表达对于底盘细胞而言是一种“负担”[18-19],外源基因表达将占用有限的DNA、RNA、蛋白质的合成机器以及各种底物,这种资源上的占用将改变底盘细胞内源的基因表达,进而改变底盘细胞的生理状态。因此,基因回路和底盘细胞两者存在天然的耦合。然而长期以来,我们对合成基因的回路设计思路主要集中在单独元件的定量和预测上,忽略了底盘细胞与基因回路元件之间的影响。所以,使用特定条件下的单个基因模块的定量数据来预测不同工作背景下在基因回路的行为会出现偏差,导致合成基因回路设计不可避免地进入无限循环的“设计➝构建➝调试”中。不仅如此,许多工程菌,如环境治理工程菌、肠道菌群改造工程菌等,其工作环境往往不是标准的实验室条件,底盘细胞生理显然受环境的影响而发生了变化,导致很多基因回路无法实现预期功能[20]。
得益于系统生物学理论以及组学实验方法的发展,近年来,许多工作使得我们对于底盘细胞生理的理解有了更加全面、定量的认识[15,21-22]。将底盘细胞的生理状态纳入到对基因回路行为的理解中,许多反常规的问题迎刃而解[23];同时,这些理论也被应用到了合成基因回路设计的实践中,给合成基因回路设计带来了新的思路。除此之外,开发正交性元件和更加精巧的模块化设计也为解决这一问题提供了新的思路[24]。
本文将梳理近年来合成基因回路与底盘细胞相互耦合的理论研究,介绍底盘细胞与基因回路的相互作用,以及与之相关的定量技术,并进一步介绍近年来关于解开底盘-回路耦合的成果。
1 底盘细胞和基因回路的相互作用
细胞通过一系列的生理生化过程从外界环境中摄取维持生长所需的物质,通过同化作用转化为复制、转录、翻译和酶促反应等生物过程所需的资源。在不同底盘细胞中,或者同一底盘细胞在不同的环境和生长条件中,细胞会将其资源以不同的策略分配给不同的环节,以最大限度地提高其适应性[9,21,25-26],分配策略的变化会导致回路的响应变化。同时基因回路作为外源基因,会竞争各种共享资源,如RNA 聚合酶、核糖体和氨基酸,以及各种生化反应所需的酶和能量[27-29]对底盘细胞的生理状态产生影响,导致细胞生长缓慢、形态发生变化,这些变化同样作为基因回路的输入函数,影响基因回路行为,并可能产生难以预料的结果[30]。而且不同回路模块之间同样也存在竞争,这种竞争同样会导致回路的输出不符合预期[图1(a)]。本节将介绍回路-底盘相互作用的机制研究成果,并讨论这些机制带来的生理效应。
1.1 底盘细胞对基因回路的影响
图1 底盘细胞和基因回路之间的相互作用[31-32]Fig.1 Schematic of interactions between host cells and genetic circuits[31-32]
不同生物底盘细胞之间的基因背景差异会导致标准化的基因元件的输出结果的差异[33-34],这为合成生物学的标准化设计提出了重大挑战。Moser等[35]研究指出转化到不同Escherichia coli菌株中的与逻辑门(AND 门)会有不同的表现。同一培养条件下,AND 门回路在E.coliDS68637 中能够正常响应,而转入到E.coliDH10B 菌株中却完全失去功能。而不同营养成分的培养基以及不同的培养条件也会对基因元件的响应产生改变[16,36-37]。AND 门在LB 培养基中对诱导剂的响应非常灵敏;而转入贫瘠培养基后,诱导剂的加入甚至使细胞停止生长。
除了底盘细胞的遗传背景差异以及培养环境差异对基因回路造成的影响之外,底盘细胞的生长速率也是影响回路功能的关键因素之一。细胞中蛋白的降解主要以细胞生长的方式对胞内蛋白进行稀释[38],因此表达水平往往和底盘细胞生长速率相耦合,而蛋白表达水平的浓度高低则决定了基因线路的输出行为[39]。Tan 等[40]分析了由自激活突变体T7 RNA 聚合酶组成的基因回路,虽然该自激活过程是非协同的,但该回路的基因表达水平却呈现出双稳态。这一反常规的现象可以解释为,基因回路的表达引起了细胞生长速率的减慢,而细胞的生长对基因元件的表达存在着正反馈调节,进一步增加蛋白的积累,从而实现了双稳态现象。
1.2 基因回路对底盘细胞的生长影响
人工基因回路的表达占用了底盘细胞生长代谢相关的资源,影响细胞的正常生长[41-42]。外源基因回路对RNA聚合酶和核糖体[36]的竞争是导致这种压力的主要因素。当E.coli细胞表达与生存不相关蛋白占细胞蛋白总量约30%时,细胞会完全停止生长[25,43]。除此之外,元件与底盘细胞的特异互作可能导致毒性,比如代谢过程中的酶发生互作等。
另外,外源基因的表达甚至会引起底盘细胞的整体资源分配策略的改变。细胞本身存在动态调节分配策略的机制[44-46],(p)ppGpp[guanosine tetra-phosphate or penta-phosphate,鸟苷四(五)磷酸]转录翻译调节机制,当外源蛋白持续表达几代之后,E.coli细胞可以利用(p)ppGpp 的调控机制,实现对全局性资源的重新分配[44,47]。较高的(p)ppGpp 水平通过直接抑制核糖体合成以及蛋白翻译速度来抑制细胞生长。较低的(p)ppGpp 水平限制参与细胞代谢相关蛋白的表达水平。在引入外源基因回路的条件下,外源基因对细胞内氨基酸资源的消耗,使得(p)ppGpp 水平升高,降低核糖体的水平,提高代谢相关蛋白的表达量,这一策略在贫瘠培养基中可以有效协调细菌的资源分配。
1.3 基因回路内部不同模块之间存在竞争
基因回路中不同的模块之间也会竞争细胞资源[48-51]。当外源回路中的基因都在争夺这些有限的资源时,基因之间就会产生非预期的相互作用。这些相互作用可以极大改变基因回路的预期行为,导致实验结果与模型预测完全不符。例如,Qian等[52]的工作表明,当两个激活模块单独存在时,希尔函数可以很好地吻合实验结果。但是将两个模块串联形成更复杂的体系后,理论预测的结果甚至和实验结果完全相反。Wei 等[50]则建立了粗粒化的模型框架,用于描述生命体中转录因子、核糖体、蛋白降解酶等资源的竞争行为,通过统一的模型框架可以有效评估和理解基因回路中可能存在的竞争效应。
除了上述三种竞争效应外,底盘细胞和基因回路的互作还带来了一系列其他效应,例如增加同基因群体的异质性、降低遗传稳定性以及毒性效应。
1.4 基因回路导致底盘细胞生理异质性增强
即使是相同基因型的细胞,在生长分裂等动态过程以及各种生理生化过程都存在噪声,造成了表型多样性[53-55]。研究表明,这种差异往往随着生长速率的减小而变得显著[56-57]。因此,外源基因的表达使得这种扰动变得更加明显,从而导致底盘细胞的生理异质性增强。而这种异质性导致一部分表达量相对较低的细胞获得相对较快的生长速度,这类细胞便可以在不断的传代培养中取得优势,最终导致合成基因回路的失效[40][图1(b)]。另外,在细菌细胞中,资源的分配比例也可能会随着个体的差异而不同。例如,外源基因和底盘细胞基因往往公用E.coli内源蛋白质降解系统ClpXP,过量表达的蛋白可能导致不同蛋白的降解出现“排队效应”,这一随机的分配过程导致细胞的异质性增强[48]。
1.5 基因回路导致系统的遗传稳定性降低
细胞的生长压力带来的负向筛选作用会减弱人工基因回路的遗传稳定性。研究表明基因回路功能可以给细胞带来很大的适应性劣势(fitness disadvantage)[31],并且发生适应性进化以减轻与表达外源蛋白质相关的代谢负荷或毒性。基因回路给底盘细胞带来压力,同时导致底盘细胞生长速率往往低于野生型菌株,而突变导致的含有失效的基因回路的菌株往往具有更好的适应性,这样一来,在连续培养的过程中,带有期望功能的合成菌株会逐渐失去优势。Sleight 等[31]评估了带有不同的调控元件的3 种荧光蛋白在E.coli中的遗传稳定性,发现表达量低和带有更少重复序列的基因回路具有更好的遗传稳定性[图1(c),修改自文献[31]]。重复序列容易导致基因重组进而导致序列丢失,因此有必要建立更大的优质元件库,减少元件在同一基因回路中的重复使用,使用低拷贝的质粒或者将基因回路整合到基因组也可以降低重组发生的概率[58]。同时在设计的环节中加入同源序列检查的过程,避免元件组合的过程中产生意外的同源序列。
1.6 基因回路导致的细胞的毒性
在基因回路的测试过程,往往会发现有些基因元件或回路会导致细胞形态发生变化,如纤维化。一般认为这种现象是由基因回路与细胞的一些生理过程发生了意外相互作用引起的。一种可能是,异源DNA 中存在一些意外的功能序列。如,DnaA Box 会严重影响细菌的分裂[59];另外,富含AT 序列的DNA 序列可能是未知的启动子,高频的转录占用了细胞大量RNAP,造成RNAP不足[60]。另外,外源基因的表达产物也可能与底盘细胞的基因组意外互作,例如TetR 家族中一些阻遏的蛋白异常调节底盘细胞的基因表达[61-62]。高表达dCas9 也会严重影响细胞生理。组学实验发现dCas9 蛋白在高表达水平下,能够非特异性结合到基因组上影响部分基因的转录水平[32][图1(d),修改自文献[32]],导致细胞生长速率的急剧下降和细胞形态的纤维化。另外,也有实验表明gRNA 只含有9 碱基与目标位点匹配的情况下,也能有效结合到基因组上引起转录下调[63]。目前,还没有系统性的定量毒性的方法,对于这些意外的互作情况,使用组学技术,如RNA-seq 等[36],可以有效地进行评估。
综上所述,基因表达与细胞生长之间存在着多方面的联系。对这些关系的认识可以提高对基因回路行为认识和预测,为合成基因回路的理性设计提供指导。基于上述实验证据,很多数学模型被用于描述这些机制,以进一步解释更复杂的生理现象。
2 对合成基因回路与底盘细胞耦合效应的预测
由于底盘细胞与基因回路之间存在复杂的相互作用,近年来不少工作利用数学模型解释了不同生长速度和药物作用下的细胞的行为[25],将基因回路与底盘同时纳入到模型的框架中,使得许多基因回路失效的案例得到了解释,并为下一步底盘改造提供了方向。本节将介绍近年来出现的代表性的工作,介绍如何用生物物理模型去预测耦合效应。
近十几年来,随着合成生物学的发展,用生物物理模型描述回路与底盘的互作逐渐兴起,但模拟细胞内全部或主要生理过程的思想早在1979 年就有报道[64]。进入20 世纪以来,伴随着组学技术、生物定量技术的发展以及运算能力的提高,出现了全盘考虑所有已知生化过程的数学模型,其被称为全细胞模型(whole cell model)[65-67][图2(a),修改自文献[67]]。也有忽略大部分生化过程,仅考虑关键的几个生化过程的粗粒化的模型(coarsegrained model)[25,68-69][图2(b),修改自文献[69]]。
2.1 基于基因组的全细胞模型
随着组学技术的兴起,构建全细胞模型的想法自然而然地产生,自2000 年以来经历了构建全基因组网络结构、整合组学数据阶段[65],到目前拥有一定的预测能力。
2012 年,Karr 等[67]基于多维组学数据对Mycoplasma genitalium进行全细胞建模,将细胞的生理过程分为28 个子过程并用16 个细胞变量将子过程整合起来,用合适的数学模型进行模拟,例如细胞代谢产物使用流平衡分析(flux-balance analysis,FBA)方法,蛋白质等代谢产物降解采用泊松过程。在每个细胞周期内,每个子过程都在一个较短的时间尺度内独立模拟,并通过细胞变量整合。该模型可以对基因组各基因与转录因子之间的互作等诸多细胞行为做出预测,在这基础上通过对单基因扰动的模拟发现了已注释基因的新功能。除了M.genitalium以外,另一个比较成熟的生物模型是E.coli模型,有研究以它为对象尝试建立对应全细胞模型,成功预测大部分基因或环境扰动对生长速率的影响[70]。除了预测实验现象以外,全细胞模型在生理机制证明方面也有应用,通过将染色体上的DnaA Box 整合进全细胞复制模型,可以建立染色体复制起始时间决策的模型[71]。从全细胞模型出发研究关于噪声对基因开关的影响,发现生长状态对噪声大小存在影响,由于转录翻译元件扩散速度慢和自我复制特性会产生正反馈机制,导致快速生长条件下的细胞存在更大的噪声[72]。通过在模型中加入基因线路模块,全细胞模型也可以进行基因线路动力学预测,Purcell 等[73]在回路噪声模拟问题上初步应用了M.genitalium全细胞模型,再现了自抑制振荡回路中的噪声现象。
全细胞模型涉及大量的参数,在M.genitalium的全细胞模型中整理了1900 个参数,包括小分子和蛋白质浓度、DNA 蛋白质亲和力大小、RNA 蛋白质降解速率、超螺旋程度影响等,以及更多当前无法定量的参数[74]。另外,繁杂的参数使得模型模拟结果与参数之间的关系变得难以解读。从“一切从简”的观点出发的粗粒化模型成为了与之互补的另一条途径。
2.2 粗粒化模型
人们希望通过一些简化模型,抓住所关注问题的核心机制,来对现象进行解释。早期细胞生理学家通过粗粒化模型想要回答的问题是,如何预测特定环境下的细胞生长速度。然而单纯从营养物质能量大小出发,无法解释实验结果,于是科学家们注意到前体代谢物对生长的关键作用以及蛋白质合成和底物之间的调节效应,相关内容总结于文献[75],这算是最初的粗粒化模型。而Scott等[25]基于实验现象,进一步将蛋白质组分为核糖体相关部分、代谢部分和其他部分,通过构建粗粒化模型得以解释实验中观察得到的现象。2015 年Weiße 等[68]又系统性地从能量角度整合Scott 的研究结果并精简了相关因素,对细胞生长做出了更为准确的预测,并进一步讨论了其中回路与宿主之间的作用机制。2017 年,Liao 等[69]引入ppGpp 作为全局调控因子,进一步对营养物质切换时细胞生长的实验现象进行了解释,并且引入了更多的竞争机制成功解释了基因回路相关的实验现象。粗粒化模型对细胞生理行为的描述越发准确,并且细胞与回路之间的互作也被越来越多地考虑到其中。粗粒化模型的参数数量比全细胞模型的要少得多,Liao等[69]的关于E.coli的粗粒化模型中的参数仅97 个,实验测得有52 个,其中部分参数相对稳定,不需要重复测量,可解释性和可实现性方面比全细胞模型更具有优势。
研究底盘-回路耦合效应,要抓住两者之间相互作用的关键节点,资源的竞争和全局性调度是绕不开的话题。根据不同的研究需要,抓住资源竞争过程中的瓶颈和底盘细胞相互作用的调节分子,研究人员构建了一系列模型帮助理解底盘-回路相互耦合的源头。外源基因回路的表达,对底盘细胞转录和翻译资源的竞争已经通过模型和实验得到了阐述,例如,Vecchio 课题组[49]和Macía课题组[42]分别对宿主细胞内的不同基因回路资源竞争进行研究,提出了基因表达的“等成本曲线”模型,将RNA 聚合酶资源和核糖体资源纳入到模型框架中,并成功地解释了实验现象。
另外,在资源较强的竞争条件下,随机性也会被放大,类似于“排队过程”。例如,蛋白质翻译过程中不同种mRNA 的丰度对有限核糖体结合竞争带来的基因表达波动[76],类似的作用机制在转录、蛋白质降解[48]过程中都会有所体现,Wei等[50]提出的分子竞争粗粒化模型为解释竞争过程在基因调控网络中的影响提供模型框架。
本质上,全细胞模型和粗粒化模型是两种不同的思考方向,全细胞模型是自下而上地逐一还原生化细节来构建完整细胞模型,而粗粒化模型是自上而下地对细胞进行简化。或许未来某个时刻这两条回路最终会到达一个终点,伴随着自动化实验技术的成熟,发展出一套成熟的细胞模型刻画体系,加快生物资源开发效率[77]。
3 减弱和规避合成基因回路与底盘细胞之间的耦合
通过生物物理模型,可以帮助有效理解回路-底盘耦合的根源。减弱或者规避这种耦合可以大幅降低预测、构建大规模基因回路的难度。目前主要有两种思路,回路元件正交化[78]和设计模块化[79-80]。前者通过人工的改造和导入各个层次上的正交元件(包括正交DNA 碱基,正交rRNA、tRNA、mRNA,正交蛋白质),来减弱甚至最终消除回路与细胞之间的耦合效应;后者通过基因互作拓扑结构的设计,来增强回路本身鲁棒性,减少其受宿主本身状态影响的效果。
3.1 合成基因回路正交化
正交化希望实现在维持回路其内部的逻辑调控的前提下,尽可能减少其内部元件与元件之间,以及元件与底盘细胞自身系统的不必要的交互。基因回路会不可避免地使用底盘细胞的各种资源,在特定情况下也需要建立与底盘细胞系统的接口,比如在进行天然产物的生产中,对底盘细胞原有的代谢网络进行连接[81-82]。正交化基因回路,减少了与底盘细胞的过多交互,在进行模拟预测时可以减少参数,提高系统的可预测性。通过在基因库中挖掘,正交化的DNA 复制、转录、翻译系统也不断涌现出来,正交中心法则系统这一概念也被提出。正交中心法则系统希望中心法则中涉及的生物合成过程使用一套正交的系统完成,可以类比为计算机科学中虚拟机的概念[83]。正交转录机器则早已在合成生物领域广泛使用,噬菌体RNA 聚合酶是使用最多的元件,这类RNA 聚合酶识别特定的启动子序列进行转录,大多为单体酶,且具有很强的转录活性。同时它们也容易被改造成为蛋白质相互作用层次的逻辑门,例如对其结构域进行分割,融合其他类型的蛋白质或结构域可以丰富其功能,例如,感光T7 RNAP[84-85]。类似地,将RNA聚合酶与DNA识别能力的蛋白[例如锌指蛋白(ZFNs)、转录激活因子(TALENs)或CRISPR Cas 蛋白等]进行融合表达,可以扩展其使用的范畴。例如拓展理性化设计的启动子的转录动力学范围[86]。
另一类正交转录系统则基于σ因子,利用不同来源的胞质外功能(extracytoplasmic function,ECF)σ因子对启动子序列的亲和性不同,通过共享RNA 聚合酶核心酶库和不同家族的ECFσ因子,可以设计出正交的ECFσ因子组合,实现在转录层面的绝缘[87]。蛋白的翻译涉及大量复杂的生物过程,利用理性化和定向进化等手段,近年来,正交翻译体系也取得大量的进展。例如,改造氨酰tRNA 合成酶可以将非天然氨基酸引入到蛋白质的序列中,有希望给蛋白质带来更多样的生理功能;得益于DNA 合成成本的降低,Freden 等从头设计DNA 序列替换细菌天然基因组,成功将E.coli中64 种密码子压缩到了61 种,为扩充非天然氨基酸到合成生命的蛋白库打下了基础[88]。改变核糖体16S rRNA 的序列,则可以得到正交核糖体,识别非典型的核糖体结合位点(ribosomal binding site,RBS)序列,从而绝缘合成基因回路和底盘细胞的基因表达[78,89]。
转录因子是合成基因回路设计中主要承担逻辑运算的元件,这类元件识别特定的序列激活或抑制下游基因的转录,未经正交化的转录因子存在交叉识别对应结合位点的风险。另外,结合到管家基因相关的DNA 序列上可能影响细胞正常代谢,产生毒性。
通过定向进化等手段对阻遏蛋白进行优化,增强其序列识别的特异性,也有助于降低细胞毒性[90]。除了典型的阻遏蛋白和激活蛋白外,许多具有识别序列功能的蛋白都可以通过理性化设计成为转录因子,如dCas9、TALENs 等,由于上述的非特异性结合等原因,高表达此类蛋白往往给细胞带来较大的代谢压力。正交化设计的dCas9*_Phlf 在dCas9 上引入了R1335K 的突变,去除了dCas9 的PAM(protospacer adjacent motif,前间区序列邻近基序)结合依赖性,并融合阻遏蛋白Phlf,使得它需要同时识别20 碱基的sgRNA 结合序列和30 碱基的Phlf 特异序列才能结合到DNA上,扩充了特异性结合序列的长度,降低了脱靶的风险,使细胞能耐受更高的表达量[91]。
3.2 模块化基因回路
合成生物学的一大愿景是实现基因元件的即插即用[92],即通过对基因元件的排列组合实现复杂的网络调控。传统的模块化主要是指元件模块化,即对启动子、编码序列、终止子等功能序列定义其边界,将它们独立出来。除了在元件设计过程中的模块化,更高层次的功能回路模块化方案最近备受关注。功能回路模块化将功能回路(例如逻辑门等)看作一个功能单元,通过合理的设计使每一个实现特定功能的回路的输入输出水平在插入到基因回路中时不受外部参数影响而发生变化[24]。基因回路中各个功能模块之间的相互作用主要由转录因子来实现,例如结合到基因位点将导致游离转录因子浓度下降,进而扰动上游模块;对于底盘细胞而言,基因回路对转录翻译资源的消耗,将改变细胞生长速率以及各种资源库的总量,进而又影响了基因线中的各种动力学参数,这就产生了所谓的回溯效力(retroactivity)[52],回溯效力的存在导致功能模块之间以及功能模块与细胞生理发生干扰,导致随着基因回路增加,功能模块的动力学属性发生变化。如何能够消除或规避回溯效力,实现回路的功能模块化呢?控制理论中反馈控制和非协同前馈环(incoherent feedforward loop,iFFL)[93]为功能模块化提供了思路。在原先的功能模块中加入一个控制器,来执行反馈调节功能或与原先模块组成一个非协同前馈环,在一定程度上解决了这一问题。
负反馈调节可以使基因回路的稳态输出水平仅与自生元件的动力学性质决定,而不受基因表达生成和稀释速率影响[图3(a)]。当前大量基于反馈控制的解决方案已经被应用到基因回路的设计上,可以归结为局部水平和全局水平两类(图3)。
局部水平的反馈策略主要着眼于功能模块输出本身的稳定性,希望利用负反馈系统来隔离模块与模块之间,以及模块与底盘细胞之间的相互影响[94-95]。例如,使用转录后调控元件sRNA 形成负反馈环,使每一模块的稳态表达水平都得以固定,使得它们对来自资源竞争产生的扰动具有抵抗的能力[图3(b)][95]。类似地,Aoki 等[96]则采用了对偶积分反馈的策略,在保证了模块的抗扰动能力的同时,实现了模块稳态输出的可调性[图3(c)]。
基于全局的资源调控反馈策略能够根据基因回路表达带来的负担对所需的资源进行调控。这样的模块化策略还可以与正交系统联用。例如,正交核糖体基因表达系统中加入反馈控制模块,能够实现对正交核糖体与内源核糖体比例的动态分配,使正交核糖体的比例按需分配给基因回路,减轻基因回路内部的资源竞争带来的耦合[图3(d)][97]。
图3 模块化的基因回路设计Fig.3 Modularity of circuits design
另一种反馈策略则由宿主生理状态决定,根据代谢压力的大小来决定外源基因的表达。通过实验筛选出外源基因高表达时转录水平上调的启动子,利用这类启动子激活下游基于dCas9的转录抑制系统,从而确保外源基因回路对细胞的压力维持在一个较低的水平[图3(e)][98]。
正反馈回路虽然无法使模块的输出水平更加稳定,但也有独特的用处。在代谢工程领域,为了增强基因回路的遗传稳定性,会利用与生理状态偶联的正反馈回路[图3(f)],这一策略使得表达目的产物的个体具有生长优势[99-100]。
除了反馈环这一策略外,另一种基于转录调控的模块化手段则采用了非协调前馈环,Segall-Shapiro 等[101]通过对iFFL 模体的分析,指出当iFFL 模体中阻遏蛋白无协同效应时,稳态下模体的输出将为一个常数而不依赖基因的拷贝数、细胞生长速度,通过这一简单的策略,可以使基因在不同拷贝数下实现稳定表达[图3(g)]。
4 总结与展望
过去20 年来,合成生物学领域涌现出了大量创造性的工作,从复杂而精巧的逻辑门回路,到多功能生物活性材料,乃至药物、化工产品的生物合成,都证明了利用合成生物学理论、方法的可行性;同时,利用合成基因回路,通过自上而下的手段,扰动生命体系,总结规律,这样一种“建物致知”的研究范式,让我们对生命的基本运行法则有了更加深入的认识。合成基因回路从实验室走出来,进入到工业大规模应用,必须要能够适应更多的遗传背景迥异的底盘细胞,以及更加复杂多变的使用环境。然而,由于对底盘细胞缺乏更系统的认识,导致更为复杂的人工生命系统的开发工作效率低下。
本文总结了近年来底盘细胞生理、底盘细胞之间相互耦合机制的研究进展,以及避免因耦合引起的基因回路失效等方面的策略。诚然,生命系统的复杂远远超出了我们的想象,掌握生命运行的基本规律是我们理性化设计基因回路的根基。目前,我们已经对合成生命体系的稳态行为有了较为全面的认识。然而,生物定量手段的匮乏、底盘细胞生理机制的空白、优质的生物元件库的缺乏仍然是限制人类实现完全自下而上设计生命体的瓶颈,未来,我们应当更加注重于以下几个方面的研究:
(1)开发更加精准、高通量的定量手段,利用多层次的组学技术,为定量刻画底盘细胞-基因回路相互作用机制提供更加可靠、全面的数据。生命系统是一个非线性复杂系统,精准的定量有助于研究这一充满噪声的系统,找到隐藏在“平均数”后的复杂机制。
(2)更加系统、定量化的底盘细胞生理研究,理清底盘细胞在各种条件下(如逆境、非稳态)的资源调控机制,扩大的底盘细胞研究种类。在真实应用场景下,不论是发酵生产还是疾病治疗,基因线路不可避免地经历外界环境变化,因此,在亚稳态下,基因回路行为遵循的规律是回路设计能力提升绕不开的门槛。
(3)挖掘、定量、优化更多的正交基因调控元件,阐明不同遗传背景的底盘细胞基因元件的性能。随着合成回路的规模日益庞大,高质量的正交元件可以减少回路逻辑网络中意外产生的拓扑结构,提高回路的可预测性。
(4)建立更加精准的模型预测框架,包括:将底盘细胞与回路的模型描述整合在一起,结合高质量定量数据,将非稳态状态下的行为纳入到模型的模拟范畴中,增强基因回路行为的可预测性;从DNA 序列生成环节出发,检查序列组合中随机产生的功能序列,如DnaA、启动子、转录因子结合序列等。
(5)规避“非预期”的底盘细胞与基因回路相互作用的解决方案,如利用反馈控制机制设计更加模块化的基因回路。