合成类胡萝卜素细胞工厂的快速构建和定向进化
2021-03-30王颖曲俊泽梁楠郝鹤元英进
王颖,曲俊泽,梁楠,郝鹤,元英进
(1 天津大学教育部合成生物学前沿科学中心,天津300072;2 天津大学系统生物工程教育部重点实验室,天津300072;3 天津大学化工学院,天津300072)
类胡萝卜素(carotenoids)是一类由类异戊二烯聚合物构成的天然色素,较为常见的是C40骨架的番茄红素、β-胡萝卜素、玉米黄质、虾青素、辣椒红素等四萜类化合物[1]。由于类胡萝卜素碳骨架结构中的共价多烯结构不稳定,极易通过非特异性(光氧化、化学氧化)和特异性的方式发生裂解,进而又可以生成许多脱辅基类胡萝卜素[2],例如β-紫罗酮、β-环柠檬醛、藏红花酸等[3-4]。同时,这种共价多烯结构还赋予了类胡萝卜素产品丰富的颜色(红色、橘色、黄色)和超强的抗氧化活性,因此多被应用于功能营养品、化妆品、食品添加剂、动物饲料等领域[5]。据报道[5-6],类胡萝卜素全球市场价值在2018 年已达到15 亿美元,预计2022 年将增至20 亿美元。随着类胡萝卜素市场需求的急剧增长,直接提取的产率低以及化学合成产品结构特异性差的问题也越来越凸显[5]。而微生物发酵法可利用廉价的碳源合成构型、活性同天然提取的类胡萝卜素一致的产物,是传统生产模式的重要补充。此外,由于类胡萝卜素具有颜色这一特征,还可作为筛选和指示标签在合成生物学方法和工具开发中得以应用,例如,显示类异戊二烯合成路径和竞争路径的通量[7-8]、示踪病原体[9]、监控血液中锌离子的浓度[10]等。因此,构建微生物细胞工厂合成类胡萝卜素逐渐成为合成生物学的研究热点。
合成生物学技术的不断发展也极大推动了类胡萝卜素及脱辅基类胡萝卜素等产品在大肠杆菌(Escherichia coli)、 酿 酒 酵 母(Saccharomyces cerevisiae)、耶氏解脂酵母(Yarrowia lipolytica)等常用底盘中的高效合成(表1)。类胡萝卜素的生物合成路径以最基本的C5单元异戊烯焦磷酸(isopentenyl diphosphate, IPP)/二甲基烯丙基焦磷酸(dimethylallyl diphosphate,DMAPP)为节点,分为上游和下游路径。上游路径包含来自于真核生物和古细菌的甲羟戊酸(mevalonate, MVA)路径及来源于原核微生物和植物质体的2-C-甲基-D-赤藓糖醇-4- 磷酸(2-C-methy1-D-erythrito1-4-phosphate,MEP)路径。下游路径以IPP 和DMAPP为起始,通过多步异戊二烯基转移反应缩合生成C20的牻牛儿基牻牛儿基焦磷酸(geranylgeranyl pyrophosphat,GGPP)。两分子GGPP继续缩聚形成C40的四萜骨架,之后经过连续多步脱氢、环化、羟基化、酮基化、氧化裂解等修饰反应合成多种类胡萝卜素及其衍生物(图1)。在异源底盘中构建类胡萝卜素合成路径,常采用过表达MVA 或MEP途径蛋白[11-13]、表达N 端截短的羟甲基戊二酰辅酶A 还原酶(tHMGR1)[14-15]、改造内源中心代谢[16-18]等萜类产物合成的通用策略,以提高前体IPP/DMAPP 的供给。值得注意的是,有别于其他萜类产品,类胡萝卜素的合成需要强化前体GGPP的供应和利用。而多数IPP/DMAPP 下游路径蛋白具有较为宽泛的底物选择性和催化多步连续反应的能力[19],易于形成代谢瓶颈,积累代谢中间体。且类胡萝卜素产品强还原性[20-21]和质膜插入积累[22]的特点常给底盘细胞带来胁迫压力,成为提高该类产品合成水平的重要限制因素。
表1 构建类胡萝卜素细胞工厂示例
续表1
续表1
图1 类胡萝卜素生物合成路径
由于类胡萝卜素具有颜色,可直接通过观察菌落表型[39]、检测发酵产物吸光度[40]、拉曼光谱分析等手段[41],挑选出高产菌株。且类胡萝卜素的强还原性使其具有拮抗活性氧(reactive oxygen species,ROS)的能力[42],从而使过氧化氢添加成为筛选高产量的选择压力。因此,通过在元件、模块以及底盘水平上产生遗传多样性,并结合颜色筛选或氧化压力选择,可以便捷地挑选或富集利于产物积累的个体。这一策略的实施减少了理性设计的工作量,有效加速了类胡萝卜素细胞工厂的构建进程和对产物合成瓶颈问题的突破,并为后续理性优化策略提供靶点信息。本文将从路径的快速构建和底盘的定向进化两个角度,系统综述类胡萝卜素细胞工厂的非理性设计策略在调控代谢流和缓解产物胁迫压力中的应用,以期为微生物细胞工厂中合成其他高附加值产物提供指导和借鉴。
1 合成路径的快速构建
构建类胡萝卜素细胞工厂涉及多模块的组装。除根据目标产品选择GGPP 合成酶(CrtE 或GGPPS)、八氢番茄红素合成酶(CrtB)、八氢番茄红素脱氢酶(CrtI)、番茄红素环化酶(CrtY)、β-胡萝卜素羟化酶(CrtZ)、β-胡萝卜素酮化酶(CrtW)等催化元件,有时还需引入异源MVA 路径[43-44]、 构建非天然异戊烯醇利用途径(isopentenol utilization pathway, IUP)[45]和类异戊二烯醇合成途径(isoprenoid alcohol pathway,IPA)[46],以解除代谢中间体的反馈抑制,增强NADPH 和ATP 的合成,提高前体的供给。类胡萝卜素产品的高水平合成需要最大限度地增加从底物到目标化合物的代谢通量,同时尽量减少不必要的副产品或代谢中间体的积累。因此,需获得最优的催化元件,并从催化特性和表达水平两个维度进行模块与模块的组合适配(图2)。
1.1 路径模块间催化性能的适配
1.1.1 关键催化元件的筛选和定向进化
类胡萝卜素产品的高水平合成需要最大限度地增加从底物到目标化合物的代谢通量,同时尽量减少不必要的副产品或代谢中间体的积累。CrtE、CrtI、CrtZ和CrtW是公认的途径限速酶。上述蛋白因具有较为宽泛的底物选择性常催化多步连续反应。而不同物种来源的催化元件在催化活性和底物选择性上存在较大差异[47]。例如,多数GGPPS以法尼基焦磷酸(farnesyl pyrophosphate,FPP)为底物,而少数GGPPS 可以直接利用IPP 和DMAPP 生成GGPP[38,48]。在酵母底盘中,后者可以有效避免与内源固醇合成竞争FPP 而具有更多的底物来源。不同生物源的CrtI在催化多步连续脱氢反应时,会展现出不同的反应步数,最终影响目标化合物在总类胡萝卜素产品中的占比[49]。CrtZ 和CrtW 分别催化两步羟基化和两步酮基化反应,形成β-胡萝卜素到虾青素的复杂代谢网络。此二者催化元件的底物选择差异决定了反应网络中代谢中间体的转化速率[50]。因此,组合筛选不同来源的路径催化元件是提高类胡萝卜素合成路径通量、减少代谢中间体积累的有效手段[17,51]。通过对筛选结果的分析,还可获得影响路径整体通量和代谢瓶颈产生的关键催化元件,为后续路径的进一步优化提供了工程化的靶标。例如,Wang 等[52]从高等植物、藻类、真菌、细菌中选择虾青素合成路径上的关键酶CrtZ/CrtW进行复配组装,并表达于β-胡萝卜素高产的酵母底盘中。通过挑选平板上颜色深红的菌株并辅以发酵验证,获得最佳的CrtZ/CrtW 来源组合,使虾青素在酿酒酵母中的发酵罐水平产量达到了81mg/L,为当时最高产量。在此基础上对CrtZ/CrtW 的进化距离与虾青素产量间的关系进行分析,发现CrtW的进化距离越短,虾青素的产量越高(R2=0.6755),因此CrtW是影响β-胡萝卜素到虾青素转化的关键蛋白。
以靶标催化元件的DNA 序列为模板进行易错PCR,形成突变文库并在宿主底盘中予以表征。通过颜色筛选,可获得符合预期催化活性和反应特异性的突变体,以用于路径组装(图2)。例如,Xie等[27]通过易错PCR对CrtE和双功能酶CrtYB进行协同进化。利用颜色筛选出红色更深的菌株,获得了环化功能失活保留八氢番茄红素合成功能的CrtYB突变体,并增强了CrtE 对番茄红素合成的促进能力,最终番茄红素在酿酒酵母中的产量达到了1.61g/L(24.41mg/g DCW)。Zhou 等[53]通过CrtW 的定向进化,加速β-胡萝卜素向角黄素的转化,最终使虾青素在酿酒酵母中的产量达到了47.18mg/L(8.10mg/g DCW)。同样通过易错PCR 协同进化CrtZ 和CrtW,使虾青素在酿酒酵母中的发酵罐产量进一步提升至235mg/L[16]。
1.1.2 调节催化路径
自然界中存在一些用于类胡萝卜素合成的双功能酶,按催化顺序衔接的两个酶,其活性中心之间构成底物通道。在底物通道的作用下可使局部底物浓度趋于饱和,使得在连续催化反应过程中加速反应底物与酶的接触,消除底物的竞争性消耗,减少旁路副反应[54]。借鉴这种天然的催化路径调控机制构建蛋白复合体,可拉近两个催化单元的蛋白活性中心,增强底物可获得性,调控催化路径。类胡萝卜素的合成通常涉及多个异源蛋白的共表达,构建IDI和CrtE的蛋白复合体,可增加IPP和DMAPP直接向GGPP 的转化,减少竞争性FPP 的合成[55];构建CrtE/CrtB/CrtI 的蛋白复合体,可加速多酶级联反应速率,促进GGPP 向番茄红素转化[56];构建CrtY 和CrtZ 的蛋白复合体,则有利于玉米黄质的合成[24]。蛋白融合[57]、蛋白支架[56]和蛋白自组装[55,58]等是构建蛋白复合体的常用手段。其中蛋白融合方向、linker 的类型、蛋白的比例等均是可工程化操作产生遗传多样性文库的靶标,直接影响催化路径的调控效果(图2)。例如,Nogueira 等[59]通过在大肠杆菌中对不同柔性linker 长度下CrtZ-CrtW 正反向融合进行筛选,获得最佳的CrtZ-CrtW融合蛋白以用于烟草中虾青素的合成。
1.2 路径模块间表达水平的适配
1.2.1 最适表达方式的筛选
通过调节模块的表达水平来平衡模块间代谢流的通量,也可达到弱化途径瓶颈的目的[23]。在调整表达强度时,多考虑调控模块拷贝数[60]、染色体整合位置[61]、启动子强度[62]、模块排列的位置和方向[63]等因素。其中,工程化模块在宿主中的质粒表达和染色体整合是筛选模块最佳拷贝数的主要手段(图2)。多拷贝质粒在不同的底盘个体中拷贝数存在较大差异。利用这一特点,将路径中每一模块分别克隆到不同质粒进行表达,可较为便捷地建立强度多样化的模块表达文库,平衡不同模块的表达水平[64-65]。在此基础上复配强度不同的启动子可增加文库的多样性[66]。通过调控质粒的复制起始位点,可调控质粒的拷贝数,以增加所克隆模块表达强度的动态范围[67]。为增强质粒的稳定性,可在表达载体上引入毒素-抗毒素系统[25]或回补基因组缺陷的必需基因[68],并通过调控上述功能标签的转录水平调节质粒拷贝数。
为实现路径模块的稳定表达,类胡萝卜素合成途径的构建仍多采用底盘基因组整合的方式。模块在基因组的插入位置和拷贝数,决定了路径模块整体表达水平的高低,从而直接影响类胡萝卜素合成路径的通量。因此,通过进行染色体多位点随机整合可以产生路径模块表达文库,结合高通量筛选也可得到类胡萝卜素高产菌株[图3(a)]。其中,δ-位点整合是酿酒酵母中最常用的基因组多位点随机整合方法[52]。Yamada 等[69]通过依次进行CrtE、CrtYB和CrtI的δ-位点整合,构建β-胡萝卜素合成路径。CRISPR 技术的引入可通过靶向双链断裂来显著提高同源整合的效率,避免选择性标签的使用。Ronda 等[70]开发了一种名为CrEdit(CRISPR/Cas9 mediated genome editing)的方法,以一步转化实现模块的多拷贝整合,应用于酿酒酵母中β-胡萝卜素的合成路径组装。Hou 等[71]设计了一个名为“wicket”的DNA 表达盒。该表达盒在经核酸酶处理后可接受外源基因,并将其整合到酿酒酵母基因组的指定位点,以实现β-胡萝卜素的合成路径中各个模块在基因组的随机拷贝数整合。在耶氏解脂酵母中应用CRISPR技术需敲除KU70,以抑制非同源末端连接(non-homologous end joining,NHEJ),提高同源重组效率[13]。而Cui 等[72]则利用耶氏解脂酵母较强的NHEJ,开发了非同源性依赖的多模块随机整合的方式,以建立模块表达水平文库,筛选β-胡萝卜素的高产菌株。
1.2.2 最适启动子序列的筛选
筛选不同强度的天然启动子[25],或者通过启动子工程人工构建强度不同的启动子文库[73],可用于路径模块相对表达强度的平衡(图2)。例如,Wu等[74]通过操纵基因启动子RBS序列和起始密码子序列,建立路径基因表达文库,平衡模块间的表达水平,在大肠杆菌中构建玉米黄质的生产路径(产量为6.33mg/L, 1.24mg/g DCW)。Larroude 等[62]通过筛选每个转录单位的最佳启动子-基因对,最终使耶氏解脂酵母中β-胡萝卜素的产量达到了6.5g/L(89.6mg/g DCW)。大肠杆菌启动子中通常可用于编辑产生启动子强度多样性文库的顺式元件,包括核 糖 体 结 合 位 点 (ribosome binding site,RBS)[16,39]、RBS 序列与基因翻译起始位点之间的间隔序列(aligned spacing sequence,AS)[75]、起始密码子序列[74]等。此外,对于原核底盘,可通过设计“可调控基因间序列”(tunable intergenic regions,TIGRs),获得长度、GC含量、茎环结构多样性的原核操纵子内基因间序列;还可以通过筛选mRNA二级结构,调控转录单元的稳定性,同时获得一个操纵子内多个基因的最优表达水平[76-77]。Shen等[24]应用可调控基因间序列,在大肠杆菌中平衡异源MVA 路径蛋白表达,最终使玉米黄质的产量达到722.46mg/L(23.16mg/g DCW)。
酵母中则通过不同启动子核心区序列和上游激活序列(upstream activating sequence,UAS)的杂合以及不同拷贝数UAS 的串联,形成表达强度梯度更精细的启动子文库[78-79]。引入正交化的异源转录因子调控系统也可构建不同表达强度的启动子文库[80]。例如,Cuperus等[81]基于大肠杆菌tet操纵子,使用与转录激活因子TetR-VP16亲和力不同的tetO序列构建启动子文库,优化番茄红素合成路径中CrtE、CrtB 与CrtI 的表达。在筛选路径模块的最佳启动子序列时,常采用Ⅱ型限制性内切酶介导的组装策略[图3(b)],例如,Golden Gate DNA 组装[37]、YeastFab 组装[82]等。COMPASS 方法(combinatorial pathway assembly)利用营养缺陷标记和抗性标记分别在大肠杆菌和酿酒酵母中建立正交化的克隆筛选体系,以克隆片段中的启动子开启载体上标签序列的转录[图3(b)],从而在迭代转化筛选的过程中避免了反复进行PCR 验证和测序验证等一系列繁琐的操作过程,有效缩短了组装周期[80]。
1.3 模块间的多因素组合适配
理论上若要取得模块与模块的最佳适配效果,需对每个催化元件的序列、拷贝数、表达水平以及所有元件的排列方式进行多因素的筛选。这需要相当庞大的构建工作量以满足文库所需的覆盖度。基于Cre/loxp 位点特异性重组系统所建立的一系列SCRaMbLE (synthetic chromosome rearrangement and modification by LoxPsym-mediated evolution)方法可有效解决这一问题。体外基因重排[体外SCRaMbLE,图3(c)],在体外由Cre 重组酶介导多个含LoxPsym位点的外源模块任意随机组合,形成质粒文库导入底盘细胞进行目标产品的颜色筛选。该方法可同时对催化元件的来源、拷贝数以及排列位置与方向进行筛选,并成功应用于β-胡萝卜素合成途径通量的优化[83]。SCRaMbLE-in[图3(c)]同时具有体外正交化的重组酶工具包与体内基因组重组系统,体外重组系统建立模块多样化的启动子文库,体内重组系统产生基因组不同位置的整合[84]。Qi等[85]综合上述两种方法的优势建立体外和体内重组系统,以筛选CrtZ/CrtW 的最佳来源组合、拷贝数和染色体整合位置,使酿酒酵母中虾青素摇瓶水平产量达到了6.05mg/g DCW。
模块化代谢工程 (modular metabolic engineering,MME)[86]将路径中所涉及的催化单元按一定规则聚类分组,将每一组中所有的催化单元的表达盒子视为一个模块。该方法只涉及平衡模块间的表达水平,以降低路径构建的复杂性。多维启发 式 过 程 (multidimensional heuristic process,MHP)不仅按MME 的思想通过筛选表达载体和不同强度的启动子对整个模块的表达水平进行适配,还增加对模块内部关键催化元件的序列优化(物种来源筛选和酶工程改造) 及启动子顺式元件(RBS、5'-UTRS)的筛选,以实现同时从催化活性和表达强度两个角度进行模块与模块的多因素适配[87]。Zhang 等[87]基于该思想将从乙酰-CoA 起始的虾青素合成路径以MVA、DMAPP、β-胡萝卜素为结点分为四个模块进行模块间适配,并对由CrtZ/CrtW 组成的第四个模块进行内部催化元件的再次适配,使大肠杆菌中虾青素产量达到320mg/L(15.1mg/g DCW)。
图3 模块间适配的组装策略
2 底盘细胞不同尺度的DNA变异与进化
类胡萝卜素的长链异戊二烯基结构使其具有强疏水性。除虾青素被报道在两相培养时会有部分产物富集于胞外油相[88],大多数缺乏亲水基团的类胡萝卜素(例如番茄红素、β-胡萝卜素等)在胞内积累后会附着在生物膜上,并以线性形式嵌入磷脂双分子结构中,进而破坏膜结构、干扰细胞膜的正常生理功能[89]。作为储存类胡萝卜素的主要场所,有限的细胞膜结构还限制了目标产品产量的提升空间。此外,类胡萝卜素的强还原性还会触发底盘胁迫响应,提高胞内活性氧(reactive oxygen species,ROS)的产生,进一步危害细胞生长[20,90]。利用诱导性启动子的时序调控解耦生产菌株的生长与生产[29,63,91]、工程化转运蛋白[92]和膜囊泡转运系统[93]促进类胡萝卜素外排、调节质膜磷脂组分弱化膜系统压力[94-95]、促进原核底盘聚β-羟丁酸颗粒(PHB)[96]和真核底盘脂质体[14,36-37]对类胡萝卜素的存储与隔绝等理性设计手段可以在一定程度上缓解类胡萝卜素合成对底盘生长的影响。例如,通过脂质工程与传统代谢工程结合,构建的工程菌番茄红素单位细胞产量通过高密度培养后可达到73.3mg/g DCW[14]。但对类胡萝卜素最终产物的产出仍具有局限性的问题。
细胞内复杂的内环境,如基因网络和对应的代谢网络的存在,决定了目标产物的产出必然会受到底盘细胞内的其他各方面因素的影响。越来越多的研究表明底盘内源非必需基因对异源类胡萝卜素的合成水平有着不可忽视的影响[40,47,97]。调控非必需基因可对底盘内环境造成扰动,有助于增加外源模块和底盘细胞内环境的适配,增强细胞对产物的耐受,强化代谢流向目标路径的流动。但理性的非必需基因调控往往受限于可操纵的靶点数目和对内源环境的扰动范围。因此需辅以非理性的底盘扰动策略,增加细胞的基因多样性和相应的表型多样化,从而加快生产菌株的进化过程。对底盘的非理性扰动包含单核苷酸水平、基因水平以及基因组大片段水平不同尺度的DNA变异(图4)。
2.1 不同尺度的DNA变异
2.1.1 单核苷酸水平下的DNA变异
单核苷酸水平的DNA 变异即为DNA 序列的碱基突变。这种突变常通过易错PCR、诱变或携带碱基突变的寡聚核苷酸链产生[图4(a)]。其中,易错PCR 的靶点多为内源调控因子。这种全转录工程(global transcription machinery engineering,gTME)策略旨在从转录组重构的角度对底盘内源环境进行扰动。例如,耶氏解脂酵母中脂质积累与β-胡萝卜素产量相关。Wang 等[98]利用易错PCR 构建转录因子Yl-SPT15 的突变文库调控胞内脂质积累,并从中筛选出高产β-胡萝卜素的菌株(产量较原始菌株提高了4.7 倍)。Huang 等[99]则通过筛选易错PCR 产生的大肠杆菌全局性转录调控因子CRP 突变文库,获得了可平衡改善菌体代谢的突变体,增强底盘对番茄红素细胞毒性的耐受。实验过程中常规使用的诱变手段包括物理诱变(紫外照射、γ射线等)和化学诱变(如碱基类似物、烷化剂)。近年来新兴发展的常压室温等离子体(atmospheric and room temperature plasmas,ARTP)诱变技术具有更高的突变效率和更多的随机突变位点[100]。Jin等[101]利用ARTP诱变技术获得高产虾青素的酿酒酵母,其产量达到了217.9mg/L(13.8mg/g DCW),并获得促进虾青素积累的新靶标基因。多元自动化基因组工程(multiplex automated genome engineering,MAGE)通过设计含有突变的寡聚核苷酸链进行基因组多位点同步替换,以实现精确的基因组多靶点定位以及局部碱基的精准变异,该技术成功应用于提高番茄红素在大肠杆菌中合成水平的研究中[102]。但在酿酒酵母中,MAGE技术由于寡聚核苷酸链同源重组的问题,无法精确进行靶点定位和基因编辑。Barbieri 等[103]所开发的改进版真核生物多重基因组工程(eukaryotic multiplex genome engineering,eMAGE)基于酵母DNA 复制机制,设计与复制叉中滞后链互补的寡聚核苷酸链引入碱基突变,从而在避免双链断裂的情况下实现精确的碱基变异。利用该方法对β-胡萝卜素合成路径每一个催化元件的启动子、编码序列、终止子引入遗传变异,进而筛选影响八氢番茄红素、番茄红素、β-胡萝卜素等积累水平的突变。
图4 底盘定向进化策略
2.1.2 基因水平的DNA变异
基因水平的DNA 变异是指基因转录的激活、抑制以及因插入、删除而造成的基因失活。表达底盘cDNA 文库[104]、使用非必需基因单敲文库[40]、转座子[105]以及CRISPR-Cas9系统[12],均可实现基因水平的DNA 变异,从而筛选底盘中影响类胡萝卜素积累的靶点。但上述策略大多只能实现一种基因调控效果。Lian 等[106]基于CRISPR 组装策略所开发的CRISPR-AID (CRESPR combining transcriptional activation, transcriptional interference, and gene deletion)同时具备转录激活、转录干扰和基因删除三种正交化功能,可实现平行的模块化和高通量代谢网络调控[图4(a)]。利用这一策略成功将β-胡萝卜素在酿酒酵母中的产量提高了3 倍。此外,Liu等[107]将酿酒酵母中的基因转移到与其具有较近亲缘的耶氏解脂酵母中进行体内组装表达,以构建的“嵌合途径”扰动解脂酵母底盘的内源代谢,并结合筛选“嵌合途径”元件的序列、组合、定位顺序和拷贝数,最终将番茄红素在解脂酵母中摇瓶水平产量提高到了259mg/L(约80mg/g DCW)。
2.1.3 基因组大片段水平的DNA变异
基因组大片段水平的DNA 变异主要指基因组结构变异(structure variation,SV),即大片段DNA的缺失、重复、移位、倒置等。上述根据自然界单核苷酸多态性变异(single nucleotide polymorphism,SNP)和插入缺失变异(Insertion/deletion,InDel)而设计开发的单核苷酸水平和基因水平人工变异策略并不能实现基因组结构变异或重排。基于人工酵母合成型染色体非必需基因两端的LoxP 位点,建立体内SCRaMbLE技术,可以设计实现由单基因及区段缺失、复制、易位、倒置而产生的基因组重排,从而对酿酒酵母进行表型进化,获得多样化的功能底盘细胞[图4(a)]。Jia等[108]以β-胡萝卜素的合成为示例,提出以“与”门开关控制基因组重排的方法,并建立多轮迭代基因组重排策略,以精准动态可控的重排技术实现了基因组多样化和持续快速进化,经过了5轮重排,β-胡萝卜素的产量提高了38.8 倍。Wang 等[109]以玉米黄质的合成作为示例,提出环形染色体重排的新体系,揭示染色体结构变异与生产菌株功能强化的对应关系。
2.2 适应性进化
适应性进化是目前通过在特殊条件下筛选并积累具有目标表型细胞的常见有效方法[图4(b)]。为了适应特殊的条件,菌株会在选择压力的胁迫下富集有益突变。这种突变并不局限于上述从单碱基到基因再到基因组大片段的变异尺度。近些年来,许多成功的案例表明[110-113],适应性进化可被应用于改善微生物的生长并同时促进微生物中高附加值化合物的生产。科学家们通过适应性进化策略,获得了适应高浓度碳源培养条件的一系列突变工程菌株, 如高度耐葡萄糖的寇氏隐甲藻(Crypthecodinium cohnii)和高度耐甘油的混浊红球菌(Rhodococcus opacus),它们被证实分别在高葡萄糖浓度和高甘油浓度的培养条件下表现出生长改善与目标产品脂质积累[53,114]。
除营养胁迫外,适应性进化实验通常还会采用诸如高氧[111]、高温[112]、高盐[113]等环境胁迫因素来改善微生物性能。利用类胡萝卜素强还原性的特性,通过在连续传代培养的过程中定期向培养基中添加过氧化氢产生氧化胁迫,可以迫使菌体增加类胡萝卜素的产量以对抗氧化压力,从而提高菌株生产类胡萝卜素能力的上限。Reyes 等[42]利用该方法使酿酒酵母中类胡萝卜素的产率从6mg/g DCW 提高到18mg/g DCW。Jiang等[31]将适应性进化与ARTP诱变相结合,以ARTP诱变加速菌株变异速度,以过氧化氢压力驱动有益突变体的适应性富集,并通过多轮迭代诱变进化稳定生产菌株的高产表型,最终使酿酒酵母中虾青素发酵罐水平产量达到404.8mg/L,并观察到胞内ROS 积累降低,菌株时序寿命增加的现象。
3 结语
因具备便于筛选的特性,非理性设计策略适用于类胡萝卜素细胞工厂的构建和开发,与理性设计策略相辅相成,将极大地推动类胡萝卜素的生物合成进程。通过理性设计策略筛选路径基因、优化基因表达、改造底盘细胞调控靶点实现类胡萝卜素的异源合成[47,97],进一步通过非理性设计策略实现关键基因元件和底盘细胞的快速进化,平衡代谢流,实现类胡萝卜素产品产量的稳步提升[31,85]。其中以番茄红素为代表的类胡萝卜素产品在微生物中的合成产量已突破g/L级别(表1),有望实现大规模工业化生产。然而,为降低路径调控和底盘优化的复杂性、应用多种碳源、应对复杂非理想化的工业发酵过程并尽可能缩减生产成本,研究者越来越倾向于使用大肠杆菌、酿酒酵母之外的微生物作为生产番茄红素等类胡萝卜素产品的底盘(表2)。这些物种或具有天然的类胡萝卜素合成路径[115],或善于表达异源蛋白[116],或可光能自养[117],或具备对高温和有机溶剂的耐受性[114]等性状。同时,烟草[59]等植物底盘也扩展到类胡萝卜素产品的合成,以便从蛋白表达、翻译后修饰以及催化环境上更加贴近产物的天然宿主。例如,在水稻胚乳中引入异源类胡萝卜素合成路径,生产富含β-胡萝卜素的黄金大米(golden rice)[118-119]、橙红色的角黄素大米和虾青素大米[120],获得了一批营养价值高、色彩丰富的水稻新物种。
天然类胡萝卜素除常见的C40骨架外,还存在C30、C50骨架[115]。类胡萝卜素合成酶具有较为宽泛的底物选择性[122],对其中八氢番茄红素脱氢酶进行定向进化,可获得不同饱和度的C40类胡萝卜素产品[49];而对异戊烯基转移酶、缩聚酶和延伸酶等进行定向进化和组合表达,还可获得C50[123]、C60骨架[124]的非天然类胡萝卜素[图5(a)]。此外,对基本C5骨架单元IPP 和DMAPP 的甲基化修饰[125]以及β-环2'-羟基化修饰[126],也进一步丰富了非天然胡萝卜素的种类和功能[图5(b)]。
图5 合成非天然类胡萝卜素
合成类胡萝卜素细胞工厂使用非常用底盘和合成非天然产物的发展趋势,增加了路径构建和底盘适配的难度,也更加彰显了发展非理性设计策略的必需性。为了在大规模的突变文库中快速高效地筛选出理想的微生物菌株,在自动化设备与快速测定方法不断发展和完善的背景下,基于光信号与传感器的高通量筛选策略应运而生。研究人员开发了自动挑菌仪、移液工作站、多功能酶标仪等自动化设备以及流式细胞术和微流控技术等高通量筛选方法[127],它们能够实现微定量实验和大规模分析,以其高效、精确的特点将在合成类胡萝卜素细胞工厂的构建与开发中发挥巨大作用。这些自动化设备与高通量筛选技术手段的发展,也将进一步丰富元件-路径-底盘的遗传多样性,使研究者能够轻松构建并筛选多因素多维度的模块适配文库和底盘突变文库。此外,计算机辅助设计[128]和机器学习[129]的引入,实现了异源代谢途径设计和构建流程的快速优化。通过多轮的设计、构建、测试与学习,即根据机器学习算法,计算机基于已有数据产生模型,从而对目标生物过程提供预测与判断,将传统的实验过程搬入电脑中,有助于加速了解生物系统及元件间的相互作用,构建出更高效、更稳定的人工细胞工厂。而结合了机器学习算法的全自动机器人平台[130],可以执行实验操作并即时分析数据,以迭代的方式优化指定的生物过程,从时间、人力、物力三方面降低了实验成本,有助于解决传统分析方法应对大规模数据采集和分析在实验成本、多变性、偏差和认知不全等方面的障碍。多学科的交叉融合,必定会促使路径构建和底盘进化向着更加自动化、智能化的方向发展。
表2 非常规微生物底盘合成类胡萝卜素示例