合成生物学新技术在基因表达精确调控和提高脂肪酸合成效率方面的应用
2019-02-19王毓舒
王毓舒, 贺 林, 马 钢
(上海交通大学 Bio-X研究院 SJTU-BioX-Shanghai国际基因工程机器大赛团队,上海 200240)
基因表达调控是一个对生物体内的基因表达进行调节控制的极其复杂的过程,是生物体内细胞分化、形态发生和个体发育的分子基础,受转录水平、翻译水平和翻译后水平等不同层次的影响.基因表达调控可以使细胞中的基因表达在时间以及空间上处于有序的状态,并且对环境条件的变化有所反应.人们通常利用外源分子元件,或者直接利用内源性元件,对基因表达进行不同程度的调控,但外源分子元件在底盘细胞中的运用往往缺乏稳定性,而内源性元件则存在着本底噪声大、结构未知、调控信号不明等问题.如何减少生物元件间的干扰,简化分子元件作用模式,充分利用生物底盘来重新编程和合成稳定、高效的人工代谢网络,是科学家们普遍关心的问题.
合成生物学是生命科学在21世纪刚刚发展出来的一个分支学科,其目的在于利用合成的 DNA 理性地构建新的表达元件、功能模块、基因线路,甚至是全新的生命体.合成生物学采用“适配”以及系统进化的概念,通过调节不同模块的表达强度,使功能模块之间,或者功能模块与底盘细胞之间进行适配,从而实现代谢流最优化,让人工生物系统进行高效运转.基于合成生物学的思维和手段,科学家们构建了用于基因表达调控的元器件,并将其广泛地应用于疾病诊断与治疗、环境监测与控制,以及高附加值化学物品的生物合成中.Shao等[1]基于光遗传学技术,设计合成一种可由远红光亮度来调控胰岛素表达的定制化细胞,并将该细胞移植到糖尿病小鼠皮下,当给予糖尿病小鼠远红光照射时,就能够激活体内的定制化细胞表达鼠胰岛素或人胰高血糖素样肽-1的短变体,从而降低血糖浓度,并维持血糖稳定.Dueber等[2]利用多细胞动物的信号传递模块,构建一种蛋白质支架,将多个酶分子进行空间重构,形成一个连续的反应体系.通过配基数量的优化,使几种酶之间达到一个最优的比例,从而使中间代谢物被快速利用,防止有毒代谢物积累.蛋白质支架的应用不仅降低了高迁移率群蛋白(HMG)对细胞的毒害作用,还将代谢流量提高了77倍[2].沙门氏菌(Salmonella)可分泌抗肿瘤蛋白,帮助机体清除肿瘤,但在正常的组织中表达会带来副作用.基于沙门氏菌优先在肿瘤组织中累积这一特性,Swofford等[3]在沙门氏菌中安装了一种群体感应线路,只有在沙门氏菌达到一定密度之后才会开启抗肿瘤蛋白的表达,实现治疗蛋白在肿瘤组织中选择性表达的目标.精准调控在细胞调节通路和响应复杂环境等方面具有十分重要的作用,利用理性设计的生物元件对生命体的代谢系统进行精密控制具有重大的科学意义和社会价值.
近半个世纪以来,化石燃料使用量的增加导致温室气体排放的加剧,对地球生存环境造成不良影响.20世纪70年代提出了生物燃料的概念,以玉米及甘蔗为原料的生物乙醇和以棕榈油为原料的生物柴油被用来替代化石燃料,但是这类生物燃料的开发也引发了针对因占用粮食和农业用地进行燃料生产所引发的社会和环境争论[4].许多微生物拥有天然的生化代谢途径,能够将生物质转化为生物燃料的前体.中长碳链(C8~C18)的烃醇类物质具有与现有石油基产品更加匹配的结构和化学性能,因此是一种理想的替代性能源[5].烃醇类化合物可以经脂肪酸分子的脱羧和酯化反应获得[6-8],而脂肪酸合成途径是生物生长繁殖所必需的同化代谢途径,因此,对微生物天然的脂肪酸合成途径进行改造已成为近年来生物燃料领域研究的热点[9].值得注意的是,合成生物学技术的日臻成熟能够帮助代谢工程学家更为科学合理地设计与底盘细胞相适配的功能模块,平衡生物体内的代谢流,提高人工生物系统的鲁棒性[10-11],极大地拓展了大肠杆菌脂肪酸的合成方式和应用范围.
基于大肠杆菌细胞中天然存在的生物元器件,上海交通大学iGEM团队开发了3种基因调控模块,并将其应用于脂肪酸合成途径的调控和优化上,实现自由脂肪酸产量的提升,展现人工生物模块在构建高效率人造细胞工厂方面的潜力和价值.
图1 两种调控系统中插入AGG数量与荧光素酶表达量的关系Fig.1 The relationship between inserted AGG number and luciferase expression level in both regulation system
1 稀有密码子开关——翻译水平上的精细调控
众所周知,代谢网络中的各个组分之间存在一个最适的化学计量比值,当反应体系在这种稳定平衡状态下工作时,能够保证各个元件利用的最优化和反应的最大化.传统的基因工程手段往往是通过启动子强度的调节和反式元件的应用来调控目标基因的表达强度,当需要在一个互相牵制紧密的代谢途径中严谨地操控各个基因的表达时,传统方法会明显暴露出操作的繁冗性和调控精度上的缺陷.由于对应同源tRNA的匮乏[12-13],稀有密码子通常会阻碍蛋白表达,所以在代谢工程改造中通常会针对底盘细胞的密码子偏好对所需调控的基因片段进行密码子优化,以增强相应蛋白的表达水平[14-15].但是,生物体对密码子的偏好性恰恰可以被用来开发调控基因表达的分子元件.在大肠杆菌中,AGG、AGA、CUA、AUA、CGA和CCC属于稀有密码子,它们在基因中的相对位置决定这个基因的表达水平[16].因此,通过共表达或过表达这些tRNA可以有效地克服由稀有密码子引起的基因表达障碍[17].利用大肠杆菌的稀有密码子AGG、AGG对应的同源tRNAArg(CUU)、终止密码子TAG,可以建立一个作为“稀有密码子开关”的分子器件,用来精确调控目标基因的表达强度[18].
1.1 受稀有密码子开关调控的目标基因的表达水平依赖于稀有密码子的数量
为了实现稀有密码子开关对目标基因的调控,分别构建含有2、4、6、8个稀有密码子的荧光素酶表达菌株.AGG序列直接通过PCR加入到luc基因的第2个密码子之后,紧接在luc基因后的是与AGG对应的同源tRNAArg(CUU),即argW基因,两个基因簇同时受异丙基硫代半乳糖苷(IPTG)诱导型强启动子T7的调控,其质粒构建见图1(a).荧光素酶活性检测结果显示,Luc蛋白的荧光强度与稀有密码子数量n的倒数存在线性函数关系,
RLU=a+b/n
(1)
式中:截距a和斜率b是常数.报告基因的表达水平与插入的稀有密码子数量之间存在一种正相关的线性关系,如图1(b)和表1所示.为了探究稀有密码子这一调控元件的稳定性,改变tRNAArg(CUU)的位置,将argW基因置于组成型启动子trc之下,同时将带有4、6、8个AGG的luc基因分别连接到组成型的弱启动子bla之后,报告基因和tRNAArg(CUU)存在于两个独立相容的质粒系统中,tRNAArg(CCU)单独受启动子trc调控,质粒构建见图1(c).这样设计是为了研究目标基因的表达水平是否仅与稀有密码子的数量有关, 而与启动子的强度或者与目标基因和 tRNA 的相对位置无关.首先对pET-bla-8AGGluc菌株进行荧光定量,并以此荧光强度为基数推测pET-bla-4AGGluc和pET-bla-6AGGluc的Luc蛋白表达水平.蛋白表达量基于表1中荧光酶的相对亮度和8个AGG之间的比值进行预测.通过荧光素酶活性检测,发现pET-bla-4AGGluc和pET-bla-6AGGluc的表达水平与模拟值吻合度很高,见图1(d)和表1,说明不同数量的稀有密码子对目标基因的调控效果可以通过模型进行拟合推演,这一结果仅与稀有密码子的数量有关,与对应的tRNA的拷贝数无关.因此,受到稀有密码子开关调控的目标基因的表达与稀有密码子数量之间的这种线性关系是非常稳定的,研究人员可以通过公式推导出所需的稀有密码子数量,将基因表达调控到合适的强度.
表1 由不同的构建类型得到的荧光素酶活性的相对比值Tab.1 The relative ratio of luciferase activities in different construction types
图2 稀有密码子元件对E.coli脂肪酸合成效率的优化Fig.2 The optimization of fatty acids sythesis efficiency in E. coli by rare codon element
1.2 用稀有密码子开关优化大肠杆菌脂肪酸合成途径
为了挖掘稀有密码子开关在复杂代谢网络调控中的潜力,需要选择一个具有清晰调控模式的代谢途径作为改造对象.Yu等[19]对在体外对大肠杆菌脂肪酸合成途径中脂肪酸合成酶系的催化动力学关系进行研究,通过在体外配制不同浓度的酶反应体系,以丙二酸单酰辅酶A(Malonyl-CoA)为底物催化目的产物十六烷酸的合成,最终获得脂肪酸合成的最优催化体系,并确定当FabG,FabI,FabZ和TesA’这4种酶的物质的量(n)之比为 1∶10∶10∶30时,细胞合成脂肪酸效率最高.基于式(1),可以推算出当AGG的数量分别为8、4、1时,对应的基因表达量的比值将大约为1∶10∶30.因此,从理论上来说,在对应基因fabG,fabI,fabZ,tesA’的起始密码子后分别插入8、4、4、1个AGG,可以将这4种酶按照1∶10∶10∶30 (n∶n) 的比例进行调节(该构建名为4Z8G4IT).同时,构建不受AGG调控的ZGIT组和各插入4个AGG的4Z4G4I4T组,将它们作为对照菌株,质粒构建见图2(a),其中数字表示紧接在相应基因起始密码子之后插入的AGG的数量.脂肪酸定量结果显示,4Z8G4IT组的总脂肪酸浓度为 68.96 mg/L,几乎是ZGIT组(37.17 mg/L)和4Z4G4I4T组(37.16 mg/L)的2倍,见图2(b).尽管4Z4G4I4T组中4个酶的表达量受稀有密码子开关的调控有所下调,但是脂肪酸合成的效率似乎与正常过表达的ZGIT组无明显差异,而且不论是在总脂肪酸还是C14、C16、C18的组成上均与ZGIT组相近,其中WT为野生型(见图 2(c)).通过比较这3组菌株的合成能力,再次证明了只有在保证代谢流平衡的条件下对多酶反应进行调控,才能实现酶催化效率的最大化,而稀有密码子开关这一元件能够通过简单地调整基本调控元件的数量来实现对多酶系统中不同基因的精细调控,对于研究体内代谢途径的酶动力学性质,优化微生物细胞工厂的生物合成效率具有广泛的应用前景和较大的应用价值.
图3 基于E. coli跨膜蛋白Lgt的膜蛋白元件设计示意图Fig.3 The schematic diagram of the design of membrane protein element based on Lgt, an E. coli transmembrane protein
2 细胞膜支架——代谢反应加速器
在代谢网络改造、组装及重建上,合成生物支架是一种行之有效的工具.人们在细胞中建立支架,将代谢反应必需的几种关键酶固定在支架上,从而将它们集中在某个特定空间内,减少各个酶之间的距离,可以有效加快酶促反应的速度[2, 20-21].人工支架的运用能够维持代谢途径中酶与酶之间能量流的平衡状态,减少中间产物的累积效应,但由于构建方式的局限性,使细胞内支架的数量受到自身表达或拷贝水平的影响,在调控灵活性和稳定性上无法达到理想状态[22-23].作为保护细胞的一种天然屏障,细胞膜由磷脂双分子层构成,这种双层结构形成了一个相对固定的空间,其中发生相互作用的分子间的空间距离相对较小,且发生在细胞膜附近的反应会由于产物在膜一侧的累积效应而加速产物的跨膜运输,有利于目的产物分泌到细胞外的介质中.同时,细胞膜可以直接感应外部环境以及细胞内部的信号,为人工制造受特定信号调控的分子元件提供良好的平台.基于微生物细胞膜的这些特点,可以在大肠杆菌细胞内膜这一天然的二维平面上搭建一种蛋白支架,通过将一个代谢反应中的多个酶固定在细胞膜支架上,实现对特定代谢流的加速[24].构建细胞膜支架所需要的基本生物元件包括来源于大肠杆菌的一种内源蛋白前脂蛋白二酯酰转移酶(Lgt)[25],一段SRP依赖的蛋白转运系统的导向序列ssDsbA[26],以及来源于后生动物细胞的二聚体蛋白系统[27].
2.1 报告基因在细胞内膜上的定位表达
为了验证锚定元件ssDsbA-LGT的定位功能,分别将编码β-内酰胺酶的lac基因和报告基因egfp连接在lgt的N-末端和C-末端,质粒构建见图3(a).在Lgt的两端分别连接功能蛋白β-内酰胺酶和增强型绿色荧光蛋白(EGFP),ssDsbA序列负责将融合蛋白导向周质空间.将得到的pETara-Anchor 质粒转化至BL21细胞中,并且经过L-阿拉伯糖诱导后用激光共聚焦显微镜对细胞进行观察,结果发现pETara-Anchor菌株在细胞边缘具有明显的绿色荧光,这说明细胞膜上聚集了大量成功表达的EGFP,从而证明了锚定元件ssDsbA-LGT具备将与之融合的蛋白分子定位在细胞膜上的功能[24].同时,为了探究锚定元件表达的最适诱导浓度,对在不同L-阿拉伯糖和氨苄青霉素浓度条件下的菌株生长情况进行测定,结果发现当L-阿拉伯糖的体积分数为 0.2%时,菌株能够耐受质量浓度高达200 μg/mL的氨苄青霉素.通过荧光检测和抗生素耐受实验,证明ssDsbA-LGT能够将目标蛋白定位在细胞内膜的两侧空间,并且不会对目标蛋白的生物学功能造成影响.
2.2 报告基因在细胞内膜上的聚合表达
在初步实现将目标蛋白定位在细胞内膜上后,希望通过进一步拉近上膜蛋白之间的空间距离,来改善代谢流.要实现这一目标,需在锚定元件中引入一种二聚体蛋白,这类二聚体蛋白由相互匹配的结合域和配基两部分组成,选取来自小鼠的SH3、PDZ和来自大鼠的GBD这3种二聚体蛋白.EGFP被拆分成1EGFP和2EGFP两部分,将它们分别与带有不同二聚体蛋白结合域或配基的锚定元件的C-末端相连,质粒构建见图3(b).通过荧光观察可见:同时表达带有聚合元件的1EGFP和2EGFP的菌株具有明显的绿色荧光信号,不带聚合元件的对照组则没有信号,由此证明锚定元件与聚合元件的组合能够将目标蛋白分子在细胞内膜上进行聚拢[24].动物细胞中存在很多具有类似功能的二聚体蛋白,通过构建不同的锚定-聚合元件,能够方便地利用细胞膜支架将多个酶分子串联在一起,以提高细胞内的酶促反应效率.
NS—无显著意义,*—P<0.1, **—P<0.01, ***—P<0.001图4 不同表达模式的脂肪酸合成酶系对E. coli脂肪酸合成效率的影响Fig.4 The effects of fatty acid synthases with different expression pattern on fatty acid synthesis efficiency in E. coli
2.3 用细胞膜支架加速大肠杆菌脂肪酸合成途径代谢流
基于DNA、RNA、蛋白质的人工支架通常是通过将生化反应所需要的多个酶分子固定在支架上,来优化特定代谢途径的反应效率,提高特定产物的生产速率.创造细胞膜支架的目的也在于此.为了验证其加速代谢流的功能,选择FabI,FabZ,FabG和TesA’这4种在大肠杆菌脂肪酸合成途径中起关键作用的酶分子作为改造对象,并构建4组具有不同脂肪酸合成酶表达模式的工程化菌株,分别为膜上聚合组(MBF)、膜上自由组(MF)、胞内聚合组(CBF)、胞内自由组(CF).脂肪酸合成系统模式见图4(a):MBF组中的4种酶在膜上聚合;MF组在膜上自由表达;CBF组将4种酶在胞质中聚合;胞质表达CF组作为实验对照组.借助气相色谱质谱联用仪(GCMS)对这4组工程化菌株合成的游离脂肪酸的构成进行分析,定量结果显示:MBF和MF在总脂肪酸产量上没有明显差异,但优于CBF和CF,见图4(b).脂肪酸合成酶系是否在细胞膜上聚合似乎对脂肪酸产量影响不大,出现这一现象的原因可能是与广阔的胞质空间相比,细胞内膜是一个相对紧凑的空间,被固定在上面的蛋白分子之间的空间距离已经足够近,以致不需要额外借力就能够实现酶促反应的加速.同时,当脂肪酸合成酶系在胞质内聚合表达时,工程菌的总脂肪酸浓度要高于自由表达组,这与此前报道的蛋白支架系统对代谢流加速[24]的效果是一致的.
另外,对4组菌的胞外和胞内脂肪酸丰度进行分析,结果显示:MBF和MF组相比于CBF和CF组而言能产生更多的胞外脂肪酸;不论是聚合组还是自由组,脂肪酸合成酶系的上膜表达均能显著提升胞外脂肪酸的浓度(MBF/CBF为 5.52 倍,MF/CF为 3.77 倍),见图4(c).这是因为带有细胞膜支架的工程菌所合成的脂肪酸被富集在细胞膜内侧,相对于胞外的低浓度环境形成一个较大的浓度梯度,从而迫使脂肪酸被动扩散至胞外,同时也缓解了脂肪酸在胞内累积对脂肪酸合成所造成的反馈抑制,进一步加速脂肪酸合成效率.因此可以认为,细胞膜支架对于细胞内合成终产物的分泌具有一定的促进作用,有助于进一步降低生物燃料的生产成本.
特别值得一提的是,基于同样的策略,文献[28]在集胞藻PCC6803中构建了另外一种细胞膜支架,从而将胞外游离脂肪酸的产量提高了近8倍(与野生型集胞藻相比,见图5),并且提高了突变藻株对脂肪酸的耐受能力,由此再一次验证了细胞膜支架在微生物代谢网络改造和优化中具有良好的应用潜力.
图5 改造后的集胞藻发酵液表面漂浮着大量脂肪酸油滴Fig.5 Substantial droplets appeared on the surface of engineered Synechocystis broth
3 光控CRISPRi系统——在转录水平上对内源基因的精确调控
研究人员对基因表达模式进行重编程的方式已经发展到序列特异性基因靶向技术,包括RNA干扰(RNAi)、锌指调控子、转录激活型效应因子(TALE)和CRISPR介导的调控.在这些技术的实际应用中如果对精确度的要求很高,例如药物治疗,则其调控效能必须在数量上可调.尽管已经有一些分子开关能够成功地开启或关闭调控[29-30],但仍然缺少可以精确定量调节的方法.为此,调控过程必须在一些实时信号的引导下进行.由于光在空间和时间尺度上都具有较高的分辨率,并且能在极短的时间内产生,所以对于分子生物学操作而言,它非常方便,同时对于需要高通量技术的实际应用光是唯一可行的信号.在本文研究中,选取一种合成的蓝光感受器YF1-FixJ-PFixK2作为感应外界蓝光信号的元件[31].CRISPR干扰(CRISPRi)是一种基因组调控工具[32],由两个基本元件组成:一个是突变的 II 型CRISPR/Cas系统中的dCas9蛋白,其缺少内切酶活性;另一个是长度为108 nt的向导RNA序列(gRNA),其中包含了一个20 nt的碱基配对区来决定其对靶向基因的序列特异性.dCas9∶gRNA复合物结合在目标基因上并阻挡转录必需的RNA聚合酶.gRNA介导的干扰在设计上成本较低,而且没有组织特异性,使用起来非常方便.因此,本文将蓝光感受器与CRISRPi相结合,在大肠杆菌中开发了一种可以受蓝光控制的基因转录调控系统,用来定量地调控外源转入的载体基因和宿主内源基因的表达[33].
3.1 利用光强对质粒上整合的报告基因进行定量 调控
蓝光感受器-CRISPRi系统的构建如图6所示:蓝光感受器由yf1和fixJ构成;启动子PFixK2控制gRNA的转录,gRNA引导dCas9蛋白结合在目标基因的识别位点,阻止转录的发生.YF1是一种蓝光敏感的组氨酸激酶,在没有蓝光的情况下,YF1磷酸化它的同源响应调控子FixJ,进而激活启动子PFixK2.将gRNA放置于PFixK2的下游,因此gRNA的转录受到蓝光的调控.理论上,当蓝光变强时,启动子受到抑制,从而减弱gRNA的表达,CRISPRi对目标基因的抑制效果也将减弱.首先用一种可见的红色荧光蛋白mrfp作为报告基因检测该调控系统的功能,并设计一个能特异性靶向结合mrfp的gRNA.在蓝光感受器YF1-FixJ-PFixK2的响应范围内设置以10个光强为一个梯度的从0到饱和的光照强度.为了避免不同实验组之间由于菌体生长情况不同所造成的差异,在黑暗中将菌株培养至稳定期(OD600=2.2)之后再分成不同的实验组,在不同光强下继续培养15 h后,收集细胞对荧光强度进行检测.结果显示:mRFP荧光强度的增长和光强呈明显的正相关关系,随着光强的增加,mRFP蛋白的表达量也逐渐增加.对不同光强条件下的mRFP荧光强度进行定量测定,由图7可见:100%光强时的mRFP表达量大约是无光信号时mRFP表达量的2倍;不同光强条件下mRFP表达菌株的表型变化为光强越大,红色越深.
图6 蓝光感受器-CRISPRi系统构建示意图Fig.6 The schematic diagram of Blue sensor-CRISPRi system
图7 mRFP表达量与光强的关系Fig.7 The relationship between mRFP expression and light intensity
3.2 利用光强调控基因组上内源基因的表达
与转入质粒中进行表达的基因不同,基因组上的内源基因通常是单拷贝的,对它们在转录水平上进行调控的方法有所不同.因此,选择大肠杆菌脂肪酸合成途径中的一种关键蛋白酰基辅酶A合成酶FadD作为研究对象,尝试用蓝光感受器-CRISPRi系统调控fadD基因的表达.利用反向PCR的方法替换gRNA中20 nt的碱基互补区域,使CRISPRi能够特异性地靶向fadD.同样,在黑暗中将菌株培养至稳定期(OD600=2.0),然后分成不同的实验组.在不同光强下培养15 h后,细胞被收集用来提取RNA.用实时定量PCR来对fadD的mRNA丰度进行测定,以此表征fadD的转录水平.大肠杆菌的看家基因gapA作为内参基因,野生型菌株BL21(DE3)被用来进行相对定量,fadD的mRNA含量随着蓝光光强的增加有一个持续而稳定的上升趋势(见图8),回归分析[33]R2=0.924.结果表明:通过用蓝光感受器控制CRISPRi/dCas9系统,能够将目标基因的表达量与光信号形成一种量化的对应关系.因此,光控CRISPRi系统能够对内源基因进行精确调控,在代谢途径优化和药物治疗等领域具有良好的应用潜力.
图8 fadD转录水平和光强的关系Fig.8 The relationship between the transcriptional level of fadD and light intensity
4 结语
本文对3种基因调控元件的构建和应用进行了详细阐述.这些研究紧扣合成生物学核心思想,独辟蹊径地选择稀有密码子和细胞膜这两种生物体内源基础的分子元件,并将当前广泛应用的CRISPRi/dCas9基因调控系统与光信号巧妙结合,搭建出一种易于操作的高敏感度的反式调控元件——稀有密码子开关,一种兼具稳定性和灵活性的内源分子支架——细胞膜支架,以及一种用电脑控制的蓝光信号精确调控内源基因表达的调控工具——光控CRISPRi系统.这3种构想的实现为大肠杆菌的基因工程操作和代谢工程研究提供了理论基础和技术支持,不仅能用于可再生生物燃料前体脂肪酸的制备,而且可以广泛应用于其他具有高附加值化学物品的生物合成和人工生物系统的构建.