APP下载

蛋白质组学和代谢组学在微生物代谢工程中的应用

2019-07-30高教琪周雍进

色谱 2019年8期
关键词:丁醇耐受性代谢物

禹 伟,高教琪,周雍进

(中国科学院大连化学物理研究所,中国科学院分离分析化学重点实验室,辽宁 大连 116023)

微生物代谢工程通过改造或重构微生物代谢途径,使微生物利用廉价原料合成目的代谢产物,包括大宗化学品、精细化学品、生物燃料和天然产物等[1-4]。然而,由于微生物在进化过程中获得了鲁棒性强、调控紧密的代谢网络,制约着理性代谢工程改造[5]。近年来,随着DNA/RNA测序和质谱检测技术的快速发展,基因组学、转录组学、蛋白质组学和代谢组学等多组学策略的运用使我们更容易获取与细胞生理和代谢相关的生物“大数据”,这些数据为改造和优化生产菌株提供重要线索。

图1 蛋白质组学和代谢组学在微生物代谢工程中的应用Fig.1 Application of proteomics and metabolomics in microbial metabolic engineering

蛋白质组学运用双向聚丙烯酰胺凝胶电泳(2D SDS-PAGE)和质谱等技术,大规模、高通量、系统化研究某一生物所表达的全部蛋白质及其特征,包括蛋白质表达水平、翻译后修饰、蛋白质与蛋白质的相互作用等。蛋白质组学除了能够提供定量的数据以外,还能提供包括蛋白质定位和修饰的定性信息,因此对深入理解生物代谢具有重要作用[6]。而代谢组学则运用质谱、核磁共振、液相色谱-质谱联用、气相色谱-质谱联用等技术,对某一生物在特定生理时期内所有相对分子质量较低(<1 000)的代谢物同时进行定性和定量分析。由此可见,质谱技术在蛋白质组学和代谢组学的研究中发挥至关重要的作用,而关于质谱技术的发展已有详细综述[7],在此不再赘述。转录组主要测定生物体内各基因的转录水平,由于转录水平受多方面因素的调控,如底物浓度、诱导剂浓度、抑制剂浓度等,测定的基因转录水平很难直接预测表型,因此蛋白质组学和代谢组学相对于转录组而言,对于生物表型的鉴定或预测更加直观可靠。需要强调的是,蛋白质(尤其是酶)的含量并不一定与其酶活力相匹配,而代谢组学能够直接测定特定条件下的代谢物水平以及代谢流向,因而可以与蛋白质组学数据相互补充。目前广泛使用的基因组尺度代谢模型(genome scale metabolic model,简称GEM),就是整合基因组学、转录组学、代谢流组学、蛋白质组学等多组学数据的代谢网络模型,GEM从全局角度理解代谢功能,通过测定基因转录水平、代谢物种类,不仅可以预测微生物生长表型,还能指导系统代谢工程改造[8]。

除了整合多组学策略进行系统代谢工程,单独运用蛋白质组学或代谢组学也可以指导微生物代谢工程改造。蛋白质组学定量分析微生物体内全部蛋白质(酶)的含量,通过比较不同条件下酶的相对表达水平,寻找需要优化表达水平的酶作为代谢工程靶点,以提高目的产物的产量[9]。而代谢组学通过分析菌株不同条件下代谢物含量的变化,可以指导菌株高效合成目的产物,提高菌株对产物对环境胁迫的耐受性,预测限速步骤等[10-12]。另外,蛋白质组学和代谢组学相结合,还可以挖掘植物次级代谢途径,促进微生物代谢工程合成更丰富的天然产物[13]。本文重点对近年来蛋白质组学和代谢组学在微生物代谢工程中的应用(见图1)进行综述和展望。

1 多组学与代谢工程

GEM以基因组学数据为基础,整合蛋白质组学和代谢组学等多组学数据,描述微生物体内所有代谢反应、催化反应的酶以及酶的编码基因三者间的相互关系(见图2),已经成为系统研究微生物代谢的重要工具[14]。GEM模拟代谢过程,对于特定目的产物,提出潜在菌种改造策略,例如敲除或弱化竞争代谢途径、过表达目的代谢途径的关键酶、改变代谢流方向等,从而提高目的代谢产物产量[15]。

图2 基因组尺度代谢模型的构建流程Fig.2 Construction procedure of genome scale metabolic model

光滑球拟酵母(Candidaglabrata)是一种高产丙酮酸的工业微生物,为了深入理解该菌种的生理和细胞代谢,Xu等[16]构建了C.glabrata的GEM,该模型包含804个基因、1 287个代谢反应和1 025种代谢物,分析确定了高产丙酮酸的原因,包括高效的葡萄糖转运系统、3条丙酮酸合成途径,以及吡哆醛、硫胺素、烟酸和生物素合成关键步骤的缺失;在此模型预测的基础上,提出其他目标产物代谢工程策略:(1)抑制α-酮戊二酸脱氢酶的活性,增加硫胺素的添加量,提高线粒体中ATP的水平,进一步增加了α-酮戊二酸的产量;(2)过表达丙酮酸羧化酶和苹果酸脱氢酶基因,提高糖酵解和细胞质还原途径的流量,实现了5.4 g/L富马酸的积累;(3)过表达α-乙酰乳酸脱羧酶(催化丙酮酸裂解形成乙偶姻),实现了1.2 g/L乙偶姻的积累。该研究证明了GEM策略用于简化代谢工程靶点的通用性。

巴斯德毕赤酵母(Pichiapastoris,最新命名Komagataellaphaffii)由于其高效的甲醇诱导型醇氧化酶强启动子,广泛用于异源蛋白质表达[17]。Ye等[18]在最新的基因组注释和文献基础上,构建了全新的P.pastoris的代谢模型iRY1243,新模型包含2 407个代谢反应、1 094种代谢物、1 243个基因。运用该模型,作者成功预测了在葡萄糖为碳源的合成培养基上生长时的123个生长必需基因,这些基因与辅因子代谢、三羧酸循环、脂类合成有关。另外,模型预测敲除甲醇氧化酶编码基因aox1、腺苷甲硫氨酸脱羧酶编码基因spe2、胱硫醚β-合成酶编码基因cys4、插入链霉杀阳菌素裂解酶编码基因vgb,以及过表达葡萄糖-6-磷酸脱氢酶编码基因zwf1、甲硫氨酸腺苷转移酶编码基因sam2,可增加S-腺苷甲硫氨酸(SAM)的产量,实验结果与预测一致,说明该模型具有指导毕赤酵母代谢工程改造的应用前景。

解酯耶氏酵母(Yarrowialipolytica)是一种模式产油酵母,胞内最多可积累自身干重50%的油脂,而油脂可用于生产高品质生物柴油[19]。Pan等[20]结合基因组注释和代谢组学、蛋白质组学等多组学数据库的信息,构建了Y.lipolytica的基因组尺度代谢模型iYL619_PCP,其中包含619个基因、843种代谢物和1 142个生化反应;该模型成功预测了Y.lipolytica的最小成分培养基以及在不同底物上的生长能力,利用代谢流平衡分析模拟单基因敲除过程,预测了模型的必需基因和半必需基因;另外,在该模型的基础上通过代谢组学进行代谢流扰动分析,得出乙酰-辅酶A(CoA)羧化酶是提高油脂合成的关键酶,以及2-磷酸甘油酸转化为丙酮酸的两个酶编码基因的敲除可增加丝氨酸的合成。

目前,大量相继报道的组学数据已经被用于构建更丰富的微生物GEM,这必将在预测微生物表型和指导代谢工程等方面做出重要贡献。

2 蛋白质组学和代谢组学指导菌株生物合成

运用蛋白质组学和代谢组学分析不同表型和基因型的菌株,探究菌株生产与酶水平、代谢物水平之间的关联,确定菌株改造靶点,可以指导菌株生物的合成。

Alonso-Gutierrez等[9]报道了一种定量靶向蛋白质组学数据分析方法:蛋白质组主成分分析(PCAP)。研究人员[9]将甲羟戊酸(MVA)途径的9个基因分成3个基因簇,并分别通过单质粒和双质粒表达的排列组合,构建了27株大肠杆菌(Escherichiacoli)工程菌,然后分析各菌株产量与MVA途径酶水平的关联,得出萜类合成酶的过表达和其他酶的平衡表达使柠檬烯产量提高40%,而且将该策略应用于生物燃料-甜没药烯的合成,产量达到最高报道值(1 150 mg/L),相比之前报道的双质粒表达系统[21],产量提高2倍以上。

Redding-Johanson等[22]报道了另一种靶向蛋白质组学数据分析方法:选择性反应监测(SRM)质谱。研究人员[22]通过SRM技术发现,由9个基因组成的紫穗槐二烯合成途径中蛋白表达量的增加直接促进产量的增加;由于该途径中来源于酿酒酵母(Saccharomycescerevisiae)的甲羟戊酸激酶(MK)和磷酸甲羟戊酸激酶(PMK)在SRM检测中几乎没有表达,推测是转录水平低导致蛋白质表达困难,而经过密码子优化后由强启动子控制MK和PMK基因的表达,使蛋白质表达水平明显提高,产物紫穗槐二烯的产量提高了3倍。

除了蛋白质组学指导菌株代谢工程改造外,代谢组学通过测定工程菌改造前后的代谢物变化,也可以为进一步代谢途径优化提供潜在的改造靶点。Gold等[10]使用靶向代谢组学评估代谢工程策略,以提高S.cerevisiae中L-酪氨酸的产量,通过定向测定不同改造菌株中心碳代谢途径和酪氨酸合成途径的葡萄糖、丙酮酸、磷酸烯醇式丙酮酸、赤藓糖-4-磷酸、脱氢莽草酸、预苯酸、酪氨酸以及香豆酸等代谢物比浓度的时间变化,最终确定葡萄糖-6-磷酸脱氢酶Zwf1、环己二烯脱氢酶TyrC、反馈抑制耐受性3-脱氧-7-磷酸景天庚酮糖合成酶Aro4为重要的代谢调控点,敲除ZWF1、过表达TYRC以及解除果糖-1,6-二磷酸对3-脱氧-7-磷酸景天庚酮糖合成酶的抑制的ARO4FBR基因后,酪氨酸产量相比原始菌株提高384倍,达到520 μmol/g DCW。

综上,蛋白质组学和代谢组学指导菌株生物合成的主要策略是,通过检测代谢物水平或酶蛋白质表达水平,确定与生物合成相关的代谢途径调控靶点,然后通过基因工程改造相应的靶点进行验证,最终通过多策略结合实现菌株生物合成的改善。

3 蛋白质组学和代谢组学指导菌株耐受性改造

以微生物细胞工厂生产生物能源,如乙醇、丁醇等,可部分替代石油基运输燃料,被认为是可持续、环境友好型生物制造过程[23]。然而,这些低碳醇类对微生物具有一定的毒害作用,因此提高产物耐受性非常重要,可提高菌株生长能力以及目标产物产量[24]。由于耐受性受多个相互关联的机制调控[25],因此难以获得特异的耐受性调控靶点。而代谢组学可以测定不同菌株在不同条件下的代谢物水平,寻找与菌株耐受性相关的代谢物及相应的改造位点;蛋白质组学可以比较不同耐受性菌株的差异表达蛋白质,寻找与耐受性相关的靶点蛋白质及其调控网络,为菌株耐受性改造提供指导(见表1)。

Hasunuma等[11]构建了一株利用木糖的S.cerevisiae工程菌,借助基于毛细管电泳-质谱联用的代谢组学方法,测定不同乙酸浓度下的胞内代谢物水平,研究乙酸对菌株木糖发酵的影响;代谢组学分析表明,在添加乙酸后非氧化磷酸戊糖(PPP)途径的代谢物-7-磷酸景天庚酮糖、5-磷酸核酮糖、5-磷酸核糖和4-磷酸赤藓糖显著积累,说明乙酸减慢了PPP途径的下游代谢步骤;在此信息指导下,过表达磷酸戊糖途径关键基因转酮酶基因TKL1和转醛酶基因TAL1,显著提高了菌株对乙酸的耐受性,工程菌株在60 mmol/L乙酸存在下乙醇产量比出发菌株提高9.47倍。Teoh等[26]应用一种基于代谢组学的半理性策略提高S.cerevisiae对1-丁醇的耐受性,借助气相色谱-质谱联用非靶向代谢组学,测定不同丁醇耐受性的19株单基因敲除菌株的代谢物指纹图谱,并建立代谢物丰度与胁迫生长速率之间的回归模型;模型分析得出,苏氨酸浓度与菌株生长显著正相关,而柠檬酸浓度与菌株生长显著负相关,因此提出菌株改造的策略为增加苏氨酸积累量、减少柠檬酸积累量。与出发菌株相比,工程菌株在丁醇胁迫条件下比生长速率更高,即提高了菌株对丁醇的耐受性。Ohta等[27]运用同样的策略,检测出与S.cerevisiae乙醇耐受性相关的化合物,如缬氨酸、肌醇等,因此这两种代谢物被认为是潜在的改造目标,经过代谢工程改造增加缬氨酸的积累、加强肌醇的还原,最终显著提高菌株对乙醇的耐受性。

表1 蛋白质学和代谢组学指导菌株耐受性改造Table1 Guidance of microbial stress tolerance engineering by proteomics and metabolomics

2DE:two-dimensional electrophoresis;iTRAQ:isobaric tags for relative and absolute quantitation.

Mao等[32]运用比较蛋白质组学分析野生型和高丁醇耐受性丙酮丁醇羧菌(Clostridiumacetobutylicum)在产酸阶段和产溶剂阶段的差异表达蛋白质;等级聚类分析表明,在丁醇耐受菌株中伴侣蛋白质和产溶剂相关蛋白质在两阶段都上调,而氨基酸代谢和蛋白质合成相关蛋白质都下调;这一结果阐述了C.acetobutylicum的丁醇耐受性机制,为丁醇耐受性改造提供了潜在的靶点蛋白质。Jia等[33]通过基因组比对得到了与丁醇耐受性相关的双功能未知基因SMB_G1518-1519,敲除该基因提高了C.acetobutylicum的丁醇耐受性;为进一步分析耐受性提高的机制,运用蛋白质组学比较基因敲除菌株与原始菌株,发现与碳代谢、细胞流动、伴侣蛋白质和脂肪酸合成相关的蛋白质表达量都增加2倍以上,证明SMB_G1518-1519是丁醇耐受性的负调控因子。

4 代谢组学预测限速步骤

代谢途径一般由多步酶促反应组成,但往往这些酶催化效率很难完全协调匹配,其中酶催化效率较低的反应便成为限制该代谢途径的瓶颈,即限速步骤。代谢工程优化细胞生产性能的一般策略,是在首轮改造后鉴定限速步骤,对限速步骤进行下一轮改造[36]。因此,鉴定限速步骤是改造中的重要环节。代谢组学可以通过定量分析胞内代谢物浓度,寻找浓度明显差异的代谢物,进而鉴定代谢途径的限速步骤(见图3)。

蓝藻(Synechocystissp.)可以通过光合作用利用CO2生产燃料和化学品。Noguchi等[12]在蓝藻中引入来源于梭菌的CoA途径,改造后的菌株可以使CO2转化为1-丁醇。为了优化CoA途径,研究人员[12]使用离子对液相色谱-三重四极杆质谱,以13C标记的蓝藻细胞提取物为内标,测定胞内各代谢物的水平,结果分析表明丁酰-CoA还原为丁醇的反应是该途径的限速步骤,优化该反应后不仅增加丁醇的产量,还提高了胞内乙酰-CoA和丙二酰-CoA含量,从而验证了丁酰-CoA还原反应为限速步骤的推测。

图3 代谢组学预测代谢途径限速步骤Fig.3 Prediction of rate-limiting steps in metabolic pathway via metabolomics

Tamakawa等[37]构建了一株能够利用木糖产乙醇的产朊假丝酵母(Candidautilis),但乙醇产量较低,因此利用CE-TOF MS对菌株全局代谢物进行代谢组学分析,结果表明木糖发酵菌株相比原始菌株积累较多的磷酸戊糖途径中间代谢物、还原型烟酰胺腺嘌呤二核苷酸(NADH)和3-磷酸甘油醛上游的糖酵解代谢物,由于磷酸戊糖途径的上游木糖利用和糖酵解途径都与NADH有关,推测高比例的NADH/烟酰胺腺嘌呤二核苷酸(NAD+)是木糖产乙醇的限速步骤;因此过表达了NADH依赖型的醇脱氢酶ADH1,该酶在催化乙醛转化为乙醇的同时将NADH转化为NAD+,使乙醇产量增加了17%。

Hasunuma等[38]利用蓝藻生产琥珀酸,通过CE-MS代谢组学测定菌株在黑暗厌氧条件下还原三羧酸途径生产琥珀酸的13C标记代谢物的动态变化,发现与磷酸烯醇式丙酮酸和乙酰-CoA相比,下游柠檬酸、苹果酸、延胡索酸和琥珀酸增加速度慢,推测催化丙酮酸生成草酰乙酸的丙酮酸羧化酶可能是一个限速酶;通过过表达丙酮酸羧化酶基因以及供应碳酸盐,显著提高了琥珀酸的产量(由120 mg/L提高到192 mg/L,提高60%)。

5 蛋白质组学和代谢组学用于植物次级代谢途径的挖掘

图4 蛋白质组学和代谢组学挖掘植物次级代谢途径Fig.4 Excavation of plant secondary metabolic pathway via proteomics and metabolomics 2D SDS-PAGE:two-dimensional sodium dodecyl sulfate polyacrylamide gel electrophoresis;PCA:principal component analysis;PCC:pearson correlation coefficient;HCA:hierarchical cluster analysis;BL-SOM:batch-learning self-organizing map.

次级代谢产物是在生命周期或形态分化的特定时期产生的低相对分子质量的活性物质的总称。植物次级代谢产物种类繁杂,可广泛用于食品添加剂、香料、杀虫剂、色素和生物燃料等。而通过植物本身生产次级代谢产物面临产量低、分离成本高、规模放大困难等挑战。因此,微生物合成植物次级代谢产物具有一定应用前景,例如在微生物中构建青蒿素前体青蒿酸的生物合成途径能显著提高青蒿素的产量[39]。次级代谢产物微生物合成需要清晰的合成途径相关基因原件,而蛋白质组学和代谢组学的发展加速了对次级代谢途径的阐述和解析。使用多组学方法可以发现植物次级代谢新基因,从全局水平理解基因功能,并在此基础上挖掘新的次级代谢途径,为微生物代谢工程合成天然产物提供重要理论依据(见图4)。

次级代谢产物的合成与调控受多个基因的控制,鉴定这些基因是揭示次级代谢的首要任务。蛋白质组学可以鉴定植物次级代谢的酶和调控蛋白质,根据美国国立生物技术信息中心(NCBI)序列同源性比对找到相应的基因。例如,Decker等[40]运用蛋白质组学分析了富含罂粟的蛋白质乳液中75个蛋白质点,其中69个蛋白质通过与已知蛋白质同源比对确定其功能,最终鉴定出参与吗啡生物合成的关键酶:可待因酮还原酶。Lei等[41]运用蛋白质组学分析模式豆类蒺藜状苜蓿细胞悬液的蛋白质组分,鉴定和定量检测1 367个蛋白质,其中约5%的蛋白质与次级代谢相关,包括与黄酮/异黄酮、查尔酮代谢相关的酶。

随着后基因组时代的到来,植物基因组测序积累了海量的基因信息,但如何注释这些基因的功能仍面临一定挑战。代谢组学是联系基因型和表型的纽带,但代谢物与基因之间并不总具有直接联系。为解决这一问题,Raamsdonk等[42]基于代谢物的相关变化能反映沉默基因的作用位点这一思想,推测相似的基因导致相似的代谢物变化,而未知功能的基因可通过代谢物比较来鉴定,据此发明了一种利用比较代谢组学测定代谢物变化来鉴定未知基因功能的方法。鉴定新基因的另一策略是非靶向转录组学和代谢组学分析,这一策略利用batch-learning self-organizing gene mapping策略把受同一机制调控的一系列代谢物和基因聚为一类,该方法将3个未表征的潜在的磺基转移酶基因鉴定为芥子油苷生物合成基因,而重组基因体外酶活测试也证明了这3个基因为脱磺芥子油苷磺基转移酶,验证了该策略的效果[43]。

萜类化合物是种类多样的天然产物,已发现的萜类生物合成途径有两种:甲醛戊酸(MVA)途径和2-C-甲基-D-赤藓糖醇-4-磷酸(MEP)途径[44]。虽然上游代谢途径的基因非常保守,但大多数萜类物质下游合成途径及关键的合成酶基因都是未知的,成为其微生物合成的限制因素。Farag等[45]运用代谢组学研究蒺藜状苜蓿中一个新的异黄酮生物合成途径,通过高效液相色谱-离子肼色谱分析响应酵母粉诱导的苜蓿细胞悬浮培养物胞内和胞外次级代谢物的组分,发现3种新的甲基化异黄酮,同位素标记实验表明前两种异黄酮均来源于芒柄花黄素,标记实验和相关性分析最终揭示了这两种异黄酮的生物合成途径。另外,非靶向代谢组学是一种检测未知途径新代谢物的高通量方法。Keurentjes等[46]应用高效液相色谱-飞行时间质谱鉴定了不同来源拟南芥的代谢物,比较分析并发现了一些未知代谢途径,再通过定量特性位点分析得到了一个新的脂肪族芥子油苷生物合成途径网络。

6 结论与展望

本文总结了蛋白质组学和代谢组学在微生物代谢工程中的应用,特别介绍了整合多组学数据构建基因组尺度代谢模型、菌株生物合成优化、菌株耐受性改造以及代谢途径限速步骤预测的成功案例。除此之外,蛋白质组学和代谢组学能加快植物次级代谢途径挖掘,为微生物合成天然产物提供新酶基因。

虽然研究报道了越来越多的微生物代谢模型,目前代谢模型在线预测的准确性还有待进一步提高。例如自动化构建的模型一般都是粗模型,缺乏细胞酶动力学数据和相关调控机制,因而只能反映代谢特征而不能精确定量模拟。因此,需要整合更多的蛋白质组学、代谢组学、流量组学、调控组学等多组学数据以及代谢酶催化速率,进一步提高模型准确性和精确度。目前,研究人员关于微生物生理和代谢相关的多组学数据通常都是发表在各自的论文中,缺乏系统性的收集和整理,人工汇集这些珍贵的实验数据又相当困难。然而,随着生物“大数据”的不断积累和人工智能的日益发展,如果研究人员将各自分散的多组学数据汇聚于统一的数据库,运用数据科学和人工智能的策略对多样化数据进行分析整理,不断更新和修正已有的系统生物学信息,有望更好地指导微生物代谢工程,从而高效合成更多重要化学品。

猜你喜欢

丁醇耐受性代谢物
阿尔茨海默病血清代谢物的核磁共振氢谱技术分析
新型燃料生物丁醇研究进展
环孢素A代谢物的研究概况Δ
生物发酵法生产丁醇的优化策略
4个地被菊新品系对湿热胁迫的耐受性研究
噻虫嗪及其代谢物噻虫胺在冬枣中的残留动态研究
巴氏醋杆菌核酸修复酶UvrA对大肠杆菌耐受性的影响
miR-29b通过靶向PI3K/Akt信号通路降低胃癌细胞对顺铂的耐受性
HPLC-MS/MS法分析乙酰甲喹在海参中的主要代谢物
阿米替林治疗脑卒中后中枢痛的疗效和耐受性分析