药用植物天然产物生物合成途径及关键催化酶的研究 策略
2021-01-27周正李卿陈万生张磊
周正 李卿 陈万生 张磊
(1. 海军特色医学中心,上海 200433;2. 海军军医大学附属长征医院药学部,上海 200003;3. 海军军医大学药学院,上海 200433)
天然产物根据其生源途径,分为初生代谢产物和次生代谢产物。初生代谢产物大多由生物大分子(多糖、核酸、脂类和蛋白质)的合成和降解形成,对维持植物基本的生命活动具有不可替代的作用,贯穿生命的全程;次生代谢产物则是生物体特有的代谢途径中所产生的各种特殊分子类型,其骨架往往比初生代谢产物更为复杂,往往发生在生命过程的某一阶段。
控制天然产物生物合成的基因决定了不同种类天然产物的产生与累积,即基因的多样性导致天然产物结构多样性。目前,药用植物天然产物的研究中最前沿的科学问题是:各种复杂的天然产物是如何形成的?能否通过调控,大量获得提取困难、结构复杂、应用需求广泛的天然产物。为了解决这些问题,需要解析天然产物生物合成途径中关键酶的功能,了解这些基因的表达和调控,进而对整个代谢网络进行调控,甚至将不同来源的生物合成相关的代谢途径模块化,在底盘细胞上进行组装,利用合成生物学的手段,实现各种重要的药用植物天然产物的高效生物合成和规模化生产。而所有问题的本源便是生物合成途径和关键催化酶的解析。
本文针对药用植物天然产物生物合成及关键催化酶的研究策略进行系统综述,从药用植物天然产物生物合成途径的推测、天然产物生物合成关键催化酶的发现与预测、酶的表达特征研究、体内酶功能研究、酶催化特征研究、酶结构解析与优化、合成生物学研究这6个方面进行总结和讨论。
1 生物合成途径的推测
通过目标代谢产物的结构,推测目标化合物的生物合成途径,是目标天然产物生物合成途径催化酶研究的基础。20世纪下半叶,随着初生代谢途径的解析基本完成,萜类、生物碱、苯丙素类等天然产物的组装化学原理开始呈现。根据基本的化学反应原理,结合研究物种中所分离到的天然产物,首先提出目标化合物的生物合成途径假说。接下来则通过同位素示踪实验,即通过稳定重原子标记初生代谢产物作为底物进行饲喂,再利用核磁共振或者高分辨质谱,动态监测并追踪含有同位素原子代谢物的流向,进而验证所提出的天然产物生物合成途径假说的正确性。
同位素示踪法广泛应用于解析药用植物天然产物生物合成途径的研究中。如在紫杉醇生物合成途径的推测中,Eisenreich等[1]对红豆杉(Taxus chinensis)的悬浮细胞饲喂前体[U-13C6]葡萄糖、[1-13C6]葡萄糖、[1,2-13C12]醋酸,发现产物 [1,2-13C12]醋酸仅转化到taxuyunnanine C的4个乙酰基侧链,却未转移到紫杉烷的环形骨架上;而两个被标记的葡萄糖不仅转移到了taxuyunnanine C的乙酰基中,同时也转移到了紫杉烷的环形骨架。以上结果表明,紫杉烷的环形骨架来源于DXP/MEP途 径(deoxyxylulose phosphate or methylerythritol phosphate pathway)。在莨菪碱的生物合成途径推测中,Robins等[2]以3-苯基-[2-13C,2-2H]乳酸、苯基- [1,3-13C2]乳酸以及[1',3'-13C,甲基-2H3]海螺碱饲喂曼陀罗毛状根(Datura innoxia),通过2D-NMR检测13C、1H、2H,发现托品和来自苯丙氨酸的苯乳酸通过缩合反应生成海螺碱。在丹酚酸途径生物合成途径推测中,Di等[3]用13C标记的苯丙氨酸饲喂丹参(Salvia miltiorrhiza)毛状根,通过高分辨质谱对丹酚酸成分的天然产物进行分析,发现丹参中迷迭香酸的产生途径可能与已报道的彩叶草途径有差异,同时预测迷迭香酸可能是丹酚酸B的前体化合物;而在丹参酮生物合成途径的研究中,Guo等[4]利用13C标记的次丹参酮二烯饲喂丹参毛状根,通过检测发现了隐丹参酮和铁锈醇的生成,证明了两种物质是丹参酮合成的中间产物。
大量的研究表明,同样类型的化合物大多共用一套生物合成途径,骨架合成酶和后修饰酶的种类,在特定结构天然产物的形成中基本一致[5-8]。因此,在后基因组时代,如苯丙素类、萜类、生物碱、黄酮等主要类型的药用植物天然产物的生物合成途径已逐步完善,基于同位素饲喂推断代谢产物生物合成途径的方法不像之前使用那样频繁。随着生物信息学的发展,大量生信工具通过基因组、转录组、蛋白质组学以及代谢组学的分析及计算,便可以提供化学原理和酶学机制的高通量信息,帮助解析目标化合物的生物合成途径。但是,对于一些基因组数据庞大、转录组与蛋白质组学研究较为复杂的物种,同位素标记仍然发挥着极其重要的作用,比如在2016年Anttila等[9]利用同位素标记法标记[13C-甲基]蛋氨酸研究海洋甲藻(Alexandrium ostenfeldii)中聚酮类螺亚胺的生物合成途径。
2 关键催化酶的挖掘和筛选
目标天然产物的生物合成途径明确之后,则需要对目标关键催化酶进行挖掘和筛选。早期科研工作者仅是通过蛋白质分离对酶的活性进行验证,但是受制于检测手段和测序技术,酶的挖掘和鉴定过程非常缓慢。
随着高通量测序技术的飞速发展,对于关键酶的发现不再局限于传统的分离纯化和鉴定,而是基于各种生物信息学数据,通过酶的氨基酸序列与酶结构的相似性进行挖掘。相比于已经通过实验验证功能的酶,绝大多数酶的功能仍然是未知的。根据未知酶和已知酶之间的相似性,对未知酶的功能进行预测,已经成为酶学研究中非常普遍的研究手段。尽管序列相似性预测不能完全找到整个酶家族中所有进化和功能的联系,但是对于催化酶的挖掘来说具有十分重要的意义。此外,为了缩小候选基因的范围,常常通过多种组学数据相结合的分析方法,如转录组学与基因组学、代谢组学相结合的方法,并辅助以酶的表达特征分析,如亚细胞定位实验、GUS实验、组织器官表达水平分析等,对生物合成途径的关键催化酶进行筛选。
2.1 传统酶的分离纯化方法
酶的提取、分离、纯化是指把酶从组织或者细胞内外提取出并使之达到相应程度的过程,一般包括5个步骤,包括细胞破碎、酶液提取、酶分离纯化、酶浓缩、酶检测与保存。其中最重要的的步骤便是分离纯化,目前常用的分离纯化方法包括离心分离、过滤分离、沉淀分离、层析分离、电泳分离、萃取分离和结晶分离等。以吗啡生物合成途径解析为例,从1967年提出吗啡的生物合成途径假说以来,数十年来科学家们通过蛋白分离纯化鉴定出了数种关键催化酶。如Roswitha于1993年利用7步程序,从罂粟(Papaver somniferum)的细胞悬浮液中分离纯化得到了可以将罂粟生物碱salutaridine还原成(7S)-salutaridinol的氧化NADPH-7-氧化还原酶[10]。1995年,Rainer又从罂粟细胞悬液中分离得到了Salutaridinol-7-O-酰基转移酶,解析了吗啡前体蒂巴因生成过程[11]。随着分子生物学的发展和组学数据的应用,仅十几年的时间,吗啡的生物合成途径便已经基本阐明,甚至成功在酵母中进行了前体的异源合成[12],这将在后文详细说明。
2.2 基于共表达分析挖掘关键催化酶
共表达分析(Co-expression analysis)是通过大量基因表达数据库构建基因之间的相关性,从而筛选、挖掘基因功能的一类分析方法。研究表明,在植物体内同一个代谢通路上的基因,在受到体外或体内刺激后,这些基因在表达量变化上会出现共表达的趋势。通过这一特性,对转录组测序后所获得的庞大数据进行筛选、注释和可视化,对目标催化关键酶进行挖掘。
Di等[3]利用茉莉酸甲酯和脱落酸诱导丹参的毛状根,根据酚酸基因表达水平的变化,寻找到了丹参迷迭香酸合成酶(SmRAS)、细胞色素P450单加氧酶(SmCYP98A14)和细胞色素P450还原酶(SmCPR)。Li等[13]利用茉莉酸甲酯处理菘蓝毛状根,并进行转录组测序,首次从菘蓝(Isatis indigotica)发现了Dirigent蛋白家族19个基因,并对其进行了序列特征和表达分析,这为该类蛋白的进一步研究提供了基础。
此外,通过共表达分析结合代谢数据的方法,Xiao等同样使用茉莉酸甲酯处理菘蓝毛状根,研究落叶松脂素生物合成途径的基因表达水平,并结合木脂素成分的积累水平,绘制了“基因与化合物”关联性热图,筛选出27个与菘蓝木脂素合成相关的基因,并对菘蓝松脂醇还原酶IiPLR1基因进行研究,发现其在落叶松脂素的积累中发挥重要的作用[14-15]。Wang等[16]对不同紫草素积累量的新疆紫草(Arnebia euchroma)进行转录组分析,并结合新疆紫草不同器官中的基因表达水平、关键酶的亚细胞定位实验,鉴定出了催化香叶基氢醌转变为紫草素前体的关键羟化酶CYP76B74。
2.3 基于基因组挖掘关键催化酶
相比于基于转录组数据通过基因的表达量挖掘关键催化酶,高质量的基因组数据提供了更为全面准确的信息,其可以在群体水平上揭示个体之间基因的变化差异,从分子水平理解基因的结构、组成、功能和进化。
Zhao等[17]通 过 黄 芩(Scutellaria baicalensis)基因组测序,揭示了汉黄芩素完整的生物合成途径。根据基因组,共注释了28 930个基因,并在黄芩特有的串联重复区内找到6个氧甲基转移酶(SbPFOMT)候选基因。通过组织器官表达分析以及茉莉酸诱导黄芩毛状根实验,对筛选到的PFOMT进行进一步筛选。最终结合体外酶催化和体内RNA抑制实验,确认了PFOMT5是催化汉黄芩素生成的关键酶。Ma等[18]对自交6代纯合的丹参株系进行基因组测序发现,形成丹参酮前体母核的二萜合酶与细胞色素P450基因以基因簇的方式存在于鼠尾草属植物中。利用基因扩张和收缩分析,聚焦于丹参中明显扩张的SmCYP71D亚家族,并筛选到了4个候选基因。后续研究表明,SmCYP71D373和SmCYP71D375可以催化丹参酮特征五元呋喃环的生成,SmCYP71D411与丹参酮类化合物C20位脱甲基化过程相关。Guo等[19]利用多种测序技术组装获得了罂粟的基因组,发现罂粟中那可丁和吗啡类生物碱合成途径中15个基因在11号染色体上形成超级基因簇(BIA基因簇),从而高效合成罂粟中的各种次生代谢产物,同时结合转录组数据分析发现BIA通路基因在根和茎中特异性表达且共表达。此外,根据序列同源性分析,发现P450和氧化还原酶基因融合形成了一个STORR基因,该基因对于罂粟中吗啡的生物合成具有关键作用。该研究揭示了罂粟基因组的复制、重排及基因融合导致了罂粟有效成分合成途径的进化。
目前,越来越多的研究结合基因组、转录组和代谢组,对药用植物天然产物生物合成途径中的关键催化酶进行挖掘。通过转录组挖掘差异基因,快速圈定核心调控网络和关键候选基因;通过代谢组寻找目标化合物的差异累积,将候选基因与表型进行关联;通过基因组对候选基因进行定位,结合序列的多态性全面对目标基因进行描述;通过酶表征数据,对酶基因的性质进行确认。通过多组学联合的方法,达到高效、快速挖掘、鉴定天然产物生物合成途径催化酶基因的目的。
3 酶催化特征研究
在挖掘到一系列参与天然产物生物合成的关键候选酶基因后,接下来需要对酶的功能进行研究。首先对目标酶分离、纯化或通过分子生物学的手段进行异源表达、纯化;然后对酶的理化性质进行分析;接下来对酶进行功能表征,检测是否在适当的条件下催化底物生成相应的产物;最后开展酶催化的动力学性质研究,多角度描述酶的催化特征。
3.1 酶的异源表达
在药用植物关键酶的研究中,常见的异源表达宿主有大肠杆菌、酵母和烟草,其它不太常用的表达系统还包括一些真菌、昆虫及哺乳动物细胞。
大肠杆菌作为原核生物,具有繁殖速度快、实验操作简单、培养成本较低和遗传背景清晰等优点,常常作为酶蛋白异源表达的首选宿主。但是原核表达系统也存在一些局限,如分泌表达能力弱、二硫键形成困难导致蛋白折叠错误、无翻译后修饰等缺点,限制了其在复杂酶的表达中的应用。而真核生物表达系统则主要是以酵母为主体,常用酵母宿主有酿酒酵母和毕赤酵母。相比于原核表达宿主,酵母系统具有外源基因整合稳定、易于调控表达、重组蛋白以胞内积累或胞外分泌的形式表达、存在翻译后修饰、发酵密度极高等优势。烟草作为近些年来兴起的植物表达宿主,通过农杆菌介导的瞬时表达体系,使外源基因无需整合在烟草基因组中就可以进行表达,不受基因位置效应以及沉默的影响。基于烟草的瞬时表达系统,即可以作为酶体外功能快速验证的平台,又可以作为酶体内功能研究的辅助,具有快速、高效的特点。
Fu等[20]利用大肠杆菌为宿主,表达出了紫锥菊(Echinacea purpurea)中菊苣酸合成的BAHD家族酰基转移酶,EpHTT、EpHQT和EpHCT;同时利用酿酒酵母表达出SCPL家族酰基转移酶,EpCAS。根据体外酶促反应结果发现,EpHTT催化咖啡酰辅酶A和酒石酸反应生成咖啡酰酒石酸,EpHQT催化咖啡酰辅酶A及奎宁酸反应生成绿原酸,两个产物再进一步被EpCAS催化,生成菊苣酸和奎宁酸,该研究完整解析了紫锥菊中菊苣酸的生物合成途径,并对关键催化酶进行了确认。Tu等[21]通过酿酒酵母表达出雷公藤(Tripterygium wilfordii)中P450单加氧酶,TwCYP728B70并发现该单加氧酶可以催化三步氧化反应生成雷公藤甲素中间体脱氢枞酸,为雷公藤甲素生物合成途径的解析奠定了基础。Fei等[22]通过底物拓品和苯乳酸共注射的方式,在烟草中瞬时表达从颠茄(Atropa belladonna)中筛选到的苯乳酸UDP-糖基转移酶AbUGT1和海螺碱合成酶AbLS,确认了AbUGT1和AbLS的功能,AbUGT1催化苯乳酸和UDP-葡萄糖生成苯乳酰葡萄糖,进一步和托品在AbLS的催化下酯化缩合生成海螺碱。
3.2 酶理化性质研究
由于绝大部分的酶是蛋白质,所以酶理化性质研究本质是蛋白质理化性质研究。根据化学组成的差异分为单纯蛋白质和结合蛋白质,结合蛋白质中的非蛋白部分称为酶的辅助因子,包括有机化合物(糖类、脂质等)和金属离子。
酶理化性质研究主要研究包括分子量、等电点以及辅助因子的确定。酶的分子量一般通过其氨基酸序列便可预测,通过SDS-PAGE电泳进行验证,分子量大小的单位以道尔顿(Da)表示。等电点的含义是,使蛋白质解离成正、负离子的趋势相等的兼性离子时,酶溶液的pH。该数值同样可以根据氨基酸序列进行预测,通过等电聚焦电泳技术进行测定。辅助因子可通过化学显色法、酶处理学或借助质谱、核磁等仪器检测来确定。
Ma等[23]从盐肤木(Rhus chinensis)中筛选到了苯丙氨酸解氨酶基因,通过大肠杆菌进行异源表达,获得了PcPAL重组蛋白。通过SDS-PAGE电泳,验证了表达出蛋白的大小约为77 kDa。接下来对PcPAL的稳定性进行研究,发现该酶的最适反应温度为45℃、最适反应pH为9.0,本研究首次从漆树科植物中克隆了PAL基因并对该酶的基本理化性质进行了探究。Su等[24]从罗汉果(Siraitia grosvenorii)中克隆出了由417个氨基酸构成的鲨烯合酶SgSQS,其可以催化法尼基焦磷酸生成鲨烯。通过大肠杆菌为宿主表达出SgSQS,通过实验发现蛋白大小为47 kD,等电点为7.3。随后又对该酶的最适反应温度和pH进行研究,结构表明在37℃ 以及 pH 7.5的条件下,鲨烯合酶的活性最高。
3.3 酶对底物选择性研究
酶对底物的选择性研究是判断酶专一性或杂泛性的重要依据。当酶只催化一种物质或某一类特定物质发生一定反应时显示出专一性。反之酶催化杂泛性则表现为具有底物的宽泛性与反应的多样性。
Wang等[25]在传统中药黄芩中发现了一个黄酮3号位氧糖基化酶Sb3GT1(UGT78B4)。该酶可以接受5种不同的糖供体,包括:二磷酸尿苷葡萄糖、半乳糖、乙酰氨基葡萄糖、木糖、阿拉伯糖。同时Sb3GT1也可以催化17种黄酮醇类化合物,转换率达到98%以上,并催化形成5个全新的黄酮苷类化合物,表明该酶具有较强的杂泛性。Gao等[26]从桑树(Morusalba)愈伤组织中鉴定出两个FAD依赖的单加氧酶MaMO以及MaDA。MaDA能高效、选择性地催化分子间[4+2]环加成反应(Diels-Alder反应)生成环己烯结构单元,且对二烯体及亲二烯体具有较宽的底物杂泛性;MaMO则可以催化异戊烯基氧化形成二烯体,两者共同完成桑中活性成分chalcomoracin的生物合成。
3.4 酶催化的动力学性质研究
酶催化的动力学性质研究通常在酶催化反应的最适条件下进行。通过考察不同pH、温度和金属离子浓度对酶反应速率的影响确定最适反应条件。
Wu等[27]从马尿泡(Przewalskia tangutica)中分离纯化了两个托品酮还原酶基因PtTRI 和 PtTRII,并于最适pH测定了两个托品酮还原酶的动力学参数,根据Kcat、Km、Kcat/Km的比较,发现相对于PtTRI,托品酮是PtTRII的最适底物,且根据其它物种托品酮还原酶的报道,PtTRI对托品酮表现出更高的亲和力。Yu等[28]通过茉莉酸甲酯诱导红景天(Rhodiola sachalinensis)细胞培养体系,挖掘了红景天苷生物合成途径中的两个葡萄糖基转移酶RsUGT72B14 和RsUGT74R1。根据Kcat/Km比较两个酶对于底物对羟苯基乙醇催化效率,发现RsUGT72B14的催化效率是RsUGT74R1的6倍。结合不同器官中两个葡萄糖基转移酶的表达量,明确了RsUGT72B14在红景天苷的生成发挥重要的作用。Xiang等[29]从川西獐牙菜(Swertia mussotii)中筛选并鉴定了两个环烯醚萜合成酶SmIS1和SmIS2,其中SmIS1的大小约为88 kD,SmIS2的大小约为46 kD。以8-oxogeranial为底物,NADPH为辅因子,测定SmIS1和SmIS2的动力学参数,结果表明,相比于SmIS1,SmIS2对底物有着较低的亲和力,却对NADPH有着较高的亲和力。并且与长春花(Catharanthus roseus)和油橄榄(Olea europaea)中的环烯醚萜合成酶相比,SmIS1的催化效率降低。
4 体内酶功能研究
通过体外实验明确了天然产物生物合成关键酶的催化功能后,需要对目标基因在生物体内的功能进行研究。常用的酶体内功能研究策略是通过基因的敲除或抑制,使目标酶基因在体内的表达量降低,以及通过基因的过表达操作增加目标酶基因在体内的表达量。通过酶表达量的变化,结合转录、代谢、表型等方面的数据,研究酶在药用植物体内的功能。但是,由于遗传转化体系的限制,部分无法获得目标酶基因稳定表达的转基因物种,则可以通过瞬时表达技术或者将基因在其它相近物种中进行表达,根据表型的变化,验证酶的体内功能。
4.1 基于CRISPR/Cas9系统的酶基因敲除研究
CRISPR/Cas9技术是指在gRNA的引导下靶向基因组特定区域,并指导Cas9蛋白切割基因双链,形成移码突变或片段敲除的方法,该技术可以使基因永久性的表达沉默。
Zhou等[30]利 用CRISPR/Cas9技 术 敲 除 了丹参中酚酸生物合成的关键酶—迷迭香酸合成酶SmRAS,发现迷迭香酸和丹酚酸的含量显著降低,证明了SmRAS在丹酚酸途径中的发挥重要的作用;而Li等[31]则利用CRISPR/Cas9技术敲除了丹参酮生物合成途径中丹参二萜合酶—SmCPS1,发现在纯合敲除株系丹参酮IIA、隐丹参酮的积累几乎消失,证明了SmCPS1在丹参酮生源途径中的作用。通过基因编辑技术,Dinkins等[32]敲除红车轴草(Trifolium pratense)中的异黄酮合酶TpIFS1,获得了单链突变的杂合突变植株,后利用杂交获得TpIFS1敲除的纯合突变株系。对突变的纯合株系进行研究发现,其异黄酮芒柄花黄素、鹰嘴豆素A还有金雀异黄酮的积累显著下降。对黄酮生物合成途径基因的表达量进行分析,发现TpIFS1敲除后,其上游基因泵丙氨酸裂解酶、查尔酮合酶的表达量显著提高,而下游基因的表达量没有显著变化。
4.2 基于基因沉默技术的酶基因抑制研究
基因沉默的方法主要有RNA干扰(RNA inference,RNAi)和病毒诱导的基因沉默(Virus Induced Gene Silencing,VIGS)两种方法。RNAi指利用同源性的RNA双链(dsRNA)诱导与之互补的同源目标序列mRNA降解,阻断体内靶基因的表达,使植物出现目标基因缺失的表型,该技术一般用于转基因体系成熟的物种研究。VIGS是指携带目标基因片段的病毒侵染植物后,可诱导植物内源基因沉默、引起表型变化,该方法一般用于未建立转基因体系的物种研究。
Zhao等[33]利用RNAi技术抑制人参(Panax ginseng)中β-香树酯醇合成酶,获得了转基因毛状根,发现β-AS的表达量降低后,β-香树脂醇以及齐墩果烷型的人参皂甙R0的含量显著降低,而总人参皂苷类化合物的含量明显提高,表明β-AS在人参皂苷的合成中具有重要的催化作用。同样是在人参中,Lu等[34]也从人参和西洋参(Panax quinquefolius)中鉴定到了两个高度同源的糖基转移酶,Pq3-O-UGT2 and PgUGT94Q2,两个糖基转移酶分别可以将UDP葡萄糖上的葡萄糖部分转移到人参皂苷Rh2和F2来产生人参皂苷Rg3和Rd。通过转基因毛状根转化体系,获得人参和西洋参中两个糖基转移酶抑制的RNAi转基因毛状根,分析发现这两个基因分别抑制后,人参皂苷Rd、原人参二醇和总人参二醇的积累均出现了下降,此外原人参二醇合酶和元人参三醇合酶的表达量也显著提高,表明两个糖基转移酶分别在人参和西洋参人参皂苷的合成中具有关键调控作用。Sarma等[35]利用VIGS技术沉默长春花中牻牛儿基焦磷酸合酶CrGGPP,研究其功能,发现CrGGPP的表达量降低后,单萜吲哚生物碱类相关的转录因子以及合成途径相关的基因表达量明显降低,同时单萜吲哚生物碱类的含量也随之下降。而通过对CrGGPP-VIGS叶片进行化学互补实验可以恢复CrGGPP抑制后的表型,证明了CrGGPP在长春花单萜吲哚生物碱类物质的合成中具有重要作用。
4.3 酶基因过表达研究
基因过表达研究主要有两种,一种是将目标基因克隆到携带有强启动子和抗性筛选标记等元件的载体上,然后转入植物体内,这样宿主细胞会获得较高量的目标mRNA转录水平和蛋白表达水平。另一种则是病毒介导的过表达系统(virus mediated gene overexpression,VMGO)瞬时转化技术。该技术亦可以将外源基因在植物体内大量表达。通过分析目标基因过表达后转基因植物的表型,便可以研究该基因的功能。
Yuan等[36]对黄花蒿(Artemisia annua)中青蒿素生物合成途径关键酶基因—青蒿醛△11(13)双键还原酶AaDBR2进行过表达操作,发现转基因黄花蒿植株青蒿素和其前体二氢青蒿酸的含量显著提高,该研究为获得高产青蒿素的黄花蒿代谢工程策略奠定了基础。Chung等[37]从鬼针草(Bidens pilosa)挖掘到了油酸脱氢酶BpOD和脂肪酸乙炔酶BpFAA,通过病毒介导的瞬时转化技术,在鬼针草叶片中分别过表达这两个基因,都可以提升聚炔类化合物的含量,表明两种酶均可以催化长链脂肪酸前体脱饱和,在天然活性产物聚乙炔的合成中作用显著。为了研究银杏(Ginkgo biloba)中黄酮类成分的生物合成途径,Wu等[38]通过转录组测序,从黄酮中发现了一个类黄酮3',5'-羟化酶GbF3',5' H1。由于银杏缺少成熟的转基因材料的体系,为了研究该基因的功能,将GbF3',5' H1于杨树(Populus)中进行过表达后发现,转基因植株黄酮类成分樱桃甙、表儿茶素、没食子儿茶素的含量显著高于野生型植株,表明GbF3',5' H1在银杏黄酮类成分的生物合成中发挥作用。
5 酶结构解析与定向改造
确认了催化酶在药用植物天然产物生物合成途径中的功能后,为了探究酶发挥催化功能的机理或进一步对酶催化功能进行定向改造,首先需要对酶蛋白晶体进行结构解析,阐明底物选择性的结构基础,解释酶催化底物的反应机制。而后对发现的关键氨基酸位点进行理性设计,获得一系列底物特异性或催化效率发生改变的突变体,对突变体的功能进行解析,最终获得特定功能的酶,实现酶功能的定向改造。
C-糖苷在自然界中分布局限、结构多样性不足,同时化学法C-糖基化面临选择性差,因此药用植物天然产物生物合成途径中C-糖基转移酶研究成为近些年来的热点问题。第一个被解析晶体结构的C-糖基转移酶来自于金莲花(Trollius chinensis),He等[39]发现了催化黄酮C-8位糖基化的碳糖基转移酶TcCGT1,研究表明该酶可以催化合成牡荆苷等36种碳苷类化合物。又初步阐明了TcCGT1催化C-、O-糖基化的分子机制,并通过定点突变实现了由C-糖基化向O-糖基化的功能转变。Zhang等[40]从光果甘草(Glycyrrhiza glabra)鉴定出一条双C-糖基转移酶GgCGT(UGT708B4)。该双C-糖基转移酶能够高效催化含有弗洛丙酮结构单元的化合物发生连续两步的C-糖基化反应,生成相应的双碳苷产物。为了阐明该酶的催化机制,解析了GgCGT分别与二磷酸尿苷葡萄糖、尿苷二磷酸半乳糖等底物结合后所形成复合物的晶体结构。结果发现相较于葡萄糖,半乳糖的结合位置的偏转导致糖基部分与周围氨基酸形成氢键作用的强弱发生变化,影响酶与糖供体的结合作用强弱,决定了糖基供体的偏好性的顺序。Xie等[41]通过转录组学等方法从芦荟(Aloe barbadensis)中发掘了一个C-糖基转移酶(AbCGT),该酶可以高效催化多种不含酰基的芳香苷元的底物进行C-糖基化。以GgCGT为模板,通过同源建模的方法构建AbCGT的三维立体结构,利用分子对接预测了该酶与底物2-羟基柚皮素的反应口袋,发现183位的缬氨酸为酶关键活性位点催化残基。通过定点将该位点突变天冬氨酸、谷氨酸或者脯氨酸后,AbCGT催化的底物选择性有明显提升。
6 合成生物学研究
由于多数药用植物天然产物在原植物中积累较低,且获得受到植物生长状态、采收时间、提取方法、遗传操作困难等诸多因素的限制。因此,天然产物合成生物学则是基于工程化的原理,通过设计改造自然界已存在的微生物或植物,或者于这些生物体内,重新构建一套完整系统,高效快速的生产药用植物活性成分。实现这一策略首先需要推测目标天然产物的生物合成途径,其次明确每一步催化反应所需要的关键酶及辅因子,再将生物合成途径整合于底盘细胞内,最终对整个代谢网络进行优化调控。目前,药用植物天然产物合成生物学常用的底盘有大肠杆菌、酵母及本氏烟草等,下文将针对不同底盘构建细胞工厂进行药用天然产物的合成进行简要综述。
Li等[42]通过来源于7个物种的11个基因整合进大肠杆菌,构建了能够将苯丙氨酸或酪氨酸两种不同的前体,定向合成黄芩素或野黄芩素的菌株。后针对丙二酰辅酶A这一重要前体的供应进行了优化,摇瓶水平黄芩素和野黄芩素的产量分别达到了23.6 mg/L 和106.5 mg/L。Yao等[43]在丹参素生物合成途径未被解析的情况下,利用大肠杆菌内源的羟基化酶和植物乳杆菌中的D-乳酸脱氢酶,在大肠杆菌中构建了丹参素生物合成途径。再采取模块化策略优化,加强底物的供给;对底盘细胞编辑,敲除竞争基因,筛选出高产丹参素的人工大肠杆菌,丹参素产量达7.14 g/L。
斯坦福大学的Christina课题组利用酵母实现了多种药用植物活性天然产物的生物合成,其中最具代表性的工作便是2015年于酿酒酵母中合成蒂巴因和氢可酮,以及2020年在面包酵母中合成托品烷生物碱。Galanie等将来自酵母本身、植物、细菌以及啮齿动物的21种酶,在不影响酵母正常生长的情况下,整合进酿酒酵母中,通过辅因子循环利用、嵌合蛋白的蛋白质折叠等方法,获得了吗啡类药物的关键前体—蒂巴因。之后又整合了另外两种催化酶,使得产生蒂巴因的酵母进一步生成了氢可酮[12]。Prashanth通过5个生物合成功能模块的设计,从糖和氨基酸出发,在面包酵母中实现了莨菪碱和东莨菪碱的合成[44]。
依托泊苷作为拓扑异构酶 II 抑制剂,广泛应用于肺癌、睾丸癌、淋巴瘤和其它恶性肿瘤的化疗。目前,依托泊苷主要从桃儿七(Sinopodophyllum hexandrum)中分离鬼臼毒素,并以此为前体合成依托泊苷。但对桃儿七过度的砍伐导致其现已濒临灭绝。目前常用的替代方法是通过植物组织培养方法合成(-)-鬼臼毒素,并以此为前体合成依托泊苷,但该方法不便于进行规模化生产。2015年Elizabeth课题组的Lau. W通过转录组和代谢组的分析,解析了依托泊苷糖苷配基完整的生物合成途径,并报道了其前体脱氧鬼臼毒素在烟草中的重构,达到11.4±3.8 μg/g干重的产量,为烟草作为天然产物的生物合成底盘研究奠定了基础,表明烟草的瞬时表达可以用于获得毫克级的植物源小分子并生物合成其类似物[45]。2019年,同课题组的Schultz. BJ等利用烟草为底盘,实现了脱氧鬼臼毒素的异源合成。通过在烟草中表达 8 个松柏醇和 8 个依托泊苷苷元的酶基因之后,脱氧鬼臼毒素在烟草中的积累量达到了 4.3 mg/g。该研究表明可以在烟草植物底盘细胞中表达难培养的药用植物中较长的生物合成途径,并达到毫克级产量[46]。
7 总结与展望
随着药用植物天然产物的市场需求的不断增加,药用植物的资源供求矛盾也越来越明显,而通过生物技术手段是解决这一矛盾的有效方法。对药用植物天然产物的生物合成化学原理和酶学机制进行探究的最终目的,便是为药用植物资源的可持续利用和发展提供一条全新而高效的途径。
在生物信息学飞速发展的今天,通过基因组学、转录组学、蛋白质组学、代谢组学、表型组学等组学技术联合分析,对药用植物天然产物的生物合成途径及关键催化酶进行挖掘和解析,利用结构生物学对获得的酶进行改造,再应用合成生物学的方法,将生物合成途径和关键酶整合到底盘中,从而异源高效生产各种目标天然产物。这一系列的研究方法,已经成为药物植物天然产物的生物合成研究的通用策略。
然而这一策略在应用时也会遇到一些问题。比如在研究一些关键催化酶的体内功能时,由于许多药用植物缺乏稳定的遗传转化体系,只能借助模式植物瞬时转化等手段进行替代,所以仍需要在药用植物的遗传转化体系的研究中加以突破。此外,植物的基因组中编码了数目众多且功能各异的催化酶,并且常以家族基因的形式存在,这些酶有的可以催化多种化合物的产生,有的只能催化单一天然产物的生成,还有的需要和其它酶或者辅因子共同作用才能发挥其催化效应。这是由于在高等植物在进化的过程中,酶的进化形成了复杂而精巧的结构,导致其催化功能多样性,进而出现了物种的多样性和代谢产物的多样性。利用这一策略,不仅可以去探索未知天然产物的生物合成途径及关键催化酶的功能,对于已知的途径,仍可能会有全新的发现和认知。这一策略为更好的挖掘天然产物生物合成途径提供了基础,也将为合成生物学的研究提供丰富的元件,进而推动药用植物天然产物提取、合成、临床应用等各领域的进步。