APP下载

米曲霉基因组与酶系表达研究进展

2018-07-18周斌王静周其洋童星

食品与发酵工业 2018年6期
关键词:肽酶水解酶糖类

周斌,王静,周其洋,童星

(佛山市海天(高明)调味食品有限公司,广东 佛山,528500)

米曲霉在东方传统酿造食品中的应用已经有上千年历史,是中国及日本酱油等发酵产品的主要生产菌株,其安全性已经得到美国食品药品监督管理局(Food and Drug Administration,FDA)[1-2]和世界卫生组织(World Health Organization,WHO)[3]的认可。在这些食品发酵过程中,米曲霉能够分泌大量的蛋白水解酶和糖类水解酶,并将大豆和小麦等原料降解成短肽、氨基酸、寡糖及单糖,这些小分子物质是提供产品风味的源泉。在中国,酱油酿造一般使用米曲霉沪酿3.042[4];而日本则多采用米曲霉和酱油曲霉混合菌种发酵。日本龟甲万中央研究院研究表明,日本酿造企业使用菌种中有74%是两种以上的菌株混合,同时菌株种类79%为米曲霉,21%为酱油曲霉[5]。为获得性状优良的菌株,菌种的选育和持续改良贯穿于整个发酵过程,是现代发酵菌种技术的核心内容。但目前传统酿造行业中米曲霉菌株的研究大部分还停留在表观研究阶段,即通过最终酶活力来表观菌株的发酵性能,对于酶活力究竟是怎么来的,如何分泌,有哪些基因调控,很少有人去深究。我们希望通过综述米曲霉基因组,以及基因与酶系蛋白表达之间的关系,使人们能够更加深入地了解米曲霉基因组和酶系基因的组成特点及作用机制,为将米曲霉更好地应用于传统酿造食品提供指导。

1 米曲霉基因组研究现状

NCBI数据库中将基因组组装完整度由好到差依次分为Complete、Chromosome、Scaffold及Contig四个等级。2017 年11 月 10日在NCBI中对真菌(Fungi)基因组进行检索分析,发现达到4种组装水平的基因组数量为2 672条,曲霉属有91条,仅占真菌总量的3.4%。没有曲霉属菌株基因组组装程度达到Complete水平;仅有烟曲霉Af293(2005 年完成)和构巢曲霉FGSCA4(2008 年完成)的基因组达到Chromosome水平;41 条曲霉基因组记录达到Scaffold水平,其中仅有1条记录是米曲霉菌株(米曲霉RIB40,2005 年完成),1条是酱油曲霉菌株(酱油曲霉NBRC4239,2011 年完成);48 条曲霉基因组记录达到Contig水平,其中8条是米曲霉,分别是3.042(2012 年完成)、AS 3.951(2012年完成)、AS 3.863(2012 年完成)、RIB326(2012年完成)、100-8(2014年完成)、BCC7051(2017年完成)、SRCM101975(2017年完成)、SRCM101989(2017年完成)。从以上数据可以看出,虽然曲霉的基因组学研究在真菌领域占比较少,基因组组装水平不高,但就是这些不算完美的基因组信息却在实际应用中极大推进了基因改造技术的发展。

2005年,日本26 家科研单位利用全基因组鸟枪法共同测序完成了世界首例酿造用米曲霉RIB40基因组序列[6]。测序数据显示,米曲霉基因组大小为37.6 Mb,分布在8条不同的染色体上,长度分别是6.4 Mb、6.2 Mb、5.0 Mb、4.8 Mb、4.4 Mb、4.1 Mb、3.4 Mb和3.3 Mb;七号染色体上还包含0.6 Mb的rDNA重复序列;线粒体序列为2.9 kb。基因的平均大小为2.8 kb,是酿酒酵母基因大小的1.4倍。在最新的曲霉基因组数据库中[7](截止2017年11月12 日),米曲霉 RIB40基因组中预测的编码蛋白基因是12 090个(基因组基因12 074个,线粒体基因16 个),其中仅有205 个基因功能是经过证实,占基因总数的1.7%。在8条染色体上分别分布着2 048、2 019、1 655、1 528、1 487、1 320、908和1 097个基因,同时还有12 个基因位于8条染色体以外的序列上。除此之外,米曲霉基因组上还有268 个tRNA序列和3 个rRNA序列。进一步对米曲霉基因组基因进行GO功能聚类分析发现(图1所示),在分子功能聚类中排名前3位为水解酶活力(hydrolase activity)、氧化还原酶活力(oxidoreductase activity)和转运酶活力(transferase activity),基因数均超过1 000(超过注释基因的8%),同时肽酶活力(peptidase activity)基因个数达到206;在细胞组分聚类中排名前3位为细胞核(nucleus)、膜(membrane)和细胞质(cytosol),均有超过1 400个基因(超过注释基因的10%);而在生物过程聚类中则有大量基因参与了糖类代谢(455个)、蛋白质和氨基酸代谢(401个)、脂类代谢(398 个)以及分泌蛋白加工转运(2 681个)等过程。到目前为止,虽然米曲霉基因组中绝大部分基因的具体功能还是未知的,但从图1相对全面的注释数据来看,米曲霉是一种非常适合用于酱油等传统食品酿造的微生物。

米曲霉RIB40基因组测序完成之后,就陆续有针对其自身及其他品类米曲霉基因组、转录组及蛋白组研究成果的相关报道。VONGSANGNAK等[8]应用表达序列标签技术分析米曲霉A1560基因组,鉴定了1 046个新基因;同时对米曲霉基因组数据库中1 469个假定蛋白功能进行新的预测,并利用修订后的基因组注释重构了米曲霉代谢网络。WANG等[9]利用RNA-Seq测序技术对米曲霉进行不同培养条件的转录分析,判定12 074个蛋白编码基因中有11 263个发生转录表达,使得米曲霉基因的注释率达到93.28%;确定了4 198个基因的5′非翻译区(5′-Untranslated Region,5'UTR)和4 357个基因的3′非翻译区(3′UTR);确认了1 345个米曲霉基因的上游开放阅读框(Upstream Open Reading Frame,uORF)和272个基因的上游起始密码子(uATG),发现了1 166 个新转录本和800个新外显子;确定了1 375个可变剪接事件。ZHAO等[10]通过比较米曲霉100-8和米曲霉3.042蛋白组学差异,鉴定出522 个胞内蛋白,并发现部分与碳及氨基酸代谢有关的蛋白可能会促进酱油风味;后续又通过比较分析米曲霉100-8和米曲霉3.042基因组与转录组的数据差异,获得了2株菌在基因组水平上单核苷酸多态性、缺失及插入序列位点信息,转录组水平上的胞外蛋白酶差异表达基因,在基因水平揭示了2种米曲霉不同的分泌调控机制和由其导致发酵产品风味不同的原因[11]。因此通过对基因组、转录组及蛋白组综合比较分析研究,使大家从全局上对米曲霉基因组信息及基因功能有了更加清晰的认识。

2 米曲霉水解酶

在传统食品酿造过程中,米曲霉能够分泌大量水解酶类,主要包括蛋白水解酶(蛋白酶、肽酶、谷氨酰胺酶)和糖类水解酶(淀粉酶、葡萄糖苷酶、蔗糖酶、植物水解酶)[12]。这两大类酶系能够将原料中的蛋白质及糖类物质转变成多肽、氨基酸、寡糖及单糖,这些小分子物质是构成传统发酵食品色、香、味、体的源泉[5]。但目前对于蛋白水解酶和糖类水解酶研究主要是集中在酶学性质(包括:酶组分、酶学性质、影响酶活因素)的研究[13-15];而对控制这些酶系表达基因的关注度不高,因此下面就从基因水平对这两大酶系进行详细阐述。

2.1 蛋白水解酶

蛋白水解酶包括内肽酶及外肽酶。大部分内肽酶可以根据催化活性中心分成4大类[16],即丝氨酸肽酶(serine endopeptidase)、半胱氨酸肽酶(cysteine endopeptidases)、天冬氨酸肽酶(aspartic endopeptidase)和金属肽酶(metalloendopeptidase)。虽然每个类别肽酶的底物结合位点不同,但活性中心催化位点周围氨基酸序列却相对保守,因此这些保守的序列信息就被用来鉴别米曲霉不同的肽酶基因(表1所示)。

表1 米曲霉基因组肽酶基因数量及氨基酸保守序列[6, 17]Table 1 The number of genes and conserved amino acid sequences of the peptidases in A. oryzae

外肽酶根据作用方式划分为氨肽酶(Aminopeptidases)、二肽酶(Dipeptidases)、二肽或三肽酶(Dipeptidyl or Tripeptidyl peptidases)以及羧肽酶(Carboxypeptidases),米曲霉外肽酶基因的预测是通过与公开数据库已知外肽酶基因信息进行比对获得(COGscores>150)[17]。对米曲霉的基因组整体预测分析发现(表1所示),米曲霉基因组上存在135 个肽酶基因,其中包含69 个外肽酶基因和66 个内肽酶基因,占到米曲霉总基因数的1%[6]。而且米曲霉肽酶基因数量还远超过构巢曲霉(90 个)和烟曲霉(99 个)[6]。米曲霉基因组上有大量在酸性pH条件下发挥作用的分泌型肽酶基因,包括天冬氨酸蛋白酶、抑肽素钝化蛋白酶(Pepstatin insensitive protease)、奥瑞素(Aorsin)、羧肽酶,这也许可以解释为什么米曲霉适合在酸性pH条件下生长。通过氨基酸序列分析发现[17],半数以上金属蛋白酶(Metalloproteinases),大部分天冬氨酸蛋白酶(Aspartic proteinases)和丝氨酸型羧肽酶(Serine-type carboxypeptidases)都有一个典型的信号肽序列,可初步判定为分泌型蛋白酶。从这些数据分析可以看出,米曲霉具有丰富的分泌型肽酶,该特性使其被选择用于富含蛋白质原料的发酵应用。BUDAK等[16]通过综合分析米曲霉RIB40等7种曲霉在麦麸和甜菜渣2种培养条件下基因组、蛋白组以及酶学检测结果,发现7种曲霉均含有大约占总基因数量3%(预测蛋白酶基因数量均超过300 个,胞外蛋白酶超过40 个)的蛋白酶基因,其中25%±1%属于丝氨酸蛋白酶,18%±1%属于金属蛋白酶,8%±1%属于氨基蛋白酶,5%属于天冬氨酸蛋白酶。对7种曲霉蛋白组数据进行比较分析发现,总共133种假定的蛋白酶基因被确认,其中米曲霉基因组上含有41个直系同源蛋白酶基因,包括5种氨基蛋白酶、7种天冬氨酸肽酶、1种半胱氨酸酶、6种金属蛋白酶、17种丝氨酸蛋白酶和5种泛素化蛋白酶。实验结果还表明,麦麸较甜菜渣能更好地诱导蛋白酶基因表达。但是通过最新曲霉数据库[7]检索发现,目前仅有21种肽酶基因得到详细的功能研究(pamA、pepAd、opsA、ocpO、ocpC、cdpA、damA、gdaA、lapA、apsB、apsA、mepB、dppIV、kexA、sedD、atg4、nptB、alpA、pepE、kexB、creB)。这说明目前蛋白酶系基因的研究主要侧重于生物信息学方面的序列比较分析,要想更深入了解酶系基因的作用机理,则需要进一步对这些预测基因进行详细的功能性研究。

2.2 糖类水解酶

米曲霉不仅能用于酱油及发酵酱的生产,在日本还被用于酒类产品的发酵,包括清酒及烧酒,而且也有上千年的历史,这主要是利用米曲霉丰富的糖类水解酶[18]。米曲霉的淀粉水解酶包含α-淀粉酶、葡萄糖淀粉酶和α-葡萄糖苷酶,到目前为止大部分淀粉水解酶的基因功能已经被证实[19]。KOBAYASHI等[17]对米曲霉RIB40的基因组进行比较分析发现,米曲霉基因组上有5个α-淀粉酶、2个葡萄糖淀粉酶和5个胞外α-葡萄糖苷酶基因。与蛋白水解酶相比,淀粉水解酶的基因数量远小于预期,但就是这些相对少量的基因却保证了米曲霉强大的淀粉水解能力。米曲霉基因组上还存在大量的果胶水解酶基因(55 个)[6],但实际生长过程中的果胶水解能力并不强。其中糖基水解酶结合域的数量决定了原料生物质的分解能力[20-21],但通过基因分析发现米曲霉含有纤维素结合域(cellulose binding domain,CBD)或淀粉结合域(starch binding domain,SBD)的基因数量是明显偏少;构巢曲霉中有19 个水解酶含有CBD结合域,但米曲霉只有5个水解酶含有CBD结合域;黑曲霉的淀粉酶和至少一个葡萄糖苷酶有SBD结合域,但米曲霉中只有glaA含有SBD结合域[17]。通过上述结果可以支持这样的假说[22]:米曲霉来源于野生的植物致病菌,但在长期驯化过程中利用容易分解的原料,导致果胶、纤维素以及生淀粉水解能力逐渐退化。COUTINHO等[23]利用CAZy family数据库对米曲霉RIB40基因组预测分析,发现基因组上存在219 个糖类水解酶基因,其中71.7%(157 个)有分泌信号,17.8%(39 个)是非经典分泌,10.5%(23 个)是在胞内发挥作用。通过作用功能归类分析,米曲霉基因组中有33 种糖苷酶,总计185 个基因;有5种多糖裂解酶,总计20 个基因;有3种糖类酯酶,共计14 个基因。由于多糖较蛋白质组成成分简单,目前糖类水解酶基因功能研究水平较蛋白水解酶相对全面。

3 转录调控

只通过酶系基因数量来衡量水解酶表达量的丰富程度具有一定局限性。在同等基因数量的前提下,不同培养时间及培养条件的酶系表观活力是不一致的,这主要是转录因子在转录水平对基因实时调控造成的。转录因子是通过与受调控基因启动子区域顺式作用元件发生相互作用来影响基因转录表达,在FTFD数据库(fungal transcription factor database)中有570 个基因被预测为转录因子[24]。COUTINHO等[23]通过总结分析认为多糖水解酶的基因表达主要是受AbaA(AO090003001587)、AmyR(AO090003 001208)、AreA(AO090009000502)、BrlA(AO090005 001041)、CreA(AO090026000464)、PacC(AO090003 000758)、PecR、XlnR(AO090012000267)几个转录因子调控。CreA是碳分解代谢物阻遏蛋白[25],在葡萄糖或其他易代谢碳源存在条件下,抑制大部分糖类水解酶基因表达,例如淀粉水解酶等。AmyR是淀粉水解转录激活因子[26],α-淀粉酶、糖化酶及α-葡萄糖苷酶基因都是受AmyR转录因子激活调控。XlnR是木聚糖以及纤维素水解的转录激活因子[27],几乎调控表达了所有参与木聚糖和纤维素降解基因,以及部分参与木葡聚糖和半乳甘露聚糖降解基因。PecR是预测参与果胶分解的转录激活因子[28],目前其具体功能还未进行详细研究。还有一些多糖水解酶基因是由铵盐相关调控因子AreA[29]以及pH调控蛋白PacC[17, 30]调控。另外在参与多糖降解基因的启动子上还发现有发育调控因子AbaA[31]和BrlA[32]结合位点,但这些转录因子在糖类代谢中具体作用效果并未得到详细评估[23]。目前对于蛋白水解酶基因转录调控因子的研究较少,只有一个得到较为详细研究,PrtT[33-34](AO090003001577),该调控因子在米曲霉中参与了中性金属蛋白酶(NpI)以及碱性丝氨酸蛋白酶(AIp)等蛋白酶基因的表达调控。除了这些专属的转录因子外,还有一些全局性转录因子,也参与了分泌酶系基因的表达调控。转录因子FlbC[35](AO090026000200)不仅参与了孢子的发育调控,还参与了固态培养条件下葡萄糖淀粉酶以及蛋白酶基因的特异表达调控。转录激活因子CpcA[36](AO090009000459)参与到氨基酸生物合成途径,在所有米曲霉转录因子中的相对表达水平最高。转录因子HacA[34](AO090124000074)参与到内质网相关分子伴侣、磷脂代谢、脂肪酸合成、易位、蛋白糖基化、细胞壁合成、膜泡运输、液泡蛋白定位和蛋白降解等过程。正由于这些特异性以及全局性转录因子对糖类及蛋白水解酶基因的动态调控表达,保证了米曲霉在不同环境条件下最优生长。

4 蛋白分泌途径

在传统食品酿造过程中主要是利用米曲霉的分泌型糖类及蛋白水解酶来进行原料的降解。这些分泌酶基因经过复制、转录、翻译以及分泌途径的熟成加工,最终形成具有作用功能的酶系蛋白。已有研究表明米曲霉等丝状真菌的蛋白分泌一般发生在菌丝顶端或亚顶端即顶端分泌,这种分泌方式在一定程度上决定了米曲霉高效分泌能力[37-38]。在蛋白分泌过程中,分泌蛋白相应的mRNA首先在核糖体上合成为多肽并靶向内质网(endoplasmic reticulum,ER);随后多肽在内质网中进行折叠与修饰,例如糖基化、形成二硫键、磷酸化以及亚基组装,发生错误折叠蛋白会激活非折叠蛋白反馈机制(unfolded protein response,UPR)或者内质网相关降解(endoplasmic reticulum associated degradation,ERAD);接着内质网中正确折叠蛋白通过囊泡运输转运到高尔基体(golgi),在高尔基体中进一步对蛋白进行成熟加工以及糖基化;高尔基体中加工蛋白可能会被转运到液泡(vacuole)降解;分泌蛋白则通过囊泡运输到细胞膜并分泌到细胞外[34]。蛋白在内质网、高尔基体以及细胞膜等细胞器之间的传输是通过囊泡运输实现,其中SNARE蛋白是囊泡运输中核心蛋白。在米曲霉基因组上有大约21 种不同SNARE蛋白基因[39],这些蛋白是水解酶蛋白正常分泌的重要保证。LIU等[40]对米曲霉基因组通过文献总结和生物信息学分析,获得目前最为全面示踪米曲霉分泌机制的369 个分泌途径组分基因,这些基因蛋白协同参与了蛋白分泌途径的所有步骤和过程,保证了酶系蛋白在分泌系统中的高效翻译、高效组装修饰以及高效分泌。

5 结语

米曲霉不仅是传统食品酿造行业中的核心菌株,而且还被广泛应用于外源蛋白的表达宿主,LUBERTOZZI和KEASLING[41]统计发现大约商业酶总量的50%是由米曲霉、黑曲霉以及李氏木霉等丝状真菌生产。自2005 年米曲霉RIB40基因组测序完成之后,米曲霉分子遗传改造效率就得到大幅度提高,YOON等[42]在米曲霉中实现了10 个蛋白酶基因的连续敲除,并以其作为宿主进行人溶菌酶(human lysozyme,HLY)和牛凝乳酶(bovine chymosin,CHY)异源表达,其表达量分别是野生型的3.2 倍和3.8 倍。同时对米曲霉进行基因组改造不仅能实现多达200 kb超大片段敲除[3],还能实现单个碱基精确删除和插入[43],利用这些技术可以用来破坏对工业生产不利的基因,改善米曲霉生产效率。后续随着组学新技术在米曲霉中应用,米曲霉将会朝着多组学协同研究的方向发展,在基因水平、转录水平、蛋白质表达和代谢物分泌水平不同维度上系统分析细胞反应和调控机理,将有助于我们更加全面地理解米曲霉蛋白分泌调控机制,为米曲霉酶系表达研究提供全面的理论指导。

由于基因组学现代遗传改造技术应用于传统食品酿造菌株的改造存在诸多限制,导致一直以来只能使用传统的物理及化学方法进行米曲霉育种研究。传统的菌种选育方式具有很大的盲目性和随机性,选育效率非常低。同时对于菌种选育过程中菌株性能评价,只简单的通过酶活力表观指标进行衡量,没有深入的理解和探究酶系相关基因对于菌种发酵性能的根本影响,评价结果往往具有一定的片面性。因此在我国后续的菌种研究过程中,如何有效利用基因组所包含的基因信息来指导和提高米曲霉菌种的选育效率以及寻找最适发酵条件,将会是一个值得深究的课题。

猜你喜欢

肽酶水解酶糖类
腈水解酶反应机制与催化性能调控研究进展
氨基甲酸乙酯水解酶的家族生物信息学分析
猪δ冠状病毒氨基肽酶N的研究进展
神奇水解酶专“吃”塑料
不同品种葡萄干中糖类成分分析
液-质联用法测定蒙药制剂中非法添加降糖类化学药品
氟啶脲对甜菜夜蛾蛋白质和糖类代谢的影响
2型糖尿病患者代谢综合征组分与血清谷氨酰转肽酶的相关性研究
靶向二肽基肽酶维药体外筛选模型的建立及应用
二肽基肽酶-Ⅳ抑制剂的降糖机制研究进展