宏基因组技术在极端环境酯酶挖掘中的应用
2021-06-01朱玉玲唐诗哲周凯燕程海娜
朱玉玲,彭 晶,唐诗哲,周凯燕,程海娜
(中南大学资源加工与生物工程学院,中国湖南长沙410083)
酯酶(esterase)可催化酯键水解生成醇和酸,也可催化逆反应使羟基和羧基脱水缩合[1],具有反应条件较温和、反应不需要辅酶、催化活性高以及选择性强等优点,被广泛应用于食品、化妆品、造纸、纺织、生物能源、皮革、环境治理、洗涤剂、新型材料、医药等领域[2]。酯酶来源广泛,其中来源于极端环境微生物的酯酶更适合工业应用。但是,由于传统的微生物分离培养技术和测序技术的局限性[3],可培养微生物只占总数的很少一部分,对于物理化学条件复杂的极端环境,可培养微生物则更少[4]。宏基因组技术作为近年来发展起来的一种可以不依赖于微生物纯培养而可以获得环境中所有遗传信息的方法,既可以研究微生物种类的多样性,又可以寻找其中的新功能基因[5]。本文综述了宏基因组方法在极端环境酯酶挖掘中的应用现状、面临的挑战以及日后的发展方向,旨在为进一步开发性能更加优良的酯酶提供参考。
1 酯酶的分类及来源
酯酶的分类有广义与狭义之分。广义上来说酯酶就是所有可以水解酯类的酶,主要有四大类,分别是羧酸酯酶、磷脂酶、硫酸酯酶和硫磷酯酶。而羧酸酯酶又可以分为两种,分别为偏好作用于短链脂肪(碳链长度小于10)的酯酶和偏好作用于长链脂肪(碳链长度大于10)的脂肪酶。狭义的酯酶就是指羧酸酯酶分类下偏好水解短链脂肪的酯酶,本文提到的酯酶是狭义的酯酶。1999年,Arpigny和Jaeger提出基于氨基酸序列特点和生物学性质将微生物酯酶分为8个家族[6]。虽然这种分类方式随着酯酶新家族的发现有一些改动,但仍被沿用至今。
酯酶的主要来源有动物、植物和微生物[7],其中微生物主要包括细菌、真菌和原生动物。真菌中有12属23种可产生酯酶,主要包含青霉、根霉、须霉、毛霉、链孢霉、红曲霉、黑曲霉、黄曲霉和酵母菌等。能产生酯酶的细菌主要有链球菌、金黄色葡萄球菌、新型隐球菌、绿脓杆菌、结核杆菌以及一些极端嗜极古菌[8]。大多数工业酯酶来源于微生物,尤其是极端微生物。这是由于极端微生物来源的酯酶大都具有更宽的温度和pH耐受范围,热稳定性、对有机溶剂和抑制剂的耐受性也更高,能够承受工业生产的严苛条件。
2 极端环境微生物与宏基因组技术
2.1 极端环境与极端环境微生物
极端环境(extreme environment)泛指一些类似于深海、极地、冰川、盐湖、酸性采矿废水、深海热液口、温泉、油田、沙漠、生物肠道等具有低温、高温、高压、高辐射、极酸、极碱、寡营养、高盐、高重金属离子浓度等一个或多个理化特点的自然或者人工环境,而能在这些极端环境中生存的微生物则被称为极端环境微生物(extreme environment microorganisms)。虽然极端环境是地球上的特殊存在,不利于生物体的生存和繁衍,但是极端环境微生物丰度很高[9],经过漫长的自然选择和适应进化,能够在极端环境中生存、繁殖并稳定存在[4]。此外,极端环境微生物往往具有适合生存在极端环境的遗传物质和特殊的代谢途径。这些与众不同的特点引起了大批学术界和工业界研究者的兴趣,全世界范围内的研究者相继启动了极端微生物及其代谢产物的研究计划[10~12],并且取得了很多突破性的进展,包括:新物种的发现;新产物、新型极端酶基因的发现;结构与功能及适应机制的研究[13]。
2.2 宏基因组技术与宏基因组文库
宏基因组(metagenome)包含环境中所有微小生物的遗传物质[3]。其最大优点在于包含环境中未培养微生物的遗传信息,研究人员可以获得传统方式无法提供的基因资源,在绝大程度上能够避开微生物的分离培养,从而进行微生物的遗传信息分析和功能基因的筛选[14~15]。同时,宏基因组包含的信息量很大,研究人员能够更加全面地研究微生物的复杂群落结构和功能基因多样性[5]。通过对宏基因组数据的分析和宏基因组文库的筛选,极端环境中的大量未培养微生物[16~19]及其功能基因更容易被挖掘。
通过宏基因组获取酯酶序列的方法主要有以下几种:1)构建宏基因组文库,再从宏基因组文库中进行活性筛选或者序列筛选;2)利用同源克隆的方法,基于保守序列设计兼并引物直接从宏基因组中将片段调出[20~21],然后通过热不对称性交错PCR(thermal asymmetric interlaced PCR,TAILPCR)、反转PCR等手段获得基因全长;3)对基因组样品直接进行测序,再利用生物信息学的方法从宏基因组中寻找与已知酯酶序列活性区域相似的读码框。
宏基因组文库主要有BAC文库、Fosmid文库、Cosmid文库、λ Phage文库、Plasmid文库、Shotgun文库等几种类型。其中,Plasmid文库主要用于小片段宏基因组文库的构建,而其余几种则用于较大片段宏基因组文库的构建。目前应用于活性物质筛选的宏基因组文库主要为Fosmid文库和Cosmid文库。
3 宏基因组方法从极端环境中获取酯酶的研究
目前,宏基因组技术在极端环境特殊性质酯酶的挖掘应用中取得了很多可喜的成果(表1)[22~47]。其中,大部分来自宏基因组的酯酶序列都是通过Fosmid文库的构建及功能性筛选获得。Fosmid作为能够承载较大片段的载体,在克隆和筛选过程中具有稳定性好、拷贝数可以诱导等优点,被广泛应用于宏基因组文库的构建和功能基因的筛选。
表1 利用宏基因组技术从极端环境挖掘的酯酶Table 1 Esterases excavated from extreme environments using metagenomics
3.1 极端低温环境宏基因组来源的酯酶研究
在已报道的极端环境宏基因组来源的酯酶中,以深海和极地深海沉积物宏基因组来源的酯酶数量最多,且很大一部分深海和极地宏基因组来源的酯酶具有耐盐性、耐碱性、适冷性等特殊的酶学性质[22~35]。Jeon等[23]从冷海沉积物宏基因组中筛选获得一个具有酯水解阳性的亚克隆,经过测序和比对分析发现了一个类似于脂肪酶的开放阅读框EML1,系统发育树显示EML1属于新的酯酶家族,进一步研究其表达产物发现EML1能在5℃时保持50%以上的活性。De Santi等[26]从北极深海沉积物宏基因组中筛选获得的酯酶Lip3能够耐受较宽的温度范围,60℃孵育2 h仍能保持80%的活性,在10℃以下能保持45%以上的活性,对二硫苏糖醇(DL-dithiothreitol,DTT)、乙二胺四乙酸(ethylenediaminetetraacetic acid,EDTA)、苯甲基磺酰氟(phenylmethylsulfonyl fluoride,PMSF)、β-巯基乙醇(β-mercaptoethanol)和高浓度盐有很好的耐受性,且在3 mol/L的NaCl中稳定性能提高4倍。Lee等[28]从韩国西海岸潮滩沉积物宏基因组中筛选到磷脂酶MPlaG,该酶在pH 5~10能保持85%以上的活性,在pH 4和pH 11条件下残余酶活仍能达到20%,在5℃能保持40%以上的酶活。Borchert等[29]从深海海绵体宏基因组中筛选到31个酯水解阳性克隆,其中活性最高的7N9最适pH为8.0,最适温度为4~25℃,能够耐受多种金属离子和高浓度的NaCl。Gavin等[30]从海洋宏基因组中筛选到的酯酶26D具有优良的对映体选择性,得到的对映体纯度高达98%。Huo等[31]从深海宏基因组中筛选到两条对金属离子和表面活性剂有较高抗性的酯酶序列。这些酯酶所表现的耐盐性、适冷性以及耐碱性等优良性质很可能与相应极端环境的复杂物理化学特征有极大的关系。另外,还有一些嗜冷酶则来源于其他极端低温环境如冰川、多年冻土宏基因组等[27,35]。
3.2 极端高温环境宏基因组来源的酯酶研究
一些地热沉积物、堆肥、深海热液口或者火山附近的卤水池沉积物等极端环境宏基因组来源的酯酶大都具有耐热的特点[37~38]。Rhee等[37]从温泉及其沉积物的宏基因组文库中筛选得到一个耐热酯酶基因,该基因与已经报道的超嗜热古细菌(Pyrobaculum calidifontis)的基因具有64%的相似性,其表达产物在pH 4条件下仍能保持40%的酶活,且90℃孵育30 min仍能保持50%的酶活,具有很好的耐热性。Mohamed等[38]从红海高温卤水池的宏基因组文库中筛选得到嗜热耐重金属酯酶基因EstATII,该酶的最适反应温度为65℃,在4.5 mol/L的NaCl和多种重金属中仍能保持活性,同时在30~80℃的温度范围内其酶活均无明显影响。Koutsandreas等[39]通过序列筛选从温泉宏基因组中获得的酯酶EstDZ4在40~85℃的温度范围内均能保持较高酶活,在70℃和75℃下孵育24 h,酶的活性仍保持在40%以上。Lu等[41]从堆肥宏基因组中克隆得到耐热酯酶EST2,其在70~80℃时的酶活性最高,且在有机溶剂中仍能保持稳定。
3.3 其他极端环境宏基因组来源的酯酶研究
另外,现有研究还报道了一些来自于其他极端环境宏基因组的具有特殊酶学性质的酯酶[42~47]。比如,邵化[42]从造纸厂的活性污泥宏基因组文库中筛选发现了耐热酯酶基因est-XG2,该酶最适pH为8.5,最适反应温度为70℃,能够耐受较宽的温度范围,在20~90℃均能保持较高的酶活性,尤其在90℃仍有70%的残余酶活。Lewin等[43]从海上油田宏基因组中获得高度耐热的酯酶FS02,该酶在pH 11时活性最高,在80℃下孵育5 h和90℃下孵育1 h仍能检测到较高的酶活性,同时热稳定性不受pH影响,并能够耐受大部分的金属离子。Zhong等[44]从造纸厂废水沉积物宏基因组中筛选获得的酯酶Est906在强碱性条件下(pH 10.0~11.0)具有良好的稳定性,在52~62℃的温度范围内仍能保持85%以上的酶活。Tutuncu等[45]通过设计简并引物从高盐湖宏基因组中克隆到的酯酶hAGEst在pH 9时活性最佳,在5℃和10℃时能保持一半的活性,在55℃条件下孵育20 min时仍然能稳定存在。
4 宏基因组技术用于极端环境酯酶挖掘的必要性与面临的挑战及其日后发展方向
4.1 宏基因组技术用于极端环境酯酶挖掘的必要性
工业生产需要酯酶能够耐受较宽的温度和pH范围、有机溶剂、金属离子等条件,而医药、食品行业还需要酯酶具有良好的区域选择性和立体选择性[48~54]。随着社会经济的发展,开发具有这些特性的酯酶的重要性日益凸显。从目前已报道的极端环境来源的酯酶所具有的性质来看,酶学性质和来源呈一定的相关性[55~57]。比如:耐热酯酶大多来自于温度比较高的环境,它们除了能在高温下保持酶活性和稳定性以外,通常还表现出对有机溶剂、洗涤剂和极端pH的抗性[58~62];耐盐耐碱的酯酶大部分来自于高盐高pH的环境,而适冷性酯酶则大都来自于温度较低的环境[63]。对于天然来源的野生型酯酶来说,虽然酯酶的来源与性质有相关性,但是不能完全决定性质。极端环境来源酯酶的这些性质的存在,对日后结构和功能关系的研究、酯酶分子的改造及定向进化、其他酶种的改造等具有重大指导意义[57~64]。通过对酶蛋白的氨基酸序列及高级结构与性质的对应规律进行研究和总结,可以对现有的酶序列进行改造和定向进化,以赋予其人类需要的酶学性质。
4.2 宏基因组技术用于极端环境酯酶挖掘面临的挑战
目前,宏基因组筛选方法主要有基于序列筛选和基于功能筛选两种。虽然两种方法都有各自的优缺点,但是无论哪种筛选方法,都不可避免地需要对样品进行宏基因组DNA的提取,而目前的DNA提取手段仍然存在很大的局限性。复杂的极端环境导致了多种影响DNA提取的因素的存在[65~66],例如:与DNA紧密结合的腐殖酸,很大程度上会抑制聚合酶活性,虽然有一些方法能够减少其含量,但是始终达不到去除的目的[67];部分特殊极端环境样品的DNA提取需要特殊的方法,但是由于DNA提取过程的损耗,通常不能获得环境中所有微生物类群的遗传物质[68~69]。
基于功能的筛选方法需要宏基因组文库的每个克隆与底物相互作用,再基于平板上底物颜色或浑浊程度(即透明圈法)的变化确定其活性[70~72]。功能筛选的成功往往需要建立在底物能够溶解、作用前后底物颜色或者透明度能够发生变化、功能基因在宿主细胞内能够有比较好的表达水平且产生的蛋白质能够正确折叠和分泌等条件的基础上,以上条件缺一不可。研究表明,当大肠杆菌被当作宿主用于宏基因组文库筛选时,只有大约40%的酶能够通过功能筛选被回收[72]。这是因为大部分极端环境微生物的遗传背景与宿主细胞差异很大,筛选过程中很可能由于稀有密码子、翻译及遗传系统等种种因素导致外源基因无法表达。另外,真菌由于内含子的存在,也无法通过功能筛选的方法获得其功能基因。
随着新一代测序技术的发展、可用于大规模分析的生物信息学工具的出现以及序列分析和筛选手段的不断完善,越来越多的研究者通过宏基因组数据分析寻找与已知序列同源的序列,或者基于已知序列的保守区设计简并引物并通过PCR的方法挖掘新的酯酶。基于序列分析和筛选方法的弊端在于无法保证基因(基因簇)的完整性,而且以大量的已知序列及其保守性为基础,与已知序列相似度很低或者全新的序列很难被发现。与此同时,高通量测序技术的成本和准确率仍旧是限制宏基因组学发展的重要问题。
4.3 宏基因组技术用于极端环境酯酶挖掘的日后发展方向
宏基因组技术应用于极端环境的酯酶及其他功能基因的挖掘,其日后的发展可以从以下几方面予以重点考虑:1)针对不同的环境尤其是极端环境的高质量基因组提取方法的建立;2)高精度、高通量、低成本的测序技术的开发[73],以提高环境中低种群丰度的微生物及其功能基因被发现的可能性;3)宏基因组文库构建系统及表达系统的更新,这里的主要内容在于宏基因组构建过程中DNA损耗程度的降低和操作复杂程度的降低,以及表达系统中宿主菌的启动子、信号肽、稀有密码子和翻译修饰系统的兼容性的改进;4)筛选精度的提高与新筛选方法的建立,现有的基于功能和序列的筛选方法局限性明显,且功能性筛选过程中除蛋白质无法正确折叠分泌以外,很有可能由于表达量不足以使底物产生明显变化而无法被发现;5)针对真菌宏基因组文库的构建及筛选系统的开发,这主要是由于现有的宏基因组文库的构建与筛选技术通常只适用于细菌,真菌的基因组因含有较多的内含子无法适用,而大多数真菌来源的酶具有较宽的底物谱以及良好的耐受性[74],其性质更加适用于工业应用;6)与宏转录组、蛋白质组等组学技术的联用[75],以促进微生物和其代谢产物与环境的关系及作用机制的研究;7)与合成生物学以及生物信息学展开更深层次的结合,一方面,宏基因组中已被打断的DNA片段的重装以及基于同源性的重新结合可以获得更加完整的微生物基因信息;另一方面,基于合成生物学的手段将完整的遗传物质、代谢通路进行重新组合最终能够得到从头合成的极端环境中的未培养微生物和活性功能性化合物。
5 结语
传统的通过微生物分离培养、纯菌测序等手段得到微生物基因组和功能基因的方法局限性明显。宏基因组学在很大程度上改变了研究者们的研究思路,为极端环境中未培养微生物来源的酯酶及其他功能基因的研究提供了新的思路和方法。极端环境是特殊性质新型酯酶基因的重要来源,基于宏基因组学的方法可从中获得性质优良且能适应工业生产过程中严苛条件的酯酶基因。虽然近年来已有大量的宏基因组数据被公布,也有一些来源于极端环境宏基因组的酯酶被报道,但仍有大量的潜在资源未被挖掘。
日后,随着新的宏基因组提取手段的建立、更加灵敏的筛选方法的改进、兼容性更好的宏基因组文库构建系统和基因表达修饰系统的更新、新一代测序技术以及更加方便的生物信息学工具的发展,极端环境来源的酯酶和其他活性物质的数量将会以更快的速度增加。这些酶蛋白和活性物质也将会在人类的生活和工业生产中发挥更大的作用。