基于病毒宏基因组技术的浮游病毒多样性研究进展
2020-12-10李樾,袁智,刘丽
李 樾,袁 智,刘 丽
(1.湖北工程学院 新技术学院,湖北 孝感 432000;2.昆明理工大学 生命科学与技术学院,云南 昆明 650500)
浮游病毒(Virioplankton)是指悬浮在水层中各类病毒的总称,一般呈长短尾蝌蚪形、纺锤形、球形等形态[1-4],噬菌体与噬藻体是其主要类群[5]。研究表明浮游病毒对引起水华现象的浮游藻类具有控制作用[6-7],浮游病毒研究已经成为科学家研究的热点。传统方法很难对浮游病毒多样性、病毒动态变化及未知病毒进行全面的了解,而宏基因组技术的出现为病毒的检测及微生物遗传多样性分析提供了新方法。病毒宏基因组学(Viral metagenomics)不需要已知核酸序列,而是直接以病毒样品的总核酸为研究对象,可以快速鉴定样品中病毒物种,既丰富了病毒库数据,也对病毒检测、病毒多样性、实时监测病毒动态数据等研究具有重要的价值[8]。病毒宏基因组技术在医学等领域[8-9]和环境体系[10-11]显示出巨大的优越性,对病毒的物种组成、系统研究、疾病预防及通过基因水平转移发现病毒与宿主的互相作用具有重要意义。
本文回顾并比较了浮游病毒多样性研究的相关分子技术发展及优缺点,综述了近年来基于宏组技术在浮游病毒多样性研究中的应用,为不同环境中未知病毒的识别提供数据支撑,为水生态系统的污染防治提供科学依据,从而丰富我国水生态病毒学的理论体系。
1 遗传多样性研究的分子技术
研究人员发现遗传多样性越高的物种,对环境和气候变化的适应能力就越强,分布的范围也越广[12]。遗传多样性的研究有助于完善物种分类、分析进化关系、探究与宿主互作机制等[13]。目前,应用于浮游病毒多样性研究的分子技术主要包括克隆文库分析法、核酸探针技术、基因芯片和宏基因组文库等。
克隆文库分析法是提取样品总DNA,设计引物进行PCR 扩增、连接、克隆、测序后与已知的数据库中序列比对,通过系统发育分析研究浮游病毒群落多样性。克隆文库应用在群落多样性研究中需要注意有广泛的通用分子标记基因,而高度差异性的病毒类群因缺乏通用的分子标记基因导致最终分析结果有误。常用的靶基因主要有病毒衣壳组装蛋白的g20基因[14-15]、DNA聚合酶基因[16]、编码光合系统Ⅱ反应中心蛋白的光合基因psbA[17-21]等。由于病毒的种类较多而g20基因仅存在于肌尾病毒中、DNA聚合酶基因主要存在于短尾病毒中、psbA基因广泛存在于短尾病毒和肌尾病毒中,因此g20基因、DNA聚合酶基因、psbA基因作为遗传多样性的标记基因在多样性研究存在一定局限性[22]。
核酸探针检测技术是一种通过特异性核酸探针检测样品中待测靶序列的方法。其中,核酸探针通常选用放射性同位素或荧光染料作为标记。该技术具备灵敏性和特异性高的特点,从而被广泛应用于多样性研究中。Wommack等[1]基于此技术对切萨皮克海湾的浮游病毒群落结构的动态性质分析,发现浮游病毒通过基因转移方式影响其宿主的遗传多样性。应用此技术的局限性是特异性标记的探针须为病毒数据库的已知序列,因此不能挖掘新的病毒基因且难以获得全面的遗传多样性数据[5]。
基因芯片又称生物芯片,是一种微量分析技术,是将标记的样品与固定在支持物上的大量探针分子杂交,通过检测杂交信号的强度分析样品相关信息,可同时实现对样品分子的大规模检测分析。此方法的缺点是标记的探针须为病毒数据库的已知序列,因此也不能发现新的病毒基因。
宏基因组(Metagenome)概念由威斯康辛大学的Handelsman等在1998年提出,指自然界特定环境中全部微生物遗传物质总和[23]。宏基因组学(metagenomics)是研究环境样品中所包含的全体微生物的遗传物质组成、群落结构功能的研究手段。因其通过对微生物的核酸物质进行测序来分析微生物群落物种组成与功能多样性,所以又称微生物环境基因组学。值得注意的是随着该方法的应用及生命科学的发展,不可培养或难培养微生物的认知与研究不再是困扰学者的难题。因为宏组技术不再需要依赖于微生物分离培养技术[24-32]。
2 病毒宏基因技术研究进展
2.1 病毒宏基因组技术
病毒宏基因组学是基于宏基因组学技术而发展的一个新的学科分支,又称宏病毒组学。该技术有一套科学的流程,包括病毒样品总核酸提取、测序文库构建、高通量测序、生物信息学分析。必须注意的是宏病毒组建库测序不同于一般的宏基因组技术,需要对病毒颗粒进行富集。笔者在应用宏组技术探究不同湖泊中浮游病毒多样性差异的流程如图1所示,基于此技术对病毒的物种组成和功能注释分析不同环境中的病毒群落结构及功能,发现高原湖泊中浮游病毒遗传多样性十分丰富,且存在大量未知病毒。
图1 病毒宏基因组学技术分析流程
病毒宏基因组学在探究未知病毒、追溯病原、疾病预防等方面具有重要实用价值。先前的病毒调查结果表明病毒具有丰富的遗传多样性,发现约60%~99%的环境病毒序列与病毒数据库无同源性[33-35]。2007年,Bench等[36]基于宏病毒方法对切萨皮克湾的浮游病毒分析发现该地区含有大量未知浮游病毒序列(仅与环境序列同源)和新序列(无显著同源),并表明dsDNA病毒可能是生物圈中未知的遗传多样性的最为丰富种群之一。Ng等[33]在2009年对佛罗里达绿海龟纤维乳头瘤组织构建宏组文库分发现了一株新型的单链DNA病毒,表明病毒宏基因组技术直接从样品中发现新病毒方面的潜力,增加了我们对病毒进化和多样性的理解。Willner等[37]应用此技术首次研究患有呼吸道疾病人群和健康人群的病毒群落,发现呼吸道患者中的病毒多样性很低。2010 年,Coetzee 等[38]提取南非葡萄园中感染病毒葡萄藤的遗传物质进行深度测序分析,发现新病毒的存在和4株已知的病毒病原体。Donaldson等[39]利用此技术对北美地区一个废弃铁路隧道中蝙蝠的粪便、口腔、尿液和组织样本分析发现7-10个种属蝙蝠群落,还发现许多昆虫病毒、植物病毒和一株新型冠状病毒,表明蝙蝠是病毒传播途径之一。Day等[40]对患病火鸡肠道内RNA病毒测序后数据库比对发现许多病毒同源序列。
2.2 宏病毒组技术在浮游病毒多样性研究中的应用
大量的研究表明浮游病毒不仅具有调节宿主群落结构的作用,还能够通过基因水平转移影响生物地球化学循环[41-43]。不同自然条件下不同浮游病毒群体之间具有一定的差异,海洋和淡水等水域中的浮游病毒已经成为生态学研究的重点课题。
2002年,Breitbart等[44]首次应用宏组技术对美国加州的2处沿海区域浮游病毒群落分析,结果表明海洋中病毒群落多样性非常丰富,大约包含374至7114种病毒类型。Angly等[45]基于此技术对来自北冰洋、不列颠哥伦比亚的海岸、墨西哥湾和马尾藻海的184个海洋病毒群落结构及分布特征进行研究,发现病毒物种组成存在地域性差异,病毒多样性很高且在低纬度地区更丰富。2004年,Breitbart等[24]将宏组技术与数学模型相结合对近岸区域的海洋沉积物病毒群落分析,结果表明海洋沉积物病毒群落是遗传多样性最丰富的生物群体之一,且每1 kg沉积物中至少有104个病毒基因型。2009年,Sharon等[46]比较分析已知的海洋病毒生物群落和宏基因组数据,发现构成蓝藻光合系统I的基因序列存在于噬藻体的基因组中,揭示了其在病毒生命周期中的独特功能。塔拉海洋探险队[47]历经两年半的时间,对采集的表层及中层海水的海洋病毒调查发现其遗传多样性丰富,经过分析鉴定揭示了巨病毒科病毒和卵菌之间的横向基因转移联系,表明宏基因组序列分析有望为海洋病毒的生物多样性及其与潜在宿主的相互作用提供新的线索。2015年,汪俭[48]基于宏组技术探究我国的北黄海海洋病毒群落特征发现肌尾病毒科病毒丰度最高,经过比对分析发现许多未知病毒序列。2016年,夏骏等[49]基于此技术分析我国渤海的海洋病毒群落特征,经分析均发现海水中肌尾病毒科病毒丰度最高且渤海地区秋季浮游病毒多样性高于冬季。2017年,Claire等[50]持续八年时间研究分析南极半岛西部(WAP)沿海地区的浮游病毒丰度变化规律及其驱动因素,发现该区域具有明显的季节性周期变化且夏季丰度最高,推断是浮游细菌的变化导致的浮游病毒的年际差异。
宏基因组学极大地扩展了已知的病毒圈,但淡水病毒的多样性仍然知之甚少,主要集中在黄石温泉、南极湖、撒哈拉沙漠淡水池塘、我国台湾的水库等。2008年,Schoenfeld等[51]首次基于此技术对黄石公园两个碱性温泉(74 ℃和93 ℃)的嗜热病毒研究,发现其病毒多样性与中温环境相似性较高,与陆地分离的病毒也有一定的相似性。Dinsdale等[52]基于宏组方法分析海洋、淡水、盐湖等9个病毒群落的遗传信息和代谢过程,结果表明各群落的功能多样性相似,但代谢特征有所不同。2009年,Alberto等[53]利用此技术对南极湖病毒群落的遗传结构分析发现大量未知真核病毒,且春夏季病毒物种的转化与宿主群落的季节性变化相关。Djikeng等[34]利用宏病毒组技术对美国马里兰州一个淡水湖泊中RNA病毒调查研究,将测序所得的数据与病毒数据库比对分析发现30多个RNA病毒家族并且存在大量的未知病毒序列。Rosario等[35]基于此技术分析废水处理厂再生水中病毒群落特征并与饮用水中的病毒比较,发现大量与昆虫、动植物病毒相关的新型病毒,推断再生水可能在病毒传播中发挥作用。2011年,Sime等[54]对非洲西部的雷特巴盐湖中病毒颗粒构建宏基因组文库进行多样性研究,发现许多与已知数据库不匹配的新序列。2012年,Roux等[55]基于宏组技术对两个生境差异明显的法国温带淡水湖泊病毒群落的组成和多样性分析发现中营养湖泊的物种丰度高于贫营养湖泊,并且与先前发表的病毒信息对比首次发现淡水环境病毒群落与其他水生生态系统在遗传上显示出特异性。2013年,Fancello等[56]对撒哈拉沙漠中部四个池塘的浮游病毒群落进行宏组研究,结果显示人类活动多的地区病毒生物多样性较低且肌病毒科噬藻体最为丰富。2016年,Skvortsov等[57]对来自爱尔兰内伊湖的浮游病毒群落进行宏组分析,发现浮游病毒多样性比之前研究湖泊更为丰富,其中以短尾病毒科为主要部分。2019年,Okazaki等[58]对日本的深淡水湖(琵琶湖)浮游病毒进行基因组探索,并与自己已发表的病毒基因组比较揭示了病毒的地域性特点,分析发现放线菌病毒是淡水系统中最多样化的、最普遍、最丰富的病毒群之一,在地表水中具有潜在的溶菌活性。
宏病毒技术发展至今,国内淡水环境浮游病毒多样性的相关研究还比较少。2012年,Tseng等[59]对我国台湾北部的翡翠淡水水库的浮游病毒多样性进行为期两年的宏组分析,发现夏季病毒丰度及多样性显著超过冬季,变异病毒主要集中在长尾病毒科、肌病毒科、短尾病毒科和微病毒科。2013年,Ge等[60]对我国武汉东湖浮游病毒群落结构进行宏组分析发现,浮游病毒多样性在秋季最高,其次是冬季,而春季最低。2016年,Cai等[61]对我国福建九龙江河口病毒群落特征初步调查发现短尾病毒科病毒丰度最高。笔者基于宏病毒技术对四大高原湖泊中的浮游病毒多样性进行分析,发现长尾病毒科的丰度最高,通过构建系统进化树发现存在大量未知病毒序列[62]。
3 总结与展望
长期以来,对于病毒的研究一直局限于从受感染宿主中分离,因其缺乏广泛的通用分子标记基因,导致一般的生物技术很难获得完整的病毒序列。而宏病毒组分析技术的建立开辟了一条新的道路,摆脱了物种界限,并揭示了复杂的生命规律,已成为环境和组织研究中病毒组成和功能的重要技术。虽然宏组技术已被证明是一种强大的工具,能够对样本中存在的所有核酸进行测序,从而不需要预先了解微生物基因组序列就可以对其身份识别,但是,宏组技术还存在明显的局限性:1)需要对病毒颗粒进行富集以满足建库要求。宏病毒组分析的前提是要保证核酸物质的质量和构建文库的覆盖率要满足后续实验要求,所以环境病毒样品处理与筛选尤为重要。2)需要其他工具的协助来增强其应用。已知的病毒注释数据库数量有限,基于宏组技术测序样品产生的海量数据需要很长的计算时间,需要其他工具的辅助对单个病毒序列进行聚类、分类和识别。如结合系统发育分析方法识别元基因组中每个序列的同源性。
浮游病毒因在海洋、湖泊等水生态系统的重要地位已成为许多国内外学者的关注焦点。相对于国外来说,我国有关浮游病毒的研究起步较晚,仅限于个别海洋、淡水湖泊等,而对于其他地区浮游病毒多样性的研究还有待深入。