有害藻华的宏条形码分析: 机会与挑战
2020-07-24陈楠生
陈楠生
(1. 中国科学院海洋研究所海洋生态与环境科学重点实验室, 山东 青岛 266071; 2. 青岛海洋科学与技术试点国家实验室 海洋生态与环境科学功能实验室, 山东 青岛 266237; 3. 中国科学院海洋大科学研究中心,山东 青岛 266071)
有害藻华(harmful algal blooms)是由于藻类快速繁殖和累积造成的自然生态现象, 可能具有灾难性的生态或经济后果, 比如导致海洋动、植物死亡、海洋食品污染、海洋食物链的改变, 以及旅游资源的破坏等[1-2]。近年来, 国内外赤潮发展具有新特点, 包括暴发规模加大、持续时间更长、致灾效应加重和全球扩张明显[3]。我国海岸线长, 近岸海域面积大, 包括渤海、黄海、东海和南海, 有害藻华是我国海洋生态系统中最重要的问题之一[1]。对于引发有害藻华的物种, 应用传统的基于形态分类的研究方法, 积累了大量的数据。然而基于形态分类的研究方法有很大的局限性。首先, 需要研究人员具有专业经验, 来准确分辨不同藻类物种; 其次, 藻类细胞在分析过程中的形态稳定性的不同可能造成结果的偏差; 另外, 细胞太小的微微藻往往会被忽略; 还有, 形态相似的隐存种得不到准确区分[4-6]。
分子分析方法的引入大大加强了我们对包括有害藻华物种在内的浮游植物生物多样性的理解[7]。早在20多年前, 美国和法国科学家分别通过克隆测序叶绿体16S rDNA和核糖体18S rDNA序列鉴定到海水中存在多种真核浮游植物[5,8-9](图 1)。随后, 18S rDNA被作为分子标记研究自然海域浮游植物的组成,并发现两类与甲藻进化关系较近的生物类群, 即海洋alveolateⅠ和 alveolateⅡ[10-11], 并确认了 AlveolateⅠ和AlveolateⅡ都是寄生性甲藻[12]。
这些基于DNA分子标记扩增、测序研究野外样本的方法迅速显示出强大的潜力, 并逐步演变成为宏条形码分析[13], 即针对包括很多物种的自然样本,而不是单一物种为研究对象的基因组研究。宏条形码分析已广泛应用于包括有害藻华在内的浮游植物的生态学研究[14]。宏条形码分析策略与基于全基因组测序的宏基因组学分析(metagenomics analysis)相辅相成, 宏条形码分析关注物种组成及相对丰度,宏基因组学则重点关注基因功能。2015年美国《科学》杂志发表了系列利用宏条形码分析的文章, 报道Tara Oceans国际合作项目的研究成果(图2)[15]。通过对采集到的334个浮游植物样本针对18S rDNA V9进行扩增和高通量测序, 得到了150 000个可操作分类单元(operational taxonomy units, OTUs), 其中1/3未能比对到已知物种, 说明海洋中存在大量的尚未得到描述的真核物种。Tara Oceans数据的分析结果揭示了藻类物种的全球分布格局, 包括藻类物种的生物地理学[16-22]、季节性变化规律[23-24]和共生性[25]。另外一个有代表性的宏条码研究是由国际海洋采样日联盟(Ocean Sampling Day Consortium)发起的国际合作项目[26-27]。这个由欧盟资助的微生物B3项目发起的国际组织意在通过国际合作, 在同时间获取海洋样本, 完成测序分析。迄今, 海洋采样日联盟已经协同完成了多个重大项目, 比如, 通过对全球141个采样位点样本的同时采样, 和18S rDNA V4序列的测序, 首次完成了大规模海洋绿藻的全球分布分析[26]。近年来, 随着DNA测序技术在海洋生态领域的应用,DNA测序正在代替传统技术, 逐步被应用于监测海洋生态状况[28]。另外, 国际合作项目全球微生物组计划(Earth Microbiome Project)也展开了较多的海洋浮游植物的宏条形码分析[29]。
图1 宏条形码分析的里程碑事件Fig. 1 Milestones in metabarcoding analysis
图2 Tara Oceans项目-浮游植物与其他浮游生物的丰富度分布格局[15]Fig. 2 Tara Oceans Project: Abundance profile of phytoplankton and other plankton
宏条形码分析方法引入我国以后, 促进了针对各海域的有害藻华研究[30-33]。特别是近年来, 宏条形码研究越来越多, 包括对渤海[34-38]、黄海、东海[39-40]、南海[41-43]、胶州湾[4,44]、北部湾、长江口、珠江口[45-46]等的研究, 取得了显著进展。本综述系统介绍这些进展, 并分析存在的机会与挑战。
1 宏条形码分析技术
1.1 条形码的选择
宏条形码分析通用的条形码包括核糖体 rRNA基因18S rDNA、28S rDNA、 ITS序列、叶绿体基因rbcL和16S rDNA[47]和线粒体基因CO1等。这些通用分子标记的最大优势在于它们的通用性, 即可以通过设计通用 PCR扩增引物进行扩增、测序, 并且可以用于分析绝大多数的浮游植物, 包括有害藻华物种。早期的宏条形码分析是通过克隆、测序策略完成的, 即扩增全长或局部的通用分子标记, 克隆, 然后挑选单克隆, 通过第一代DNA测序(即桑格测序)技术读取每一条条形码的序列。随着第二代DNA测序技术的出现, 高通量、低成本的第二代DNA测序技术逐步取代低通量、高成本的第一代DNA测序技术, 变成宏条形码主流测序技术。由于第二代DNA测序技术的读长比较短, 因此基于第二代DNA测序技术的宏条形码分析往往针对上述通用分子标记的局部, 比如, 18S rDNA的V4区域[4]或V9区域[15], 28S rDNA的D1-D2区域[48]等特异性条形码。目前, 第二代DNA测序技术是开展宏条形码研究的主流, 但是, 由于二代DNA测序得到的DNA片段往往不足以分辨不同物种, 基于第二代DNA测序的宏条形码分析不能充分回答很多问题。随着第三代单分子DNA测序技术的日益成熟, 特别是基于PacBio测序平台的测序通量的不断增加, 成本逐步下降, 越来越多的人开始尝试将第三代DNA测序技术应用于宏条形码分析[49]。
1.2 宏条码分析方法: 从OTU分析到ASV分析
很长一段时间以来, 宏条形码分析的通常分析思路是通过分子标记(即条形码)扩增和测序后, 对测序结果进行聚类分析, 生成可操作分类单元(OTU)。每一个可操作分类单元OTU包括样本中相差很小(通常在3%以内)的序列。OTU分析方法被广泛用于分析宏条形码研究项目。通常, 人们期待OTU 具有如下两方面的功能: 其一, 把针对某种分子标记的环境样本的高通量测序结果转换成物种分类信息, 并且不同的相似性对应不同的分类单元;其二, 通过把相似的序列聚类起来, 从而减少测序错误带来的副作用, 降低对生物多样性分析和物种组成分析的负面影响[50]。然而, OTU并不能够很好地执行上面的两个功能。OTU并没有具体的分类信息,不能与物种进行一一对应。而且, 模拟研究发现OTU聚类分析得到的 OTU数目往往远远多于物种数目, 表明OTU聚类分析具有很高的假阳性[50]。同时, 由于OTU聚类分析忽视了现代测序结果中的质量信息, 浪费了区分更精细的序列多样性的可能性,人为限制了OTU聚类分析的分辨率, 表明OTU聚类分析还具有很高的假阴性[51-52]。
OTU聚类分析的另外一个严重的弊端是分析结果不能用于比较不同样本的物种组成。无参考数据库的OTUs(de novoOTUs)分析结果非常依赖样本的组成(图3), 因此, 两个不同样本的OTU聚类分析结果不能进行比较。为了支持不同样本聚类分析结果的可比性, 人们提出了“封闭式”有参OTUs(closedreference OTUs)的概念, 即在聚类过程中, 根据相似性, 序列都围绕参考数据库中的参考序列进行聚类,得到 OTUs。因此, 只要利用相同的参考数据库, 分析得到的 OTUs是可以比较的。这个分析思路的局限是, 参考数据库中不存在但是样本中存在的数据就不能得到聚类(图 3)。因此, 封闭式有参 OTUs分析受到参考数据库的局限[50]。并且, 参考数据库的任何变化比如数据库升级都会影响分析结果。
图3 基于ASV的分析在逐步取代基于OTU的分析[50]Fig. 3 Replacement of OTU-based analysis by ASV-based analysis
为了解决上述OTU相关的问题, 人们提出了基于扩增子序列变异(amplicon sequence variant, ASV)概念。ASV算法的基本假设是真实的DNA序列在测序结果中出现的频率远远高于测序误差, 不依赖阈值区分不同的ASV[50]。因此, 来自不同样本的ASV序列具有可比性[50]。
基于这个概念的宏条形码分析具有既不依赖参考数据库, 也不依赖相似性阈值的优点。因此, 与基于OTU概念的分析方法相比, 基于ASV的宏条形码分析方法具有很高的优越性, 可以捕获样本中所有的变异, 并且可以用于比较分析不同样本的物种组成(图3)。由于基于ASV的分析更加准确, 分析结果可以用于比较不同样本的物种组成, 可以重复使用,并且更加全面, 基于OTU的宏条形码分析方法在逐步被基于 ASV的方法替代[50,53]。常用的用于分析ASV的方法包括DADA2[51], Deblur[54]和denoise[55]。
DADA算法, 即不同扩增子去噪算法(Divisive Amplicon Denoising Algorithm), 最早发表于2012年[52]。DADA是在AmpliconNoise算法[55]的基础上开发出来的。DADA的优势在于不需要训练数据集, 充分利用序列丰度信息, 通过误差建模, 评估误差参数, 最后推测出样本测序结果中的序列类型。2016年DADA2发表, 特别增加了针对Illumina扩增子的测序质量模型, 并开发了R软件包, 全部分析可以在R环境下运行, 包括过滤、去重复、推测序列信息、鉴定嵌合体、结合双端测序结果等[51]。最近, 我们成功利用DADA2方法分析胶州湾2019年冬季航次采集的样本, 分析发现了大量浮游植物, 其中包括首次在胶州湾发现的有害藻华物种, 以及大量的寄生性甲藻, 并评估了浮游植物之间的互作情况[4]。
2 我国海域有害藻华物种的宏条形码分析进展
2.1 近岸海域的宏条形码分析
渤海是我国唯一的内海, 具有半封闭性, 包括辽东湾、渤海湾和莱州湾, 是一个重要的产卵场和索饵场(图 4)[56]。由于陆生污染物排放和富营养化,赤潮和褐潮暴发频率和强度均呈上升趋势[56-57]。基于形态学的镜检的研究发现渤海代表性有害藻华物种, 包括夜光藻(Noctiluca scintillans)、原甲藻(Prorocentrumsp.)、血红哈卡藻(Akashiwo sanguinea)[58], 丹麦细柱藻(Leptocylindrus danicus)[59]、柔软拟菱形藻(Pseudo-nitaschia delicatissima)[59]、浮动弯角藻(Eucampia zoodiacus)[59]、中肋骨条藻(Skeletonema costatum)[59]、诺氏海链藻(Thalassiosira nordenskioldi)[59]、旋链角毛藻(Chaetoceros curvisetus)[59]、柔弱几内亚藻(Guinardia delicatula)[60]、多形微眼藻(Minutocellus polymorphus)[61]和有害甲藻(Stoeckeria algicida)[36,62-63]。基于扩增测序 18S rDNA V4的宏条形码研究证实褐潮的致灾藻华物种是抑食金球藻(Aureococcus anophagefferens)[64-65]。通过对沉积物样本进行18S rDNA V9区扩增测序, 发现了抑食金球藻是一个本地种, 并且是一个在全世界范围内广泛分布的有害藻华物种[66]。除此之外, 宏条形码研究还发现渤海还存在很多丰度较低但是又具有暴发潜力的有害藻华物种[34,36,38,67-69]。
黄海是一个陆缘海(marginal sea), 具有比较复杂的海流包括黄海冷水团(Huanghai Cold Water Mass,HCWM), 黄海暖流(Huanghai Warm Current, HWC),以及长江冲淡水(Changjiang River Diluted Water,CDW)(图 4)[70]。苏北浅滩的浮游植物以硅藻为主[71]。孢囊分析发现很多有害藻华物种的孢囊, 包括具刺膝沟藻(Gonyaulax spinifera)和多边舌甲藻(Lingulodinium polyedrum), 链状/塔马亚历山大藻(Alexandrium catenella/tamarense), 微小/相似亚历山大藻(Alexandrium minutum/affine)和链状裸甲藻(Gymnodinium catenatum)[72]。基于18S rDNA V4区的宏条形码比较分析发现南黄海与北黄海海域的绿藻与硅藻具有很高的丰度, 可以支撑海岸带的食物链, 特别是海洋经济贝类的养殖[73]。
位于我国、韩国、日本之间的东海是一个很大的大陆架(continental shelf), 也是一个高产渔场, 其浮游生物受长江冲淡水以及黑潮(Kuroshio Current)的影响比较大[74-75]。东海的长江口附近海域是赤潮暴发最显著的位置[1], 对海洋生态环境和公共卫生产生极大影响[76]。迄今对于东海浮游植物及有害藻华物种的研究以浮游植物色素研究[74]、流式细胞研究[75]和形态观察[77-79]为主。东海有害藻华物种中,东海原甲藻(Prorocentrum donghaiense)[80-83]和米氏凯伦藻(Karenia mikimotoi)[84-85]占主导地位。最近在东海发现了指状卡罗藻(Karlodinium digitatum)[84], 血红哈卡藻的多个隐形种(cryptic species)[85], 以及尖刺拟菱形藻(Pseudo-nitzschia pungens)[86]。厦门岛样本进行18S rDNA V9测序, 发现底栖微型真核生物的多样性比浮游的更高, 不同生境的物种分布模式以及影响分布模式的关键过程不同[39,87-88]。定鞭藻(haptophyte)是重要的浮游植物, 贡献显著的初级生产力, 也具有很高的生物多样性[89-91]。通过利用定鞭藻特异性引物对18S rDNA V4区的扩增测序及宏基因组分析证实了定鞭藻的分子多样性水平, 并检测到所有定鞭藻的主要分枝, 包括有害藻华物种球形棕囊藻(Phaeocystis globosa)及三个同属的棕囊藻物种(P. cordata,P. johnii,以及一个由序列ST3500.059代表的物种)[40]。
南海位于西太平洋北部, 是由多个国家围绕的半封闭海域, 也是东南亚最大的半封闭的陆源海[92]。南海的主要有害藻华物种包括夜光藻、球形棕囊藻、中肋骨条藻、锥状斯克里普藻(Scrippsiella trochoidea)、赤潮异弯藻(Heterosigma akashiwo)、海洋卡顿藻(Chattonella marina)和米氏凯伦藻, 有害藻华极大地影响了南海海洋渔业。镜检和形态学分析显示上升流对物种分布具有显著的影响[93]。调查研究系统描述了南海浮游植物的组成和季节性变化, 其中也包括很多有害藻华物种[94-104]。卫星遥感方法也跟踪研究了南海赤潮[105-108], 特别是球形棕囊藻赤潮[109]的形成过程。宏条形码分析揭示了香港水域微微藻生物的多样性,远高于预期[110]。全长18S rDNA扩增, 克隆测序分析揭示了南海浮游植物的组成和分布格局, 发现甲藻是优势物种[111]。基于ITS2的宏条形码分析发现了珊瑚礁共生藻类的多样性[41-43]。
2.2 海湾宏条形码研究
胶州湾是黄海西部的一个半封闭性内湾, 海湾与外海可以进行通畅的海水交换, 半交换周期为5天[112]。近 30年来, 经济活动加快和人口增长造成了胶州湾显著的富营养化[113-114]。长时序遥感影像分析跟踪胶州湾秋季叶绿素a浓度变化也显示出胶州湾浮游植物群落的巨大变化[115]。胶州湾发现的甲藻孢囊中很多是有害藻华物种[116]。近年来, 胶州湾暖水性浮游植物、甲藻等浮游植物类群的数量呈现升高趋势[117]。胶州湾有记录的有害藻华物种高达 68种, 其中有多种在胶州湾引发过赤潮暴发[118]。常见有害藻华物种包括夜光藻[119-120]、浮动弯角藻[121-124]和骨条藻[4]。在挪威海域引发大规模有毒藻华的有害藻华物种里氏金色藻(Chrysochromulina leadbeateri)也在胶州湾发现[125]。历史调查报告中, 胶州湾的骨条藻大多被鉴定为中肋骨条藻[124]。最近我们针对18S rDNA V4的宏条码分析, 加上对分离到的单细胞骨条藻株系的全长 18S rDNA测序分析表明, 胶州湾的骨条藻为玛氏骨条藻(Skeletonema marinoi)(图4)[4]。针对rbcL的宏条形码分析初步揭示了胶州湾浮游植物的生物多样性, 春季代表性物种包括隐藻、定鞭藻和红藻[44]。我们针对18S rDNA的 V4片段完成了宏条形码分析, 分析了胶州湾冬季(2019年1月)的浮游植物组成及空间分布格局, 鉴定出胶州湾有 28个有害藻华物种, 并发现了胶州湾物种之间的可能互作网络关系(图5)[4]。
北部湾位于南海西北部的一个半封闭式的海湾,热带季风气候, 曾经被认为是我国最后“一片干净的海域”和高产渔业基地[126]。进入19世纪90年代, 由于自然与人类活动的双重影响加剧[127], 北部湾海域暴发了一系列赤潮, 包括红海束毛藻(Trichodesmium
图4 胶州湾分离得到的骨条藻是玛氏骨条藻[4]Fig. 4 Skeletonema marinoi is the primary Skeletonema species in the Jiaozhou Bay
图5 胶州湾浮游生物之间的互作网络[4]Fig. 5 Phytoplankton species-species interaction network in Jiaozhou Bay
erythraeum)赤潮和球形棕囊藻赤潮[128-130]。在过去30年里, 北部湾藻华暴发频率、暴发持续时间和暴发规模都有显著上升; 这些赤潮暴发事件不仅影响渔业, 还对附近核电设施造成了巨大的威胁[126]。基于形态学分析在涠洲岛附近鉴定出103种浮游植物,包括23种有害藻华物种, 其中球形棕囊藻、红海束毛藻、菱形海线藻(Thalassionema nitzschioides)、旋链角毛藻和洛氏角毛藻(Chaetoceros lorenzianus)占优势[129]。利用流式细胞仪对北部湾9个航次的分析揭示了浮游植物在北部湾分布的时空变化[131], 浮游植物在夏季和秋季的丰度较高, 并集中于钦州湾附近以及雷州半岛的西部。镜检发现钦州湾附近的浮游植物也比较丰富, 优势种包括球形棕囊藻和多种硅藻, 季节变化显著[132]。球形棕囊藻囊体在北部湾也呈现出特定的时空分布, 高峰出现在12月到次年3月, 6月囊体很少[133]。迄今利用宏基因组学方法研究北部湾海域有害藻华物种的组成, 以及在有害藻华暴发过程中的动态变化刚刚起步[134]。通过对2014—2015年度样本的18S rDNA V4序列的测序, 重点分析了5种定鞭藻在北部湾北方的钦州湾分布情况, 发现与NO3-N正相关, 并且发现水温是决定球形棕囊藻丰度的主要原因。
2.3 河口宏条形码研究
河口往往是多样性程度很高的物理-生物互作生态系统, 由于淡水注入(freshwater discharge)和咸水倒灌(salt water intrusion), 在河口附近盐度和营养盐显示很大的变化, 形成了河流-海域连续带(river ocean continuum)。由于河口附近海域复杂的物理及生物地球化学互作, 使得针对这些水域浮游植物的生长、分布规律, 以及有害藻华暴发的研究都具有很大的挑战。
长江口由于长江径流和泥沙入海, 以及复杂流系结构和特殊地形, 形成了独特的生态系统, 也为赤潮暴发提供了条件[135-137]。长江口及其邻近海域受到长江冲淡水和黑潮分支的双重影响, 有害藻华的形成和演变不仅是陆源污染的“指示器”, 也是反映黑潮分支年际变异的“效应器”[138]。从20世纪60年代到 90年代, 人为富营养化(cultural eutrophication)越来越严重[139]。长江口水域有多达68种有害藻华物种, 其中 5种有在长江口暴发赤潮的记录[140],以甲藻为主, 包括东海原甲藻[83]、米氏凯伦藻、亚历山大藻(Alexandriumspp.)和夜光藻[138,141]。仅次于甲藻的是硅藻, 包括中肋骨条藻[141-143]。中肋骨条藻与夜光藻是常见和多发性赤潮物种, 二者经常形成“混合型”赤潮[144]。长江口内到长江口外的盐度梯度和磷浓度严重影响有害藻华物种的分布[145]。迄今对长江口水域的浮游植物及有害藻华物种的研究以基于形态分析的镜检为主[137,144,146-160]。比如, 对长江口24个站位的72个样本进行的形态学鉴定和统计学分析, 鉴定出 94个物种, 包括骨条藻、东海原甲藻、米氏凯伦藻。发现不同有害藻华物种引起的不同类型的赤潮在长江口的不同地点同时暴发, 包括一个骨条藻赤潮, 两个东海原甲藻赤潮, 以及一个米氏凯伦藻赤潮。另外发现从河口到离岸海域, 赤潮物种逐步从硅藻向甲藻、裸甲藻转变的趋势[161]。此外近来硅藻有逐步被甲藻替代的趋势[138]。针对18S rDNA的一个1 001 bp片段的宏条形码分析发现长江口水域存在较高的阿米巴藻Amoebophryidae[162]。针对18S rDNA V2-V3的宏条形码研究发现长江口附近海域包括很多的甲藻(特别是裸甲藻Gymnodinium和异冒藻Heterocapsa)和硅藻物种(特别是骨条藻)[163]。迄今为止, 还没有利用宏条形码方法分析长江口中河流-海水连接带的浮游植物的相关研究。
珠江口是一个位于我国南方亚热带河口, 连接南海北部大陆架, 其通量仅次于长江口, 全球排第13位。近30年来, 由于工业发展, 农业活动, 以及城市化, 珠江口富营养化严重[164]。基于藻细胞形态和荧光色素的分析, 发现珠江口的浮游植物中存在多种有害藻华物种, 包括无纹螺沟藻(Gyrodinium instriatum)、中肋骨条藻、浮动弯角藻、海洋原甲藻(Prorocentrum micans)、三角棘原甲藻(Prorocentrumtriestinum)、叉角藻(Ceratium furca)、血红哈卡藻、链状裸甲藻、哈曼褐色多沟藻(Pheopolykrikos hartmannii)、双胞旋沟藻(Cochlodinium geminatum)等[165-173]。珠江口浮游植物组成和动态分布的季节性变化, 受包括风暴在内的环境因子的影响[172,174-175]。迄今珠江口的宏条形码研究不多。基于rbcL的宏条形码的分析展示了珠江口到南海的浮游植物组成, 以及受营养盐和盐度梯度影响的分布方式[46]。珠江口河流-海域连接带的浮游生物在丰水(夏季)和枯水(冬季)之间差异的宏条形码研究创造性地利用了DNA与RNA的不同特性及其反映的不同状态, 比较研究了浮游生物的丰度及活性[176]。
3 机遇与挑战
3.1 宏条形码分析的稳步发展
由于DNA测序技术的快速提升, 生物信息学分析方法的迅速跟进, 宏条形码分析也得到了显著的完善, 经历了三个主要发展过程: (1)基于对野外样本的特定分子标记(即条形码)的 PCR扩增、分子克隆和第一代DNA测序技术的低通量分析。这个阶段的主要分析方法是将测序结果与已知物种的序列合并在一起, 构建遗传进化树, 分析野外样本的物种组成[10-11,64,162]。(2)基于对野外样本的特定分子标记的PCR扩增, 对测序产物进行高通量(第二代DNA测序技术)测序, 利用生物信息学方法进行 OTU分析,解析野外样本的物种组成及相对丰度[36,44,163,176-177]。(3)基于PCR扩增、第二代或第三代DNA测序技术,利用ASV分析物种组成及相对丰度[4]。
3.2 宏条形码分析的竞争优势
与基于形态观察和分类的研究方法相比, 宏条形码研究方法, 具有多方面的显著优势。(1)分辨率比较高, 能够区分隐存种(cryptic species)。在宏条形码分析中, 分子标记中任何差别, 比如只要有单碱基的差别, 都可以通过DNA测序和生物信息学比较检测到。因此分辨率比较高。相比而言, 基于形态观察的分析方法只能够分辨出具有显著区别的形状。因此, 基于形态分析不能分辨的很多不同隐存种,都依据分子标记信息区分成不同的物种。比如塔玛亚历山大藻“复合种”(“Alexandrium tamarensespecies complex”)根据分子标记信息被区分为 5种藻:A. fundyense、A. mediterraneum、A. tamarense、A. australiense和A. pacificum[178]。(2)适于开展定量分析。在高分辨率基础上, 还可以通过测序结果分析、跟踪每个不同分子标记的数量, 从而能够定量分析包括有害藻华物种(以及所有浮游植物、浮游动物)相对丰度在内的各种多样性指标, 更加准确地计算浮游植物群落的α多样性指数、β多样性指数[179]。(3)宏条形码分析方法比较容易标准化, 因此比较容易学习。相反, 基于形态学的分析方法的掌握需要长时间的专业训练和积累才能够获得对不同物种的认识, 导致针对相同样本, 不同研究者可能得到不同的分析结果, 客观性比较差。(4)比较容易规模化, 采样标准化的宏条形码方法分析我国各个不同海域,以及相同海域的不同时间点采集的样本, 并且分析结果的可比性比较强。相比而言, 基于形态学的分析方法由于很大程度上依赖研究者的经验和判断能力,不同项目的研究结果往往可比性较低。因此, 宏条形码分析方法开始应用于研究我国近岸海域的浮游植物组成以及动态变化, 为研究有害藻华的暴发机理提供了很好的支撑。
3.3 宏条形码分析带来的机遇
可以期待, 宏条形码分析方法将在我国有害藻华研究中起越来越重要的作用。(1)增加不同项目之间的可比性。迄今为止的基于形态观察的浮游植物和有害藻华物种调查研究虽然取得了巨大的成就,描绘出我国近岸海域浮游植物和有害藻华物种的组成和分布。然而, 这些组成和分布研究结果大多是定性的。未能实现定量分析的原因有很多, 比如, 采集体积 不定量(网采), 研究者的经验和特长不同, 对相同海域的物种鉴定结果可能不一致, 导致不同研究者获得的结果可比性差。基于宏条形码的分析将大大提高不同项目之间的定量可比性。(2)发掘新物种,研究物种的生物地理学。通过采用规范性采样程序,开展高通量测序, 宏条形码分析可以发现曾经被忽视的浮游植物物种。很多微微型有害藻华物种, 光学显微镜不能充分发现和区分, 常常被忽略。比如, 北戴河海域的抑食金球藻正是通过宏条形码分析得到证实[64]。抑食金球藻的广泛分布格局也是由宏条码分析方法实现[66]。宏条形码分析发现海水中大量存在的寄生性甲藻[180]。(3)浮游植物-浮游植物互作。海洋生态系统中的浮游植物与其他种类浮游植物、浮游动物、浮游微生物之间都存在着多种多样的相互作用,包括捕食(predator-prey)、共生(host-symbiont)和寄生(host-parasite)[4,181]。
3.4 宏条形码分析的挑战
宏条形码分析具有极大的竞争力, 将在我国浮游植物研究, 特别是有害藻华物种的分布和丰度的动态研究中起越来越重要的作用。为了确保宏条形码分析方法释放更大的威力, 需要突破两方面的挑战[182]。
第一个挑战是高分辨率分子标记(即条形码)的选择和PCR扩增引物的设计。(1)选择对研究对象具有代表性或特异性, 具有高分辨率的分子标记。宏条形码分析中通常使用的分子标记包括核糖体RNA基因18S rDNA和28S rDNA, ITS, 线粒体基因CO1,以及叶绿体基因rbcL。使用这些通用分子标记的优势是它们都有通用 PCR扩增引物, 并得到充分验证和应用, 具有广泛的可比性。然而, 这些分子标记也有其局限性, 它们往往过于保守, 分辨率有限, 不能够有效区分很多同属物种, 更不能够区分同种的不同遗传株系。除此之外, 这些通用分子标记在基因组中往往以多拷贝存在, 而且拷贝数在不同物种中具有拷贝数多样性, 因此这些分子标记的测序结果不能简单解析其在样本中的相对丰度。最近证据表明,有些通用分子标记在同一基因组中的多拷贝之间具有序列多样性, 影响了这些分子标记应用价值[183]。为了提升分子标记对不同物种的分辨率, 可以采用第三代DNA测序技术测序样本的全长分子标记。也可以通过比较分析, 开发其他分子标记。比如线粒体、叶绿体或核基因组中的高变异区作为分子标记。通用分子标记 18S rDNA的通用扩增引物不能很好扩增定鞭藻的信息, 改用 28S rDNA作为分子标记,扩增到丰富的定鞭藻的信息[48]。(2)设计PCR扩增引物, 降低其偏好性。如果PCR扩增引物具有偏好性,测序结果就不能够如实反映样本的组成以及动态变化规律。因此, 为了获得较好的结果, 选择适当的分子标记, 设计适当的PCR扩增引物至关重要。
第二个挑战是分子标记数据库的完整性。针对浮游植物和有害藻华物种的分子标记数据库包括SILVA[184]和PR2[185]。在通常的宏条形码分子中, 超过 50%(或更多)的测序结果在数据库中没有对应的参考序列, 因此得不到准确注释。随着数据库不断更新, 这种情况在逐步得到改善。不过, 我国海域中有很多特有的浮游植物和有害藻华物种。为了获得对这些物种的覆盖, 我们需要针对中国特异性物种,充实相应的分子标记, 完善数据库, 促进对我国海域样本宏条形码分析结果的解读。随着这些挑战性问题的解决, 可以预期宏条形码方法将会更加有效应用于有害藻华物种的研究。
此外, 宏条形码分析与其他组学分析技术比如宏基因组学, 宏转录组学, 宏蛋白组学和宏代谢组学具有互补的特性。宏条形码分析集中解析物种组成和相对丰度, 宏基因组学分析基因组功能, 宏转录组学和宏蛋白组学分别从转录水平和蛋白水平分析基因表达以及对环境的响应, 宏代谢组学分析环境一般的代谢产物。这些组学技术结合起来应用将更能发挥其重要性。