基于GFM和GAMM模型分析对虾白斑综合征(WSSV)对黄海和东海北部水域虾类生物量的影响*
2022-01-14徐婷婷滕广亮李英瑕吴强单秀娟2张庆利金显仕
徐婷婷滕广亮李英瑕吴 强单秀娟,2张庆利,2① 金显仕,2
(1.中国水产科学研究院黄海水产研究所 农业农村部海水养殖病害防治重点实验室青岛市海水养殖流行病学与生物安保重点实验室 山东 青岛 266071;2.青岛海洋科学与技术试点国家实验室海洋渔业科学与食物产出过程功能实验室 山东 青岛 266071)
中国近海渔业资源种类丰富,鱼类和虾类资源在渔业生态系统中占据着重要地位(唐启升, 2006;吴强等, 2012)。自20世纪80年代以来,受过度捕捞、气候变化、环境污染等多重压力的影响,黄东海生态系统发生明显的变化,传统经济鱼类资源出现一定程度的衰退,包括虾类在内的甲壳类资源所占比例明显升高(Jin et al, 2013; Tang et al, 2016; Wu et al, 2018)。近期的相关研究表明,受人类海洋活动日趋频繁和全球气候变化加剧的影响,渔业资源种群演变更加复杂(Ramos et al, 2018; Baltar et al, 2019; Ward et al, 2019;Walworth et al, 2020)。除捕捞因素外,近海甲壳类动物的生物量还受水深、底层温度、盐度、经纬度、底质类型和离岸距离等因子的影响(Gribble et al, 2007;黄庆洋等, 2009; 逄志伟等, 2015; 赵静等, 2017;张孝民等, 2018)。虾类作为海洋生态系统中重要的次级生产者,是构建食物网结构、解析能量流动和物质循环过程中必不可缺的关键环节(陈小庆等,2010;梁金玲,2015)。因此,探讨海洋中虾类生物量变化及其影响因素对近海生物种群动态和海洋生态学研究有重要意义。
20世纪80年代以来,对虾养殖业在世界多国蓬勃兴起,为经济发展和优质动物蛋白供应做出了突出贡献(余云军,2006)。然而,与全球对虾养殖业快速发展相伴的是多种病毒性疫病不断出现,并对养殖产业造成冲击(李建军等,1998)。其中,对虾白斑综合征病毒(white spot syndrome virus, WSSV)是已报道的对虾病毒性疫病中危害严重且流行区域最广的一类病原(Lightner,1996;何建国等,1999;雷质文等,2002、2003;闫冬春, 2004;李钫, 2009)。池塘养殖对虾感染WSSV后2~7d内的累计死亡率可达100%(雷质文等,2003)。除了感染养殖对虾外,近年来陆续有WSSV感染近海甲壳类动物的报道。如Chapman等(2004)通过PCR、组织病理学和组织原位杂交实验证实捕获自南大西洋湾的凡纳滨对虾(Litopenaeus vannamei)样品中存在 WSSV感染。Mijangos-Alquisires等(2006)从墨西哥加利福尼亚湾采集的近海虾类样品中检测到WSSV较低阳性率(0.8%)的感染。Orosco等(2017)通过PCR检测表明,采集自菲律宾近岸水域的虾类中有WSSV阳性检出。Gholamhosseini等(2020)通过PCR、组织病理学实验和透射电子显微镜技术确定了伊朗近海印度明对虾(Penaeusindicus)中存在WSSV。鉴于WSSV对甲壳类的广泛致病性,近海甲壳类样品中存在WSSV流行不免引发其可能危害野生虾类种群动态的担忧。
基于此,本研究于2016—2018年每年8月对WSSV在黄海和东海北部虾类中的流行情况进行系统调查,通过构建梯度随机森林模型(gradient random forest model,GFM)和广义加性混合模型(generalized additive mixed models, GAMM),评估WSSV流行情况及相关环境因子与调查海域虾类生物量的相关性,以期为揭示水产养殖疫病病原对海洋甲壳类资源的影响提供新的视角。
1 材料与方法
1.1 样品采集
2016、2017和 2018年 8月(休渔期),搭乘中国水产科学研究院黄海水产研究所“北斗号”渔业调查船赴黄海和东海北部海域进行3个航次的调查,并利用底拖网采集虾类样品。根据临近站位间的距离和实时海况,在预设的120个站点中选择站点进行取样(图1)。根据底拖网所获虾的种类和生物量,每个采样站点随机取样4~6尾。取样时,将样本个体的头胸甲剖开涂抹于FTA®卡片上,自然晾干后保存于–20℃冰箱,以备后续检测。调查网具参数见单秀娟等(2011),拖速为3.0~3.5 nmile/h,拖网时间0.5~1 h。记录各站点捕获虾的种类和数量,将不同种虾分别标准化为每小时的数量(个/h)作为其种群生物量(陈云龙等, 2013)。
图1 2016—2018年黄海和东海北部设置的采样站点Fig.1Sampling sites in the Yellow Sea and the northern East China Sea from 2016 to 2018
1.2 虾类样品中WSSV 的环介导等温扩增(LAMP)检测
按照马芳等(2016)报道的方法,使用WSSV现场快速高灵敏检测试剂盒对涂抹于 FTA®卡片上的样品进行LAMP检测。为避免检测过程中出现假阳性和假阴性,采用 2套不同引物制作的WSSV现场快速高灵敏检测试剂盒对同一样品进行重复检测和复核。
1.3 海洋环境数据
各航次站点的底层温度、底层盐度、深度数据通过SBE25plus自容式CTD (SeaBird公司,美国)进行现场采集。底质类型(BST)参考石学法(2014)报道的方法进行分类,并考虑到各底质类型的站点数量,所有调查站点被概括为 4种类型:砂质(包括砂、砂质粉砂和中砂)、粉砂质砂、粉砂(包括粉砂和粉砂质黏土)和黏土质砂(包括黏土质粉砂和黏土质砂)。
1.4 模型的构建
1.4.1 模型的假设 以 WSSV 阳性虾类总生物量作为模型的响应因子;考虑到虾类总生物量数据呈正偏态分布(官文江,2015),以虾类总生物量的对数(ln_Abu)作为响应变量。选取 WSSV阳性检出率(P_rate)作为模型的解释变量,并假设 WSSV阳性虾类被WSSV感染的概率一致,即虾类总阳性样品数量=阳性检出率×虾类总生物量,并将阳性样品量进行对数处理,得到的阳性样品量的对数(ln_posi)作为模型的解释变量。
1.4.2 模型影响因子的选取 除了P_rate和ln_posi以外,根据已发表的环境因子对虾类生物量影响的研究报道(Gribble et al, 2007;黄庆洋等, 2009;逄志伟等, 2015;赵静等, 2017),选取水深、底层温度、盐度、经纬度、底质类型和离岸距离等相关因子作为模型的解释变量。
1.4.3 虾类生物量影响因子的初步评价 采用梯度随机森林模型筛选因子,并初步评价各环境因子对虾类资源密度分布的影响。GFM 是一种机器学习方法,建立在随机森林的基础上,通过整合各响应变量上的单个随机森林分析来捕获潜在相关预测因子和多个响应变量之间的复杂关系(Ellis et al, 2012)。从本质上讲,随机森林是一种回归树,它将响应变量按每个预测因子p的特定分割值划分为2组,以最大化同质性。与其他措施一起,梯度森林提供了每个响应变量f的拟合优度以及加权的重要性。对梯度森林进行1000次运行,获得的变异度,并使用总体性能最高的模型(即拟合优度R2最大)进行进一步分析。
1.4.4 利用GAMM模型评价环境因子对虾类分布的影响 考虑到解释能力和预测能力的潜在差异,采用广义加性混合模型对可能影响虾类生物量的时空分布因子、环境因子和WSSV阳性检出率等进行分析(Derville et al, 2018)。在建模之前,首先对数据进行初步分析、检验以选择合适的模型,主要进行异常值的剔除以及检查解释变量之间的共线性。采用方差膨胀因子(VIF)度量多重共线性的程度,并对选取的初始因子进行多重共线性检验,筛选可纳入模型的因子(Shono, 2008)。VIF越高,多重共线性的影响越严重,以VIF>5作为判断是否存在多重共线性的标准。解释变量中底质类型(BST)作为随机效应。模型的连接函数为“identity”(Kabacoff, 2015)。利用F检验评估解释变量的显著性。将不同环境因子进行组合,生成多个候选GAMM模型。
采用赤池信息准则(Akaike information criterion,AIC)和方差解释率(devianceexplained)来比较候选模型的性能(周慧敏等, 2014)。在分析中将不显著变量(P≥0.1)从初始模型中逐一剔除,最终得到最优模型。主要步骤:1)剔除解释偏差最小的不显著变量;2)拟合简化的 GAMM到数据;3)重复步骤 1和步骤 2,直到AIC值最小化(deLeeuw,1992;Burnham et al,2003)。数据分析和模型构建的过程中分别使用 R软件中的“car”,“gradient Forest”和“mgcv”进行(R Core Team, 2017)。
2 结果
2.1 WSSV 在黄海与东海北部虾类中的流行情况
在2016、2017和2018年8月对黄海和东海北部的调查中,从73个采样点共采集517份虾类样品(图 2,表 1)。LAMP检测结果显示,2016、2017和2018年所涉及的25、31和46个采样站点中,WSSV阳性采样站点的比例分别达48.40%、38.75%和21.74% (图2、图3),且3个年度样品中WSSV阳性检出率分别为16.86%、9.60%和4.80%(图3);上述3个年度所采集样品包括 26种虾类,其中,脊腹褐虾(Crangon affinis)、葛氏长臂虾(Palaemon gravieri),哈氏仿对虾(Parapenaeopsis harbwickii)、日本囊对虾(Penaeus japonicus)、戴氏赤虾(Metapenaeopsis dale)、中国毛虾(Aceteschinensis)和海蜇虾(Latreutes anoplonyx)等11种虾类样品中均有WSSV阳性检出,除样品量较少(少于10尾)的滑脊等腕虾(Heterocarpoides laevicarina)、细螯虾(Leptochela gracilis stimpson)和刀额仿对虾(P.acultrirostris)外,中华安乐虾(Eualus siensis)、海蜇虾、葛氏长臂虾和脊腹褐虾中WSSV阳性检出率皆在10%以上(表1)。
表1 2016—2018年在黄海和东海北部采集的不同虾类样品数量及样品中WSSV的阳性检出率Tab.1Number and WSSV positive rates in different shrimps collected from Yellow Sea and the northern East China Sea (2016—2018)
图2 2016—2018年黄海和东海北部虾类中WSSV的流行范围和流行率Fig.2The prevalence scopes and prevalence rates of WSSV in the shrimps of the Yellow Sea and the northern East China Sea (2016—2018)
图3 2016—2018年黄海和东海北部WSSV阳性采样站点检出率和阳性样品检出率Fig.3WSSV positive rate in the sampling sites and the collected samples of the Yellow Sea and the northern East China Sea (2016—2018)
2.2 GFM模型的结果分析
利用GFM模型对虾类生物量相关影响因子的初步评价结果显示,ln_posi(阳性样品数的对数)重要性最高,其次是温度(Temp)、离岸距离(Distance)、纬度(Lat)、经度(Long)、阳性率(P_rate)、盐度(Sal)和底质类型(BST)(图 4)。
图4 不同解释变量在GFM模型中的重要性分析Fig.4Importance analysis of different predictor variables from the gradient forest
2.3 GAMM模型的结果分析
通过 VIF对初始影响因子进行多重共线性检验,发现初始影响因子之间存在共线性现象。将P_number和深度2个因子排除后,各因子的VIF值均小于5。因此,选取 ln_posi、Temp、Distance、Lat、Long、P_rate、Sal、BST_No作为构建GAMM 模型的备选影响因子(表2)。根据AIC最小原则,通过逐步剔除非重要因子,得到最优模型为Model 6:ln_Abu~P_rate+ln_posi+Long。P_rate和ln_posi是Model 6中的极显著相关因子(P<0.001)。ln_Abu随着P_rate的升高而降低,而ln_posi也会随着ln_Abu的升高而升高(图5)。
图5 最优模型中显著因子与虾类生物量对数(ln_Abu)的关系Fig.5The relationship between significant variables and abundance of shrimps for the final generalized additive mixed models
表2 备选GAMM模型的拟合效果Tab.2Fitting effect of candidate GAMMs
3 讨论
WSSV可引起养殖对虾白斑综合征,该病毒在1992年首次发现于我国台湾(Chouet al, 1995),此后迅速蔓延到日本、韩国、东南亚各国以及南北美洲、欧洲等地,给全球对虾养殖业造成了巨大的损失(Nakanoet al,1994; Inouyeet al,1994; Momoyamaet al,1994; Takahashiet al,1994; Wanget al,1995;Lightner,1999)。研究发现,在墨西哥、菲律宾和伊朗等国近岸海域捕获的野生虾类中存在WSSV感染(Chapmanet al, 2004; Mijangos-Alquisireset al, 2006;Oroscoet al, 2017; Gholamhosseiniet al, 2020),但WSSV是否也在远离陆地海域的虾类中流行尚未见报道。本研究对黄海和东海北部海域虾类中WSSV流行情况的调查结果显示,WSSV在我国上述海域的流行范围比较广、流行率也较高;特别是2016年,WSSV阳性采样站点和阳性样品的比率分别高达48.395%和16.86%,其中,样品阳性率高于同年我国养殖对虾中WSSV的阳性检出率(12.9%)(农业部渔业渔政管理局等,2017)。在采集到的26种虾类中,除已证实可被WSSV感染的日本囊对虾和中国毛虾(雷质文等,2003)外,还有9种虾类样品中有WSSV阳性检出,这提示WSSV经由上述虾类传播扩散的风险不容忽视。2016、2017和2018年黄海和东海北部WSSV的阳性样品检出率和阳性站点检出率均呈不断下降的趋势,推测可能与渔业主管部门和对虾养殖从业者加大了苗种检疫力度,海洋环境监测部门加强了养殖废水排放监管,进而降低了WSSV由近岸养殖池塘向近海传播有关。
本研究引入梯度随机森林模型(GFM)和广义加性混合模型(GAMM)评估了WSSV对调查海域虾类生物量的潜在影响。对GFM模型中各解释变量的分析显示,ln_posi (WSSV阳性样品数的对数)对响应变量虾类生物量的对数(ln_Abu)的重要性最高。根据AIC最小原则筛选出的GAMM 最优模型显示,ln_posi和 P_rate是虾类生物量的极显著影响因子,并且虾类生物量随WSSV阳性率的增高而下降。上述 GFM和 GAMM模型的分析结果均表明,WSSV流行对黄海和东海虾类生物量存在潜在影响,野生虾类感染WSSV后,可能会导致其生物量减少。黄东海是我国重要的渔业水域,甲壳类资源丰富,许多虾类除了是重要的捕捞对象外,更是诸多头足类、鱼类和哺乳类等动物的主要捕食对象(韦晟等,1992;程济生等, 1997)。如WSSV阳性检出率较高的脊腹褐虾,为黄东海的优势种类,是众多底层和近底层鱼类的主要饵料生物(唐启升,2006),其资源变动将会进一步影响主要经济鱼类的生物量和近海生态系统的稳定。
限于目前尚无WSSV对野生虾类致病性的相关数据,本研究为便于模型分析,假设WSSV对呈现WSSV阳性虾类的感染和危害风险相同,这一假设可能与实际情况存在偏差:有些虾类对WSSV较为敏感,染病个体会出现病理变化甚至会死亡,而有些阳性检出的种类或仅是WSSV的载体,并不一定会发病或死亡,仅在WSSV的水平传播中起重要作用(Rajendran et al,1999)。因此,将来可通过进一步研究WSSV对近海虾类致病性及其在群体中的传播方式,为模型分析提供更多参数,以便提出更加合理的假设,进而提高模型的评估准确性和预测能力。
本研究的流行病学调查表明,黄海和东海北部虾类优势种——脊腹褐虾、葛氏长臂虾和日本囊对虾等基本都携带了WSSV或被WSSV感染。为探讨病毒传播对近海虾类生物量的影响,本研究把WSSV LAMP检测呈阳性的虾类总生物量作为模型响应因子,这有别于传统的物种分布模型。传统的物种分布模型一般评估海域温度、盐度和深度等环境因子对单一种群时空分布的影响,个别环境因子对种群分布的影响往往较大。而本研究模型的被解释变量是虾类生物量,包含虾的种类较多,其环境适应性更广,对单一虾类存在影响的环境因子对虾类生物量的解释率不会被高估,这在客观上更有利于分析WSSV传播流行对虾类生物量的影响。
从总体上看,观测数据积累和基础研究成果可为模型模拟或预测提供更多或更适合的因子与参数,并有利于提高响应变量对解释变量的响应能力和预测能力。此外,构建模型时关注诸如残差异质性、空间自相关、因子间交互作用等因素可有助于提高模型的预测能力。本研究仅是运用统计模型探索水产养殖动物病毒影响近海野生群体资源动态的初步尝试,待完成更长时间、更大空间尺度上的调查数据积累,获得养殖虾类病毒对野生虾类致病特性等信息,并进一步优化模型因子后,将会更准确地解释和预测养殖动物病原传播对近海生物种群、生态系统影响的规律和趋势。
致谢:中国水产科学研究院黄海水产研究所“北斗号”渔业科考船上科研人员与工作人员在本研究的调查和样品采集过程中给予了大力帮助,谨致谢忱!