基于MaxEnt模型的白缘象甲潜在地理分布区识别
2022-11-28冼晓青赵浩翔郭建洋刘万学
梁 莉,冼晓青,赵浩翔,郭建洋,*,刘万学,*
(1.中国农业科学院植物保护研究所,植物病虫害生物学国家重点实验室,北京 100193;2.中华人民共和国西宁海关,青海西宁 810000)
生物入侵是导致生物多样性丧失的主要因素之一,其对原有物种、栖息地和生态系统造成严重的负面影响,被认为是当今全球十大环境问题之一,中国是世界上遭受外来入侵物种危害最严重的国家之一(Courchampetal.,2017;李晗溪等,2019;Diagneetal.,2020)。全球化进程也使得众多新的外来入侵物种传入速度进一步加快,近三十年在中国经济高速发展的背景下,外来物种入侵的数量和频率呈不断增加的趋势(鞠瑞亭等,2012)。根据《2020中国生态环境状况公报》可知,截止2019年,我国目前已知共有660余种入侵物种,其中71种威胁或已经威胁到中国的生态系统。而且我国外来入侵物种呈现蔓延速度快、危害面积广、新入侵种不断增加的特点(王雁楠等,2020),其中象甲类外来入侵物种对我国农业生产和农产品贸易造成了极大的危害(丁新华等,2019;王章训等,2019;王欽召等,2020)。例如,起源于北美洲的中国进境植物检疫性有害生物和全国农业植物检疫性有害生物稻水象甲Lissorhoptrusoryzophilus,自1988年首次在河北省唐山市唐海县发现以来,截止到2022年6月,它已扩散至全国25个省(区、市),造成水稻产量减少15%~50%,局部甚至绝收(Aghaee and Godfrey,2014);起源于南亚的严重危害棕榈科植物的毁灭性外来入侵物种红棕象甲Rhyncophorusferrugineus,自1997年被首次发现以来,已成功入侵到海南、广东、广西等我国13个省区,对我国棕榈科植物造成严重危害,造成严重的经济损失(宋玉双,2005;王辉等,2020)。而系统探明象甲类外来入侵物种的潜在地理分布区,以期达到象甲类外来入侵物种早期预警和减少其造成的经济损失目的,对其有效防控至关重要。
白缘象甲Naupactusleucoloma为象虫科(Curculionidae)粗喙象亚科(Entiminae),原产于南美洲,1936年在美国的佛罗里达州首次被发现(Watson,1937),如今已在全球多个国家和地区广泛扩散分布,主要分布于美国、阿根廷、巴西、秘鲁、乌拉圭、智利、澳大利亚、新西兰等地(蔡悦,1993)。虽在中国未有分布,2007年已被列入《中华人民共和国进境植物检疫性有害生物名录》。白缘象甲严重威胁农田里广泛栽培的大宗农作物。在美国,白缘象甲对棉花已造成严重的危害(Metcalfetal.,1982)。白缘象甲的成虫取食寄主范围非常广泛,尤为喜食阔叶植物,寄主包括花生、大豆等农作物和经济作物,幼虫取食根部造成为害,以春季最明显,也取食播种后的种子,还可危害马铃薯和甘蔗等(蔡悦,1993)。在新西兰牧场中,白缘象甲导致牧草产量减少25%~45%(Kingetal.,1982)。白缘象甲危害三叶草时导致三叶草的固氮率降低了92%。因成虫不具飞行能力,主要通过能携带此虫的土壤、寄主植物调运及交通运输工具进行远距离传播,被动传播能力强。有关该象甲的研究主要集中于生理形态特征(杨国海,1993;Healthetal.,2020)及其入侵检疫报告(谌运清等,2011)等方面。我国作为农业大国和农产品国际贸易大国,白缘象甲对我国农作物和农业生产有着较高的潜在威胁,如何对于白缘象甲的潜在地理分布区进行识别并进一步分析其扩散和定殖风险,是建立白缘象甲入侵风险评估的重要组成部分。
物种分布模型(species distribution model,SDM)已被广泛应用于个体生态学研究和识别物种潜在地理分布区(Elith and Leathwick,2009),该类模型在利用环境变量的变化推断物种的潜在地理分布方面也日益发挥着重要的作用,近年来被广泛应用于外来入侵物种的潜在地理分布区识别(Gallienetal.,2012;范靖宇等,2019)。最大熵模型(maximum entropy model,MaxEnt)是基于Java平台构建的一种以最大熵理论(maximum entropy theory)为基础的生态位模型(Phillips and Dudík,2008)。近年来,该模型的应用范围不断扩展,不仅包括濒危物种(牛沛航等,2021)和外来入侵物种(Lietal.,2009),还包括预测病虫害的潜在风险区(卢辉等,2019;韩晓潮等,2020)。ArcGIS的空间分析技术能将MaxEnt模型的输出结果进行可视化,而且结合MaxEnt模型的输出结果能对白缘象甲在气候变化过程中适生程度较高的地区进行识别,进而推断出白缘象甲在中国的潜在适生区(Chanetal.,2011)。基于MaxEnt最大熵模型和ArcGIS对外来入侵物种的潜在地理分布区识别的广泛应用,简单有效地评估了外来入侵物种的传入、定殖和扩散风险,从而为建立象甲类外来入侵物种的风险预警机制提供理论参考。
本研究通过收集和筛选白缘象甲的分布数据,结合相关环境变量,利用MaxEnt模型和ArcGIS软件的空间分析技术识别白缘象甲的潜在地理分布区和分析其扩散和定殖风险,阐明环境变量对白缘象甲潜在地理分布区的影响,为建立其早期入侵预警机制提供理论依据和佐证。
1 材料与方法
1.1 物种数据来源
本研究中,通过访问全球生物多样性信息平台(http:∥www.gbif.org)、国际应用生物科学中心(http:∥www.cabi.org)等相关网站,查询白缘象甲的地理分布信息。对白缘象甲的地理坐标进行确认和筛选,去除描述不具体和重复分布的分布记录。如果分布数据在某地区集中分布,会导致模型过度拟合,带来不确定性(Waltarietal.,2007)。本研究利用ArcGIS中的缓冲区工具,按照环境变量的分辨率,在每个分布点周围建立半径为5 km的缓冲区,5 km以内只保留一个分布点(张兴旺等,2014)。最后,共收集白缘象甲分布点752个,并绘制其分布图(图1)。
图1 白缘象甲在全球的地理分布[审图号:GS京(2022)0702号]Fig.1 Geographical distribution of Naupactus leucoloma worldwide [Map Approval No:GS Beijing (2022)0702]
1.2 环境变量及相关数据
通过访问世界气候数据库(https:∥www.worldclim.org/) 得到坐标系为WGS84、栅格大小为2.5′的19个气候环境数据,该数据库收集1970-2000年世界各地的气象站所记录的详细气象信息。前人研究对于环境变量选择的标准不具备统一性,主要包括考虑环境变量对物种分布的限制影响和环境变量之间的相关性两方面。本研究对于环境变量的选择更侧重于考虑环境变量对物种分布的限制影响,选取了对白缘象甲分布限制影响较大的环境变量(表1),研究已经验证这些环境变量能提高模拟昆虫潜在地理分布的准确度(Waltarietal.,2007;Fengetal.,2019)。地理底图来源于国家测绘地理信息局标准地图服务网站(http:∥bzdt.ch.mnr.gov.cn/index.html)。MaxEntV3.4.1版下载于网站(http:∥biodiversityinformatics.amnh.org/open source/MaxEnt/)。
表1 本研究MaxEnt模型中使用的环境变量Table 1 Environmental variables used in MaxEnt model in this study
1.3 MaxEnt 模型参数设置
将白缘象甲的分布数据和环境变量数据分别导入到MaxEnt软件中,进行建模运算,参数设置:测试集为分布点的25%,训练集为分布点的75%,默认设置最大迭代次数为500次,最大背景点数量为10 000个,其余采用默认设置。接收器工作特性曲线下面积(area under the curve,AUC)值和受试者工作特征(receiver operating characteristic,ROC)曲线用于测试适用性结果的准确性。ROC曲线是一个接受曲线,其中横坐标表示假阳性率(1-特异性),纵坐标表示真阳性率(1-遗漏率)。由于AUC值不受阈值影响,因此其对模型的评估更为客观(Fanetal.,2006)。
本研究中,为了评估参数配置的性能,我们通过调用ENMeval数据包来调整MaxEnt模型调控倍频(regularization multiplier,RM)和特征组合(feature combination,FC)参数,选择了不同的参数配置进行试运行,已达到调整模型最优参数的目的(Muscarellaetal.,2014)。首先,基于白缘象甲的已知分布点及其相应的环境变量,将RM分别设置为0.5~4。6个特征组合(FC)用于优化模型参数以选择最佳参数组合:L(线性特征);LQ(线性特征+二次特征),H(铰链特征),LQH(线性特征+二次特征+铰链特征),LQHP(线性特征+二次特征+铰链特征+产品特征)和LQHPT(线性特征+二次特征+铰链特征+产品特征+阈值特征)。最后,本研究的RM设置为0.5,特征组合为H(图2),选择用刀切法(jackknife)来确定影响变量的每个变量的权重。
图2 不同参数设置下MaxEnt模型表现Fig.2 Performances of MaxEnt model under different settingsAICc:小样本校正的Akaike信息量准则Akaike inforation criterion with a small sample correction;L:线性特征Linear feature;LQ:线性特征+二次特征Linear feature + Quadratic feature;H:铰链特征Hinge feature;LQH:线性特征+二次特征+铰链特征Linear feature+Quadratic feature + Hinge feature;LQHP:线性特征+二次特征+铰链特征+产品特征Linear feature+Quadratic feature+Hinge feature+Product feature;LQHPT:线性特征+二次特征+铰链特征+产品特征+阈值特征Linear feature + Quadratic feature + Hinge feature + Product feature + Threshold feature.调控倍率从0.5开始,到4结束,以0.5为间隔,共设置8个值。The regularization multiplier starts from 0.5,and ends at 4.In total 8 values are set in 0.5 intervals.
1.4 MaxEnt 模型验证
采用ROC AUC评估模型的预测精度。AUC值越接近1表示模型预测效果越好。将模型模拟精度的评估标准划分为较差(AUC≤0.80)、一般(0.8 在输出文件中,选择10次重复的平均作为本研究的模拟结果。该结果是基于物种的存在概率逻辑值(P)生成ASCII栅格图层,P值范围为0~1,P值越大表示物种存在的可能性越大。利用ArcGIS10.2软件将预测结果转换成raster格式,对适宜生境进行等级划分和可视化处理。基于P值,采用重分类将其适生区划分为4个等级,分别为高适宜生境(0.5≤P≤1.0)、中适宜生境(0.3≤P<0.5)、低适宜生境(0.1≤P<0.3)和不适宜生境(0.0≤P<0.1)。统计每个等级的栅格数,计算各等级适宜生境面积所占比例。 基于752条分布记录利用MaxEnt模型对白缘象甲在中国的潜在地理分布进行模拟预测,得到的模型的AUC平均值为0.970,表明模型拟合效果结果比较好。获得的ROC曲线如图3所示。 本研究选择贡献率大于10%的环境变量作为主导环境变量。用于MaxEnt模型预测的10个环境变量中,贡献率大于10%的环境变量依次为:最干月降水量(Bio14,43.0%),年平均气温(Bio1,28.4%),最冷月最低温(Bio6,22.8%),累计贡献率为94.2%(图4);由刀切法检验结果(图5)可知,仅使用单一环境变量时,对正规化训练增益影响最大的3个环境变量为最干月降水量(Bio14)、年平均气温(Bio1)和最冷月最低温(Bio6),表明这些环境变量包含其他环境变量不具有的信息,同时也进一步佐证了影响白缘象甲潜在地理分布的主导环境变量。综上所述,影响白缘象甲潜在地理分布的环境变量为最干月降水量(Bio14)、年平均气温(Bio1)和最冷月最低温(Bio6)。 图3 白缘象甲MaxEnt模型的受试者工作特征曲线Fig.3 Receiver operating characteristic curve of the MaxEnt model for Naupactus leucolomaAUC:曲线下面积Area under the curve. 图4 环境变量对白缘象甲分布的贡献率Fig.4 Contribution rates of environmental variables to the distribution of Naupactus leucoloma环境变量信息见表1。图5同。For the information of environmental variables,see Table 1.The same for Fig.5. 图5 白缘象甲环境变量刀切法检验结果Fig.5 Jackknife test result of environmental variables of Naupactus leucolomaAll:所有变量All variables. 利用MaxEnt模型运算模拟出白缘象甲在当前气候条件下的全球潜在地理分布区(图6),并利用ArcGIS的空间分析方法对其各个等级的适宜生境面积进行统计。结果表明,其高适宜生境面积为219.1×104km2,中适宜生境面积为374.5×104km2,低适宜生境面积为847.1×104km2,总适宜生境面积为1 440.7×104km2(表2)。其适宜生境主要分布在美国东南部的阿肯色州、路易斯安那州、密西西比州、佛罗里达州以及北卡罗来纳州和南卡罗来纳州等,欧洲的法国西南部地区、西班牙北部地区、土耳其西北部地区等;南美洲的阿根廷东部地区和巴西南部地区以及非洲的南非南部地区,大洋洲的澳大利亚和新西兰也有分布,在我国暂时没有其高适宜生境的分布。其中低适宜生境主要呈斑块状分布在高适宜生境周围。其高适宜生境面积占总适宜生境面积15.2%,中适宜生境面积占26.0%,共计41.2%,表明其在全球的中高风险区范围较大,应对其进行严格的检疫工作。 根据MaxEnt模型的预测结果表明(图6),白缘象甲在我国的总适宜生境面积为124.4×104km2,约占全国总面积的13.0%(表2)。其高适宜生境在我国没有分布,中适宜生境面积为3.9×104km2,占总适宜生境面积的3%,主要分布在安徽的东北部和江苏的西北部地区。低适宜生境面积为120.5×104km2,占总适宜生境面积的97%,主要分布于我国的中部和东部沿海地区的河南、湖南、江西、福建、浙江、江苏、安徽、河北、山东等地,其中多个省份为沿海地区,各海关口岸应该严格检疫,降低其入侵风险。 图6 当前气候条件下白缘象甲在全球的潜在地理分布[审图号:GS京(2022)0702号]Fig.6 Potential geographical distribution of Naupactus leucoloma worldwide under current climate conditions [Map Approval No.:GS Beijing (2022)0702] 表2 不同地理范围白缘象甲潜在适宜生境面积(×104 km2)Table 2 Area (×104 km2) of the potential suitable habitats of Naupactus leucoloma in different geographical scope 本研究利用MaxEnt模型结合ArcGIS软件,基于白缘象甲752条有效分布记录和10个影响其分布的环境变量,模拟其在全球和中国的潜在地理分布,识别其入侵风险区。MaxEnt模型的AUC均值达到了0.97,表明模型模拟结果准确性较高。影响白缘象甲潜在地理分布的环境变量中,最干月降水量(Bio14)、年平均气温(Bio1)和最冷月最低温(Bio6)三者占主导作用,刀切法表明气温因子(年平均气温和最冷月最低温)的重要性大于降水因子(最干月降水量),但是降水因子的重要性也不能忽视。环境变量(气温和降水因子)对昆虫有着直接和间接两种影响,其中温度直接影响昆虫的生长发育和生存繁殖,是影响昆虫的分布和存活率的重要驱动力和环境变量(Abarca and Spahn,2021;Marchioroetal.,2021)。气温升高会导致一些昆虫提前发生危害(Danglesetal.,2008),另外,在桔小实蝇Bactroceradorsalis和稻绿蝽Nezeraviridula中发现,气温升高可使其越冬死亡率大大降低,危害范围增大(Stephensetal.,2007;Tougouetal.,2009)。气温因子对红棕象甲潜在适生区的影响最大,其中年均温起主导作用(王欽召等,2020)。以上研究验证了气温是影响昆虫地理分布和生长发育的重要环境变量,对白缘象甲而言也是如此,即气温升高可能会加速其发育,降低其死亡率,使得其危害程度增加。尤其是,当温度大于25℃时,会显著缩短白缘象甲从幼虫到成虫的发育历期。上述研究验证了气温升高对白缘象甲可能有着正面作用,使得其入侵风险增加。此外,降水因子也不可忽视,在秋季大范围降雨使得豆科植物发芽之时白缘象甲成虫大量产卵,表明降水因子通过影响其寄主对其起到了间接影响(蔡悦,1993)。因此,应建立更加完善的检疫和预警机制,严防其入侵到我国形成新的扩散。 白缘象甲如果入侵我国,会对我国的农作物造成严重危害,如同为象甲类害虫的稻水象甲,起源于北美洲,入侵我国后对水稻等作物造成了严重危害(杨春林等,2020)。白缘象甲起源于南美洲,据本研究所用的年平均气温(Bio1)数据表明,其在南美洲分布的北界温度大约为20.9℃,南界温度大约为13.7℃。白缘象甲在北美洲危害区域的温度条件基本与其在南美洲的吻合,在我国也有相似气候条件的区域,我国东南部地区的年均温大约在10~15℃之间,有着极其适宜白缘象甲生存的气候条件,表明气候条件不会限制白缘象甲在我国的生存。我国为农业大国,生物多样性资源丰富,农作物和植物种类繁多,白缘象甲寄主为阔叶科植物以及棉花和大豆等农作物,在我国寄主种类较多。大豆作为其主要的寄主,在我国中部和东南部地区广泛分布(刘珍环等,2016),而且大豆种植区是白缘象甲的潜在适生区,所以如果白缘象甲传入我国有着较大的定殖风险。但是白缘象甲的生存可能会受到其他条件的制约,如传播条件和人为因素等。白缘象甲成虫有明显向上爬的习性,易附着在其他物品上被传带。由于成虫不具飞行能力,该象甲主要通过能携带各种虫的土壤、寄主植物调运及各种交通运输工具进行远距离传播,其中土壤转移是白缘象甲人为传播的最主要方式,原因是其常年以幼虫和蛹的形式在土壤中存活(蔡悦,1993)。幼虫常聚集取食根茎,移栽时很容易被携带,从而容易随被寄生植物的茎部进行传播。白缘象甲严重威胁许多农作区的栽培作物,如在美国棉田中,在一株受害的棉花上就曾采到成虫250头(Metcalfetal.,1982),可见它具有极强的繁殖和扩散能力。白缘象甲在新环境下变成一种重要经济害虫的潜在危险性不可忽视,一旦它入侵到我国会迅速定殖和扩散,不仅会对我国造成严重的经济损失,进一步扩散蔓延甚至对生态系统会造成极大破坏。 在澳大利亚,白缘象甲是危害马铃薯的主要害虫,其幼虫对马铃薯的根部和块茎造成毁灭性损害(Allen,2015)。而马铃薯是全球第四大粮食作物,中国是全球马铃薯第一大生产国和主要贸易国家(张玉胜等,2020),故对该象甲的潜在危害不容忽视。作为中国马铃薯主要的贸易伙伴国家,如美国、土耳其、比利时、荷兰、德国和加拿大都具有白缘象甲的适生区,由此该象甲有伴随进境马铃薯传入我国的风险。这可从往年该物种截获记录得到佐证,如2010年,连云港出入境检验检疫局从来自阿根廷的进口大豆中首次截获白缘象甲(谌运清等,2011)。目前我国进口大豆产需缺口巨大,巴西、美国和阿根廷是我国主要的大豆进口国家(王芳等,2021),而白缘象甲在巴西、美国和阿根廷均有适生区,因此白缘象甲有着伴随上述国家大豆国际贸易传入我国的风险。而且该虫还能通过被携带的土壤、寄主植物调运和各类交通运输工具进行远距离传播。随着近年来我国进口贸易量的增大,白缘象甲随货物入侵我国的风险增加,而且白缘象甲在全球的高适宜生境主要分布于沿海地区,我国多个沿海省份也为白缘象甲的潜在适宜生境,为其定殖和扩散提供了良好条件,进一步增加其在我国扩散蔓延的风险。口岸检疫与国内检疫应密切配合,互通信息加强交流与合作,加强针对性检疫,必要时可组织重点疫情监测,降低其入侵风险。 综上所述,影响白缘象甲的潜在地理分布的主要环境变量为气温,即最冷月最低温和年平均气温以及降水因子(最干月降水量)。由于气温和降水代表着水热分布格局,可认为白缘象甲的潜在地理适宜生境是多因素综合作用的结果。白缘象甲在全球的潜在适宜生境主要分布在美国、欧洲的法国西南部地区、西班牙北部地区、土耳其西北部地区等;在我国虽然暂时没有白缘象甲的高适宜生境的分布,但潜在适宜生境存在于我国的中部和东部沿海地区。由于白缘象甲潜在适宜生境大多位于沿海地带,且我国东南地区的气候条件适宜其生存,对其传播扩散也有利,增加了其入侵风险。因此,应加强对相关进口货物实施严格的检疫工作,防止其在我国扩散,降低其入侵风险。1.5 适生等级划分
2 结果
2.1 影响白缘象甲潜在地理分布的环境变量
2.2 当前气候条件下白缘象甲在全球的潜在地理分布
3 讨论和结论