APP下载

新疆典型蝗虫适生区分布预测

2022-11-26巨喜锋吴建国陈吉军关靖云李漠岩郑江华

生态学报 2022年21期
关键词:适生区蝗虫典型

巨喜锋,林 峻,吴建国,陈吉军,关靖云,李漠岩,郑江华,,*

1 新疆大学资源与环境科学学院, 乌鲁木齐 830046

2 新疆治蝗灭鼠指挥部办公室, 乌鲁木齐 830001

3 绿洲生态教育部重点实验室, 乌鲁木齐 830046

草地是自然生态系统的重要组成部分,不仅在水土保持、生态平衡、碳固定方面具有重要生态价值,而且在政治、经济、文化、生态环境建设方面扮演着重要角色[1—2]。新疆草原草地面积为57.2588万km2,在全国草地面积中排名第三[3],其健康受包括蝗灾在内的各类草原生物灾害严重影响,其中蝗灾与水灾、旱灾并称为三大天灾,新疆蝗灾发生最早可追溯到东汉时期[4],1986—1991年发生面积近4万km2,其中严重危害区面积近2.8万km2,发生面积占可利用面积的8.5%[5]。新疆草原蝗虫具有种类多,分布广,数量大,灾害严重的特点。20世纪陈永林[6]调查新疆蝗虫有62属157种;近期于冰洁等[7]指出新疆蝗虫种类达65属177种;而徐超民等[8]认为新疆草原蝗虫发生区蝗虫记载有8科16属171种,其中优势种包括亚洲飞蝗(Locustamigratoriamigratoria)、意大利蝗(CalliptamusItalicus)、黑腿星翅蝗(C.barbarus)、西伯利亚蝗(GomphocerusSibirius)、宽须蚁蝗(Myrmeleotettixpalpalis)、黑条小车蝗(Oedaleusdecorus)、红胫戟纹蝗(Dociostauruskraussikraussi)等十余种。近年新疆极端气候事件日渐频繁,气候变暖和极端降水增加与新疆典型蝗虫持续爆发关系紧密[9],此外肆虐亚非的沙漠蝗(Schistocercagregaria),使得全球粮食安全和生态安全备受关注,文献也应用多种技术方法研究了沙漠蝗的迁飞通道以及入境中国的风险,此外Guan等还通过MaxEnt模型研究了在未来气候条件下沙漠蝗的适生区分布情况[10—11]。在常态化疫情防控条件下,切实做好新疆本地典型蝗虫适生区预测与境外蝗虫迁飞入境监测工作异常重要。新疆草原蝗虫在日常监测、防治方面面临防治范围广、防治监测蝗虫类型多的严峻挑战。

物种分布模型(Species Distribution Models, SDMs)以已知物种分布点及环境数据作为输入,利用数学统计方法或机器学习理论探究物种在生态位空间实际状况[12],在生物多样性保护研究、物种入侵研究及物种适生区预测等方面得到广泛应用[13]。在模型发展中形成了基于生态位理论、数理统计和机器学习物种分布模型[14],其中BIOCLIM模型、HABITAT模型及领域模型(DOMAIN)等都是典型的基于生态位量化理论而形成的模型,该类模型基于典型已知物种分布点及环境空间中多变量极值组成的包络体外边缘,预测出物种分布的潜在区域[15]。在此基础上,随着数学方法的发展,出现了应用数理统计方法探索物种分布点与预测区统计学关系以预测物种潜在分布区的模型算法,该类模型算法包括广义线性模型(GLM)、随机森林模型(RF)和马氏距离(MAHAL)等[16]。近些年伴随着计算机科学的发展,机器学习的理论思想逐步引用到物种分布模型预测中,其中应用相对较为广泛的有人工神经网络(ANN)、支持向量机(SVM)、提升回归树(BRT)以及最大熵模型(MaxEnt)等一大批优秀模型[17]。但基于不同模型的物种分布区及潜在适生区预测结果具有很强的不确定性,从而导致单个最优模型的选择具有一定困难,因此将多个不同模型预测输出组合为一个集成模型变得尤为重要[18]。集成建模的基本思想是将各单一模型中捕获到的真实信号予以保留,对数据和模型中产生的错误和不确定更好地分离和降低,从而使得建模的结果更为可靠[19—20]。

在新疆典型蝗虫发生预测相关研究中,杨洪升等[21]探究了新疆蝗虫与植被长势、气候因子间的关系,指出蝗虫发生与植被长势息息相关,且温度是影响植被长势的主要因子。Zheng等[22]使用基于GIS多准则分析方法预测了新疆蝗虫可能爆发的区域,得到较高的预测精度。杨会枫等[23]使用MaxEnt模型预测了西伯利亚蝗在新疆的潜在分布,确定了影响西伯利亚蝗分布的重要环境因子,得出模型精度较高。李培先等[24]基于MaxEnt模型预测了未来不同气候变化情景下新疆意大利蝗潜在分布,指出极端水分条件和水热条件对其潜在分布影响巨大。因不同物种分布模型自身差异,各模型算法对模型不确定性的影响会进一步影响到模型预测结果的准确度[25]。基于集成建模思想发展起来的利用多个模型信息的集合模型可以有效降低单一模型预测的不确定性,从而提升模型的稳定性及预测结果的可靠性[26]。当前也有大量的文献应用多个模型集成对不同生物物种的分布做了预测,如韩欣娆等[27]通过多个物种分布模型的集合对草地贪夜蛾的潜在分布区做了预测,Lippi等[28]应用多个物种分布模型对美国犬蜱的分布区做了预测。

前人的研究集中于单一种类蝗虫在不同气候条件下的潜在适生区展开,但各类主要蝗虫对地理环境、草地类型、气候状况、土壤条件等环境的适宜性存在一致性,因此文献[29]将新疆草原蝗虫发生区分为八大亚区;此外前人针对草原的相关研究主要通过单一物种分布模型开展,但单一模型预测的不确定性较高,而通过多模型集成预测的方法则受到了很大的关注,相关研究成果也逐步增多;且相聚焦于与蝗虫生长密切相关的气候因素、植被等因素展开,影响蝗虫产卵、繁殖关系密切的土壤环境研究有待深入。基于此,本文综合考虑了新疆草原优势蝗种,而非某单一类型蝗虫;而且集成建模可以有效降低预测不确定性、提升模型的可靠性[30];研究表明土壤因素对蝗虫的繁殖、虫卵孵化过程具有显著影响[31—32]。

本文以与蝗虫活动紧密相关的环境数据为基础,应用经典物种分布模型对新疆典型蝗虫的潜在适生区进行研究,探究模型在新疆典型蝗虫预测研究中的性能表现;选择高性能模型构建草原蝗虫预测模型集合对新疆典型蝗虫的适生区展开预测,以期为一线蝗虫监测工作提供可靠的技术支持。

1 研究区概况

新疆位于亚欧大陆腹地,处于我国北方干旱半干旱区,地理位置在东经73°40′—96°23′,北纬34°25′—49°10′,面积166万km2,如图1。其地形特征是“三山夹两盆”——自北向南依次为阿尔泰山、准噶尔盆地、天山、塔里木盆地和昆仑山。因深居内陆,远离海洋而形成典型的干旱气候特征,年均气温10℃,年均降水量167.1 mm,降水空间差异大,北部多于南部,由此形成多种草地类型。草场面积占自治区国土面积一半以上,是当地农牧业重要的生产资料[33]。

图1 研究区位置及新疆典型蝗虫发生监测点

2 数据与方法

2.1 数据来源

2.1.1 蝗虫发生数据

使用由新疆维吾尔自治区蝗虫鼠害预测预报防治中心站提供的全疆范围内各类蝗虫发生历史记录,并通过收集文献[23—24,33—36]及全球生物多样性信息网络数据库(GBIF)中新疆典型蝗虫数据记录,此外还有研究团队长期在野外调查中采集记录的蝗虫发生区GPS数据。原始数据记录共计3800条,通过筛选及预处理得到3714条数据参与后期处理与分析。

2.1.2 气象数据

气象数据包括与新疆典型草原蝗虫繁殖、生长密切相关的气温降水数据,其中气温数据为月最高气温和月最低气温。气象数据空间分辨率为2.5′,该数据时间范围基本与所收集的蝗虫发生记录相一致,为2000—2018年。该数据集由WorldClim(https://www.worldclim.org/data/monthlywth.html)提供,数据包括平均最低温度、平均最高温度和总降水量3个变量。通过处理与合成生成多年平均最低温度、多年平均最高温度和多年总降水量数据。

2.1.3 土壤数据

土壤湿度数据来自全球土地数据同化系统(https://disc.gsfc.nasa.gov/),使用空间分辨率为0.25°的表层土壤湿度(0—10 cm)数据,该数据时间范围与气象数据一致。采用表层土壤酸碱度数据(0—30 cm),获取自中国科学院南京土壤研究所(http://www.soilinfo.cn/),其空间分辨率为1 km。

2.1.4 植被数据

使用MODIS NDVI月度归一化植被指数(MOD13A3)表征研究区植被生长状况,数据时间范围与气象数据保持一致,空间分辨率为1km,通过最大值合成方法,形成多年植被指数平均值。

2.1.5 地形数据

本研究使用的地形数据为数字高程模型(DEM),数据获取自中国科学院地理科学与资源研究所资源环境科学与数据中心(http://www.resdc.cn/),数据空间分辨率为500 m,使用ArcGIS软件生成研究区坡度、坡向数据。

根据实际状况,在开展数据分析和模型构建前,使用ArcGIS软件对所有环境因子数据重投影为WGS—84坐标,根据新疆行政区划数据(由国家基础地理信息中心发布的国家基础地理信息数据库提供)裁剪出研究区数据,将所有数据重采样至1 km,并将处理结果统一转为Geo TIFF格式。

2.2 研究方法

为避免环境因子间共线性问题导致模型稳健性降低,采用相关性分析方法和方差膨胀因子进行筛选。Green团队推荐相关系数(r=0.7)为最佳阈值[37]。由于相关性分析有时存在非显性的相关结构,学者[38]提出使用方差膨胀系数度量多重共线性影响的严重程度,一般认为当方差膨胀系数高于10时,则模型会存在较为严重的多重共线性问题[39]。移除方差膨胀系数最大且相关性高于0.7的环境变量,使用其他变量构建模型。

物种分布模型在各领域获得了很高的评价,如BIOCLIM、DOMAIN及最大熵(MaxEnt)等经典模型[40]。但由于数据量的增大及各类模型应用场景差异,通过集成建模可降低模型选择中的误差,同时提供所有候选模型中各变量的相对重要性[41]。集成建模分简单平均和加权平均两种方法[20],其中加权平均基于单个模型的精度系数(AUC)分配权重[42],如式1:

(1)

式中,WApi为i的集成模型预测,AUCj为单一模型的AUC值;pij为各单一模型对i的预测值。

本文使用R语言dismo(https://cran.r—project.org/web/packages/dismo/index.html)包实现各典型模型的预测,之后使用加权平均方法实现集成模型对新疆典型蝗虫适生区预测。

众多模型评价方法中接受者操作特性曲线(ROC)曲线下面积(AUC)以及真实技巧统计(TSS)得到了广泛的应用,AUC将所有阈值范围的值集成到一个单一最终指标中,而非在所有阈值上寻找度量的最大值[43];TSS是对Kappa系数优点的继承和对物种分布模型响应曲线不足的克服,通过敏感性和特异性度量[44]。Araujo等[45]认为AUC低于0.5为反预测(即观测值与预测值间存在负相关),AUC低于0.6为失败,低于0.7为差,低于0.8为可接受,低于0.9为良好,高于0.9为优秀;张雷等[46]认为TSS低于0.4为失败,低于0.55为一般,低于0.70为好,低于0.85为很好,高于0.85为极好。

3 结果与分析

3.1 环境变量筛选

通过相关分析得出变量间存在不同相关性,其中土壤湿度与降水变量间相关性最高(0.5027),而坡度与坡向间相关性最小(0.0021),相关性最高的变量未达到最佳阈值。将方差膨胀系数的相关性阈值设定为0.7,再次对所有变量进行筛选,得出月最低气温变量及地形变量与其他变量间共线性问题更为突出,如表1,因此予以剔除。在新疆典型蝗虫适生区预测中使用除月最低气温数据及地形外的其余七个环境因子参与建模。

表1 各环境变量方差膨胀系数

3.2 模型精度评价

将发生监测点数据分为训练集和验证集两部分,其中验证样本集通过随机选取20%样点得到。利用AUC验证各预测模型的性能得出均在可接受的范围以内,如图2和表2所示,其中DOMAIN模型的AUC值和TSS值均最低,分别为0.688和0.301;提升回归树模型最高,分别为0.920和0.910。

图2 各模型接受者操作特性曲线

表2 各模型真实技巧统计值

3.3 模型预测结果

首先使用单一模型对新疆典型蝗虫的适生区进行预测,得出高适宜性区域集中于天山以北区域,但预测结果存在一定差异,其中应用BIOCLIM模型得出适生区面积最小,DOMAIN模型得出全疆大范围内均为高度适生区,如图3。地理分布上,高度适生区集中于北疆各大草原及天山山麓、阿尔泰山附近;行政区划上,则集中于阿勒泰地区、塔城地区、博乐地区、石河子市、昌吉州、乌鲁木齐市一带,此外伊犁州、巴音郭楞蒙古自治州、克孜勒苏柯尔克孜自治州及哈密部分区域也有分布。

图3 各模型对典型蝗虫预测结果

由于各模型性能存在差异,为提高预测模型可靠性和稳健度,本研究将模型AUC和TSS值均更高的提升回归树、支持向量机和最大熵等3个高精度模型进行集成,以3个模型的加权平均最终预测新疆典型蝗虫适生区,如图4。通过集成模型预测结果与单一模型相似,但通过集成模型预测的结果结合了三种模型的优势,综合各模型在不同区域的预测结果,从而使得预测的区域达到更合理的范围。在对三种典型蝗虫统一预测的基础上,运用集成模型分别针对三种典型蝗虫进行适生区的预测,有利于认识到不同类型蝗虫在全疆各地的地理分布特征和规律,以便在后期工作中对单一蝗虫采取相对应的监测与防控措施。作为新疆典型蝗虫适生区集成预测的重要基础,也分别对亚洲飞蝗、意大利蝗和西伯利亚蝗在全疆的适生区进行了模拟预测。三类蝗虫的适生区具有较大比例的重合区,从图中看,蝗虫的高度适生区基本都集中在新疆北部天山段及伊犁河谷等区域,对三类蝗虫适生区的分别预测将会对蝗虫的监测、防治等各项工作的开展提供便利和支持。

图4 集成模型对不同蝗虫类型预测结果

使用ArcGIS自然间断法,将集成模型预测的新疆典型蝗虫适生区划分为5个等级[24],如表3。根据划分标准对集成模型预测结果分类,无论是新疆典型草原蝗虫还是亚洲飞蝗、意大利蝗和西伯利亚蝗单一类型蝗虫优势种而言,北疆各地州高适生区面积占比较大,南疆各地州则相对较少。而在北疆的地理分布则主要集中于天山一带、阿尔泰山一带、东部的吐哈盆地和西部的伊犁河谷一带,南疆的适生区则呈带状分布于塔里木盆地南缘的绿洲一带,如图5。

表3 新疆典型蝗虫适生区划分

图5 新疆典型蝗虫适生区分级

统计新疆典型蝗虫不同适生区分区面积和比例,如表4,各类适生区(低适生区、边缘适生区、适生区、高危区)面积共约59.844万km2,占新疆所有面积的36%。其中低适生区面积为28.284万km2,所占比例最大,占所有适生区面积的近二分之一(47%),占所有总面积的17%;适生区面积1.735万km2,所占比例最小,仅为不到百分之一(0.87%);边缘适生区所占面积较低适生区低,但也高于其他适生区分区;而高危区面积为16.568万km2,所占面积仅次于低适生区,所占比例也高达10%。

表4 不同适生区分区面积及占比

3.4 环境因子重要性

新疆各典型蝗虫对不同环境因子具有不同耐受性,本文综合考虑影响意大利蝗、西伯利亚蝗和亚洲飞蝗生存与繁殖等活动的重要生态环境变量,各环境变量对预测新疆蝗虫适生区分布的贡献率如表5。综合而言,在新疆三类典型蝗虫适生区预测的建模中,不同环境变量在各主要预测模型中的贡献率存在较大差异性,但是各个环境变量贡献率的排名整体上较为一致。具体而言,从3个预测模型的表现上看,在对三类蝗虫预测中,降水、归一化植被指数及月最高气温3个变量始终是对蝗虫适生区预测贡献最大的几类,其中在提升回归树模型中,对亚洲飞蝗、意大利蝗和西伯利亚蝗适生区预测贡献率最高的变量均为降水,其表现分别为20.8%、53.7%和48.2%;支持向量机模型中,对亚洲飞蝗、意大利蝗和西伯利亚蝗适生区预测贡献率最高的变量分别为土壤酸碱度、月最高气温和降水,其表现分别为20.13%、26.28%和23.55%;最大熵模型中,对亚洲飞蝗、意大利蝗和西伯利亚蝗适生区预测贡献率最高的变量均为降水,其表现分别为31%、62.2%和67.3%。

表5 环境变量贡献率

土壤湿度和土壤酸碱度及地形因子也同样对新疆草原典型蝗虫的适生区分布有较大影响,而坡向则在新疆典型蝗虫发生和分布中的影响较小。环境变量在各预测模型分别针对三类典型蝗虫适生区预测中的贡献率存在一定差别,但根据3个模型的综合表现月最高温度、降水和植被3个变量始终是蝗虫生长和繁育的重要且直接的环境因素,对于其生境的选择具有很大的影响。

4 讨论与结论

4.1 讨论

物种分布模型准确预测基础之一是环境变量筛选,研究表明[47]环境变量会对模型预测精度造成较为显著的影响。当各环境变量间存在较高相关性时,会难以避免地带来自相关和多重共线性等问题,从而在建模中造成不必要的信息冗余,影响模型的稳健性。本研究采用相关性及方差膨胀系数移除月最低气温变量构建预测模型,这与众多学者在相关研究中采用的变量筛选方法基本一致,如学者Pradhan[48]使用皮尔逊相关系数对环境变量进行了相关性分析,其后计算方差膨胀系数,对南亚和东南亚的生物气候变量进行了多重共线性和冗余的筛选。

对模型性能度量的重要标准之一是接受者操作特性曲线(即AUC值),AUC受阈值影响较低,可对所有阈值范围内的性能评价结果予以显示,因此也受到生态环境领域学者重视[49]。AUC值越接近1即表明模型的性能越好,本研究中各模型的AUC基本都保持在0.7以上,说明各模型的性能可较好地预测新疆典型蝗虫的适生区,但模型间存在一定差异,其中DOMAIN性能相对最差,对新疆典型蝗虫的预测能力最低;而提升回归树、支持向量机、最大熵3个模型的AUC均大于0.9,其性能在新疆典型蝗虫的预测中高于其他各模型,这也与相关研究中各模型在不同物种分布预测模型中的性能表现基本一致[50]。具体如Duan等[51]使用BIOCLIM、DOMAIN、MAHAL、RF、MaxEnt和SVM等六个模型预测了五种树种的潜在分布区,以标准差、变异系数、Kappa值和AUC值评估模型的稳定性,指出MAHAL、RF、MaxEnt和SVM具有更高预测精度。

物种分布模型模拟出物种生存的可能性空间依赖于基本生态位的稳定性及空间分布的平衡[52]。通过物种分布模型预测的物种潜在适生区与真实适生区之间存在一定差异,但预测的潜在适生区基本覆盖了其实际的分布状况[53]。本文参考陈健等[54]关于蝗虫生境研究应用进展中不同生境因子对蝗虫影响的研究成果,结合新疆草原典型蝗虫具体实际,综合考虑了对蝗虫有显著影响的气温、地形、植被和土壤四个方面的因素,使预测的潜在适生区较真实蝗虫适生区范围最大化[55]。在新疆典型蝗虫适生区预测中各生境因子对预测模型的贡献率表现差异显著,其中降水量对蝗虫适生区的影响尤为显著,这与王晗等[56]在新疆意大利蝗适生区与降水量、最高气温和最低气温的变化相关研究中相关的结论有一定的关联性。因本文选取的环境变量并非在不同气候情境下的生物气候变量,预测变量的贡献情况与李培先[24]等关于意大利蝗潜在分布中各变量贡献率和杨会枫[23]关于西伯利亚蝗在新疆潜在分布中各变量贡献率存在一定差异。

本文对新疆各类典型蝗虫的适生区预测结果显示,典型蝗虫的适生区具有显著的区域差异,各类适生区面积近60万km2,适生区地理分布主要集中在新疆天山一带、北部阿尔泰山及伊犁河谷一带,此外在东部的吐哈盆地和南疆塔里木盆地边缘也有适生区,这些基本与文献有关新疆蝗虫地理分布的表述基本一致。同时本文预测的适生区地理分布及其面积也与郑淑丹对2012年新疆草地蝗虫发生分布拟合结果一致,但本文预测结果无论是从预测方法上还是预测结果上均有了较大的提升和优化;更近一步,与杨会枫等人使用MaxEnt模型对西伯利亚蝗潜在分布区的预测结果同样具有相似性,这也印证了本文构建的新疆典型蝗虫预测模型及其预测结果对新疆典型蝗虫适生区预测存在一定合理性和可靠性。

本文基于新疆典型蝗虫发生数据和相关环境变量,使用经典物种分布模型对新疆典型蝗虫适生区进行了预测,但还存在一些不足:(1)在环境变量选择方面未全面考虑人类活动等非自然因素影响,因此可能对预测结果造成一定影响;(2)仅选用部分经典物种分布模型进行了预测,暂未将如生态位因素分析模型(ENFA)、广义加性模型(GAM)、人工神经网络(ANNs)等其他具有同样代表性的模型考虑在内,可能也会对更精准预测结果的展示产生一定影响。(3)仅对新疆全区尺度典型蝗虫适生区进行了预测,未对地州甚至区县尺度状况展开,另一方面也未对新疆周边省区以及国外地区展开研究,在未来条件允许的情况下也可考虑在不同尺度下推进。总之,本研究对新疆典型蝗虫适生区预测一方面于区域相关研究深入开展具有一定探索意义,另一方面于基层实际蝗虫监测、防治工作的推进亦可提供一定建议和支持。

4.2 结论

基于物种分布模型对新疆典型蝗虫适生区预测,得出:

(1)新疆典型蝗虫适生区受多种环境因素共同作用,各因素相互影响对新疆蝗虫适生区影响存在差异。本研究选取的众多影响蝗虫繁殖、生长等不同生命活动阶段的环境因子中,月最低气温变量及地形相较于其他变量对蝗虫适生区的影响最小。降水、气温和植被对物种分布预测模型的贡献率最高,此外土壤湿度和土壤酸碱度对新疆典型蝗虫适生区预测也有较高贡献率。

(2)各预测模型性能存在显著差异,其中DOMAIN模型在新疆典型蝗虫适生区预测中性能最低(AUC=0.688,TSS=0.301),而提升回归树模型的预测性能最佳(AUC=0.920,TSS=0.910);综合预测性能最优的3个经典模型集成最终预测模型对新疆典型蝗虫潜在适生区的预测具有更高的准确性与合理性。

(3)通过集成预测模型的预测,新疆典型蝗虫的潜在适生区分布具有区域性,其中天山以北的广大草原地区存在各类蝗虫适生区,此外在东部的哈密地区、南疆各绿洲边缘地带亦有零星分布;各类适生区面积56.844万 km2,其中高危区面积16.568万 km2。

(4)新疆草原典型蝗虫适生区存在高度集中、区域差异显著、地理分布结构复杂等多种特点,不同区域、不同地州草原部门对蝗虫的日常监测和防治工作需紧密结合当地工作实际,分区、分时制定严密的蝗虫日常监测和防治计划,在做好本地蝗虫监测防治工作的同时,各边境地区草原部门还需做好跨境蝗虫的迁飞入境的监测、预防工作。

致谢:自治区级产学研联合培养研究生基地——新疆维吾尔自治区治蝗灭鼠指挥部办公室提供蝗虫发生点数据,国家基础地理信息数据库提供本文所有基础底图数据。

猜你喜欢

适生区蝗虫典型
用最典型的事写最有特点的人
你真的认识蝗虫吗
未来气候条件下天麻适生区预测及时空变化分析
珍贵用材树种红椿4个变种栽培的潜在气候适生区预测*
腐烂茎线虫在山西省的适生区预测
典型胰岛素瘤1例报道
蝗虫
《圆》典型易错题
基于MaxEnt模型的绍兴市香榧潜在适生区研究
人多势众的蝗虫