APP下载

基于随机森林模型和GIS 的假臭草全国适生区预测

2023-06-05张华纬李志鹏

亚热带植物科学 2023年1期
关键词:环境变量适生区气候

张华纬,李志鹏

(1.福建信息职业技术学院,福建 福州 350003;2.福建省农业科学院数字农业研究所,福建 福州 350001)

在经济全球化的背景下,国家之间的商业互通、文化交流越来越频繁,各类生物的远距离迁徙、传播也随之增加。各国生态系统不断被外来入侵物种冲击,因此对其预防与控制也越来越受到全世界的重视[1]。外来入侵物种已然成为影响对外经济、国际贸易以及国家生态安全的重大学科问题,备受瞩目。物种的生存繁衍通常受到地理区域隔离、气候环境的影响,具有区域性。人类活动破坏了物种原本的地理分布格局,加快物种的传播速度,使得各国的外来入侵物种问题愈加严重[2]。外来物种入侵对原生态群落健康构成重大威胁,也是全球生物多样性下降的主要因素[3],超过35%的濒危植物是由外来入侵物种造成的[4]。同样外来入侵物种也对我国农林生态系统造成严重破坏,目前由境外输入中国的外来入侵物种超过660 种[5]。因此,研究入侵物种的空间分布,预测其适生区域,对于提升入侵物种的防控水平有重要意义。

入侵植物通常能够快速生长繁衍并产生化感物质抑制本土植物生长,进而形成其单优势群落[6]。假臭草Praxelis clematidea被列入《中国外来入侵物种名单(第三批)》[7],喜潮湿且光照充足的环境,对土壤土质要求不严格,能适应荒地、道路、林场、滩涂、农田和牧场等各种生存环境,形成高密度的片状覆盖区,使得本土低矮草本植物被逐渐排斥,形成假臭草单优势种,造成当地生态系统结构和生态功能的原有平衡被破坏[8]。此外,假臭草生长严重消耗土壤养分,与农作物争夺水肥资源,影响农作物生长,破坏土壤可耕性。假臭草还分泌一种有毒物质,造成牧场牲畜误食中毒[9]。因此,它对入侵地区草本植物及食草动物的生存繁衍构成了较大威胁,是入侵我国华南地区最严重的恶性杂草之一,至今依然对农业、畜牧业等行业的发展造成严重的经济损失。

国内对假臭草的研究主要集中在物种特性[10]、化感作用[11]方向,而对于适生区的研究主要利用不同算法构建基于预设规则的遗传算法(Genetic Algorithm Rule-set Prediction,GARP)模型、DOMAIN模型[12]、Maxent 模型[13]等生态位模型,模拟预测潜在分布区。其中CLIMEX 模型通过气候因素来预测物种的地理分布,能够模拟入侵物种在入侵地区的适生性[14],但该模型缺少地形、土地利用因子等非气候因子[15]。GARP 模型也广泛应用于入侵物种及其群落的分布区预测,其样本需求量较小,计算速度快,但也存在与CLIMEX 模型相似的问题[16]。DOMAIN 模型易受取样位置影响,其预测结果与物种分布联系紧密,预测分布区多以样本点为中心向周围分散[17]。机器学习算法中Maxent 模型是结合物种的已知分布数据与环境数据进行预测[18],具有较强稳定性[19],目前广泛应用于入侵物种的潜在分布研究中[20]。而另一种机器学习算法随机森林模型则同时使用物种分布有数据和分布无数据,通常用一部分数据来学习和描述数据集,另一部分数据用来评估模型精度。

假臭草对本土植物的危害极为严重,预测其潜在适生区有助于区域有害生物风险评估和预防,对于未来的防控管理极其重要。本研究利用我国已有的假臭草分布数据与伪分布数据,并结合相关环境变量,运用随机森林模型结合地理信息系统(Geographic Information Systems,GIS)技术对其在我国的潜在分布区域进行模拟预测并与其他模型预测成果进行对比分析,以期为地方农、林业部门加强对假臭草的防控提供依据。

1 材料与方法

1.1 分布点数据来源

假臭草分布数据收集自中国数字植物标本馆(http://www.cvh.ac.cn/)、全球生物多样性信息平台(https://www.gbif.org/)、中国植物图像库(http://ppbc.iplant.cn/)等国内外重要生物信息网站以及福建省农业科学院野外采集的假臭草分布信息,删除各网站重复收集的数据后,共获取假臭草分布数据296 条。通过网络地图API 坐标拾取插件的功能,提取发生地的经纬度坐标。伪分布点数据的获取是采用2 度距离法,即根据地理分布位置相关性,基于存在点 的经度和纬度以2°作为缓冲区大小,在缓冲区外围随机生成伪分布点[21]。从分布点位来看,现阶段假臭草主要位于海南、广西、广东、福建等南方各省(区),浙江、江西、安徽、湖南、四川等东部和中部省份也有小范围分布,在中国西北和华北地区只发现零星分布点,整体分布较为集中(图1)。

图1 假臭草在中国的分布示意图Fig.1 Distribution of records of Praxelis clematidea in China

1.2 软件、环境与地理数据

软件主要有R4.0.3 和ArcGIS10.3。

环境数据集包含Worldclim 世界气候数据库中获得的19 个生物气候因子,地理空间数据云网站获取国内数字高程模型数据并利用地理信息系统软件提取相应的坡度因子和坡向因子,以及从中国科学院资源环境科学数据中心获取的土地利用分类数据。通过每月的温度和降水量进行推演获得气候年 趋势,如年均气温(Bio1)、年降水量(Bio12);季节性变化范围,如气温的日较差(Bio2)、等温性(Bio3)、温度季节变动系数(Bio4)、温度年较差(Bio7)、降水量季节变动系数(Bio15);极端条件下的气候,如最热和最冷月份的气温(Bio5、Bio6),最干、最湿月份的降水量(Bio13、Bio14),以及不同干湿、冷暖季度的平均温度与降水量(Bio8、Bio9、Bio10、Bio11、Bio16、Bio17、Bio18、Bio19),为物种分布预测提供具有显著生物学意义的多种变量。未来气候数据是由全球气候模型(Global Climate Models,GCMs)计算获得,一定程度取决于大气中假定的温室气体浓度。数据获取具体步骤是从 Worldclim 网站(http://www.worldclim.org)下载空间分辨率为1 km的19 个生物气候变量利用地理信息技术手段对数据进行投影变换,转换为CGCS2000 坐标格式,以中国地区的矢量图为底图,掩模裁切取得19 个生物气候因子在国内的栅格数据,为后期数据处理做准备。地理地图数据来源于自然资源部所有的标准地图服务系统(http://bzdt.ch.mnr.gov.cn/)。该幅1:6000万标准中国地图(审图号:GS(2019)1697 号)完整地表示中国陆地范围以及台湾岛、南海诸岛、钓鱼岛、赤尾屿等重要岛屿,并用相应的地图符号绘制南海诸岛归属范围线。

1.3 研究方法

1.3.1 环境变量相关性分析和筛选

首先将收集的假臭草分布数据与伪分布数据各296 条,根据需求利用GIS 中属性值提取方法,即在点要素类的指定位置提取气候、地形、土地利用类型等多个栅格像元值,并将这些值记录到点要素类的属性表中,整理分布点的属性数据集,用于随机森林模型的物种分布预测。在模型测试无误后,输入气候、地形、土地利用类型数据,通过计算获得各个环境变量的影响等级排序作为数据相关性检验的参考依据。

为降低环境变量的冗余度并提升模型的运算速度,对存在一定相关性的环境因子进行筛选,利用SPSS22.0 软件对环境因子进行多重共线性检验。采用Pearson 相关系数进行多重共线性检验,当任意两个环境因子之间的相关系数绝对值>0.8 时,剔除其中一个环境因子,只保留另一个环境因子[22—23]。通过相关性分析,得到因子的相关性矩阵。将相关性较大的环境因子剔除后,重复上述流程,得到更加合理的适生区预测结果和影响因子排序。

根据环境变量之间相关性与环境变量的贡献度评价,最终选取10 个分别与最低温度、平均温度、温差、降水量、海拔、土地利用类型相关的环境变量作为最终的随机森林模型预测参数(表1)。

表1 环境变量之间多重共线性检验Table 1 Multi-collinearity test among environmental variables

1.3.2 随机森林模型预测

利用随机森林模型得到的假臭草在中国的分布区进行适生区等级划分,参照Aranda 等[24]通过设定固定阈值的方法,参考有关文献[10,25—26]和分布数据对假臭草的发生程度进行描述,将物种适生等级分为5 级:高适生区[0.8,1)、中适生区[0.6,0.8)、一般适生区[0.4,0.6)、低适生区[0.2,0.4)和非适生区[0,0.2),最后得到假臭草在中国的适生区分布图。利用受试者工作特征曲线(Receive Operating Characteristic curve, ROC)下面积值(Area Under the Curve, AUC)评估随机森林模型预测结果的准确性,AUC 值以0.5 到1.0 为区间,AUC 值越接近1 表示预测结果越准确。

2 结果与分析

2.1 随机森林模型预测能力验证

随机森林模型预测的准确性和可靠性主要通过训练集数据和测试集数据的ROC 曲线进行检验。如图2 所示,数据集的ROC 曲线均远离随机预测模型的ROC 曲线,且训练集数据和测试集数据的AUC值分别为0.989 和0.986,均明显高于随机预测模型的AUC 值(0.5),说明通过随机森林模型结合现有的假臭草分布数据和随机获取的假臭草伪分布数据,利用选择后的环境变量能较好地预测假臭草在中国的分布区,结果可靠。

图2 假臭草的ROC 曲线图Fig.2 ROC curve for Praxelis clematidea

2.2 假臭草的适生区与环境变量的关系

通过对影响假臭草生长的环境变量进行分析,一般采用基尼(Gini)系数进行评价。从图3 可知,最冷月份最低温度(bio6)相应的基尼系数最大,表示低温对假臭草地理分布产生重大影响。其他环境变量也按照基尼系数的大小,划分其对适生区的影响程度,主要影响因子还包括多年平均降水量(bio12)、平均日较差(bio2)、最干季度降水量(bio17)。因此对于假臭草的适生区范围影响最大是低温因素,其次是降雨量、温差,而高温、海拔、土地利用类型对其影响较小。

图3 环境变量对假臭草在中国分布的重要程度Fig.3 Importance analysis of environmental factors for Praxelis clematidea

图4 表示最冷月份最低温度和假臭草的生存概率关系。当最低温度高于10 ℃时假臭草的生存概率在1 以上,当气温低于8 ℃时生存概率持续下降,低于0 ℃时生存概率接近于0.4,属于低生存概率。与刘小文等[27]在实验中证实的结果一致,高温有助于提升假臭草与其他植物的竞争力,以此提升其潜在入侵能力,也与其多分布于华南热带亚热带地区的情况相吻合[26]。

图4 最冷月份最低温与假臭草存在概率的关系Fig.4 Relationship between min temperature of coldest month and presence probability of Praxelis clematidea

温度平均日较差是每月最高温度减去每月最低温度的平均值,表示某时间段内的温度变化量。从图5 可以看出,当温度平均日较差在5~10 ℃之间,假臭草的生存概率在0.5 以上,而随着温度平均日较差逐渐增大,其生存概率逐渐下降,说明温差过大也会限制假臭草的生长。

图5 平均日较差与假臭草存在概率的关系Fig.5 Relationship between mean diurnal range and presence probability of Praxelis clematidea

从图6 可知,年均降水量在1250~3000 mm 区间内假臭草的生存概率高。年降水量低于1250 mm时,假臭草的生存概率迅速下降,当低于1000 mm时几乎为0,这符合假臭草喜湿润环境的特点。当最干季度降水量低于180 mm 时,假臭草的生存概率开始下降,当降水量高于180 mm 时,生存概率稳定在0.8 以上(图7)。

图6 多年平均降水量与假臭草存在概率的关系Fig.6 Relationship between annual precipitation and presence probability of Praxelis clematidea

图7 最干季度降水量与假臭草存在概率的关系Fig.7 Relationship between precipitation of driest quarter and presence probability of Praxelis clematidea

2.3 假臭草在中国的适生区预测分析

根据随机森林模型的预测结果,利用GIS 技术制作假臭草在中国的适生区分布图(图8)。假臭草的 高适生区面积占全国陆地面积的8.08%,主要位于广东、广西、海南、福建全境,以及贵州南部山区、江西东南部、浙江东部沿海区,云南省西南部山区也是假臭草高度适生区。根据全国气候条件可知,大部分高适生区的年平均气温在20 ℃以上,最高气温35 ℃以上且雨水充沛。结合环境因子与存在概率之间的关系,发现我国南方高适生区,雨热条件基本符合假臭草的存在概率。较易适生的地区面积占我国陆地面积的5.69%,主要有云南中南部、湖南南部、湘鄂交界地带、江西中部以及川渝交界地区、河南零星地区。低适生区包括华南、华东、华中地区以及华北平原、新疆吐鲁番地区,面积占我国陆地面积的9.09%,而其余区域是非适生区,占我国陆地面积的77.14%。

图8 假臭草在中国的适生区预测图Fig.8 Potential suitable habitats of Praxelis clematidea in China

2.4 未来气候条件下假臭草的潜在适生区

通过IPCC 协会给出的2040~2060 年未来气候条件,预测假臭草的潜在适生区,面积合计占全国陆地总面积的23.25%,相比于现代气候条件下预测的全国适生区总面积有略微增加。从表2 来看,比较明显的变化是一般适生区面积减少而中度适生区面积增加。通过现代和未来两种气候条件下假臭草适生区的对比,发现四川东南部和重庆西南部的接壤区域出现大片高度、中度适生区。通过与地形图对比发现,增加的适生区主要位于四川盆地,该地区气候特征表现为降水丰富、温度适宜。在IPCC协会预测的未来气候中,全球气温持续上升,使得川渝地区原来的适生区等级提高,形成中高适生区,并且包括湖南、湖北、江西、安徽等我国中部省市,假臭草的中适生区面积均有所扩张,比现代气候条件下约增加2%(图9)。

表2 现代气候环境与未来气候环境下假臭草适生区面积百分比Table 2 The percentage of the suitable area for Praxelis clematidea in modern climate environment and future climate environment

图9 未来气候条件下预测的假臭草在中国的适生区Fig.9 Potential suitable habitats of Praxelis clematidea in China under the future climate scenario

3 结论与讨论

本研究基于随机森林模型并结合GIS 技术预测 假臭草在中国的潜在适生区。通过假臭草的分布点和伪分布点,以及相关气候、土地利用类型、地形、海拔等,验证了随机森林模型对于预测入侵生物适 生,AUC 值为0.986,模型精度可靠。同时模拟假臭草的适生区,最后对相关环境因子进行多重共线性检验,筛选相关性较弱的环境因子,分析各因子的影响机制,提高随机森林模型预测效率。随机森林模型与GIS 相结合,用于模拟入侵物种的空间分布,在大数据量处理分析时具有稳定性强、预测精度高等特点[28—29]。

结果表明,假臭草的适生区主要位于北纬30°以下(图8),与郭燕青等[13]基于Maxent 模型的预测结果对比,适生区范围有所增加。结合假臭草近年在郑州、四川等地的出现[30—31],说明随机森林模型对于假臭草适生区的预测并未“高估”。预测的假臭草现阶段分布范围主要集中在华南、华东地区,而未来的分布范围可能会扩散到华中甚至华北地区。从预测结果看,假臭草的分布范围仍有继续扩张蔓延的可能,除现阶段有记录的区域,在浙江、江西、湖南、贵州、四川、重庆等省市均有假臭草易入侵的区域。

Intanon 等[32]发现气候变化对假臭草的生长和繁殖有重要影响。本研究表明,温度对预测假臭草适生范围的影响最大,如最低温度;其次是降雨量,如平均降雨量、最干季度降雨量;而地形因子对假臭草的分布范围影响相对较小。在全国尺度上,我国华南地区降水充沛,气候炎热,年均温在15 ℃以上,因此模型预测为假臭草的中、高适生区,而北方寒冷干燥的气候环境对假臭草的生长繁殖造成一定的限制,构成了阻止假臭草入侵中国北方的天然屏障。据Intanon 等[32]研究,对比10 ℃、20 ℃、25 ℃、30 ℃、45 ℃情况下假臭草的生长速度,20 ℃、25 ℃、30 ℃观察到假臭草种子发芽,而在10 ℃和45 ℃未观察到种子发芽,因此温度20~30 ℃最适宜假臭草生长。这可解释假臭草在两广、海南、福建适生性最高的缘由,且雨热同期的气候特征有益于假臭草的生长繁殖,与假臭草喜阳光充足且湿润土地的习性相符,因此假臭草容易在光照条件强,气温高以及降雨量适宜的地区生长繁殖。土地利用类型对假臭草分布贡献率较小,与假臭草在田地、森林、弃耕地、公路边等不同生存环境下均可生长繁衍的习性相符[33]。

本研究预测华南各省区、华东的福建以及浙江沿海地区都属于假臭草高适生区,其分布数据显示假臭草已成功入侵这些区域,且发生规模大,防控形势严峻,需采取措施控制其进一步蔓延;对于潜在的中低适生区,也需做好假臭草的预防工作,不能放松警惕。在目前全球气温持续上升的趋势下,使用IPCC 协会给出的未来气候数据对假臭草潜在适生区进行预测,预测结果表明适生区面积扩张,因此随着气候条件的改变目前对于假臭草不适生的区域可能变为假臭草适生区。预测的假臭草未来分布图显示,中、高适生区的扩张主要集中在川渝地区、两湖地区,表明适生区向北延伸,若不及时防控会造成假臭草爆发式增长。

猜你喜欢

环境变量适生区气候
气候变化下中国蒟蒻薯科箭根薯的地理分布格局预测
未来气候条件下当归适生区预测及时空变化分析
从桌面右键菜单调用环境变量选项
气候变化下濒危植物半日花在中国的潜在分布
彻底弄懂Windows 10环境变量
巴拉圭瓜多竹适生区分布研究
瞧,气候大不同
气候变暖会怎样?
基于三阶段DEA—Malmquist模型的中国省域城镇化效率测度及其收敛分析
气候的未来掌握在我们手中