基于DIVA-GIS的牡丹在中国适生区的预测
2022-04-12圣倩倩王立飞刘彦辰耿兴敏祝遵凌
圣倩倩,王 晨,王立飞,刘彦辰,耿兴敏,祝遵凌
(南京林业大学 a.风景园林学院;b.南方现代林业协同创新中心;c.艺术设计学院,江苏 南京 210037)
植物物种的地理分布受气候制约,而气候影响植物分布的主要因素则是温度和降水[1-2]。通过对植物物种所需温度与降水量的统计和模型的建立,可以有效预测其可能存在的地理区位。随着电脑技术的发展和地理信息系统的应用,各种生态位模型(如BIOCLIM、DOMAIN、MaxEnt、GARP 等)[3-5]都被逐渐开发并应用到植物物种适生区的预测之中。
牡丹是我国四大传统名花之一,东汉时期已被用作中药,而其作为观赏植物的栽培历史则可追溯至南北朝。牡丹花姿绰约,气味清香,自有“花王”之相,其观赏价值很高。中国是牡丹培育生产大国,牡丹种质资源多样,品质优异,且在其种质利用和产品加工等方面均有相应的产出。近年来,牡丹除了作为传统的药用、观赏植物得以开发利用外,还陆续涌现出一些新兴的牡丹产业,这些产业主要涉及食品、化妆品、医药保健品及牡丹文化、艺术、服饰等领域[6-8]。为了促进牡丹产业的科学发展,运用地理信息系统软件DIVAGIS 模拟牡丹最可能分布的适生区域,以期为未来牡丹的保护、引种与推广提供科学依据[9]。
1 材料与方法
1.1 有效分布记录的获取
本研究通过查看标本库获得牡丹分布点数据。从中国国家标本资源平台(http://www.nsii.org.cn/2017/home.php)获得了827 份标本信息,筛选并保留具体到乡镇一级的标本数据,应用百度地图对标本记录进行定位,确定经度与纬度[10],最终获得259个分布点的经纬度数据,并将分布点数据保存为Excel 文件以备用[11]。
1.2 气候环境数据的获取
选择19个和物种分布有关的生物气候变量[12],其中、英文名称见表1。所有数据均从世界气候数据库(https://www.worldclim.org)中获得,未来的气候数据则选用CMIP6 计划下SSP1-2.6 情景中的2081—2100年气候预测数据和SSP5-8.5 情景中的2081—2100年气候预测数据。利用ArcGIS 软件处理从数据库中下载的生物气候变量数据,保存为相应格式以备用。
表1 19个生物气候变量Table 1 19 bioclimatic variables
1.3 预测过程
DOMAIN 模型和BIOCLIM 模型的预测都是利用DIVA-GIS 软件进行的,即将收集到的牡丹分布点位的坐标输入到Excel 工作表中,以DBF 文件格式保存。对参与建模的已知的牡丹分布点位数据,按照75%的比例进行随机分割[13],以随机选取的75%的“存在点”作为训练子集,以其余25%的“存在点”与数倍于“存在点”的“不存在点”作为验证子集,在DIVA-GIS 软件平台上依次加载随机生成的不同训练子集文件。使用之前生成的生物气候变量数据集参与模型运算,得到多个分布预测图,将多个预测值进行平均,获取基于两种模型的牡丹在中国的分布图,然后将得到的分布图导入ArcGIS 软件中进行可视化处理。
DOMAIN 模型的输出值不是牡丹适生可能性的估算值,而是分类置信度[14]。根据DOMAIN 模型运算的结果,需以人为定义的阈值来确定其适生区范围。将DIVA-GIS 软件平台中输出的grd 格式文件转换成ArcGIS 相应格式文件,利用ArcGIS软件使用重分类(Reclassify),对DOMAIN 模型的结果进行可视化处理,参照张海涛等[15]对DOMAIN 模型适生区的分类标准对预测的牡丹适生区进行划分,即以评价指数为100 的区域作为最佳适生区,以评价指数为97 ~99 的区域作为高适生区,以评价指数为96 ~97 的区域作为适生区,以评价指数为95 ~96 的区域作为低适生区,以评价指数为91 ~95 的区域作为边缘适生区,以评价指数为0 ~91 的区域作为非适生区。以BIOCLIM 模型对当前气候条件下牡丹的适生区进行预测,根据系统默认的适生度,可将牡丹的地理适生区分别划分为非适生区、边缘适生区、低适生区、适生区、高适生区、最佳适生区这6个等级,其指数分别为0 ~2.5%、2.5%~5.0%、5% ~10%、10% ~20%、20% ~42%。利用ArcGIS 软件对预测出的不同等级适生区的地理范围进行最小几何边界处理,以WGS1984 坐标系为标准,计算出各等级分布区的经纬度范围。
1.4 主导气候因素的筛选
提取259个标本分布点所对应的19个生物气候变量数据,利用SPSS 软件对提取出的数据进行主成分分析(Principal component analysis,PCA)[16-18],以筛选出当前气候条件下与牡丹适生区关联度最大的气候因素。
1.5 模型精确度的检验
模型预测结果数据可以分为如下几类[19]。
1)模型预测结果中显示物种存在的数据:以预测结果显示存在而事实上也存在的数据为真阳性数据,用a来表示;以模型预测结果显示存在而事实上不存在的数据为假阳性数据,则用b来表示。
2)模型预测结果中显示物种不存在的数据:以预测结果显示不存在而事实上也不存在的数据为真阴性数据,用d来表示;以模型预测结果显示不存在而事实上存在的数据为假阴性数据,则用c来表示。
研究中涉及的评价指标包括灵敏度(真阳性率)、特异度(真阴性率)、准确度与AUC 值和Kappa 值。灵敏度是指预测出的真阳性数据在所有实际存在数据中的比例,特异度是指真阴性数据在所有实际不存在的数据中的比例,准确度是指真阳性结果和真阴性结果在总目标区所占的百分比。以特异度为X坐标,以灵敏度为Y坐标绘制受试者工作特征曲线(Receiver operation characteristic,ROC),受试者工作特征曲线下面积(Area under ROC curve,AUC)是指ROC 曲线下的面积,Kappa 统计值(Kappa statistic,K)是根据灵敏度(Sensitivity,Se)、特异度(Specificity,Sp)、准确度(Accuracy,A)这3个指标值综合计算后得到的评价指标值,其计算公式分别如下:
利用预测环节随机分割步骤中得到的验证子集来检验模型预测的精度,同时利用DIVA-GIS 软件中的ROC 曲线和Kappa 统计值对模型预测精确度进行检验[20]。以AUC 值为评判依据,不受诊断阈值的影响,且对物种发生率不敏感,AUC 值目前被公认为最佳的评价指标,在生态位模型精确度检验评价中得到了广泛的应用[21]。其评价模型对适生区的模拟效果分为如下6个等级:极好(0.90~1.00)、好(0.80~0.90)、一般(0.70~0.80)、差(0.60 ~0.70)、失败(0.50 ~0.60)。Kappa值也是被认可的评价指标,其同样有如下6个评价等级:极好(1.00 ~0.85)、很好(0.70 ~0.85)、好(0.55 ~0.70)、一般(0.40 ~0.55)、失败(<0.40)。
2 结果与分析
2.1 两个模型预测结果的比较分析
运用Domain 模型预测出的牡丹不同等级适生区的分布情况见表2。由表2 可知,等级较高的牡丹适生区主要分布于北京、天津的大部分地区,河北部分地区,山东大部分地区,河南大部分地区,陕西中南部与甘肃东部地区,四川山地区域与四川盆地交界处以东地区,重庆全境,湖北与重庆、湖南交界地区,湖北西部和东部地区,江苏部分地区,上海全境,浙江北部地区,贵州大部分地区,江西部分地区等区域。
表2 DOMAIN 模型的预测结果†Table 2 The results of the DOMAIN model
运用BIOCLIM 模型预测出的牡丹不同等级适生区的分布情况见表3。由表3 可知,等级较高的牡丹适生区主要分布于甘肃南部和陕西的中部、南部地区,山西南部地区,河南除东南部外的大部分地区,江苏中北部地区,山东南部与东部地区,四川和重庆东部地区,贵州东部的大部分地区,湖北大部分地区等区域。
表3 BIOLCIM 模型的预测结果Table 3 The results of the BIOCLIM model
比较分析两个模型的预测结果可知,以DOMAIN 模型预测出的高适生区更为分散,而以BIOCLIM 模型预测出的高适生区更为集中;以DOMAIN 模型预测出的最佳适生区的面积比以BIOCLIM 模型预测出的最佳适生区面积要小,且这些最佳适生区域集中于已知的牡丹标本分布点附近;而以DOMAIN 模型预测出的最佳适生区、高适生区和适生区面积之和大于以BIOCLIM 模型预测的结果。但是,两个模型预测的结果都表明,中国中部以陕西和贵州为中心的两个适生区的面积均较大,牡丹适生的程度均较高。
2.2 环境因素分析
提取标本点的19个生物气候变量数据,利用SPSS 软件对提取出的19个生物气候变量数据进行主成分分析,结果见表4。在19个主成分中,第1、第2、第3、第4个主成分的方差贡献率分别为61.820%、18.526%、7.605%、6.245%,其累计贡献率达94.196%,说明这4个主成分可以反映出大部分生物气候变量的信息。各个生物气候变量在前4个主成分中的得分系数见表5。由表5 可知,在第1 主成分中,极端最低气温(bio6)、最干燥季度的平均温度(bio9)、最冷季的平均温度(bio11)、年降水量(bio12)的得分系数都较高,分别为0.081、0.081、0.080、0.080;在第2 主成分中,温度季节性变化方差(bio4)、最湿季平均温度(bio8)、极端最高温(bio5)的得分系数都较高,分别为0.231、0.217、0.206;在第3 主成分中,季节降水量变异系数(bio15)、最热季降雨量(bio18)、最湿月降雨量(bio13)的得分系数都较高,分别为0.281、0.265、0.198;在第4 主成分中,最湿月降雨量(bio13)、湿季降水(bio16)、平均日温差(bio2)、最热季的降水(bio18)的得分系数都较高,分别为0.374、0.277、0.275、0.275。可见,各个环境因素作用的效果顺序为:温度因素大于湿度因素。在19个生物气候变量中,对牡丹适生区分布起到主要影响作用的气候变量分别是极端最低温度(bio6)、温度季节性变化方差(bio4)、季节降水量变异系数(bio15)、最湿月降水量(bio13)。
表4 前4个主成分的方差贡献率Table 4 Variance contribution rate of the first four principal components
表5 旋转后的因素荷载矩阵Table 5 Rotated factor loading matrix
2.3 模型的验证和评估
对DOMAIN 模型预测精度进行检验,结果得到的评价指数AUC 值与Kappa 值分别为0.887(图1)和0.633(图2)。参考前文所述的模型评价标准可知,DOMAIN 模型对牡丹适生区的预测结果的精度高、模拟效果好。而对BIOCLIM 模型预测精度进行检验,结果得到的评价指数AUC值与Kappa 值分别为0.842(图3)和0.594(图4),说明以DOMAIN 模型对牡丹适生区预测的精度与模拟的效果要高于和优于以BIOCLIM 模型对其预测的精度与模拟的效果。
图1 DOMAIN 模型的ROC 曲线Fig.1 ROC curve of DOMAIN model
图2 DOMAIN 模型的Kappa 统计值Fig.2 Kappa statistic of DOMAIN model
图3 BOCLIM 模型的ROC 曲线Fig.3 ROC curve of BIOCLIM model
图4 BIOCLIM 模型的Kappa 统计值Fig.4 Kappa statistic of BIOCLIM model
2.4 不同气候情景下牡丹适生区的变化
使用SSP 1-2.6 情景下的19个生物气候变量和DOMAIN 模型对牡丹在未来气候条件下的适生区进行预测,结果见表6。SSP 1-2.6 情景是在SSP1的基础上对RCP 2.6 情景的更新[22]。同理,使用SSP 5-8.5 情景下的19个生物变量和DOMAIN 模型对牡丹在未来气候条件下的适生区进行预测,结果见表7。SSP 5-8.5 情景是在SSP5 的基础上对RCP8.5 情景的更新。在这两种气候情景下,牡丹适生区仅在小区域内稍有变化,但没有大面积的变化,说明其适生区的分布状态稳定。
表6 SSP 1-2.6 情景下DOMAIN 模型的预测结果Table 6 The results of BOCLIM model under the SSP 1-2.6 scenario
表7 SSP 5-8.5 情景下DOMAIN 模型的预测结果Table 7 The results of BOCLIM model under the SSP 5-8.5 scenario
3 讨论与结论
生态位模型理论在物种保护研究中得到了有效的应用。例如,针对目标物种基于生态位模型的模拟结果,可以从宏观角度了解物种适生区的分布情况,对物种的发现和保护都有积极意义。与GARP、MAXENT、BIOCLIM 这些生态位模型有所不同的是,在参与的变量较少的情况下,DOMAIN 模型对物种适生区的模拟仍有较高的精度。将DOMAIN 和 Neural Ensembles 模型配合起来运用,能有效预测中国毛竹的潜在分布区域[14],DOMAIN 模型在对天麻的适生区的预测中也表现出优异的效果[22]。在未来气候情景下,牡丹的适生区范围将有可能碎片化地增加或减少,但不会出现大范围的变化。
3.1 影响牡丹分布的环境变量
主成分分析结果表明,在前4个主成分中得分系数最高的变量里,温度因素占据主导地位,极端最低气温(bio6)与温度季节性变化方差(bio4)这2个变量为影响牡丹适生区分布的主要气候因素。对前4个主成分中得分系数最高的生物气候变量数据进行处理,得到牡丹适生区的气候特征(表8),由极端最低气温的变化范围值可知,牡丹适生区的温度最低值为-21 ~5 ℃,因为牡丹有深度休眠的特性,需要在1 ~10 ℃的环境下通过冷处理来解除深休眠。一般情况下,牡丹能耐受的最低温度为-30 ℃,因此适于牡丹分布的区域需要有明显的季节性温度变化特性和适宜的最低温,而不适宜的温度条件会导致牡丹生长停滞。有关研究结果[23-25]表明,温度对牡丹的影响最大,是影响牡丹生长的关键气候因素。结合主成分分析结果来看,温度是需要首先考虑的气候因素,相对于温度而言,牡丹对水分的需求具有更高的普适性。
表8 牡丹适生区的气候特征Table 8 Climatic characters in the suitable habitat of P.suffruticosa Andr.
3.2 牡丹适生区与牡丹生长的关系
在全国范围内,牡丹适生区等级较高的区域主要分布于北京和天津的大部分地区、河北部分地区、山东大部分地区、河南大部分地区、陕西中南部地区、甘肃东部地区、四川东部地区、重庆大部分地区、湖北部分地区、湖南部分地区、江苏部分地区、安徽部分地区、上海大部分地区、浙江北部地区、贵州大部分地区、江西部分地区等区域。南部地区适生区的分布形状与大山脉、江河走势基本一致,这是因为气温年较差等温度因素与地形、海拔等因素密切相关,依据农业气候相似性理论,模型预测出的适生区的气候环境条件与采样点的气候环境条件相似,因此,这些气候环境条件基本可以满足牡丹生存所需。但是,植物的生长除了受到温度、水分条件的制约之外,人类活动、土壤条件等都会影响植物的生长,例如都市化和工业化过程中产生的二氧化氮(NO2)会对植物生长产生影响[26],土壤碱化会影响植物的生理代谢[27]。因此,未能结合人类活动和土壤条件等环境变量来预测牡丹适生区也是本研究的不足之处,今后需对此问题进行更加深入的研究。