基于MaxEnt模型预测伯乐树生境适宜性评价
2024-12-31吴晓昱
作者简介:吴晓昱(1997-),男,硕士。研究方向为林木良种工程。
DOI:10.20028/j.zhnydk.2024.07.006
摘" 要:该研究旨在预测伯乐树的适宜分布区并识别主导其分布的环境变量,为保护伯乐树资源提供理论依据。该研究使用ENMTools筛选出126个伯乐树分布点数据。应用MaxEnt模型,模拟4种环境变量组合,气候变量,气候和土壤变量,气候、土壤和紫外变量及气候、土壤、紫外和地形综合变量。通过比较这4种模型的准确性和可靠性,探讨影响伯乐树分布的主要环境变量。基于4组环境变量的 MaxEnt 模型,AUC值训练集分别为 0.973±0.001、0.973±0.001、0.975±0.001、0.977±0.001。结果表明,4类综合环境变量模拟模型最为稳定和可靠。伯乐树地理分布主要由气候(日温度平均范围、最干季度平均温度、最干月降水量)、土壤(基本饱和度、土壤有效水含量)、紫外(紫外线的季节性变化、紫外线最弱月份平均辐射量)、地形(高程)等4类综合环境变量影响。伯乐树的地理分布格局受多种环境因素的综合影响。4类环境变量模拟的结果更准确地反映了伯乐树的适宜分布区。该研究可为伯乐树遗传资源收集和种质资源保护提供重要的数据支持。
关键词:伯乐树;MaxEnt;AUC;环境变量;适宜分布区
中图分类号:S722" " " " 文献标志码:A" " " " " 文章编号:2096-9902(2024)07-0021-06
Abstract: The purpose of this study is to predict the suitable distribution areas of Bretschneidera sinensis based on MaxEnt model and identify the environmental variables that dominate its distribution, so as to provide a theoretical basis for the protection of Bretschneidera sinensis resources. In this study, the data of 126 Bretschneidera sinensis distribution sites were screened by ENMTools. The MaxEnt model was used to simulate four combinations of environmental variables: climate and soil variables, climate, soil and ultraviolet variables, as well as climate, soil, ultraviolet and topographic variables. By comparing the precision and reliability of the four models, the main environmental variables affecting the distribution of Bretschneidera sinensis were discussed. Based on the MaxEnt model for four groups of environmental variables, the AUC value training sets are 0.973±0.001,0.973±0.001, 0.975±0.001 and 0.977±0.001 respectively. These findings indicate that the model integrating all four types of environmental variables is the most stable and reliable. The geographical distribution of Bretschneidera sinensis is mainly affected by four kinds of comprehensive environmental variables, including air temperature, precipitation, soil, and ultraviolet and topography. The geographical distribution pattern of Bretschneidera sinensis is affected by a variety of environmental factors. The simulation results of four kinds of environmental variables more accurately reflect the suitable distribution area of Bretschneidera sinensis. The findings of this study provide important data support for the collection of genetic resources and protection of germplasm resources.
Keywords: Bretschneidera sinensis; MaxEnt; AUC; environmental variable; suitable distribution area
物种分布模型(Species distribution models,SDMs)是通过将物种地理分布信息与各种环境因子相结合,分析环境对物种生存的影响,并对目标物种的分布范围进行相应预测[1]。非生物因素被认为是大尺度空间里影响物种空间格局和地理分布范围的主要驱动力[2]。物种的地理分布与环境密切相关[3]。MaxEnt模型具有预测效果好、精度高等优点[4],适用于缺少物种地理坐标信息、环境变量类型多、大尺度区域的研究[5]。目前已在多种濒危物种的保护和研究上发挥了重要作用[6-8]。
伯乐树(Bretschneidera sinensis Hemsl.)为伯乐树科伯乐树属的单科单属物种,是第三纪古热带植物区系的中国特有孑遗物种,其花大而美丽,极具观赏价值,被誉为“植物中的龙凤”。由于长期以来伯乐树生存环境遭到破坏、母树资源少、花粉和种子传播效率低等原因[9],种群面临濒危的境地,被列为国家Ⅱ级重点保护野生植物。近年来已有众多学者对其进行分布区预测,龚维等[10]初步预测了伯乐树的潜在适宜区,郭飞龙等[11]模拟末次盛冰期(约22 000年前)、全新世中期(约6 000年前)、当前(1950—2000年)、未来(2060—2080年)不同气候情景下的伯乐树地理分布格局。但是,两者都只使用气候作为环境变量,其他环境变量对伯乐树潜在分布区的影响也尚不清楚。鉴于此,在本研究中采用了MaxEnt模型,以评估4种不同环境变量组合的模拟效果:气候变量,气候加土壤变量,气候、土壤加紫外变量,以及一个综合的气候、土壤、紫外和地形变量。本研究不仅精确分析了影响伯乐树分布的主导环境变量,还预测了其潜在适宜分布区,可以为加强伯乐树种质资源保护工作提供一定的基础。
1" 材料与方法
1.1" 伯乐树分布信息的收集与筛选
伯乐树的地理分布点数据主要来源于全球生物多样性信息网络数据库(GBIF,https://www.gbif.org/),并根据中国数字植物标本馆(CVH,https://www.cvh.ac.cn/)等信息平台的数据进行比对。为避免分布点集中,导致数据过度拟合,运用ENMTools工具,筛除重叠或不精确的分布点数据,最终筛选出126个伯乐树野外分布点,以物种名、经度、纬度的格式整理为.csv格式。
1.2" 环境变量信息
本研究共收集气候、地形、紫外、土壤4种类型的多个环境因子,其中气候变量来源于全球气候数据库(WorldClim,https://www.worldclim.org/),地形变量数据来源于地理空间数据云(DEM,http://www.gscloud.cn/),紫外变量数据来源于全球紫外线辐射数据库(glUV,https://www.ufz.de/gluv/),土壤变量数据来源于联合国粮农组织(HWSD,https://www.fao.org/)。用ArcGIS 10.4软件统一不同种类环境变量的空间分辨率为2.5 arc*min-1。为避免多种环境因子间可能存在的多重共线性,造成最终模型的过度拟合,使用ArcGIS 10.4软件提取伯乐树分布点的气候数据,通过Person 分析筛选环境变量,相关性较低(|r|<0.8)的环境变量保留,相关性高(|r|>0.8)的变量只保留贡献率高的用于模型构建[12-13]。最终,保留了表1中的19个变量用于MaxEnt 3.4.4软件建模。详情见表1,变量包括:日温度平均范围(Bio2)、年温度平均范围(Bio7)、最湿季度平均温度(Bio8)、最干季度平均温度(Bio9)、最干月降水量(Bio14)、最湿季度降水量(Bio16)、最暖季度降水量(Bio18)、高程(Ele)、坡度(Slope)、坡向(Aspect)、紫外线的季节性变化(UVB2)、紫外线最弱月份平均辐射量(UVB4)、土壤有效水含量(AWC_CLASS)、土壤参考深度(REF_DEPTH)、基本饱和度(T_BS)、碳酸钙含量(T_CACO3)、碎石体积百分比(T_GRAVEL)、粉沙粒含量(T_SILT)和土壤质地(T_TEXTURE)。
表1" 筛选前环境变量一览表
1.3" 模型建立与优化
本研究运用ENMeval包(R4.2.2)[14]对MaxEnt模型进行调优,探索了8种不同的调控倍频(RM,范围0.5~4,间隔为0.5)与5种特征组合(FC)的交叉组合[15-16],即L(线性)、LQ(线性+二次性)、LQH(线性+二次性+片段化)、LQHP(线性+二次性+片段化+乘积性)和LQHPT(线性+二次性+片段化+乘积性+阀值性)。在40种组合中,通过ENMeval包进行参数调试,选择delta.AICc值为0的组合,即认为是最佳参数,用于MaxEnt建模[15, 17]。
运用MaxEnt(v3.4.1)[18]模型来预测伯乐树的潜在适生区分布。将筛选后的伯乐树分布点数据和环境变量数据导入软件,启用刀切法(Jackknife)进行分析,模型使用75%的伯乐树分布点数据作为训练集,剩余25%的数据作为测试集,选取优化后的RM和FC值,重复10次建模,其他参数保持默认值。精度检验主要采取MaxEnt模型输出结果的受试者工作特征曲线(ROC),ROC曲线与横坐标特异度围成的面积(Area under ROC curve, AUC)介于0~1,越接近1说明预测结果越好,一般认为AUC值在0.9到1之间表明预测结果极好[19]。此外,MaxEnt模型预测结果中的环境因子贡献率百分比(Percentage of contribution)和特征重要性排序(Permutation ordering)被用来评估单个环境因子的影响力和重要程度[20]。最后,模型选用非齐次泊松分布过程(IPP)的互补双对数(Complementary log-log,Cloglog)作为输出格式,在预测当前环境下物种的潜在适生区时,选用“Cloglog”作为输出格式相较于“Raw”“Logistic”“Cumulative”有更强的理论合理性[21]。
1.4" 环境变量重要性评估
为了深入探究模型对不同环境变量的响应,分别采用4种环境变量组合:气候变量(Climate, C),气候加土壤变量(Climate and Soil,C+S),气候、土壤加紫外变量(Climate,Soil and Ultraviolet,C+S+U),以及一个综合的气候、土壤、紫外加地形变量(Climat,Soil,Ultraviolet and Topographical,C+S+U+T)。根据MaxEnt输出的4种环境变量组合,各自的环境变量贡献率、置换重要值以及刀切法(Jackknife)结果进行综合分析,得到影响伯乐树适宜分布区的主导环境变量。
1.5" 适宜区划分
用ArcGIS 10.4软件对MaxEnt输出的多种模型数据进行处理,转换为栅格格式数据。使用固定值法对伯乐树分布频率 P 进行重分类(Reclassify),根据P<0.4,为不适宜分布区; 0.4≤P≤0.7,为较适宜分布区;P>0.7,为适宜分布区,将分布频率划分为3个等级[11]。将4组模型的图层进行统计分析,得到伯乐树的适生区的面积以及在各个省份的分布情况。
2" 结果与讨论
2.1" 模型准确性与稳定性检验
本研究使用ENMeval包对MaxEnt模型进行了调优,以避免模型在预测潜在分布区时产生过度拟合。基于筛选出的126个物种分布点和20种不同类型的环境变量,对不同的RM和FC参数组合进行了交叉验证。根据表2的结果显示,使用默认参数设置(即RM=1,FC=LQHPT)时,delta.AICc的值高达449.375;将RM设置为1且FC调整为LQ时,delta.AICc值降低到0。相较于默认设置,这种参数调整使得Avg.diff.AUC减少了约10.7%,Mean.OR10减少了约19.6%。这些数据表明,选用RM=1和FC=LQ的参数设置,可以有效降低模型的复杂性和过拟合风险,同时提升模型的准确性。基于这些结果,本研究选取了RM=1和FC=LQ这一参数组合进行相应的模型构建。
本研究还分别采用4种环境变量组合:C、C+S、C+S+U、C+S+U+T进行模拟。结果表明(表3),4种模型都表现出极高的预测准确性。C、C+S、C+S+U 和C+S+U+T 的训练集AUC值分别为0.973±0.001、0.973±0.001、0.975±0.001、0.977±0.001;验证集的AUC值分别为0.972±0.005、0.969±0.004、0.973±0.005、0.971±0.003。所有模型的预测评级均达到“极好”的标准。在验证集中,综合环境变量C+S+U+T的AUC标准差最小,表明这一组合在模拟伯乐树潜在分布区时,MaxEnt模型的稳定性最高[13]。
表3" 4种环境变量组合下受试者工作特征曲线下面积(AUC)
2.2" 伯乐树主导环境变量分析
4种环境变量组合:C、C+S、C+S+U、C+S+U+T模拟结果中的环境变量贡献率及置换重要值见表4。基于C+S+U+T 综合环境变量模拟可知,贡献率排名前5的环境变量分别为日温度平均范围Bio2(41.39%±3.85%)、最干季度平均温度Bio9(13.47%±2.19%)、最干月降水量Bio14(11.65%±3.84%)、基本饱和度T_BS(5.00%±2.38%)、土壤有效水含量AWC_CLASS(5.90%±1.82%),累积贡献率达77.41%;置换重要值排名前5的环境变量分别为最干季度平均温度Bio9(65.24%±10.57%)、紫外线最弱月份平均辐射量UVB4(8.39%±4.91%)、紫外线的季节性变化UVB2(5.94%±2.47%)、高程Ele(5.05%±1.10%)、日温度平均范围Bio2(4.88%±2.72%),累积置换重要值达89.5%。
基于4种环境变量组合获得的刀切法测试结果如图1所示。在C+S+U+T 综合环境变量输出的结果中,不使用该变量时重要性降低前5项是紫外线最弱月份平均辐射量UVB4、最干季度平均温度Bio9、紫外线的季节性变化UVB2、高程Ele、最干月降水量Bio14;仅使用单独变量时重要性排名前5的环境变量依次为最干季度平均温度Bio9、最干月降水量Bio14、日温度平均范围Bio2、年温度平均范围Bio7和紫外线最弱月份平均辐射量UVB4。
综合分析环境变量贡献率、置换重要值以及刀切法测试结果,采用C+S+U+T 综合环境变量模拟,气温(日温度平均范围Bio2、最干季度平均温度Bio9)、降水(最干月降水量Bio14)、土壤(基本饱和度T_BS、土壤有效水含量AWC_CLASS)、紫外(紫外线的季节性变化UVB2、紫外线最弱月份平均辐射量UVB4)、地形(高程Ele)是影响伯乐树分布的主要环境变量。这与伯乐树喜暖喜湿,耐半荫,较耐寒,适宜土层深厚、肥沃的砂壤土的生态习性相一致[22]。
2.3" 伯乐树潜在适宜分布区
对模拟结果重新分类,分别统计4种环境变量组合:C、C+S、C+S+U、C+S+U+T模拟伯乐树的适生区面积,结果见表5。C环境变量模拟的适生区面积为575 922 km2;C+S环境变量模拟的适生区面积为512 316 km2;C+S+U环境变量模拟的适生区面积为457 579 km2;C+S+U+T环境变量模拟的适生区面积为409 817 km2,4种环境变量组合模拟的适生区面积呈递减趋势。郭飞龙等[23]、王义贵等[20]在利用MaxEnt模型分析多种环境变量都得到了相似的结果,这进一步表明,直接采用单一气候变量数据模拟物种潜在分布可能与物种实际地理分布有较大偏差[24]。利用C+S+U+T模拟的伯乐树潜在适宜分布区可知其主要适宜分布区主要集中在贵州、广西、广东、湖南、江西、浙江和福建。
表5" 伯乐树适宜分布区面积
3" 结论
本研究利用ENMTools筛选得到的126个伯乐树分布点数据,并利用4种环境变量组合:气候变量,气候加土壤变量,气候、土壤加紫外变量,以及一个综合的气候、土壤、紫外和地形变量模拟并比较模型准确性与可靠性,发现4类综合环境变量模拟模型稳定性最好,可信度高。伯乐树地理分布主要由气候(日温度平均范围、最干季度平均温度、最干月降水量)、土壤(基本饱和度、土壤有效水含量)、紫外(紫外线的季节性变化、紫外线最弱月份平均辐射量)、地形(高程)等4类综合环境变量影响。以4类环境变量模拟的结果,更能反映伯乐树适宜分布区范围。本研究可为伯乐树遗传资源收集、种质资源保护提供数据支持。
参考文献:
[1] ELITH J, LEATHWICK J R. Species distribution models: ecological explanation and prediction across space and time [J]. Annual review of ecology, evolution, and systematics, 2009,40:677-97.
[2] HORTAL J, ROURA-PASCUAL N, SANDERS N J, et al. Understanding (insect) species distributions across spatial scales[J].Ecography, 2010,33(1):51-53.
[3] LIU X, WANG H, HE D, et al. The modeling and forecasting of carabid beetle distribution in northwestern China [J]. Insects, 2021,12(2):168.
[4] MEROW C, SMITH M J, SILANDER JR J A. A practical guide to MaxEnt for modeling species' distributions: what it does, and why inputs and settings matter[J].Ecography, 2013, 36(10):1058-69.
[5] FARASHI A, KABOLI M, KARAMI M. Predicting range expansion of invasive raccoons in northern Iran using ENFA model at two different scales[J].Ecological informatics, 2013, 15:96-102.
[6] 王鑫,任亦钊,黄琴,等.基于GIS和Maxent模型的赤水河地区濒危植物桫椤生境适宜性评价[J].生态学报,2021,41(15):6123-6133.
[7] 朱满乐,韦宝婧,胡希军,等.基于MaxEnt模型的濒危植物丹霞梧桐潜在适生区预测[J].生态科学,2022,41(5):55-62.
[8] 代玉烜,金瑭,徐海霞,等.基于MaxEnt模型的小黄花茶在中国的适生区域研究[J].四川大学学报(自然科学版),2021,58(2):189-98.
[9] 乔琦,邢福武,陈红锋,等.中国特有珍稀植物伯乐树的研究进展和科研方向[J].中国野生植物资源,2011,30(3):4-8,13.
[10] 龚维,夏青,陈红锋,等.珍稀濒危植物伯乐树的潜在适生区预测[J].华南农业大学学报,2015,36(4):98-104.
[11] 郭飞龙,徐刚标,牟虹霖,等.伯乐树潜在地理分布时空格局模拟[J].植物科学学报,2020,38(2):185-194.
[12] JONAS N,KLITH P B,WEN X, et al.Snub-nosed monkeys (Rhinopithecus):potential distribution and its implication for conservation[J].Biodiversity and conservation,2018,27(6):1517-1538.
[13] ELITH J, PHILLIPS S J, HASTIE T, et al. A statistical explanation of MaxEnt for ecologists[J].Diversity amp; Distributions,2011,17(1):43-57.
[14] MUSCARELLA R, GALANTE P J, SOLEY-GUARDIA M, et al. ENMeval: An R package for conducting spatially independent evaluations and estimating optimal model complexity for Maxent ecological niche models [J]. Methods in Ecology amp; Evolution,2015,5(11):1198-205.
[15] MORALES N S, FERNáNDEZ I C, BACA-GONZáLEZ V. MaxEnt's parameter configuration and small samples: are we paying attention to recommendations? A systematic review[J].Peerj,2017,5(2).
[16] 朱耿平,原雪姣,范靖宇,等.MaxEnt模型参数设置对其所模拟物种地理分布和生态位的影响——以茶翅蝽为例[J].生物安全学报,2018,27(2):118-123.
[17] WARREN D L, SEIFERT S N. Ecological niche modeling in Maxent: the importance of model complexity and the performance of model selection criteria[J].Ecological Applications, 2011, 21(2):335-342.
[18] PHILLIPS S J, ANDERSON R P, SCHAPIRE R E. Maximum entropy modeling of species geographic distributions[J]. Ecological modelling,2006,190(3-4):231-59.
[19] YI Y J, CHENG X, YANG Z F, et al. Maxent modeling for predicting the potential distribution of endangered medicinal plant (H. riparia Lour) in Yunnan, China[J]. Ecological Engineering,2016,92:260-9.
[20] 王义贵,何学高,胡云云,等.基于MaxEnt模型的大果圆柏生境适宜性评价[J].中南林业科技大学学报,2023,43(7):41-51.
[21] PHILLIPS S J, ANDERSON R P, DUDíK M, et al. Opening the black box: an open-source release of Maxent [J]. Ecography, 2017, 40(7).
[22] 中国科学院中国植物志委员会.中国植物志:第三十四卷第一分册[M].北京:科学出版社:1984.
[23] 郭飞龙,徐刚标,卢孟柱,等.基于MaxEnt模型分析胡杨潜在适宜分布区[J].林业科学,2020,56(5):184-192.
[24] HUANG J, LI G, LI J, et al. Projecting the range shifts in climatically suitable habitat for Chinese sea buckthorn under climate change scenarios [J]. Forests,2017,9(1):9.