基于Maxent模型的丹霞梧桐生境预测模拟分析
2022-06-30李芮芝胡希军文亚峰何原荣周小芬
李芮芝,胡希军*,文亚峰,何原荣,周小芬
(1.中南林业科技大学 风景园林学院,湖南 长沙 410004;2.湖南省自然保护地风景资源大数据工程技术研究中心,湖南 长沙 410004;3.中南林业科技大学 城乡景观生态研究所,湖南 长沙 410004;4.厦门理工学院计算机与信息工程学院,福建 厦门 361024)
丹霞梧桐(Firmiana danxiaensis)为锦葵科(Malvaceae)梧桐属(Firmiana marsili)小乔木,其花色嫩紫绚丽,很适合培育为庭院观赏树木、道路绿化树种和造林的先锋树种。由于其自然分布区狭窄,种群数量小,已被列入《中国物种红色目录》“极危等级”,是国家二级重点保护植物[1]。
1987 年丹霞梧桐最初于广东丹霞山被发现,并认定为丹霞山特有种[2]。随后研究人员对丹霞山丹霞梧桐种群进行了种群分布[3]、丹霞梧桐群落区系[4]、基因测序[5]和环境变量[6]等方面的研究,得出丹霞山丹霞梧桐种群遗传多样性较差[7]、种群分布于海拔180 m 等高线穿过坡度60°附近崖壁的结论[8]。2015 年广东南雄市也发现了丹霞梧桐种群,研究人员对丹霞山和南雄种群进行了种群遗传[9]、植物群落对比[10]和环境变量[11]等的研究,发现两个种群存在显著的遗传分化[12],土壤亚类、年日照时数、地貌形态成因等对丹霞梧桐分布影响较大[13]。已有研究对丹霞山丹霞梧桐种群进行了无人机探测和分布样点数据采集[14-16]。
适宜生境分布研究对珍稀濒危物种的保护具有重要参考价值,其主要研究方法有两种:①通过资源普查[17]对物种进行实地生境调查,其优点在于数据真实可靠,缺点在于耗费人力物力成本高,时间周期长;②收集相应环境数据,结合已知物种分布点[18],通过数学模拟进行潜在生境预测,其优点在于时间周期短,缺点在于结果可靠性依赖于收集数据的精细程度。目前相关的研究以方法②为主,其中最常用的算法为最大熵模型(Maxent)[18-19],其次有随机森林[20-21]、主成分分析法[22]、Biomod2 集成模型[23]、BIOCLIM[24]、ModEco[25]等,可实现的软件分别有DIVA-GIS软件[26]、Maxent[27]等。
从现有研究成果可以看出丹霞梧桐的分布与土壤、气候、地形等因子均有关系。本研究通过无人机探测在已有的丹霞山丹霞梧桐样点分布的基础上增补南雄市丹霞梧桐保护区、始兴县、英德市等区域新发现的丹霞梧桐分布种群样点,选取生境预测中常用的Maxent 模型和相关研究中常用的19个生物气候变量,并增加了与土壤、植被及人为干扰相关的环境变量共计32个,以探究丹霞梧桐在国内主要陆地范围(岛屿仅包含海南岛与台湾岛)的潜在分布情况和分布机制。
1 材料与方法
1.1 丹霞梧桐样点收集
收集整理丹霞梧桐相关文献资料(论文和相关报导)以及相关网站(http://zhiwu.cnki.net,http://www.iplant.cn 等)中丹霞梧桐分布点的经纬度数据及地名数据,并进行实地考察,对前人研究中尚未进行航拍的主要分布区进行无人机航拍定点,形成丹霞梧桐样点数据。
于2021 年4 月29 日至4 月30 日(天气多云转晴,丹霞梧桐花期)航测采集数据。无人机航拍采用旋翼(精灵4RTK)无人机,重量1 391 g,轴距350 mm,最大起飞海拔高度6 000 m,架次飞行时间约30 min。航测参数设置如表1所示。
表1 丹霞梧桐分布航测参数设置Tab. 1 Aerial survey parameter setting of F. danxiaensis distribution
运用Terra 软件将无人机航拍影像生成正射影像图,将正射影像导入ArcGIS 10.5 软件中,结合其它地理信息数据查询特征目标丹霞梧桐。(以广东南雄丹霞梧桐自然保护区为例,图1)
图1 丹霞梧桐分布区域正射影像解译(部分)Fig. 1 Distribution map of F. danxiaensis interpreted from orthoimage(Part)
1.2 环境因子数据分析处理
模型选择32个环境变量,其中包括当前气候条件下的19 个生物气候变量以及土壤、植被、地形等13个其它环境变量,环境变量数据来源如表2所示,运用Maxent 模型中的刀切法(Jacknife test)来检验各环境变量对模型预测的贡献率大小。
表2 物种分布模型的32个环境变量Tab. 2 Twenty-three environmental variables in species distribution model
1.3 Maxent模型原理与模型参数设置
根据Dudík 等[28]的研究成果,通过物种发生记录Z及研究区地理数据D,定义非负实值强度函数λ(z)到D中每一个点z,在D中物种发生概率被定义为:
其中λ(z)为实值向量特征x(z)的对数线性函数:
采用Maxent 3.3.3k将获取的物种分布数据和环境变量导入软件。勾选“刀切法”,选取75%的点用于构建模型,25%的点作为模型验证数据,其他设置均采用默认值。点击“运行”得到分析结果。
2 结果与分析
2.1 模型精度检测
受试者工作特征曲线(Receiver operating characteristic curve,ROC 曲线)分析法[29]用于检验预测模型的准确性。ROC 曲线显示了模型对数据的拟合(图2),训练数据集(Training data 深灰色)和测试数据集(Test data 浅灰色)ROC 曲线均靠近图左上角,AUC 值分别为0.999 和0.993,接近于1,远大于随机模拟预测的AUC 值0.5,说明模拟具有很高的稳定性和精度。
图2 丹霞梧桐Maxent模型受试者工作特征曲线Fig. 2 Receiver operating characteristic curve of F. danxiaensis Maxent modeling
2.2 环境变量贡献率
在训练Maxent 模型的同时,跟踪环境变量对模型的贡献程度。通过修改单个特征的系数来增加模型的增益,程序会将增益分配给功能所依赖的环境变量,在训练结束时转换为百分比。根据贡献率百分比统计结果(图3)可以看出在模型运行的过程中32 个环境变量对丹霞梧桐分布的前六个环境因子贡献程度为最湿季度降水量(49.1%)>植被类型(9.4%)>等温性(9.1%)>湿度(7.7%)>海拔(6.4%)>人口密度(5.9%)。由此可知,最湿季降水量对丹霞梧桐分布的影响最大,贡献率达到49.1%,其次为植被类型与等温性。
图3 环境变量贡献率Fig.3 Contribution rate to environmental variables
通过选择“Do jackknife to measure variable important”复选框来运行jackknife 测试。依次排除每个变量,并使用其余变量创建模型。然后使用隔离的每个变量创建模型。Jackknife 结果见图4。结果显示,年平均温度、最干季平均温度等变量与训练数据的拟合性较好,与所选择的其他30个环境变量相比,坡度、坡向对丹霞梧桐的分布影响最小。
图4 刀切检验法训练环境变量贡献值Fig. 4 The contribution value of the environmental variables trained by the knife cutting test method
2.3 环境因子与物种发生概率的关系
物种响应曲线反应环境因子与物种发生概率之间的关系,能够展示物种对环境变量的耐受性和栖息地偏好选择。为更直观的显示各环境变量对丹霞梧桐分布的影响,将上述贡献率较大的环境变量逐一进行单因子建模,同时根据模型输出的物种存在概率绘制单变量与分布概率值的响应曲线,即丹霞梧桐分布概率与主导环境变量的关系(图5 中展示了发生概率大于0.5 的六个主导环境变量的响应曲线),可以得到丹霞梧桐对每一环境变量的相应阈值。
图5 主导环境变量的响应曲线Fig. 5 The response curve of the dominant environment variable
结果显示,最湿季度降水量变化范围在20~60 mm,最适值约为28 mm;植被类型变化范围在0~10 000,最适值约为0,数据的植被类型代码显示0~10 000包括了针叶林、针阔混交、阔叶林等大部分植被类型,而代码0 代表由于植被稀疏程度过高从而在植被类型数据中没有相应植被类型的区域范围,代码定义为其它植被类型,由此可以看出丹霞梧桐最适宜分布于植被稀疏程度高的区域;等温性变化范围在25%~35%,最适值约为29%;湿度变化范围在70.5%~80%,最适值约为75%;海拔变化范围为0~1 000 m,最适值约为300 m;人口密度变化范围为0~1 000 人·km-2,最适值约为100 人·km-2。
2.4 丹霞梧桐生境预测
Maxent 模型模拟的结果经ArcGIS 10.5 地理信息系统可视化处理的结果显示(图6),国内主要陆地范围(岛屿仅包含海南岛与台湾岛)内丹霞梧桐总体预测生境范围在108.0°E~122.0°E,18.0°N~31.0°N,预测出的丹霞梧桐生境面积共计85 191.64 km2。高适生区大致范围为112.0°E~115.0°E,23.0°N~26.0°N,面积4 393.52 km2,占总生境面积的5.16%。核心分布区主要集中广东省北部韶关市及其周边县市区域。
图6 丹霞梧桐国内主要适生区Fig. 6 Domestic suitable area of F. danxiaensis
3 结论与讨论
基于Maxent 模型模拟32 个环境变量对丹霞梧桐潜在适生区分布的影响,预测得出对丹霞梧桐分布的贡献程度较大的依次为最湿季度降水量(49.1%)>植被类型(9.4%)>等温性(9.1%)>湿度(7.7%)>海拔(6.4%)>人口密度(5.9%)六个环境因子,其中最湿季降水量影响最大;丹霞梧桐在国内主要陆地范围(岛屿仅包含海南岛与台湾岛)分布的主要区域为广东省北部韶关市及其周边地区,大致范围在108.0°E~122.0°E,18.0°N~31.0°N;丹霞梧桐适生生境大部分植被稀疏,湿度较大(70.5%~80%),海拔不高(1~1 000 m),等温性较低(25%~30%),降水量较少(最湿季降水量20~60 mm)。
Maxent 是近期较常用的生境预测模型之一,已有相关研究运用该模型对丹霞梧桐进行生境预测[11,30-31],其训练集和验证集的AUC 均大于0.9,接近于1,分别为0.947 和0.906(研究区域丹霞山)[11]、0.999 和0.999(研究区域全国)[30]、0.998 和0.998(研究区域全国)[31]。本次国内主要陆地范围(岛屿仅包含海南岛与台湾岛)研究中AUC 为0.999 和0.993,表明运用Maxent模型进行丹霞梧桐生境预测模拟具有较高的稳定性和精度。
丹霞梧桐分布近年来持续有新的发现,分别为1987 年丹霞山[2]、2015 年南雄市丹霞梧桐自然保护区[32]、2020 年英德市[33]、2022 年始兴县[34]。在已有研究中,丹霞梧桐的潜在适生区位于广东与江西两省的交界处和韶关周边县市,即南岭山脉以南地区[30-31]。本次研究增加了13 个环境变量,预测结果有细微差异,江西省南部不再有高适宜性的潜在适生区分布。可见增加的环境变量对预测结果产生了一定影响。
影响丹霞梧桐分布的环境变量,前人研究主要选取了气候、地形、土壤等方面的环境变量,研究分析地形得出高程、坡度、坡向影响较大(研究区域丹霞山)[11];分析气候变量得出温度、温差、降水量、水蒸气压、太阳辐射量均会产生影响(研究区域全国)[30-31];综合分析气候、地形、土壤三方面的变量得出土壤亚类、地貌形态成因类型和年日照时数影响较大(研究区域丹霞山和南雄)[13]。本次研究选取了气候、地形地貌、人为影响和植被情况四个方面的环境变量共32个,预测结果显示四个方面的环境变量均有影响,可见环境变量对丹霞梧桐分布的影响是复杂的,在环境变量的选择上尚有拓展空间。