APP下载

基于MaxEnt的无翼坡垒在三亚潜在适生区的研究

2020-07-14

中南林业科技大学学报 2020年6期
关键词:环境变量适生区贡献率

(中南林业科技大学,湖南 长沙 410004)

无翼坡垒Hopea exalata,又名铁凌,是在1978年才发现的龙脑香科新种[1],生于海拔400 m 左右的丘陵、坡地、山岭的森林中[2]。它分布的地域范围很小,仅在海南三亚东北部山区甘什岭一带见其踪迹[3],属于珍稀濒危种,国家Ⅱ级重点保护野生植物(国务院1999年8月4日批准)。目前,对无翼坡垒的研究报道较少且多为早期研究成果。杨小波等[4-5]通过最小面积取样调查法得到了无翼坡垒的种群结构呈现集群性的特征且随着无翼坡垒个体越大,集群的程度不断减小。随后杨小波等[6]继续从种群高度与种群密度的关系与种群生物量和种群稀疏规律解释了无翼坡垒种群调节的规律。胡荣桂等[7]研究了无翼坡垒不同立木级下叶、树干皮与根中的N、P、K 营养元素的含量变化。伍月花等[8]总结出无翼坡垒有叶尖干枯病、灰斑病、褐斑病、枯斑病4 种病害,并分析了4 种病害的症状及发生环境。羊金殿等[9]提出在无翼坡垒的迁地保护中适当的遮阴有利于无翼坡垒的生长发育。后人也有对无翼坡垒裸根垒幼苗移植技术[10]、无翼坡垒的生长与光合生理特性的差异[11]、无翼坡垒于土壤营养元素及化学计量学特征[12]方面的研究。但目前对无翼坡垒的潜在适生区的研究或影响无翼坡垒分布的环境条件的研究都暂无报道。

关于物种分布格局分析及潜在分布预测的模型众多,研究表明在BIO_CLIM、DOMAIN、ENFA、GARP、Mahalanobis、MaxEnt 这常用的6 种生态位模型中,MaxEnt 的预测效果最好[13]。MaxEnt 是以最大熵理论为基础,将物种分布点数据与对应的环境变量相结合,从符合条件的分布中选择熵最大的分布作为最优分布,建立物种最大可能预测模型。MaxEnt 模型被广泛地应用于珍稀动物[14]、病虫害[15]、入侵植物[16]甚至是病 菌[17]的潜在适生区的预测。而且MaxEnt 模型的准确度对样本量并不太敏感,是目前针对可用分布数据较少情况下最有效的模型[18]。综上所述,MaxEnt 模型在物种潜在分布预测方面的应用已十分成熟且不仅可以处理复杂的非线性关系,还能预测模型结果并检验,现根据无翼坡垒分布范围小、可用分布点样本少的特点,本研究选择MaxEnt 模型对无翼坡垒的潜在适生区进行研究。研究得出的适生区可为对无翼坡垒的保护区边界的划定提供参考依据,分析得到的主要影响无翼坡垒分布的环境变量,可为无翼坡垒的迁地保护提供理论支持。

1 材料与方法

1.1 无翼坡垒分布点数据

无翼坡垒独特的分布特点决定了获取无翼坡垒分布点的难度较大,且分布点样本点较少。一般常用的物种分布点数据大多来自各平台物种标本馆,在物种分布点数据量上占较大优势。而无翼坡垒的分布点数据在各平台物种标本馆皆不可获得,根据无翼坡垒目前可考文献得知无翼坡垒的分布主要集中分布于海南三亚甘什岭一带,因此构建MaxEnt 模型所需的无翼坡垒分布点数据主要来源于海南甘什岭省级自然保区科学考察报告(2011年)以及外业实地考察作为验证(2018年,胸径起测径阶为5 cm)。外业考察中于海南甘什岭省级保护区实验区及其南部范围共设置两条样线,调查20 m×20 m 的样地共41 块。

调查过程中主要记录的数据为样地中无翼坡垒分布的经纬度、高程、坡度和坡向,便于后续数据处理与验证。将科考报告和外业样方调查中的无翼坡垒分布点数据整理成经纬度数据,剔除地理位置重复与异常数据后共得到无翼坡垒有效分布样点26 个。无翼坡垒分布点分布见图1。

1.2 环境数据

参考常见预测物种分布模型所需环境变量,并根据无翼坡垒的生长特性,现选取气候数据、地形数据、径流累积量数据、土壤数据以及太阳辐射数据(从高程数据计算获得的太阳栅格图)共5 套环境数据。考虑到无翼坡垒胸径年平均生长量为0.13~0.18 cm,而无翼坡垒在幼年时期的发病率较高存活率较低[8-9],在随着苗龄的增加,对环境的适应能力将不断增强[2],故在综合考虑数据的可获得性的情况下,本研究确定的气候区间为1970—2000年。数据来源于Worldclim 气候数据库(http://worldclim.org/),数据库内包括19个气候变量(BIO_1~BIO_19)的1970—2000年间共30年间的平均值,分辨率为30″×30″(约 1 km×1 km)。该套气候变量是世界各地气象站的记录数据,通过空间差值生成全球气候栅格数据,这被广泛地应用于潜在适生区的研究。生物气候变量信息见表1。土壤数据来源于“黑河计划数据管理中心”(http://westdc.westgis.ac.cn),采用的土壤分类系统主要为FAO-90,数据格式为投影成WGS84 坐标的grid 栅格数据。土壤变量中以T_开头属性字段表示上层土壤属性(0~30 cm),若以S_开头属性字段表示下层土壤属性(30~100 cm)。土壤变量信息见表2。

图1 无翼坡垒分布点Fig.1 Distribution point of Hopea exalata

表1 生物气候变量及其信息Table 1 Information of BIO_climatic variables

地形数据中高程数据来源于地理空间数据云GDEMDEM 30M 分辨率数字高程数据(http://www.gscloud.cn/search),数据格式为投影成WGS84 坐标的tiff栅格数据。其中坡度、坡向、汇流累积量和太阳辐射数据均可由ArcGIS 空间分析工具分析高程数据得到,得到的数据的坐标和分辨率保持与原文件相一致。

表2 土壤变量及其信息Table 2 Information of soil variables

1 .3 研究方法

本研究基于MaxEnt 模型,将无翼坡垒分布点和环境数据作为源数据预测无翼坡垒在甘什岭一带的潜在适生区。MaxEnt 软件的运行需要环境变量具有相同的空间范围、坐标和分辨率。现通过ArcGIS 将以上环境数据统一定义为WGS_1984 坐标,并利用掩膜提取工具统一环境数据的空间范围和分辨率一致,分辨率设置统一为30 m。将预处理好之后的各环境栅格变量通过转换工具转换成asc 格式文件,无翼坡垒分布点数据转换成经纬度数据导入Excel 表,另存为csv 格式。

由于参与建模的环境变量的数据量较大,为排除环境变量之间的数据联系同时使得参与建模的环境变量具有代表性,现对19 个气候变量和32个土壤变量标准化后分别进行主成分分析,选取累计方差百分比达90%的主成分。气候变量与土壤变量总方差解释达90%以上数据分别见表3与表4。在气候变量筛选出的3 个主成分中,选取各主成分中成分得分系数绝对值最大的气候变量,得到BIO_2、BIO_8、BIO_9、BIO_13、BIO_14、BIO_18、BIO_19 共7 个气候变量,代替原19 个气候变量参与建模。在土壤变量中选取各主成分中成分得分系数绝对值最大的土壤变量,得到 s_oc、s_ref_bulk、t_bs、t_gravel、t_oc、t_ph_h2o、t_ref_bulk、t_sand 共8 个土壤变量代替原32 个土壤变量参与建模。气候变量与土壤变量主成分分析得分系数矩阵见表3和表4。最后将MaxEnt 软件生成的asc 格式栅格导入ArcGIS 分级显示:适宜性指数范围在(0,0.3]为不适宜区;适宜性指数范围在(0.3,0.45]为低适宜区;适宜性指数范围在(0.45,0.6],为一般适宜区;适宜性指数范围在(0.6,0.75],为高适宜区;适宜性指数范围在(0.75,1],为核心适宜区。

表3 气候变量总方差解释Table 3 Interpretation of total variance of climate variables

表4 土壤变量总方差解释Table 4 Interpretation of total variance of soil variables

表5 气候变量成分系数矩阵Table 5 Component coefficient matrix of climate variables

表6 土壤变量成分系数矩阵Table 6 Component coefficient matrix of soil variables

本次研究以气候数据、土壤数据、地形数据、径流累积量和太阳辐射量之间相关性低为前提,因此只对气候数据与土壤数据分别进行主成分分析。将主成分分析筛选得出的7 个气候变量、8 个土壤变量、高程、坡度、坡向、径流累积量和太阳辐射量共20 个变量输入MaxEnt 模型进行初次建模。在筛选初次建模后对模型贡献率低于1 的环境变量,得到了BIO__14.tif、高程、BIO__19.tif、BIO__02.tif、BIO__13.tif、t_gravel、BIO__18.tif 7 个环境变量。将这7 个环境变量作为二次建模环境变量导入MaxEnt 模型得到最终结果。

2 结果与分析

2.1 模型精度检验

MaxEnt 模型利用ROC 曲线检验模型精度,结果显示训练样本AUC 值为0.991,测试样本的AUC 值为0.992。AUC 值非常接近1,说明筛选后环境变量对无翼坡垒潜在适生区分布的关系大,该次模型预测精度高,本次模型运行取得很好的结果。无翼坡垒的ROC 曲线验证见图2。

图2 MaxEnt 模型对预测结果的ROC 曲线验证Fig.2 Verification of ROC curve of prediction results by MaxEnt model

2.2 无翼坡垒的潜在适生区

在对无翼坡垒在三亚的适生区进行预测后,得到无翼坡垒在三亚的潜在分布(图3)。无翼坡垒的核心适宜区主要分布于甘什岭森林公园核心区范围内,在大茅村北部与罗蓬村交界处也有少许分布,两处核心适宜区的总面积约632.09 hm2;高适宜区的总面积约为825.12 hm2,其分布除了甘什岭保护范围,也分布于大茅村与三亚北部边界三郎岭林地处。预测结果中南田农场爱国分厂的东北部和东风分厂东北部赤田水库北面林地也有极少高适宜区分布;一般适宜区的总面积约为699.93 hm2,其主要紧密围绕于高适宜区周围分布,也有少部分分布于坡湾村中甘什岭森林公园范围内;三亚市其他区县及岛屿都多为适生指数较低的不适宜区与低适宜区。

发现预测结果与现有资料对无翼坡垒的分布描述相同,主要在甘什岭一带有分布,因此将甘什岭一带作为后续分析的研究区。研究区的划定在保证连续性的同时,排除水域、村庄和交通运输用地后,并使得研究区内的地类基本为林地,最终确定无翼坡垒潜在适生区的研究区。研究区横跨三亚市吉阳区与海棠区,贴近三亚市的西北面边界,总面积为5 596.69 hm2,无翼坡垒在研究区范围内的潜在适生区分布见图4。MaxEnt 模型的输出结果统计如下:不适宜区面积为3 078.72 hm2,约占研究区面积的55%;低适宜区面积为 585.29 hm2,约占研究区面积的10%;一般适宜区面积为529.46 hm2,约占研究区面积的9%;高适宜区面积为711.13 hm2,约占研究区面积的14%;核心适宜区面积为632.09 hm2,约占研究区面积的11%,主要分布于甘什岭自然保护区的核心区。

2.3 环境变量结果分析

在训练算法的每次迭代中,将正则增益的增加量加到相应变量的贡献中,若λ的绝对值的变化是负的,则从其减去,定义此为第一估计值即贡献率。若对每个环境变量的值随机置换,在置换后的数据基础上重新评估模型,将训练AUC 的下降结果数据归一化为百分比定义为第二估计值即排列重要性。隔离环境变量单独使用时增益最高的环境变量为BIO_14,因此,BIO_14 本身似乎具有最有用的信息。环境变量的刀切试验结果见图5。根据模型输出的结果反馈可以直观地看到,对模型的贡献率从大到小依次是:BIO_14、高 程、BIO_19、BIO_2、BIO_13、t_gravel、BIO_18。其中BIO_14 贡献率为41.4%,排列重要性为42.3%,对模型贡献率与排列重要性均为第一;高程对模型的贡献率为17.9%,排列重要性为34.8%;BIO_19 对模型的贡献率为12.8%,排列重要性为7.7%。综上所述BIO_14、高程和BIO_19三个环境变量对模型的贡献率最大,贡献率总和为72.1%,重要性总和为84.8%;t_gravel 对模型的贡献率只有5.2%,但排列重要性排第三达9.5%。环境变量对模型贡献率见表5。

图3 无翼坡垒在三亚的潜在适生区分布Fig.3 Distribution of potential suitable growing area of Hopea exalata in sanya

图4 无翼坡垒在甘什岭的潜在适生区分布Fig.4 Distribution of potential suitable growing area of Hopea exalata in Ganshenling

MaxEnt 模型通过迭代法不断修改环境变量的参数来计算不同环境变量对于模型的贡献率,即在其他环境变量保持在其平均样本值条件下,分别对BIO_14、高程、BIO_19、t_gravel 四个环境变量与预测概率变化的关系进行分析,并以响应曲线的形式进行表现。同时通过单因子响应曲线与变量在所有环境变量参与下的响应曲线进行对比,来确定环境变量的阈值。同一变量的两个响应曲线的一致性越高,也进一步说明了该环境变量对模型的贡献率高,是确定主导变量的依据之一。响应曲线结果显示BIO_14 的阈值为 19~25 mm,在BIO_14 达到25 mm 左右时,适应性最高;高程的阈值为0~1 200 m,当高程在300 m 左右时,适宜性最高;BIO_19 阈值为 70~105 mm,当BIO_19 在90 左右时,适应性最高;t_gravel 的阈值为0%~30%,当t_gravel 为30% 时,适宜性最低。BIO_14、高程、BIO_19、t_gravel 的响应曲线见图6。

表7 环境变量对模型贡献率Table 7 Contribution rate of environmental variables to model

图5 环境变量对模型贡献率Fig.5 Contribution rate of environmental variables to model

图6 主导环境变量响应曲线Fig.6 Response curve of dominant environmental variables

3 结论与讨论

3.1 结 论

通过整理无翼坡垒物种分布数据、气候变量、地形变量和土壤变量,用MaxEnt 模型软件对无翼坡垒在海南甘什岭一带的潜在分布进行模拟预测,同时对主导无翼坡垒潜在分布的环境变量进行分析,主要结论如下:

在总共56 个环境变量中,BIO_14、高程、BIO_19 和t_gravel 对无翼坡垒的适生区有重要影响。其中BIO_14 对无翼坡垒分布的影响最大,贡献率为41.4%,高程的贡献率为17.9%,BIO_19的贡献率为12.8%,t_gravel 的贡献率为5.2%。环境变量的响应曲线表明:无翼坡垒在干燥和寒冷季对降水量的需求较低;上层土壤中较低的碎石比例利于无翼坡垒的生长,上层碎石比例达到15%时存在无翼坡垒的概率几乎为0;无翼坡垒最适生长高程范围为200~400 m。

根据无翼坡垒潜在适生区分布图可得:无翼坡垒的核心适宜区和高适宜区主要分布于甘什岭保护区的核心区范围内,还有部分核心适宜区分布于甘什岭保护区外西北面;一般适宜区的分布除了分布于甘什岭保护区范围内,还在保护区外南边有零星分布,无翼坡垒的潜在适生区有往南扩张的趋势,可能是无翼坡垒群落仍处于演替阶段,尚未达到稳定[19]。

3.2 讨 论

本研究包含的环境变量为气候数据、土壤数据、地形数据、径流累积量和根据地形模拟的太阳辐射总量。其中气候数据、土壤数据、地形数据为一般预测植物潜在分布的常用变量[20-23],在此基础上本研究加入了径流累积量和根据地形模拟的太阳辐射两组变量。在对环境变量的选择时,由于甘什岭设有省级自然保护区,人为活动痕迹较不明显,因此并未引入人为活动的干扰作为环境变量。且无翼坡垒与其他树种间的竞争关系较难数据化为栅格变量,故未考虑种间竞争对无翼坡垒适生的影响。在获取无翼坡垒分布点方面,由于现有野外无翼坡垒的记录仅在甘什岭一带,这使得分布点可能没有完全代表物种的全部实际生境[24],这对可预测的范围也是极大的限制,过大的研究范围可能会导致极低的预测准确性。

无翼坡垒在三亚的适生区的预测结果为甘什岭一带,范围包括海南甘什岭省级自然保护区与海南甘什岭省级森林公园。但是仍有部分适生区存在于保护区与森林公园的范围外,后续可在本研究的基础上对保护区进行空缺分析,这将更好地对无翼坡垒的生境进行保护。研究结果显示BIO_14、高程、BIO_19 和t_gravel 对无翼坡垒的适生区选择有重要影响。无翼坡垒在最干季与最冷季对降水量的需求不高可能是由于甘什岭一带干湿季明显,每年5—10月为雨季,11月至翌年4月为旱季,而最冷季与旱季持续时间基本一致且降水量都较低。可能是由于甘什岭的季节性降水特点使得无翼坡垒的分布主要集中分布于那一带。在对无翼坡垒的迁地保护的过程中,可为无翼坡垒提供含有较低碎石比例的表层土壤来保证较好的适生环境,同时需在最干季与最冷季控制对无翼坡垒的浇水量。

猜你喜欢

环境变量适生区贡献率
基于物种分布模型的画稿溪国家级自然保护区桫椤保护现状及影响因素*
未来气候条件下天麻适生区预测及时空变化分析
基于MaxEnt和ArcGIS的乌檀生长适应性区划研究
腐烂茎线虫在山西省的适生区预测
一种通用的装备体系贡献率评估框架
从桌面右键菜单调用环境变量选项
彻底弄懂Windows 10环境变量
关于装备体系贡献率研究的几点思考
基于三阶段DEA—Malmquist模型的中国省域城镇化效率测度及其收敛分析
基于权变管理理论的科技期刊管理模式研究