APP下载

基于MaxEnt模型分析胡杨潜在适宜分布区*

2020-06-15郭飞龙徐刚标卢孟柱孟艺宏袁承志郭恺琦

林业科学 2020年5期
关键词:分布区环境变量居群

郭飞龙 徐刚标 卢孟柱,2 孟艺宏 袁承志 郭恺琦

(1. 中南林业科技大学林木遗传育种实验室 长沙 410004; 2. 浙江农林大学 杭州 311300)

物种地理分布区是物种在长期进化过程中历经气候、土壤、地形、生物、地史变迁及人类活动等因素的综合影响而形成的,反映了物种系统发育历史、种群扩散过程及其对新的环境适应能力(Soberónetal., 2005)。20世纪以来,人口急剧增长,社会经济活动频繁,城市化进程及农业用地面积日益扩大,导致全球气候变暖,生态环境恶化,严重影响着物种地理分布格局以及生态系统的结构、功能和稳定性 (Chenetal., 2011; Gibsonetal., 2011; Dielemanetal., 2015)。探讨物种潜在地理分布,已成为区域生态学和生物地理学研究的热点之一(Bellardetal., 2012)。

物种分布模型是利用物种客观存在的居群地理位置及其环境变量信息,采用特定的算法原理估计物种生态位,投影到环境中,以概率的形式反映物种对生境的偏好程度(庄鸿飞等, 2018)。基于不同的算法原理,已开发出多种物种分布模型。其中,最大熵模型(Maximum Entropy, MaxEnt)是以物种现实居群地理位置及其环境变量信息作为约束条件,基于约束条件下最大熵的概率分布作为最优分布的算法原理,预测物种潜在的地理分布区域(Phillipsetal., 2006; Merowetal., 2013)。与其他物种分布模型相比,MaxEnt模型预测准确性高(Phillipsetal., 2008; Elithetal., 2011),结果易于解释(Ahmedetal., 2015),特别是对于区域尺度大、环境变量较多、居群地理信息不完整的研究,更为实用(Farashietal., 2013)。目前,MaxEnt模型是物种潜在分布区模拟的首选模型,已被广泛应用于物种保育(Kumaretal., 2009)、谱系地理(Wangetal., 2015)、物种潜在分布区模拟(Narouei-Khandanetal., 2017; Zhangetal., 2018; 李璇等, 2018)等研究领域。

胡杨(Populuseuphratica)为杨柳科(Salicaceae)落叶乔木,属古地中海孑遗树种,喜光,耐干旱、盐碱、极端高温,对风沙大、气候恶劣多变的荒漠环境具有极强的适应性,是干旱区主要建群种,对维持干旱地区的生态环境稳定和安全具有不可替代的作用(王世绩,1996; 张宁等, 2017)。胡杨自然分布区横跨欧、亚、非大陆,是亚非荒漠地区典型的耐水旱中生植物,主要分布于地中海周边地区、西亚至中亚大陆干旱区的内陆河岸及河流下游地区,与古丝绸之路的线路高度重合,是丝绸之路经济带沿线国家和地区的特有树种。由于毁林开荒、不合理灌溉等农业经济活动引起的土壤沙化、盐渍化以及河水断流的现象频繁发生,胡杨林居群退化严重,大多数为长势差、质量低的稀疏残林(王世绩,1996; 中国绿化基金会, 2018),胡杨林保护与修复工作刻不容缓,已成为我国政府倡议的“一带一路”生态环境合作的重要举措(中国绿化基金会, 2018)。胡杨生长的环境适宜性评价是胡杨保护、修复与人工林营造的前期基础。Guo等(2018)和张晓芹(2018)曾基于我国西北干旱区内陆河流域胡杨居群分布与环境变量数据,模拟胡杨潜在的适宜分布区,为我国西北地区退化胡杨林的保护和恢复管理提供理论指导。但是,胡杨地理分布区域广,分布区内生境因子差异大,部分地区胡杨资源分布信息不详,目前还缺乏对胡杨全分布区的生态环境变量特征与生态过程的全面解析。本研究全面地收集已知的全球胡杨居群地理位置信息,基于不同种类环境变量的MaxEnt模型,模拟其潜在适宜分布区,比较不同环境变量对模型模拟结果的影响,旨在探讨制约胡杨地理分布的主导环境变量,明晰胡杨对生态环境变量的需求,为科学开展胡杨林保护修复和扩大栽培提供理论参考,这对推动“绿色丝绸之路”建设具有重要意义。

1 材料与方法

1.1 数据来源 胡杨居群地理信息: 胡杨居群分布的地理数据,来源于中国国家标本资源共享平台(NSII,http:∥www.nsii.org.cn/)、中国数字植物标本馆(CVH,http:∥www.cvh.ac.cn/)、全球生物多样性信息网络(GBIF,http:∥www.gbif.org/)。经检索,共获得标本采集纪录的居群信息2 708条。

环境变量信息: 气候变量数据来源于世界气候数据库(WorldClim,http:∥www.worldclim.org/),地形变量数据来源于世界土壤数据库(HWSD,http:∥www.fao.org/soils-portal/),土壤变量数据来源于世界土壤数据库补充数据(HWSD Supplementary Data,http:∥webarchive.iiasa.ac.at/Research/LUC/External-World-soil-database/),水文变量数据来源于戈达德地球科学数据与信息服务中心(GES DISC,https: ∥disc.gsfc.nasa.gov/)。

1.2 数据处理 剔除无详细地理位置、标本信息重复及人工林的数据,使用Google earth软件(https:∥earth.google.com/)确定居群位置的经纬度。为了避免居群分布过密造成误差,以经纬度2.5′×2.5′为1个样本单元,共筛选得到有效居群226个。

用ArcGIS 10.2.2软件(https:∥www.esri.com/)统一不同种类环境变量的空间分辨率(2.5′)及投影坐标(WGS 1984),并转化为ASCII格式,供MaxEnt 3.4.1软件(http:∥biodiversityinformatics.amnh.org/open_source/maxent/)识别。为了避免环境变量相关性过高造成过拟合(Elithetal., 2011),采用 ArcGIS 10.2.2软件提取226个胡杨居群的环境变量信息,利用SPSS 19.0软件(https:∥spss.en.softonic.com/)进行Spearman相关性分析。当2个环境变量相关系数大于0.8时,剔除贡献率较小的环境变量,最终选择表1的环境变量。

表1 用于MaxEnt的环境变量描述

以胡杨现实居群分布点及其环境变量的信息作为约束条件,构建MaxEnt模型,加载胡杨居群地理数据(.asc格式)及环境变量数据,进行迭代运算,输出的全球区域尺度(D)范围内胡杨居群分布概率为: 1-exp[-exp(H)pλ(z)] (Phillipsetal., 2017; 赵佳强等, 2019)。

1.4 模型可信度检验 采用刀切法(Jack knife)评估环境变量的相对权重,选择Auto features特征参数用于提高模型对环境变量的约束水平。MaxEnt 3.4.1模型“Setting”选项中,选择25%为验证集,75%为训练集,设置最大迭代次数为10 000,设置重复训练(Replicates)为10。选择Random seed,绘制受试者工作特征(receiver operating characteristic, ROC)曲线。采用ROC曲线下方面积(area under the ROC curve, AUC)评价模型的精度,AUC取值范围为[0,1]。训练数据AUC值比测试数据的AUC值高,预测效果好; AUC值越大,模型的可信度越高(李璇等, 2018)。模拟结果选择Cloglog输出方式,文件输出类型(output file type)为.asc格式。

采用ArcGIS 10.2.2软件,对模拟分布区进行适宜性划分及可视化处理。基于MaxEnt软件生成的阈值,划分生境适宜指数(suitable habitat index, SHi)。胡杨生境适宜性等级分为: 不适宜分布区,SHi<0.3; 低适宜分布区,0.3≤SHi≤0.6; 适宜分布区,SHi>0.6。将胡杨居群地理信息导入世界标准地图(http:∥bzdt.ch.mnr.gov.cn/)比较模型预测的胡杨生境适宜分布区与其现实分布区的一致性,检验模拟结果的可信度。采用Reclassfy分类工具,统计胡杨生境适宜分布区的面积。

1.5 环境变量重要性评估 将环境变量导入MaxEnt 3.4.1模型中,基于刀切法,计算不同环境变量测试增益(training gain)。结合MaxEnt 3.4.1 软件自动生成的环境变量贡献率与置换重要值,检验不同环境变量限制胡杨地理分布的重要性大小。

为了比较不同环境变量对模型模拟结果的影响,分别采用单一气候变量和4类综合环境变量(气候、地形、土壤、水文)进行模拟,分析2种模拟结果差异。

2 结果与分析

2.1 模型的可靠性与稳定性 基于胡杨全分布内的226个有效居群地理数据,分别采用4类综合环境变量与单一气候变量进行MaxEnt模型模拟。结果表明,4类综合环境变量与单一气候变量的训练集AUC值分别为0.982±0.001、0.983±0.002,验证集AUC值分别为0.967±0.009、0.980±0.006,训练数据AUC值均比测试数据AUC值高。一般认为,AUC值介于0.7~0.9之间,模型预测效果较好; AUC值大于0.9,预测效果极好。AUC值标准差越小,模型的稳定性越高(Elithetal., 2011; 陈新美等, 2012)。2种不同类型环境变量模拟过程中的训练集AUC值和验证集AUC值均大于0.9,AUC值标准差均小于0.01。这表明,基于MaxEnt模型模拟胡杨潜在分布区的效果好,稳定性高。

2.2 制约胡杨分布的主导环境变量 MaxEnt模型运行过程中自动生成的环境变量贡献率及置换重要值见表2。由表2可知,基于4类综合环境变量模拟,贡献率排名前5的环境变量分别为最干月份降水量Bio14 (22.15%±3.16%)、最热季节降水量Bio18 (17.53%±3.17%)、10~40 cm土壤含水量SMC2 (14.61%±4.60%)、根部土壤湿度RSM (7.45%±2.03%)和最湿月份降水量Bio13 (5.80%±1.50%),累积贡献率达67.54%; 置换重要值排名前5的环境变量分别是土壤水分蒸发量Eva (17.32%±4.99%)、最热季节降水量Bio18 (17.28%±7.01%)、10~40 cm土壤含水量SMC2 (9.88%±6.09%)、降水量变异系数Bio15 (6.92%±2.52%)和最干月份降水量Bio14 (4.69%±2.97%),累积置换重要值达56.09%。

单一气候变量模拟结果,贡献率排名前5的气候变量分别为最干月份降水量Bio14 (43.42% ±3.31%)、最热季节降水量Bio18 (22.03%±5.44%)、等温性Bio3 (11.44%±1.78%)、最冷季节降水量Bio19 (6.94%±5.19%)和最湿月份降水量Bio13 (5.47%±1.10%),累积贡献率达89.30%; 置换重要值排名前5的气候变量分别是最热季节降水量Bio18 (53.89%±9.74%)、最湿月份降水量Bio13 (12.29%±6.53%)、降水量变异系数Bio15(9.90%±1.57%)、最冷季节降水量Bio19 (7.92%±1.71%)和最干月份降水量Bio14 (7.35%±5.74%),累积置换重要值达91.35%。

基于刀切法检验不同环境变量的测试增益结果,见图1。基于4类综合环境变量(图1A),测试增益排名前5的环境变量依次为10~40 cm土壤含水量SMC2、最热季节降水量Bio18、根部土壤湿度RSM、最干月份降水量Bio14、0~10 cm土壤含水量SMC1。基于单一气候变量(图1B),测试增益排名前5的气候变量依次为最干月份降水量Bio14、最热季节降水量Bio18、等温性Bio3、昼夜温差月均值Bio2、最湿月份降水量Bio13。

综合分析环境变量贡献率、置换重要值及测试增益,采用4类综合环境变量模拟,大气降水(最干月份降水量Bio14、最热季节降水量Bio18)、土壤水分(10~40 cm土壤含水量SMC2、根部土壤湿度RSM、土壤水分蒸发量Eva)是限制胡杨分布的主导环境变量; 采用单一气候变量模拟,与大气降水相关的最干月份降水量Bio14、最热季节降水量Bio18、最冷季节降水量Bio19和最湿月份降水量Bio13是限制胡杨地理分布的主导气候变量。由此可见,基于4类综合环境变量进行MaxEnt模型模拟可挖掘更多影响胡杨地理分布的有效环境变量,而仅采用单一气候变量模拟不能反映出胡杨生长、分布对地下水位的生态需求。

表2 各环境变量贡献率

图1 刀切法检验不同类型变量的测试增益结果

2.3 胡杨潜在适宜分布区 采用ArcGIS 10.2.2软件对模拟结果重新分类,分别统计4类综合环境变量和单一气候变量模拟的胡杨适生区面积,结果见表3。4类综合环境变量模拟的适生区面积(471.00×103km2)是实际面积(6.48×103km2)(王世绩,1996)的72.69倍。采用单一气候变量模拟的胡杨适生区面积(2 041.23×103km2)是4类综合环境变量模拟的胡杨适生区面积(471.00×103km2)的4.33倍,是实际分布区面积(6.48×103km2)(王世绩,1996)的315.00倍。无论是4类综合环境变量还是单一气候变量模拟,南美洲局部区域均适宜胡杨分布,潜在适宜分布区面积分别为9.0×103km2和0.2 ×103km2,但目前还未见胡杨在南美洲分布的报道。总体来说,基于MaxEnt模型模拟的胡杨潜在分布区比实际分布区广,4类综合环境变量模拟的胡杨全球分布面积与单一气候变量模拟的结果比较,更接近于实际分布面积。

4类综合环境变量模拟的结果经ArcGIS 10.2.2可视化处理的可视化图见图2。由图2可知,胡杨潜在适宜分布区横跨欧、亚、非大陆。其中,亚洲,胡杨主要适宜分布于中国西北、蒙古、哈萨克斯坦、吉尔吉斯斯坦、塔吉克斯坦、阿富汗、巴基斯坦、乌兹别克斯坦、土库曼斯坦、伊朗、伊拉克、叙利亚、土耳其、印度等国的干旱和半干旱荒漠地区; 非洲,胡杨适宜分布区为地中海沿岸的摩洛哥、阿尔及利亚、突尼斯、利比亚、埃及等地区; 欧洲,胡杨适宜分布在地中海沿岸的西班牙干旱和半干旱荒漠地区; 南美洲,智利境内阿塔卡沙漠地带的环境条件也可能适宜胡杨生长、分布。4类综合环境变量模拟的结果较能反映胡杨沿河流两岸呈不连续分布的特征。如,模拟的中亚地区胡杨分布在塔里木河、叶尔羌河、孔雀河、伊犁河、锡尔河、阿姆河、恒河、底格里斯河、幼发拉底河的流域两岸,这与该地区胡杨的现实分布特征相吻合。

表3 胡杨适宜分布区面积

图2 胡杨世界适生分布区

3 讨论

3.1 MaxEnt模型模拟结果的可靠性 物种分布模型模拟结果的可靠性,很大程度上依赖于居群样本采集范围及样本量。一般而言,采集的居群样本量越大,覆盖的区域越广,获取的物种与环境之间关系的信息越丰富,MaxEnt模型建立的约束条件越多(庄鸿飞等, 2018),物种分布模型估计精度越高(赵晓冏等, 2018)。ROC曲线下的面积AUC值被公认为是模型预测准确度的最佳衡量指标(Hughesetal., 2003)。本研究采用4类综合环境变量和单一气候变量模拟训练集AUC值分别为0.982±0.001、0.983 ±0.002,验证集AUC值分别为0.967±0.009、0.980±0.006,均高于张晓芹等(2018)基于我国西北地区胡杨居群信息的MaxEnt模型运算过程中产生的AUC值(训练集和验证集AUC值分别为0.94和0.91),与Guo等(2018)的研究结果(训练集和验证集AUC值分别为0.994和0.989)相接近,这表明居群分布点样本取样范围及研究区域的尺度对MaxEnt模型模拟的结果会产生影响。本研究基于胡杨全分布区的居群样本,能代表其分布区的生境,从根本上避免了由于样本问题而导致模拟结果的偏差。

环境变量的选择是物种生境适宜性评价的关键(Sillero, 2011)。气候、土壤、地形、水文、生物及人类活动等因素综合制约着物种的分布范围(Borcardetal., 1992)。物种生境适宜性评价结果的可靠性,取决于选取的环境变量因子是否具有代表性和完整性(Sillero, 2011; 唐书培等, 2019; Guoetal., 2018)。但是,物种居群分布位置、环境变量的相关性,会引入冗余信息,使模型变复杂,导致模拟结果偏差(陈新美等, 2012; Verbruggenetal., 2013; 朱耿平等, 2014)。本研究综合考虑气候、土壤、水文、地形4类综合环境变量,基于成对环境变量相关性分析,剔除相关系数大于0.8的成对环境变量中贡献率较小的变量,模拟的结果较能体现胡杨主要在干旱地区内陆河流的两岸区域呈带状的分布特征,接近于前人的实际调查结果(刘洪霞等, 2018; Wangetal., 2018)。采用单一气候变量模拟的胡杨分布多呈片状分布,与胡杨实际的居群分布特征存在很大偏差,模拟分布面积是实际面积的300倍以上(表3)。这进一步表明,直接采用全球气候变量数据模拟物种潜在分布区,与实际情况相比较,存在较大偏差的风险(Huangetal., 2017)。

与其他研究结果(Huangetal., 2017; 刘超等, 2018; 王茹琳等, 2017)一样,本研究模拟的胡杨适宜分布区的面积大于实际分布面积。一种可能是,研究过程中仅考虑非生物的环境变量,没有考虑物种间相互作用及物种自身的繁殖能力,导致过高地估算了物种分布面积; 另一种可能是,由于物种自身的迁移能力较弱或存在迁移障碍,导致物种不能到达其适宜的生境(Soberónetal., 2005; 2009)。一些胡杨被砍伐后的原生迹地常会被柽柳(Tamarixchinensis)入侵不再形成胡杨林(中国绿化基金会, 2018),表明生物因子严重制约着胡杨的实际分布。

3.2 制约胡杨分布的主导环境变量 本研究结果表明,最干月份和最热季节的降水、10~40 cm土壤含水量、根部土壤湿度及土壤水分蒸发量是限制胡杨生长、分布的主导环境变量,这与天然胡杨“林随水生”的生态习性相一致。胡杨主要分布在临近水源的冲积、洪积平原,胡杨生长发育及居群更新多体现在所处生境的地下水位在一定的阈值范围内波动,特别是夏季土壤能得到河水浸润或有引洪灌溉(王世绩,1996; 中国绿化基金会, 2018)。最干月份和最热季节的降水,是胡杨生长季节土壤地下水补给的重要来源,土壤水分蒸发限制着土壤地下水的有效补给,土壤含水量、植物根部土壤湿度是土壤地下水有效补给量的重要指标。

本研究结果与Guo(2018)的研究结果不完全一致。Guo等(2018)认为,土壤饱和含水量、0~5 cm土壤有机碳含量、生长季平均地下水位、土壤类型和干旱指数对胡杨分布起决定性作用。这可能是研究区域的尺度大小、获取环境变量途径不同而造成的。本研究采集的胡杨居群分布数据,覆盖了整个物种分布区的环境条件,但没有考虑不同地理区域居群的适应性变异、复杂条件下形成的局部生境及人为因素等情景的影响,是大尺度区域范围的胡杨适宜生境评价。Guo等(2018)研究的区域是分布于我国黑河流域的胡杨复合居群,为胡杨物种的一个居群样本,揭示影响胡杨生长发育的主导环境变量仅适用于黑河流域胡杨适宜生境评价,用于胡杨物种的生境适宜性评价可能会存在较大风险,这可能是造成二者结果不完全一致的原因。

3.3 胡杨资源保护 胡杨在“丝绸之路经济带”沿线国家,主要沿内陆河流两岸分布以及在河流下游冲积扇形成绿洲。20世纪80年代以来,生态保护意识日益增强,特别是“一带一路”战略的实施,胡杨林的保护与修复取得了重大进展,部分地区已建立了胡杨自然保护区和国家森林公园,有效地防止了乱砍滥伐和过度放牧对胡杨林的破坏,但胡杨林生存与发展状况仍不容乐观,胡杨林低质、低效,林分结构退化的整体状况没有得到根本遏制(中国绿化基金会, 2018)。基于本研究的结果,制定胡杨林地定点引水浇灌措施,确保胡杨生长季节(最干月份和最热季节)生态用水,使其根部土壤湿度、土壤含水量维持在一定的范围,是胡杨林保护与修复的关键措施。

基于MaxEnt模型模拟的结果,胡杨潜在的适宜分布区面积(471.00×103km2)远大于实际面积 (6.48×103km2)(王世绩,1996)。胡杨分布的国家,大多数社会经济条件相对落后,当地民众只考虑经济发展,过度利用薪柴及不合理利用水资源,导致天然胡杨林面积锐减。因此,改善当地民生条件,加大胡杨的科普宣传力度,提高当地民众保护胡杨的意识,是胡杨林保护与修复的一项基本措施。

天然胡杨更新为根蘖和种子繁殖,林分遗传多样性不高,自然更新能力弱,进化潜力低。胡杨为异花授粉树种,自然分布区广,不同生态气候区的地理居群在历史进化过程中,长期经受不同环境变量的选择压作用,会导致形态特征、生理特性、生态习性等方面可遗传差异,种内蕴藏着十分丰富的遗传变异(Heetal., 2010; Wangetal., 2011)。在胡杨全分布区范围内,开展遗传资源调查、收集与评价基础上,除原地保存外,还应营建异地遗传资源保存林,以确保胡杨多样性不丢失。

本研究表明,南美洲局部地区适宜胡杨分布。一种可能是该地区可能有胡杨分布,但由于野外调查的缺位,至今仍未被发现; 另一种可能是,胡杨起源于欧亚大陆,未能传播到南美; 也有可能是,本研究没有考虑到影响胡杨生长、发育的生物因子,如土壤微生物等。因此,建议在该区域开展林木遗传资源清查、发掘和胡杨引种工作。

4 结论

胡杨地理分布受多种环境变量综合影响,采用单一气候变量进行MaxEnt 模型模拟,过高估算了胡杨潜在的分布范围; 基于气候、地形、土壤、水文4类综合环境变量,能较好地拟合胡杨的实际分布情况,反映出胡杨居群真实的分布特征。基于4类综合环境变量的胡杨全分布区生境适宜性评价,最干月降水量、最热季降水量、根部土壤湿度、10~40 cm土壤含水量、土壤水分蒸发量是限制胡杨分布的主导环境变量因子。本研究结果可为胡杨资源保护与修复措施的制定提供理论参考。

猜你喜欢

分布区环境变量居群
燕山地区不同居群白头翁种子萌发的初步评价
恩平市植物组成及区系特征研究
广东地区夹竹桃科植物区系分析
基于简单重复序列间扩增分子标记的金钗石斛遗传多样性研究
对西藏不同居群野生牡丹籽油的主要脂肪酸成分分析
从桌面右键菜单调用环境变量选项
彻底弄懂Windows 10环境变量
物种分布区特征及其对生物多样性保育的意义
斜纹夜蛾(Spodopteralitura)在我国的时空分布概述
基于三阶段DEA—Malmquist模型的中国省域城镇化效率测度及其收敛分析