基于MaxEnt模型的油麦吊云杉西藏潜在适生区预测
2023-01-12舒骏生张晓晨
舒骏生,彭 玺,张晓晨,陈 昕
(1.国家林业和草原局 中南调查规划设计院,湖南 长沙 410014;2.南京林业大学 南方现代林业协同创新中心/ 生物与环境学院,江苏 南京 210037)
油麦吊云杉(Piceabrachytylavar.complanata),松科(Pinaceae)云杉属(Picea)植物麦吊云杉的1个变种,中国特有树种。油麦吊云杉树形端正,枝叶茂密,适应性强,材质致密,病虫害少,具有较高的经济价值。该树种产于海拔1 800~4 000 m的高寒山岭和高原地区,分布于四川西部、云南西北部、西藏东部和中南部,属雅砻江流域,金沙江、澜沧江、怒江三江并流地区和雅鲁藏布江流域的高山、亚高山寒温带气候区。常连片或散生于寒温性常绿针叶林,如油麦吊云杉群落、冷杉群落、丽江云杉、喜马拉雅冷杉、长苞冷杉等各种云杉、冷杉建群种构成的阴暗针叶林各种群落中,为上层乔木,有时为优势种或建群种,在涵养水源、保持水土等方面具有重要的生态价值,是高原森林更新和造林的极佳树种[1]。目前,对油麦吊云杉的研究主要集中在繁育技术、天然更新能力、林分密度、造林技术、人工林生长量、木材解剖和材性性质等方面[1-5]。而对油麦吊云杉的分布及生长环境并无系统研究。
在第二次全国重点保护野生植物资源调查西藏自治区的调查中,油麦吊云杉作为国家Ⅱ级重点保护野生植物被列为调查对象,主要分布在藏东南地区很多区域,调查过程中,由于自然地理环境的限制无法到达,同时必须要根据我国西藏实控线以内该树种分布情况,推测出西藏实际控制线以外的信息和数据,补充以前的空缺。如何准确地推测出这些不可到达区域的油麦吊云杉分布情况意义重大。物种分布模型(SDM)也称生态位模型(ENM),可以将物种的地理分布与相关环境变量关联起来,在预测物种潜在分布的研究中应用广泛[6-9],应用物种分布模型(SDM)推测油麦吊云杉在西藏自治区的潜在分布,能更加准确地掌握西藏自治区部分不可到达区域的油麦吊云杉资源情况。
物种时空分布格局预测中常用的生态位模型有遗传算法模型、生物气候分析模型、生态位因子分析模型和最大熵模型(MaxEnt),其中最大熵模型是应用最大熵理论,利用已知的物种分布信息来预测物种适宜分布的区域,更多地不约束物种的未知分布信息,较多地留存该物种已知分布区域的相关环境数据,当物种分布信息较为缺乏时,也能取得较好的预测效果,是目前预测精度最高、应用最广的模型[10-11]。近年来利用最大熵模型进行物种分布区预测的物种分布信息大多来源植物标本信息共享网站、植物数字标本馆、全球生物多样性信息网或文献资料,有些分布信息仅为地名或小地名,没有精确的位置信息,并且有些标本采集时间可能比较久远,受气候变化或人类活动的影响这些标本描述的分布情况可能已发生改变[12-14]。本研究使用第二次全国重点保护野生植物资源调查实际调查分布点位置信息,相对来说数据来源更加可靠。
采用西藏自治区102个现地调查油麦吊云杉分布点位置信息,筛选并处理气候因子、土壤因子、高程数据(DEM)和坡向等环境数据,应用地理信息系统(ArcGIS)软件和最大熵模型(MaxEnt)软件,以期较准确地推测西藏自治区部分不可到达区域油麦吊云杉资源分布情况,补充以前的空缺,同时分析适宜油麦吊云杉的生态环境条件,为下一步油麦吊云杉资源的保护与利用提供科学依据。
1 材料与方法
1.1 分布点数据收集与预处理
第二次全国重点保护野生植物资源调查西藏自治区共实地调查油麦吊云杉分布点784个,为避免过度拟合,采用缓冲区分析法对油麦吊云杉分布数据进行筛选和校对,排除人为因素导致分布点过多的数据[15]。排除方法:使用环境变量数据分辨率为30″(约1 km),设置缓冲区为1 km,同一个缓冲区内的分布点任意保留1个。筛选后获得102个油麦吊云杉分布点(图1),MaxEnt软件导入需要,筛选后油麦吊云杉分布点要保留植物名、位置经度、纬度这3个字段,以表格形式导出后转成.CSV文件。
1.2 环境变量数据的获取与预处理
气候和土壤因子以及海拔、坡向等对物种的空间分布起着决定性作用[16]。选取了45个环境变量,其中全球气候数据中心(http://www.worldclima.org/)下载了当前气候条件下(1950-2000年)栅格分辨率为30″(约1 km)的气候数据,该数据包含了年均气温、年温度变化范围、年降水量等19个气候环境变量(所有气候数据已经过标准化处理,为无量纲数据)[17];从国家基础学科公共科学数据中心(http://www.nsdata.cn/)下载分辨率为30″的数字高程数据,并在ArcGIS中利用3D Analyst Tool处理得到坡向数据(因藏南地区山势陡峭,30″的数字高程数据生成的坡度变量为单一值,故未采用坡度数据);在联合国粮农组织数据库下载世界土壤数据库(HWSD),并用ArcGIS提取了24个土壤因子变量[18]。
在ArcGIS软件中将45个环境变量栅格数据坐标系统一(转为UTM,WGS1984),用ArcGIS里Data management tools中的Resample工具统一各数据分辨率,然后用ArcGIS里Spatial analyst tools中Extract by mask功能结合西藏自治区行政界线矢量数据提取出西藏部分数据。
1.3 环境变量相关性的检验和筛选
物种分布模型的建模中,并非所有的环境变量都对油麦吊云杉的分布预测有影响,同时环境变量的多重共线性会使物种分布模型过度拟合,导致预测结果的精准性降低[19]。使用Arcgis的Spatial analyst tools中的Extract value to point功能提取45个环境变量中102个分布点所对应的环境变量值(图1),用Spss分析软件中Pearson相关系数分析分别检测19个气候变量与24个土壤因子变量间的相关性,选择Pearson系数大于0.8的环境变量里生态学意义大的变量和已选环境变量相关性低的变量(Pearson系数小于0.8)[20],筛选后得到8个气候环境变量、8个土壤因子变量、海拔和坡向变量(表1)。
图1 研究区102个油麦吊云杉分布点位置
表1 用于MaxEnt模型的18个环境变量
1.4 模型建立和精度检验
将102个油麦吊云杉分布数据和18个环境变量数据导入MaxEnt 3.4.1软件,运行规则选择线性特征、二次方特征与符合特征,设置分布数据的75%为模型训练集,25%为模型测试集。勾选刀切法分析影响因子贡献率,选择建立各环境变量的响应曲线,其他参数均为软件默认值。在Arcgis 10.5中打开输出的ASC.文件,用自然间断点分级法对格栅数值进行分级,划分出研究区域内油麦吊云杉分布的适宜性等级。使用MaxEnt软件自带ROC曲线(receiver operating characteristic curve)分析法评价分布预测模型精度[21]。
2 结果与分析
2.1 MaxEnt模型精度
用ROC曲线来评价MaxEnt模型精度。以1-特异性为横坐标,灵敏度为纵坐标,ROC曲线下方的面积大小为AUC(area under curve,AUC)。AUC在0~1,与模型的精度正相关,AUC值越大,说明模型精度越高。一般AUC值0.5~0.6为预测失败、0.6~0.7为预测精度较差、0.7~0.8为预测精度一般、0.8~0.9为预测精度良好,0.9以上说明预测精度极高。本研究建立的预测模型的AUC值为0.992(图2),说明建立的MaxEnt模型预测的油麦吊云杉潜在分布具有极高的精度,其预测结果可信。
2.2 油麦吊云杉适宜分布区
MaxEnt模型预测得到油麦吊云杉适生区成果为数值在0~1之间的连续栅格数据,数值越高表明该栅格区域越适宜油麦吊云杉生长。根据自然间断点分级法,将模型运算得到的油麦吊云杉适生区划分为4个等级:不适生区(0~0.09),低适生区(0.09~0.24),中适生区(0.24~0.48),高适生区(0.48~1)。结合西藏自治区行政界线,绘制油麦吊云杉在西藏自治区的适生区区划图(图3)。
结合西藏自治区地形地图分析,油麦吊云杉在西藏自治区的适生区主要位于藏东南区域,高适生区面积3 346 km2,位于巴宜区、墨脱县的雅鲁藏布江沿线山地,波密县易贡藏布和帕隆藏布沿线山地,察隅县贡日嘎布曲、察隅河沿线山地,左贡县、芒康县南面的怒江、澜沧江沿线山地;中适生区面积6 019 km2,基本位于高适生区的外围;低适生区面积达12 070 km2,位于中适生区外围。
图2 油麦吊云杉MaxEnt模型的ROC曲线
图3 应用MaxEnt模型预测的油麦吊云杉在西藏的适生区
2.3 油麦吊云杉分布与环境变量的关系
2.3.1 MaxEnt模型中主要环境变量的贡献率 刀切法对各环境变量分析可得到各变量对油麦吊云杉分布的贡献率,贡献率越高说明该变量对油麦吊云杉分布起更重要的作用,刀切法分析结果见表2,其中年降水量(Bio12)贡献率达到25.7%,顶层有机碳含量(T_OC)贡献率17.1%,年均温变化范围(Bio7)贡献率10.3%,顶层可交换钠盐(T_ESP)10.3%,这4个环境变量是影响油麦吊云杉分布的关键变量。此外,昼夜温差月均值(Bio2)贡献率7.7%,顶层基本饱和度(T_BS)贡献率6.1%,海拔(ALT)贡献率5.9%,这3个环境变量对油麦吊云杉的分布也有一定的影响。
2.3.2 主要环境变量对油麦吊云杉分布的影响 MaxEnt软件对应每个环境变量会对独立建立MaxEnt模型,输出相应的响应曲线,响应曲线反映的是该环境变量与物种适宜性之间的关系,曲线横坐标为环境变量的数值,纵坐标为对应环境变量数值物种的分布概率,通过响应曲线可清楚地反映出环境变量中物种适宜分布的区间,同时可通过进一步分析得出适宜该物种的生态环境条件[22]。图4为预测油麦吊云杉的MaxEnt模型中主要的7个环境变量和坡向的响应曲线,分析得出油麦吊云杉适宜分布生态环境条件,海拔为2 500~3 800 m,年均温变化范围24~27 ℃,昼夜温差月均值为9.5~11.5 ℃,年降水量为750~1 350 mm,土壤属性方面顶层基本饱和度在88%~96%(表层土壤极潮湿),顶层有机碳含量0%~0.4%(表层土壤有机碳含量低),顶层可交换钠盐1%~2%(非盐碱土,土壤偏酸性)。
3 结论与讨论
油麦吊云杉分布点位置信息源于现地调查,调查数据还包括了每个分布点的环境数据,筛选后分布点有102个,充分保障了本研究的可靠性。年均温变化范围24~27 ℃,昼夜温差月均值9.5~11.5 ℃,年降水量为750~1 350 mm等,环境条件与本次现地调查的样地较为集中的西藏察隅慈巴沟国家级自然保护区、雅鲁藏布大峡谷国家级自然保护区(波密县境内)、西藏芒康滇金丝猴国家级自然保护区的气候条件也基本符合,土壤属性方面,现地调查为淋溶土-棕壤,几个土壤因子响应曲线显示的数值范围也都在相应范围内,另外坡向的响应曲线(图4)显示,油麦吊云杉较适合生长在阴坡和半阳坡,与现地调查情况基本一致,也有相关的研究表明油麦吊云杉为耐阴树种,在阴坡或半阴坡更新较好[23]。
表2 用于MaxEnt模型的18个环境变量的贡献率
图4 主要环境变量的响应曲线
本次预测得到油麦吊云杉适生区主要位于巴宜区、墨脱县的雅鲁藏布江沿线山地,波密县易贡藏布和帕隆藏布沿线山地,察隅县贡日嘎布曲、察隅河沿线山地,左贡县、芒康县南面的怒江、澜沧江沿线山地。油麦吊云杉在云南主要分布于德钦、贡山等地[24],恰好与左贡县、芒康县南面相接,为怒江、澜沧江中游区域。油麦吊云杉亦分布于四川西部及西南部,位于横断山脉东面[25],与油麦吊云杉西藏、云南分布区域不连续,有相关研究发现油麦吊云杉内部遗传分化程度很高,分布于四川一带的与分布于西藏、云南一带的有明显的隔离分化[26]。另外,有相关调查记载油麦吊云杉在西藏错那县有分布,《西藏植物志》也有记载[27],但在第二次全国重点保护野生植物资源调查西藏自治区的调查中未发现错那县有油麦吊云杉分布,错那县分布的应为林芝云杉(P.likiangensisvar.linzhiensis),与油麦吊云杉区别在于叶背面无白色气孔带。本次预测得到的油麦吊云杉适生区亦无错那县,进一步验证了预测的准确性。
此外,现地调查油麦吊云杉分布区域基本处于本次预测的油麦吊云杉高适生区范围内。本次预测的油麦吊云杉高适生区未实地调查确认,因其分布区域主要为雅鲁藏布大峡谷国家级自然保护区(墨脱县境内),该区域山高谷深、坡险路陡,为无法到达的“无人区”;还有就是西藏自治区察隅县和墨脱县实控线附近及实控线以外的区域,只能通过推测完善其分布信息,摸清这些无法到达的区域内油麦吊云杉资源分布情况显然是十分必要的。
通过MaxEnt生态位模型结合气候、土壤等环境变量进行分析,比较准确地掌握了西藏自治区油麦吊云杉资源分布情况,补充以前的空缺,同时探明油麦吊云杉对相关环境变量的响应特点,为下一步油麦吊云杉资源的保护与利用提供科学依据。