基于优化MaxEnt模型的天女木兰在中国适生区预测
2022-08-02兰雪涵王金玲李黎明袁梦琦檀婷婷杜凤国
兰雪涵,王金玲,2*,付 聪,李黎明,袁梦琦,檀婷婷,杜凤国,3*
(1.北华大学 林学院,吉林 吉林 132013;2.西北农林科技大学 林学院,陕西 杨陵 712100;3.长白山特色森林资源保育与高效利用国家林业和草原局重点实验室,吉林 吉林 132013)
天女木兰(Magnoliasieboldii)也称天女花、山牡丹,隶属于木兰科(Magnoliaceae)木兰属(Magnolia)的落叶小乔木,为木兰科在中国分布最北的一个物种。现分布于安徽、福建、江西和吉林等12个省的中低山岭与原始林中[1-2],地理分布呈间断式。《中国物种红色名录》中被定为国家重点保护的濒危物种,亦是吉林省一级保护植物,其花、果、叶具有较高的观赏价值,其器官提取物可作高级香料。近年来,受多种人为因素干扰致使天女木兰生境遭到破坏,野生种群和个体数量呈显著下降趋势,处于濒危状态。目前,众多学者对天女木兰的研究多集中在种子休眠[3]、遗传多样性[1]、遗传结构[4]、生育力分析[5]和叶表皮微形态[6]等方面,对天女木兰适生区预测的研究尚未见报道。
MaxEnt模型自2006年开发以来,已广泛应用于濒危物种适生区的预测、未来气候变化下的物种分布预测、入侵物种监控区确定等领域[7-10],该模型对样本量要求不苟,即使小样本也具有较高精度和稳定性。基于此,本研究将MaxEnt模型、ENM Tools、R语言和地理信息系统(ArcGis)相结合,预测天女木兰在中国的适生区,为濒危植物天女木兰迁地保护引种地的选择与科学保育提供依据。
1 材料与方法
1.1 地理分布数据与处理
主要采用以下方法获取天女木兰的地理分布(经纬度)数据:1)对吉林省、贵州省、河北省、辽宁省与安徽省等7个省份的13个天女木兰种群分布地进行实地调查与测量,用GPS记录经纬度;2)通过全球生物多样性信息网络(GBIF,https://www.gbif.org)获得数据;3)检索与天女木兰相关的文献[1-2,4-5,11-13]。通过以上方法获得天女木兰42个地理分布点。为避免由于天女木兰分布点聚集导致的模型过度拟合,利用ENM Tools1.4.4软件筛选分布点数据,最后得到用于模拟天女木兰地理分布点数据为40个(表1)。
表1 天女木兰40个种群的基本信息Table 1 Basic information of 40 populations of Magnolia sieboldii in China
1.2 环境变量数据与处理
环境数据包括气候[14]、地形、陆地生态系统[15]、土壤[16]和人类活动强度[17]5类环境因子共30个环境变量,环境变量之间存在着较高的空间相关性,这些环境变量在模型预测过程中会引入更多的复杂且无用信息,为提高模型的精确性,本研究利用ENM Tools 1.4.4软件和R语言corrplot软件包对30个环境变量进行相关性分析并制图(图1),删减相关性|r|≥0.85的环境变量,余下17个环境变量用于后续的优化模拟(表2)。
表2 天女木兰分布模拟的17个环境变量Table 2 17 environmental variables for simulation of M.sieboldii distribution
注:蓝色代表正相关,红色代表负相关,颜色越深相关程度越大。图1 30个环境变量相关性分析Fig.1 Correlation analysis of 30 environmental variables
1.3 MaxEnt模型优化
利用MaxEnt模型对天女木兰在我国的适生区进行预测。将收集到的天女木兰地理分布点导入MaxEnt模型软件,75%的地理分布点用于训练集构建,25%用于测试集验证,选择刀切法创建环境变量反馈曲线,设置其训练模型所用的feature和倍频乘数。使用R语言的kuenm软件包[18]从模型的40个倍频乘数水平[0.1~4]和29种选择特征组合[L,Q,P,T,H,LQ,LP,LT,LH,QP,QT,QH,PT,PH,TH,LQP,LQT,LQH,LPT,LPH,QPT,QPH,QTH,QTH,LQPT,LQPH,LQTH,LPTH 和LQPTH]等参数设置的1 160种模型结果中进行筛选,选择delta AICc最小值作为最优设置并建立最终模型。
1.4 模型评价及适生区等级划分
通过ArcGIS 10.4的Conversion Tools-ASCII to Raster将MaxEnt运行优化参数后所得模拟结果中的asc格式文件转化成栅格数据并进行适生区划分。使用“自然间断点分级法(Jenks)”功能,划分适生级别并标注存在概率的范围:存在概率<0.07,非适生区;0.07≤存在概率<0.23,低适生区;0.23≤存在概率<0.48,中适生区;存在概率≥0.48,高适生区。统计各适生区面积并进行比较。
本研究中MaxEnt模型使用AUC评分法(ROC曲线下面积值)评估所得模型的准确性。评估标准划分为5个等级,分别为较差(AUC≤0.80)、一般(0.80 基于我国天女木兰分布点数量和相应的环境因子预测适生区,在1 160种模型结果中,筛选出在统计学上显著又满足模型遗漏率和AICc标准的组合有2种,参照Cobos的选择方法[18],选择delta AICc值最小的组合:倍频乘数为2.4和feature为LPQ。使用其组合设置使模型重复运行10次,得到重复运算AUC训练集平均值为0.963(图2),表明模型预测达到“很好”效果,说明预测结果有较高的精确度和可信度。 图2 MaxEnt模型的天女木兰预测结果ROC曲线验证Fig.2 ROC curve verification of prediction for M.sieboldii by MaxEnt model 将MaxEnt模型输出的结果导入ArcGis10.4中,采用来源于国家基础地理信息中心(http:∥www.ngcc.cn/ngcc/)的中国行政区矢量地图作为分析底图,生成天女木兰在中国的适生分布(图3)。预测结果显示,天女木兰高适生区主要包括我国的东北、华中、华南和西南等部分地区,主要分布于吉林省的通化市和吉林市,辽宁省的丹东市、抚顺市、鞍山市与大连市,安徽省的六安市、安庆市、黄山市、池州市和宣城市,浙江省的杭州市、衢州市、金华市和丽水市,福建省的南平市、三明市和宁德市,江西省的景德镇市、上饶市、鹰潭市、抚州市、南昌市、宜春市和吉安市,湖南省的张家界市、邵阳市、怀化市、益阳市、恩施土家族苗族自治州和湘西土家族苗族自治州,广西壮族自治区的桂林市、柳州市和贺州市,重庆市,四川省的成都市、乐山市、眉山市和雅安市,西藏自治区的林芝市,台湾地区等。 图3 基于MaxEnt模型预测的天女木兰在中国的适生分布Fig.3 Suitable distribution of M.sieboldii in China based on MaxEnt model 中适生区与低适生区沿高适生区周围或邻域附近分布,主要集中在黑龙江省、吉林省、辽宁省、河北省、山东省、江苏省、安徽省,浙江省、福建省、江西省、河南省、湖北省、四川省、重庆市、贵州省、台湾地区和西藏自治区等部分地区。 天女木兰在我国的高、中和低适生区面积分别为21.96、52.41×104km2和155.627×104km2,分别占我国国土面积的2.28%、5.44%和16.15%。江西省的高适生区面积最大,为6.94×104km2,辽宁省与浙江省次之,分别为4.08×104km2和2.10×104km2。天女木兰在各环境变量条件下的适生区面积预测结果见表3。 表3 天女木兰在各环境变量条件下的适生区面积预测Table 3 Predicted areas for M.sieboldii under each environmental variables condition 依据MaxEnt模型的运算结果,不同环境变量对天女木兰分布的贡献率和置换重要性见表4。由表4可见,年均温较差(bio7)和最湿季度降水量(bio16)变量的贡献率较高,分别高达38.1%和31%;最冷季度平均温度(bio11)、等温性(bio3)、最干季度降水量(bio17)、坡度(slope)、土壤酸碱度(t_ph)、平均日较差(bio2)、海拔(alt)、黏土含量(t_clay)、陆地生态系统类型(ldeco)、土壤有机碳含量(t_oc)、人类活动强度(hfp)和降水量变异系数(bio15),12个环境变量的累计贡献率合计为30.9%;而含沙量(t_sand)、碎石体积百分比(t_gravel)和坡向(aspect)环境变量对天女木兰分布的贡献微乎其微。而年均温较差(bio7)和最湿季度降水量(bio16)的置换重要性亦是较高,分别达到17.5%和62%。因此,年均温较差和最湿季度降水量环境变量在预测天女木兰在我国的地理分布中起着主导作用。 表4 MaxEnt模型中各环境变量贡献率和置换重要性Table 4 Percent contribution and permutation importance of each environmental variables in MaxEnt modeling % MaxEnt的默认参数最初是通过早期模型开发人员对6个不同地理区域的266个物种的数据进行测试而设定的。如果只使用默认参数,模型的转移将因过度拟合而精确度降低。另外,模型复杂度对物种的转移能力有重要影响[20],而有研究[21-22]表明,通过使用AICc参数和调整倍频参数可以约束MaxEnt模型的复杂度。本研究使用R语言的kuenm软件包[18]对模型40个倍频乘数水平和29种选择特征组合等参数设置的1 160种模型结果中进行筛选,在符合相应条件的组合中,选取delta AICc值最小优化设置。在重新建模后,得到天女木兰在中国的适生区预测结果,优于默认参数的预测结果。 本研究预测的高适生区主要分为2个区域:一个由东北地区的吉林省南部与辽宁省中东部组成的带状适生分布区;另一个由华东和华中地区的安徽省南部、浙江省西部、江西省中东部与福建省北部等地区组成不均匀的团块分布区。其他高适生区分布呈星点状,分布于山东省、湖北省、湖南省、四川省、广西壮族自治区与西藏自治区等地区。与孙李勇等[23]、施晓灯等[24]和翟新宇等[25]预测其他木兰科植物紫玉兰(Magnolialiliflora)、红花玉兰(Magnoliawufengensis)和鹅掌楸(Liriodendronchinense)的适生区部分地区重叠,适生区的面积及比例不尽相同,其原因可能是木兰科植物的自然种群多分布于我国华中、华东、华南和滇黔桂等地区[26],而天女木兰是木兰科在中国分布最北的物种,有较好的抗寒性,本研究中天女木兰自然种群的地理分布点中有12个位于东北地区,从而使其他木兰科树种所预测适生区范围与天女木兰的东北部适生分布区不重叠。同时,根据中国植物志和已发表的文献[5,27-28]记载,天然天女木兰种群分布于辽宁、吉林、安徽、江西、福建、广西北部及西南一些省份等地区,地理分布呈间断式,本研究结果预测的适生区分布与天女木兰实际分布重合度较高且更为广阔,可能由于自然分级法进行划分存在概率阈值所导致。 研究结果显示,气候变量中的年均温较差和最湿季度降水量环境变量的贡献率较高,置换重要性亦较高,说明这2个变量包含了其他变量不可替代的信息与重要性,因此,年均温较差和最湿季度降水量环境变量在预测天女木兰在我国的地理分布中起着主导作用。在预测其他木兰科植物研究结果显示[23-25],主导环境变量均为气候变量,气候因素亦是影响物种分布的主要非生物因素之一[29]。另外,本研究着重探讨非生物因素对天女木兰的影响,自然条件下种群分布扩增时,还受伴生物种、种间互作、种群更新和物种自身繁殖力等生物因素的影响。因此,在后续研究中应考虑其他物种等生物因素进行综合预测和分析。 年均温较差可以反映温差特点,夏季降水的增加将有益于植物的生长发育并增加大气湿度与土壤含水量[30],而大气湿度和土壤含水量对促进天女木兰种子发育具有显著影响[13]。6-8月是天女木兰开花盛期至果实成熟期的月份[31],也是种子逐渐成熟的关键时期,如果种子不成熟将影响种群更新,进而导致物种分布区扩增的能力减弱,并将进一步加剧天女木兰种群数量的减少。而天女木兰多生长于海拔400~2 100 m、夏季温暖多雨、湿润的阴坡山谷中[1,26],也进一步说明本研究结果中年均温较差和最湿季度降水量等气候因素为主导环境因素的合理性。 鉴于天女木兰为国家濒危物种,一方面,应加大宣传力度,基于天女木兰天然种群现有分布地建立保护区,实施就地保护;另一方面,全球气候变暖的情境下,多数濒危植物都将面临原始生境向高纬度或高海拔迁移,导致自然种群数量变少,在后续的研究中,建议将未来气候变化下不同情景的气候因素考虑进行预测,预测其适生区的动态变化。基于预测的高、中适生区可以作为天女木兰引种地选择的参考,进行天女木兰引种、繁育和栽培技术研究,实施迁地保护,扩大其种群数量,同时普及宣传教育,引起全社会的高度重视,加大天女木兰保护力度,加快保育这一濒危物种。2 结果与分析
2.1 模型准确性检验
2.2 适生区预测
2.3 主导环境变量的确定
3 结论与讨论