基于Maxent模型对尼泊尔芒适生区时空分布的预测
2020-05-18李世成易自力廖剑锋肖亮
李世成,易自力,廖剑锋,肖亮
(湖南农业大学生物科学技术学院,湖南 长沙 410128)
尼泊尔芒为多年生禾本科芒属植物[1],分布于中国的西藏中部、云南西北部和四川西部等海拔高度为1 900~2 800 m的山坡或河谷漫滩草地[2]。尼泊尔芒具有多种经济价值,可用于能源、饲料、水土保持和园林造景等[3–4],也可为芒属其他种的遗传改良提供优良遗传资源[5]。为开发和利用尼泊尔芒,本课题组曾将其引种到湖南农业大学芒属植物资源圃内,但发现种植于该资源圃内的尼泊尔芒在自然条件下逐渐消亡,推测可能是由于气候原因造成的。查阅相关文献发现,目前对尼泊尔芒的研究仅局限于系统分类和地理分布[5–7],少有利用物种分布模型对其主导环境因子和具体适生区分布相关方面的研究。本研究中,利用 Maxent模型对尼泊尔芒适生区分布进行了研究,以期为尼泊尔芒的引种和资源保护提供理论依据。
Maxent模型是一种以最大熵原理和机器学习为基础的物种分布模型,它可以通过机器学习的方法,根据物种分布记录和环境变量图层对物种的适生区进行模拟预测[8–9]。因Maxent模型具有操作简易、预测效果好[10–11]等优点,在物种分布研究领域得到了广泛应用。另外,利用 Maxent模型所构建的模型能够转移到不同时期或地理空间中,可为预测物种其他时期的适生区分布[12]和评估物种入侵风险[13]提供工具。但当 Maxent模型转移到非模拟情景时,其默认设置可能会导致模型过拟合[14],影响预测结果。对此,MUSCARELLA等[15]基于R语言开发了ENMeval数据包,可优化Maxent模型默认参数的设置,以平衡模型的拟合度和复杂度。
本研究中,通过ENMeval数据包对Maxent模型进行了优化,利用优化后的 Maxent模型对现代尼泊尔芒的适生区进行了预测。根据贡献率、置换重要性和Jackknife检验对限制尼泊尔芒适生区分布的主导气候因子进行综合评估,以期为科学地引种尼泊尔芒提供依据,并对末次冰盛期、全新世中期和未来(2061~2080年)3个时期的尼泊尔芒适生区加以预测,与现代适生区的分布进行对比,以期了解限制现代尼泊尔芒在不同地点分布的主导气候因子。
1 材料与方法
1.1 物种分布数据的获取与处理
通过查阅全球生物多样性信息网(https://www.gbif.org/)、中国数字植物标本馆平台(http://www.cvh.ac.cn/)、Kingdonia(http://kun.kingdonia.org/)、中国国家标本平台(http://www.nsii.org.cn/2017/home.php)等网站,获得 60个尼泊尔芒分布点和研究范围内作为背景点的2 709个禾本科植物的分布点,采用区块法将60个尼泊尔芒分布点划分为3个训练集和1个测试集。
1.2 气候变量的获取与筛选
末次冰盛期、全新世中期、现代(1970~2000年)和未来(2061~2080年)的气候数据均来自于Worldclim(http://www.worldclim.org/),每个时期的气候数据包括19个生物气候变量,空间分辨率为5弧分;通过ArcGIS对19个生物气候变量图层进行剪裁。利用19个生物气候变量在Maxent中建模,根据各个生物气候变量的贡献率和其在SPSS软件中的相关性分析结果[16],最终筛选出9个生物气候变量(表1), 作为预测尼泊尔芒适生区的环境变量。
表1 气候变量及其重要性参数Table 1 Environmental variables and corresponding important parameters
1.3 模型的建立与评估
利用ENMeval数据包对Maxent模型的设置参数中的调控倍频(regularization multiplier,RM)和特征组合(feature combination,FC)进行优化,设置RM的变化范围为0.5~4.0,每次增加0.5;FC选取6种组合,分别为L、LQ、H、LQH、LQHP和LQHPT,其中L为线性(linear),Q为二次型(quadratic),H为片段化(hinge),P为乘积型(product),T为阈值型(threshold)。运用 Akaike信息量准则(Akaike information criterion correction,AICc)评估不同参数组合的拟合度和复杂度[17];运用测试受试者工作特征曲线下的面积(area under receiver operating characteristic curve,AUCTEST)[18]评估不同参数组合的区分测试点和背景点的能力;利用训练AUC和测试AUC值之差(the difference between training and testing AUC,AUCDIFF)[18]、10%训练遗漏率(10%training omission rate,OR10)[19]与“最小训练集”遗漏率 (‘Minimum Training Presence’ omission rate ,ORMTP)[14]评估不同参数组合的拟合度,选择出最适合尼泊尔芒的参数组合。利用该参数组合在Maxent模型中进行建模和预测,采用受试者工作曲线(ROC曲线)评估模型的准确性[18]。在输出文件中,选择10次重复的平均值作为本研究的预测结果,将预测结果导入到ArcGIS中,根据Maxent模型中的逻辑输出结果(P值),参考IPCC(联合国政府间气候变化专门委员会)第5次评估报告中对可能性的表述,将整个区域划分为4个等级,分别为不适宜区(0≤P<0.3)、低适宜区(0.3≤P<0.5)、中适宜区(0.5≤P<0.7)和高适宜区(0.7≤P≤1.0)。
1.4 多元环境相似度面和最不相似变量分析
采用多元环境相似度面和最不相似变量对不同时期的气候差异和引起尼泊尔芒适生区发生变化的主要气候变量进行探讨。根据多元环境相似度面计算不同情景中的环境变量与参考图层中环境变量的相似度(similarity,S),当S值为正值时,S值越小,表示该点的环境变量与参考图层的差异越大,S值为100时表示不存在差异;当S值为负值时,表示该点至少有1个环境变量的数值超出了参考图层的范围[20]。本研究中,以中国境内 N16.3°~35.6°,E80.3°~122.5°的主导气候变量为参考图层,采用Maxent模型中的density.tools.Novel工具进行分析。
2 结果与分析
2.1 模型的优化与准确性评价
通过ENMeval建立的48种不同Maxent参数设置组合的ΔAICc(delta AICc)值如图1所示。在默认情况下,60个尼泊尔芒分布点的默认设置参数RM=1,FC选取LQH,其ΔAICc值为60.08。ΔAICc值远大于 2,表明基于默认参数条件下建立的Maxent模型是不可靠的,要选择其他的设置参数进行建模。在 48种参数组合中,ΔAICc<2的参数组合共有3组,分别为:RM=2,FC选取LQH;RM=2.5,FC选取LQH和RM=3,FC选取LQH。它们的ΔAICc分别为0、0.12和0.17,3组参数组合的ΔAICc都在接受范围内,其复杂度和拟合度均较低,具有较高的可靠性。进一步对ENMeval生成的其他评估指标进行比较,结果(表2)发现:当RM=3,FC选取LQH时,其 AUCDIFF、ORMTP和 OR10值均低于其他2个参数组合的值,表明RM=3,FC选取LQH的拟合度小于其他 2个参数组合的,并且其AUCTEST的值更高,表明其能更好地区分测试分布点和背景点,因此,以RM=3,FC选取LQH作为最终的设置参数。在该设置参数条件下,Maxent模型模拟尼泊尔芒适生区的训练AUC值为(0.966±0.003),测试AUC值为(0.963±0.028),表明模型预测结果准确,可用于对尼泊尔芒适生区的预测。
图1 不同设置参数下的Maxent模型的ΔAICcFig.1 ΔAICc of Maxent models under different setting parameters
表2 ΔAICc<2的参数设置下的Maxent模型评估结果Table 2 Evaluation results of Maxent model under settings which is less than 2
2.2 主导气候变量及其适宜区间
根据气候变量对Maxent模型的贡献率(表1),共有5个气候变量对模型的贡献率大于5%,分别为 bio12、bio4、bio10、bio6和 bio7,其累计贡献率达96.5%,其中bio6和bio7的置换重要性较高,二者累计置换重要性达95.2%。为了减少气候变量之间的影响,以进一步解释哪些气候变量在模型中是最重要的,对 9个气候变量的重要性进行Jackknife法检测(图2)。仅单独使用气候变量时, 正则化训练增益、测试增益和AUC值较高的3个气候变量均为 bio4、bio7和 bio12;在使用正则化训练增益的Jackknife中,单独使用bio10时,几乎没有任何增益,表明它对预测尼泊尔芒适生区的帮助很小;在使用除bio6以外的气候变量时,正则化训练增益下降的最多,表明它对训练数据有更好的匹配性,具有较多其他变量中不存在的信息;在使用测试增益和AUC值的Jackknife中,使用除bio7以外的气候变量增益下降的最多,这与bio6和bio7的置换重要性结果相一致。综上所述,bio4、bio6、bio7和bio12是影响尼泊尔芒分布的主导气候变量。根据 Maxent模型中生成的响应曲线,按照逻辑值大于0.5的范围,划分出气候变量的适宜区间(表1)。4个主导气候变量bio4、bio6、bio7和bio12的适宜区间分别为 2.61~5.75 °C,–5.43~3.71 °C,18.72~27.00 °C 和 864.58~1 468.75 mm。
图2 Maxent模型中气候变量重要性的Jackknife检测结果Fig.2 Jackknife test result of climatic variables importance in Maxent model
2.3 尼泊尔芒的现代适生区
60个尼泊尔芒分布点中属于高适宜区、中适宜区、低适宜区和不适宜区的比例分别为 13.33%、61.67%、16.67%和8.33%(图3),预测结果与其分布数据基本一致,表明了预测结果的准确性和Maxent模型对评价尼泊尔芒适生区的实用性。尼泊尔芒在中国的现代适生区总面积约为60.92万km2,其中高适宜区的面积为6.08万km2,占适生区总面积的9.98%。尼泊尔芒的中、高适宜区主要分布于中国的西藏东部、四川南部、贵州西部和云南大部分地区,涵盖了东亚植物区的8个亚地区和古热带植物区中的2个亚地区。这些区域多以河谷以及高原和山地为主,海拔高度差异大,局部气候比较复杂,分布有大量孑遗物种并常为孤立类型,具有热带、亚热带植物区系的特征。
2.4 尼泊尔芒适生区时空变化分析
末次冰盛期到全新世中期期间,尼泊尔芒适生区大面积消失,适生区面积减少了29.34%,表现为东海和南海沿海区域内的适生区消失,内陆适生区的向内收缩。全新世中期到现代期间,两者适生区轮廓和面积基本相似,但现代的高适宜区面积与全新世中期相比增加了43.51%,主要表现为云南省内的高适宜区向四周扩散。与现代相比,尼泊尔芒适生区在未来气候变暖的情景(RCP8.5)下可能会整体北移,海南省和台湾省内的适生区消失,云南省南部的适生区破碎化,湖北省将成为新的适生区,适生区面积与现代的相比会略有增加,大约增加了5.50%,其中高适宜区面积约增加了3.18万km2。
图3 尼泊尔芒的现代分布点(黑色点)和不同时期适生区Fig.3 Extant occurrence points (black dots) and suitable areas of M.nepalensis during different periods
2.5 多元环境相似度面和最不相似变量分析
3个时期与现代的多元环境相似度面和最不相似变量如图4所示。末次冰盛期、全新世中期和未来适生区内的多元环境相似度分别为(25.94%±19.57%)、(28.78%±20.48%)和(27.05%±15.91%),末次冰盛期适生区内的主导气候变量与现代的差异最大。末次冰盛期所特有的适生区内的相似度为(35.26%±22.60%),其在东海和南海沿海适生区内的相似度较低,该区域内的最不相似变量主要为bio12,内陆适生区内的相似度较高,该区域内的最不相似变量主要为bio7;全新世中期所特有的适生区内的相似度为(35.90%±23.72%),除 bio7外的 3个主导气候变量均占据了一定区域内的最不相似变量;未来所特有的适生区内的相似度为(41.08%±13.54%),该区域内的最不相似变量主要为 bio4。现代与末次冰盛期和全新世中期相比,特有适生区位置相似,相似度分别为(45.95%±19.10%)和(54.98%±13.84%),主要的最不相似变量均为bio4,现代与未来相比的特有适生区范围最大,相似度为(11.70%±8.09%),最不相似变量主要为bio4和bio6。
3 结论与讨论
Maxent模型的默认设置参数源于对6个不同地理区域中266个物种的测试[21],在为多个物种同时构建模型时能够较好地辨别物种的存在概率,但当研究只集中于某一特定物种时,以默认设置参数构建的模型可能不是最优的[22],可能会造成模型的拟合度和复杂度过高;因此,需要根据所研究物种调整设置参数。本研究中,利用ENMeval数据包计算了多个评估指标,发现默认设置参数的ΔAICc值远远大于 2,如果继续采用默认参数,则会降低模型转移能力[23],进而降低预测结果的准确度,而设置参数组合(RM=3,FC选取LQH)不仅复杂度和拟合度低,且能较好地区分测试分布点和背景点;因此,选取了此参数组合,基于它所构建的模型转移能力强,能更准确地预测不同时期的尼泊尔芒适生区。
图4 尼泊尔芒不同时期的多元环境相似度面(MESS)和最不相似变量(MoD)Fig.4 Multivariate environmental similarity surface and most dissimilar variable analysis for M.nepalensis during different periods
在利用Maxent模型对物种适生区进行预测时,常用 19个生物气候变量作为环境因子,但是它们之间存在着高度的相关性,使得模型用于转移时变得不稳定[24];因此,在建模前需要对其进行适当的筛选,这不仅可以降低共线性和过拟合的风险,而且也可以使模型简化和更易解释。本研究中,综合分析了每个气候变量的贡献率、置换重要性和Jackknife后,发现温度季节性标准差、最冷月最低温度、年温度变化范围和年降水量是影响尼泊尔芒分布的主导气候因子。利用多元环境相似度面和最不相似变量分析后发现,在末次冰盛期,尼泊尔芒适生区内的4个主导气候因子与现代的差异最大,未来次之,全新世中期与现代最为接近。
末次冰盛期的气候与现代的反差极大,尼泊尔芒的适生区面积在该时期最大,中国这一时期的温度比现代低 5~11°C,降水量是现代的 30%~80%[25]。尼泊尔芒作为一种适应于极端或特殊低温和干旱的植物,末次冰盛期的低温和降雨量可能会增加尼泊尔芒的适生区面积。相对于现代,末次冰盛期时的夏季风降水和夏季风降水强度平均减幅分别为25.1%和14.3%[26],海平面比现代的低100~150 m,台湾和海南都与大陆相连[25],这可能是尼泊尔芒在广东省、福建省、海南省以及台湾大面积出现适生区的原因。全新世中期是历史上最近的一个暖期,Maxent模型预测结果表明,该时期的尼泊尔芒适生区面积和轮廓与现代相似,没有明显的移动趋势,这可能是因为全新世中期的气候特征与现代十分相似[27],所以对尼泊尔芒适生区的面积和轮廓影响不大。在未来气候变暖的情景(RCP8.5)下,Maxent模型预测的尼泊尔芒适生区可能会整体北移,海南省和台湾的适生区消失,云南省南部的适生区呈破碎化。综合4个时期的适生区发现,尼泊尔芒在喜马拉雅—横断山脉的适生区变化不大,可为尼泊尔芒提供长久的气候避难所,这应该与该地区第四纪以来相对稳定的气候环境和复杂的地形地貌有关。另外,预测结果表明,湖南省属于尼泊尔芒的不适宜区,与之前作出的尼泊尔芒在引种湖南省后于自然条件下逐渐消亡是由于气候原因造成的推测相一致。