基于MaxEnt模型和未来气候条件预测太行花属植物的适生分布区
2021-05-24高萌萌张晓华李菁博李良涛
李 安,高萌萌,陈 曦,张晓华,李菁博,李良涛
(1.河北工程大学 园林与生态工程学院,河北 邯郸 056038; 2.河北武安市林业局,河北 武安 056399; 3.北京植物园,北京 100094)
物种分布模型(Species distribution modeling,SDM)可定义为基于物种发生(Species occurrence)与环境变量之间相互关系进而预测该物种在整个生态环境中存在概率的分布模型[1]。气候、地形、土壤特征和生物之间相互作用是决定各种地理尺度上物种分布的主要因素,地理信息系统(Geographic information systems,GIS)能够将这些因素快速而直接地展现在景观尺度上,基于此,才能在生物多样性的背景下分析并预测物种的分布[2]。最大熵模型(Maximum entropy model,MaxEnt)是通过计算最大熵的概率分布来估计目标概率分布的一种机器学习模型[3],与其他模型相比,MaxEnt模型在仅需要物种分布数据的情境下依然能够获得较高的预测精度,是目前用于预测物种分布表现较理想的模型[4]。随着保护生物学、生态学、生物地理学等学科的交叉深入发展,MaxEnt模型已经在不同物种、不同时期、不同需求的情境下得到更多应用[4]。叶学敏[5]基于MaxEnt模型预测濒危物种血皮槭[Acergriseum(Franch.)Pax]的适生分布区,SEDYED等[6]利用最大熵模型预测伊朗中部在目前和未来气候条件下药用植物瑞香(DaphneodoraThunb.)的地理分布,此外,MaxEnt模型在预测入侵种香丝草[7]、濒危植物独叶草适生分布区[8]以及识别人与野猪冲突的高风险区[9]、三江源重点保护区等[10-11]方面都得到广泛应用。
太行花属是中国太行山特有属,1980年经中国科学院植物研究所俞德浚和李朝銮研究认定为蔷薇科的一个新属,因生长在太行山南麓山崖上,命名为太行花属(Taihangia)[12],该属共有原种太行花(Taihangiarupestris)和变种缘毛太行花(TaihangiarupestrisYu et Li var.ciliata),前者主要分布在河南省林州、辉县等地,后者主要分布在河北省武安市梁沟、朝阳沟等地。太行花属植物可以与固氮菌共生,这是仙女木族最重要的共有衍征,但是传统分类学因为太行花属植物的果实为瘦果将其归为蔷薇亚科,而分子研究表明,仙女木族是蔷薇科的较基部分支,因此,现阶段太行花属植物仅隶属于蔷薇科(Rosaceae),具体位置尚有争议[13]。太行花属植物是特有的古老孑遗种,现仅残存于太行山南部,已经被列入国家二级保护植物名录和世界自然保护联盟濒危物种红色名录(IUCN红色名录),是极小种群保护植物,属于极危(CR)状态[14]。由于太行花属植物自然生境范围狭窄且植株数量稀少,暂未发现国外有相关研究,国内的研究主要关注在资源分布[15-18]、生物学[19-22]、遗传多样性[23-24]、花叶解剖结构[25]、DNA分子学等[24,26-27]方面。太行花属植物既是濒危物种又是中国特有种,对于特有种的扩繁和引种一直都是保护生物学和生态学的研究重点,而作为太行山地区独特存在的物种,太行花属植物对于解译物种起源和研究系统发育也有重要的意义和价值。
物种分布会受到很多因素的影响,但所有影响因素最终都将通过环境因子直观地表达进而影响植物的生长发育,太行花属植物濒危的原因可能是其本身的生态适应性较差,但是也有可能是因为特殊生境条件阻碍了其分布和扩散[28]。另外,对于濒危物种的迁地保护更应该慎重选择。因此,对太行花属植物的潜在适生区进行模拟及识别,不仅可以明确太行花属植物的引种扩繁范围,同时也可以探明环境因子对于太行花属植物生长的合适阈值,以便后期采取有效措施进行合理管护。
1 材料和方法
1.1 太行花属植物分布数据
太行花属植物分布点数据相对较少,主要通过3种途径收集分布数据:(1)查阅有关太行花属植物的文献,包括政府网站的新闻消息,通过Google earth进行坐标拾取及校准;(2)2017—2019年连续3 a实地调查太行花属植物的分布数据;(3)通过对数字标本植物馆(Chinese virtual herbarium,CVH)以及晋冀鲁豫等地的植物标本馆进行检索。对所获得的数据进行筛选,排除错误和重复的信息。另外,由于高校和科研院所试验用植株未处于完全自然生长环境,本次模拟不予采用。最终获得太行花属植物有效分布点31处,将分布数据的经纬度统一为十进制,存储为Taihangia rupestris var.ciliata.csv文件。
1.2 地理信息与环境变量数据
地形数据来源于Google earth高程信息,空间分辨率为300 m,将数字高程模型信息(Digital elevation model,DEM)数据加载至ArcGIS中,运用3D Anlyst工具进一步解译坡度、坡向等信息,并将数据转为ASCⅡ格式。
当前生物气候变量数据及未来生物气候变量数据从全球气候数据库(WorldClim-global climate data version 1.4,http://www.worldclim.org)下载,该数据库通过收集全球范围内气象站所记录的数据,然后利用克里金插值法计算出全球范围内气候数据并予以共享,本次所用数据的空间分辨率为30″(地理空间分辨率为1 km),数据包含月平均降雨量、月最高温等在内的19个气候变量(表1)。未来生物气候变量数据采用联合国政府间气候变化专门委员会(IPCC)在2013年第5次报告会中推荐的CCSM4气候变化模型,未来气候变化情况是基于温室气体排放情况进行模拟预测,IPCC在第5次报告会中发布的新一代排放情景“典型浓度目标”(Representative concentration pathways,RCPs)较之前的情景设计更加完善与准确,又依据第21届联合国气候变化大会上通过的《巴黎协定》中各国的主要目标,即“21世纪末全球平均气温上升幅度控制在2 ℃以内,较工业革命前全球气温上升幅度不超过1.5 ℃”,只有RCP2.6碳排放模式符合要求,因此,本研究将模拟RCP2.6情境下太行花属植物适生区分布范围。将WorldClim数据库下载的生物气候变量数据加载ArcGIS中,提取中国范围内环境数据,并将数据转为ASCⅡ格式。
表1 物种分布模型的22个环境变量Tab.1 22 climate variables in SDMs
1.3 MaxEnt模型模拟当前太行花属植物的适生分布区
将太行花属植物分布数据、中国范围内环境变量数据和DEM 数据加载到MaxEnt软件中,开启刀切法(Jackknife)选项用于评价各环境变量的贡献率并绘制响应曲线,输出形式选择逻辑斯蒂(Logistic)形式,设置随机测试集(Random test percentage)为25%,其他选项均为默认设置。试验时间为2019年8月,试验重复10次。
在Arcmap 10.2中加载MaxEnt预测结果并进行重分类,将适生等级划分为4个级别并标记颜色,即高适生区(P≥0.75)、中适生区(0.75>P≥0.4)、低适生区(0.4>P≥0.2)、非适生区(P<0.2),得到当前太行花属植物适生分布区预测图,加载中国行政区划图(1∶400万),并运用数据框的属性列表统计太行花属植物的适生分布区及面积。
采用受试者工作特征曲线(Receiver operating characteristic curve,ROC)对模型的准确度进行评价,ROC曲线是根据一种一系列不同的二分类方式,以特异性(Specificity)为横坐标,以灵敏度(Sensitivity)为纵坐标绘制的响应曲线,ROC 曲线与横轴围成的面积为AUC值(0≤AUC≤1),AUC值越大,表明模型的预测精度越高,一般而言,AUC值小于0.7时,说明模型准确度较低,AUC值介于0.7~0.9时,表明模型准确度良好,AUC值在0.9以上时,表明模型准确度很高,模型的预测结果才有意义。
2 结果与分析
2.1 太行花属植物在中国的适生区
基于MaxEnt模型与ArcGIS地理信息系统模拟太行花属植物适生区分布范围(图1),根据物种适生区分布图可知,太行花属植物的适生区大致为E112.8°~115.3°、N33.2°~37.8°,主要分布在河北、河南和山西3个省份的交界处,即太行山南麓。
图1 中国太行花属植物适生分布区Fig.1 Suitable distribution areas of Taihangia plants in China
1)高适生区:区域面积800 km2,主要分布在河北省南部、河南省北部及西北部、山西省东北部等地,其中三省交界处是太行花属植物可能分布的热点区域(表2)。
表2 太行花属植物高适生区Tab.2 Highly suitable area of Taihangia
2)中适生区:区域面积8 977 km2,基本位于高适生区的边缘,在河北省向东延伸至内丘县,在河南省向南延伸至登封市,在山西省向西延伸至武乡县,此外在山东省的中东部、河南省的西部也有极少数分布(表3)。
3)低适生区:区域面积17 392 km2,基本位于中适生区的边缘地带,除中适生区分布的范围外,河南省的鲁山县、栾川县、南召县、西峡县、内乡县、巩县、偃师县、汝阳县、嵩县以及北京市西南部、东北部出现较小面积的低适生区。
4)非适生区:除以上3个区域,其他地区均为太行花属植物的非适生区,这里不作详细阐述。
2.2 模型的准确性
受试者工作特征曲线(图2)显示,MaxEnt模型训练集和测试集的AUC值分别为0.996、0.996,显著高于随机预测的AUC值(0.5),这说明模型拟合效果较好,预测数据可信度高。在Arcmap 10.2中加载已知分布点(图3),所有已知分布点均在适生区范围内,进一步说明模型的可靠性。
表3 太行花属植物中适生区Tab.3 Medium suitable area of Taihangia
图2 受试者工作特征曲线Fig.2 Receiver operating characteristic curve
2.3 环境变量对太行花属植物分布的影响
MaxEnt模型可以计算出不同环境变量对物种分布的影响大小(图4),降水量是主导太行花属植物分布的因素,另外最湿季度降水量(Bio_16)、年降水量(Bio_12)、温度季节性变化标准差(Bio_4)、最湿月份降水量(Bio_13)、最冷月份最低温度(Bio_6)、最暖季度降水量(Bio_18)、年均温变化范围(Bio_7)和最冷季度平均温度(Bio_11)7个环境变量对于物种的分布影响较大,降水量季变异系数(Bio_15)、最湿季度平均温度(Bio_8)、最暖月份最高温度(Bio_5)和坡向(Asp)4个变量是影响较小的因素(表4)。
图3 中国太行花属植物适生分布区(包含已知分布点)Fig.3 Suitable distribution areas of Taihangia plants in China(including known distribution points)
图4 采用刀切法检验环境变量对物种分布的影响Fig.4 Effects of environmental variables on species distribution by Jackknife test
物种响应曲线反映了环境因素与物种发生概率的关系,能够展示目标物种对环境变量的耐受性和栖息地偏好选择,为了更加直观地显示各环境变量对于太行花属植物的影响,将每一个环境变量逐一加载到MaxEnt模型中,将单因子模型的输出结果进行处理(图5),可以得到太行花属植物对于环境变量变化的相应阈值(发生概率>0.5):最湿季度降水量(Bio_16)383.35~416.67 mm,最适值为400.05 mm;年降水量(Bio_12) 607.50~712.55 mm,最适值为648.85 mm;温度季节性变化标准差(Bio_4)9 500~13 000,最适值为9 950;最湿月份降水量(Bio_13)166.67~186.67 mm,最适值为176.00 mm;最冷月份最低温度(Bio_6)-13.57~ -7.85 ℃,最适值为-12.5 ℃;最暖季度降水量(Bio_18)366.67~433.33 mm,最适值为393.33 mm;年均温变化范围(Bio_7)16.88~28.12 ℃,最适值为22.50 ℃。
表4 环境变量的训练集增益Tab.4 Regularized training set gain of environmental variables
图5 环境因子的响应曲线Fig.5 Environmental factor response curve
2.4 气候变化情景下太行花属植物分布区的变化
未来气候条件下,太行花属植物的适生分布区依然集中在河南、河北、山西三省的交界处,其他地区仅有低适生区,会有小面积的变化(图6a—d)。具体来讲,2050年代与现在相比,高适生区将增加到831.54 km2,增长3.94%;中适生区将增加到14 648.38 km2,增长63.18%;低适生区将增加到34 194.29 km2,增长96.61%。2070年代与现在相比,高适生区将减小到516.44 km2,减小35.45%;中适生区将减小到7 183.5 km2,减小19.98%;低适生区将增加到23 866.42 km2,增长37.23%。未来气候条件下,太行花属植物适生区呈现先增加后减少的趋势,2070年代,高适生区和中适生区面积将比现在减少2 077.06 km2,下降21.24%,这应当引起关注。
a—b:2050年代太行花属植物适生分布区预测;c—d:2070年代太行花属植物适生分布区预测a—b: Prediction of suitable distribution areas of Taihangia plants in the 2050s; c—d: Prediction of suitable distribution areas of Taihangia plants in the 2070s图6 中国太行花属植物未来不同时间的适生分布区Fig.6 Suitable distribution areas of Taihangia plants in China at different time in the future
3 结论与讨论
基于MaxEnt模型预测当前气候条件下太行花属植物的适生分布区,受试者工作特征曲线显示,MaxEnt模型训练集和测试集的AUC值为0.996、0.996,显著高于随机预测的AUC值(0.5),这说明模型拟合效果较好,预测数据可信度高。基于MaxEnt模型与ArcGIS地理信息系统模拟太行花属植物适生区分布范围,根据物种的分布图可知,太行花属植物的适生区大致范围为E112.8°~115.3°、N33.2°~37.8°,其中高适生区面积800 km2,主要分布在河北、河南和山西3个省份的交界处,即太行山南麓,这与武德昌等[17]预测范围基本重合。MaxEnt模型可以计算出不同环境变量对物种分布的影响大小,降水量是主导太行花属植物分布的因素,这与唐敏[28]的研究表现出一致性,另外,太行花属植物的适宜生境部分信息如下:最湿季度降水量(Bio_16)383.35~416.67 mm,最适值为400.05 mm;年降水量(Bio_12)607.50~712.55 mm,最适值为648.85 mm;温度季节性变化标准差(Bio_4)9 500~13 000,最适值为9 950;最湿月份降水量(Bio_13)166.67~186.67 mm,最适值为176.00 mm;最冷月份最低温度(Bio_6)-13.57~ -7.85 ℃,最适值为 -12.5 ℃;最暖季度降水量(Bio_18)366.67~433.33 mm,最适值为393.33 mm;年均温变化范围(Bio_7)16.88~28.12 ℃,最适值为22.50 ℃。未来气候条件下,太行花属植物的适生分布区依然集中在河南、河北、山西三省的交界处,其中高适生区呈现先增加后减少的趋势,2050年代,高适生区达到最大值831.54 km2,以后逐渐较少。
模型的模拟结果可以指导以后的实际调研方向和范围,进一步探索和发现太行花属植物的分布点;可以有针对性地进行引种扩繁,高适生区的气候条件更适合太行花属植物的生长发育;对于以上高适生区,建议有关部门给予一定的关注,有条件的地区应当组织人力物力进行合理的科学探查。另外,虽然模型模拟的结果显示太行花属植物的适生区面积达到800 km2,但是结合实际考察经验来看,其适生区面积远没有这样大。在实际调研中发现,太行花属植物生长在山崖石壁上,虽然模型模拟时考虑了坡度和坡向的影响,但是并不是每一种质地的岩石土壤都适合其生长,适合其生长的石壁上可能已经有其他物种占据了生态位优势。因此,太行花属植物的保护形势并不乐观,应该及时采取必要的措施保护这些仅有的适生区。在太行花属植物的引种扩繁过程中,应当优先考虑高适生区,可以在高适生区引种成功后,有一定经验积累的基础上,逐步向中适生区范围进行扩散,不建议在低适生区和非适生区范围内引种,但是对于已经引种到非适生区的应当严加管护和观察,太行花在中国科学院植物园已经引种成功(非适生区内),这表明太行花的适应性还是比较强的,可以进一步观察和对比其与原生境的植株在生长物候期、繁殖能力等方面的变化。此外,引种时除了考虑地区间气候条件的差异性之外,也应当注意物种的竞争关系、协同作用以及物种入侵。