最大熵模型在植物适生区预测应用中的研究进展
2022-11-22欧阳泽怡欧阳硕龙吴际友周志春李志辉董帅昌
欧阳泽怡, 欧阳硕龙, 吴际友, 周志春, 李志辉, 董帅昌
(1.湖南省植物园, 湖南 长沙 410116; 2.中南林业科技大学, 湖南 长沙 410004; 3.湖南省林业科学院,湖南 长沙 410004; 4.中国林业科学研究院亚热带林业研究所, 浙江 富阳 311400; 5.湖南省青羊湖国有林场, 湖南 宁乡 410627)
物种分布模型(Species Distribution Model, SDM)是一种基于物种的分布数据及可能与其相关的环境因子数据,依据分布点所在的环境信息评估物种的生存需求,再投影到选定的研究范围内,从而推断物种适宜生境分布的数学模型[1-3]。作为生物地理学研究的重要方法之一,物种分布模型在国内外各研究领域得到了广泛的应用。针对不同的建模目的、物种生态位特征以及建模数据基础,研究者建立了不同算法的模型,例如广义线性模型(Generalized Linear Model, GLM)[4]、Gower距离(DOMAIN)[5]以及最大熵模型(Maximum Entropy Model, Maxent)等[6],在未来气候对物种分布的影响、野生动植物保护、病虫害防治、入侵物种监测、物种适宜性分析等研究领域中起着重要的作用[7]。
本文对2006年最大熵模型建立以来该模型在植物适生区预测中的应用研究进行了总结,综述了该模型在保护生物学、入侵生物学、亲缘地理学以及植物地理学等方面的应用,以期对今后的植物科学研究以及该模型的发展提供参考。
1 最大熵模型简介
最大熵模型是由Phillips S.J.等人提出的最大熵理论[8](在已知条件下,熵最大的事物接近该事物最真实的状态)的基础上利用Java语言编写的物种分布模型,该模型通过结合物种已知的地理分布信息(经、纬度数据)和相应的环境因子数据,将研究区域内物种分布点所在的气候数值与该区域的其他地区的气候数值进行相似度比较,从而预测该区域内物种可能分布的范围及其适生度[6]。相较于生态位模型(Bioclim)、域模型(Domain)等模型,最大熵模型的预测不仅更加准确,还有可同时使用连续型和分类型数据、其算法可保证模型收敛至最优分布概率、可利用1-正则化来避免模型的过度拟合等优点。
最大熵模型中的固有模块可以用来绘制受试者工作特征曲线(Receiver operating characteristic, ROC),并计算出曲线与横坐标围成的面积值(AUC, Area under Curve),从而对模型的准确度进行评估。AUC值的范围在0和1之间,其值越大,模拟的精度越高。通常认为:AUC值为0.5~0.7时模型准确度较低,在0.7~0.9时模型准确度为中等,0.9以上准确度非常好[9]。
2 最大熵模型模拟过的植物
目前利用最大熵模型进行适生区预测的植物涉及154个科,共1051个种,其中有一些文献存在同时对多个物种进行模拟的现象,这些物种也一并统计在内。进行适生区预测的植物主要集中在蔷薇科(Rosaceae)、松科(Pinaceae)、豆科(Fabaceae)、禾本科(Poaceae)、菊科(Compositae)以及壳斗科(Fagaceae),与郭飞龙等[10]所统计的结果大致相符。但是,随着模型研究的增多,各科被模拟物种的数量也随之增加,其中物种数量最多的为松科和蔷薇科,模拟过的植物分别为73种和69种,各约占总数的7.0%和6.6%;其次为豆科,63种,占6.0%;占总数3.0%以上的科有禾本科(52种,5.0%)、菊科(47种,4.0%)、壳斗科(33种,3.0%)。被模拟的植物主要包括濒危植物如红豆杉(Taxuschinensis)、独叶草(Kingdoniauniflora)、崖柏(Cupressaceae)等;药用植物如川续断(Dipsacusasper)、宁夏枸杞(Lyciumbarbarum)等;入侵植物如黄顶菊(Flaveriabidentis)、草胡椒(Peperomiapellucida)、飞机草(Eupatoriumodoratum)等。
3 最大熵模型的应用领域
3.1 最大熵模型在保护生物学领域的研究进展
利用最大熵模型在不同尺度对濒危植物潜在分布区进行预测,在此基础上为濒危珍稀物种提供相应的保护措施,已成为保护生物学研究的热点[11]。植物的生存状态受气候的变化影响。研究表明,在未来气候变暖背景下,植物面临灭绝的风险将逐渐升高,群落组成与结构、植被格局及生态系统功能将受到影响[12]。结合当前气候和不同的未来气候情景,利用最大熵模型对珍稀濒危植物的适宜分布区及其动态变化进行分析,有助于这些植物的保护与经营管理。龚维等[13]利用19个气候因子研究了珍稀植物伯乐树(Bretschneiderasinensis)在我国的潜在适生区,结果表明伯乐树的适生区主要位于华南地区,常见于海拔500~2000m的山地常绿阔叶林、常绿针叶林和落叶阔叶林。李安等[14]结合气候数据和地形(海拔、坡度、坡向)数据对极小种群太行花属(Taihangia)植物在中国的适生区进行了模拟,认为在未来气候条件下,该范围内太行花属植物的适生区呈现先增多后变少的趋势。龚晔等[15]研究发现,除气候变化外,植物的生存状态还受人类干扰、遗传等因素影响。针对某种资源植物尤其是药用植物的采伐往往会导致该类植物的濒危。
3.2 最大熵模型在入侵生物学领域的研究进展
随着全球化的发展,外来生物入侵的问题日益加剧,对各国的生态环境、农业发展影响重大,针对当前的生物入侵状况,我国已采取制度建设、调查监测、综合防控以及科技支撑等一系列相关的防控措施[16]。其中,基于入侵生物适生性风险区的预测,制定相应的潜在入侵物种的检测监测技术是阻碍有害生物入侵的最佳办法[17]。目前,已对常见的入侵植物如加拿大一枝黄花(Solidagocanadensis)[18]、空心莲子草(Alternantheraphiloxeroides)[19]、飞机草(Eupatoriumodoratum)[20]、肿柄菊(Tithoniadiversifolia)[21]等的适生区进行了预测,并提供了合理的防治措施。
雷军成等[22]结合入侵植物假高粱的生态学特性,应用最大熵模型对其在中国的潜在分布进行预测,发现假高粱在我国的适生区广泛,几乎覆盖除青藏高原和东北北部以外的所有地区。小蓬草(Conyzacanadensis)是起源于北美的一种菊科(Compositae)植物,目前已入侵中国的台湾、四川及重庆等地,YAN等[23]对其在中国潜在入侵区域进行了模拟,结果显示小蓬草在中国的适生区范围为91.9—124.7°E、18.1—40.8°N,其中高适生区主要分布于海南、台湾以及广东南部。
3.3 最大熵模型在亲缘地理学领域的研究进展
亲缘地理学主要研究具有亲缘关系的种内与种间的支系,旨在解决形成现有的地理分布格局的机制、过程和历史原因并推测冰期避难所[24]。近年来,地理信息系统以及物种分布模型在亲缘地理学中发挥了重要作用,于海彬等[25]基于长花马先蒿(Pedicularislongiflora)叶绿体基因变异的单倍型空间分布格局, 模拟了长花马先蒿的两条迁移路线,其中一条主要沿雅鲁藏布江河谷地带向高原西部进行扩散,到达西藏阿里地区的狮泉河流域;另一条沿喜马拉雅山脉北坡向西扩散至西藏珠峰地区,并与前一路线在此汇合。刘想等[26]利用ArcGIS与MaxEnt模型对檫木(Sassafrastzumu)末次盛冰期的避难所进行了推测,结果显示檫木在末次盛冰期的适生区主要分布于横断山脉、武夷山、天目山以及大巴山,这些地区地形复杂多样,存在不同且独立的小生境,可作为生物的避难所以应对冰期带来的影响。此外,结合物种分布模型,探讨影响物种分布的生态因子,分析种内或种间独特的生态位特征,可从生理生态基础上阐明物种的形成机制,为物种的界定提供了一条途径[7]。王婧如等[27]应用Maxent模型对我国特有同倍体杂交树种紫果云杉(Piceapurpurea)开展的研究结果表明,高土壤湿度和冬季低温是紫果云杉与青杄(Piceawilsonii)和丽江云杉(Picealikiangensis)2个亲本种之间产生生态位分化的主要因子,而在未来气候情境下,紫果云杉分布区将由青藏高原东南部边缘向内部扩张。
3.4 最大熵模型在植物地理学领域的研究进展
植物地理学,又称地植物学,是研究植被的空间分布规律的学科。它研究植被的组分、性质的分布类型,及其形成的原因、动态以及实践中的应用等。未来气候变化会影响植物的分布格局,通常认为在未来全球变暖的情境下,植物的分布范围会随着全球气温的升高而移向高纬度高海拔地区,研究气候变化下植物的适生区分布,对物种分布格局形成机制、植物迁移的预测以及制定物种保护措施具有非常重要的意义[28]。第三纪孑遗植物沙冬青(Ammopiptanthusmongolicus)是良好的防风固沙物种,探究沙冬青在未来气候变化下的适生区变化,可为以后荒漠地区的治理提供参考;其模拟结果显示在未来30年里,沙冬青的适生区面积将增加,适生区总体呈向新疆东部迁移趋势,因此对该地区进行生态修复时可优先考虑该物种[29]。赵金鹏等[30]对软枣猕猴桃(Actinidiaarguta)在我国的适生区动态变化进行了分析,结果显示,软枣猕猴桃的适生区质心在RCP2.6和RCP4.5情境下,高适生区和总适生区中心到 2070s 将向东北移动;在RCP8.5情境其高适生区质心向东北移动,总适生区中心将向东南移动。
此外,气候变化还会通过影响传粉者与植物之间的关系而改变植物的分布[31]。余元钧等[32]应用包括MaxEnt在内的4种模型预测了大黄花虾脊兰(Calanthesieboldii)和其传粉者黄胸木蜂(Xylocopaappendiculata)等在未来气候变化下的分布格局,结果显示大黄花虾脊兰与其传粉者共同分布的面积在未来会有所缩减。
3.5 最大熵模型在资源植物繁育领域的研究进展
随着经济的发展和人口的快速增长,市场对果实、野菜、药材、纤维植物以及木材等资源植物的需求日益增高,一些稀有的野生植物资源如五味子(Schisandrachinensis)[33]、桃儿七(Sinopodophyllumhexandrum)[34]、细辛属(Asarum)植物[35]等因无法满足人们的需求而转向大面积的人工种植。应用物种分布模型预测植物的适宜生境,对资源植物的种植、栽培及管理有指导意义。为更好地在最适宜潜在分布区指导开展川贝母(Fritillariacirrhosa)野生抚育和种植区划等工作,王娟娟等[36]除了对川贝母的适生区进行了预测外,还分析了影响其生长的环境因子,结果显示川贝母的适生区集中分布在四川西南、云南西北部和西藏东南部,海拔2500~3500m、年均降水量850~950mm、1月份最低温度-3.5~4.7℃和土壤偏酸性(pH=6.66)是川贝母最适宜生长的环境参数。胡秀等[37]预测了经济用材檀香(Santalumalbum)在我国的适生区,其中高适生等级(>0.8)区域分布主要由广东汕尾向东直至福建惠安县的沿海地区,以及传统认为的海南西部的丘陵山地、广东的雷州半岛。野生蔬菜鸭儿芹(Cryptotaeniajaponica)原产于东亚及北美温带地区,对其进行引种驯化可获得巨大的经济价值。孙兵等[38]应用最大熵模型对鸭儿芹在中国的适生区进行了预测,结果显示鸭儿芹在浙江省的栽培适宜性最高,其次为湖南省和江西省。
4 小结与建议
4.1 最大熵模型应用中存在的问题
虽然最大熵模型模拟物种适生区的应用起步较晚,但在近十年来发展迅速,在保护生物学、生态学以及繁育管理等研究领域得到了广泛应用。其中,植物适生区预测的研究发展尤为迅速。然而,大量的植物适生区预测势必导致物种重复模拟的现象。例如张童等[39]以及赵金鹏等[30]均利用最大熵模型对软枣猕猴桃在中国的适生区进行了分析,前者采用了79个软枣猕猴桃样点和气候变量、土壤变量以及地形变量3类环境因子进行模拟,后者则采用205条分布样点和月平均气象数据、生物气候数据以及海拔数据3类环境数据进行模拟,从软枣猕猴桃的分布预测来看,二者预测的范围大致相符,主要分布于我国的华北南部、华东北部和南部、西南西部及华南北部等地;但从影响软枣猕猴桃的环境变量来看,前者认为最湿季度降水量、年均温、最冷季度降水量和海拔是影响猕猴桃分布的主要因子,而后者则认为7月降水量、4月均温、温度季节性变化标准差、3月均温、最暖季降水量和海拔等因子对猕猴桃的生长至关重要。本文统计了利用最大熵模型进行过适生区模拟的植物,并分析了被模拟物种所处的系统地位,虽然难免有遗漏,但对总体结论不会产生显著影响。大量的植物物种适生区模拟研究表明物种生态位模型已被广大研究人员认可,成为自然科学研究领域内不可或缺的一部分,但在模型的研究与应用中仍存在一些问题。首先,是所用数据的准确性和时效性。一是模型预测研究所用到的物种分布信息多来自于各大标本平台收录的标本采集信息,许多采集信息往往只有模糊的采集地,而没有精确的经纬度信息,通过经纬度拾取系统得到的经纬度信息存在一定的误差,可能会对模型预测的结果产生一些影响,且采用年代久远的标本上的采集信息也容易导致研究结果存在误差。通过文献分析可以看出,物种分布研究所用的环境数据多来源于世界气候数据库的19个生物气候因子以及地形因子,前者数量虽多,但均由简单的温度和水分因子所衍生而来,存在一定的局限性。此外,这些环境因子多为21世纪初期的气候观测数据,然而近20年来气候已发生较大变化,以前的数据已不够准确。其次,是模型参数的设置。相比于其他模型,最大熵模型操作界面简单友好,使得研究人员能很快地掌握其操作,但是该模型在参数设置上没有固定的标准,对于没有生态学背景的研究人员而言只能单纯地仿照他人文献中的模拟参数,因而容易导致模型的滥用。最后,是模型预测的实际应用。物种分布研究多停留在理论指导层面,而实际应用则相对短缺。
4.2 建议
笔者建议:第一,应增强数据的准确性、时效性以及多元化,针对物种分布信息,应尽可能的采用实地考察信息,或者采用较新的物种标本信息,同时还需考虑多个标本数据库,以验证数据的真实性。针对环境数据,除了全球环境数据外还需要结合本土的实时观测数据,以确保研究的准确性。植物生长受多种生态因子综合作用,不应仅局限于水、热条件,还需考虑土壤、植被覆盖、地形、廊道中断以及人为活动等因素;第二,在模拟植物适生区时,应对研究对象有充分的认识,同时还需要对模型的原理有充分理解,以设置最好的模拟参数,得出最佳的模拟效果;第三,应当秉承理论与实践并行的理念,让模拟的结果参与到具体实践中,以发挥物种分布模型的价值。