物种分布模型的研究进展与展望
2022-02-26吴艳王洪峰穆立蔷
吴艳,王洪峰,穆立蔷
物种分布模型的研究进展与展望
吴艳,王洪峰,穆立蔷
(东北林业大学 林学院,黑龙江 哈尔滨 150036)
物种分布模型是当前生态学领域十分热点的研究方向,自生态位的概念提出后,物种分布模型也随之产生.从最初仅依赖专家学者的经验探究物种分布和环境关系,到随着计算机技术与物种分布背后生态学理论的并行发展,出现了各种基于不同理论的物种分布模型.近年来,物种分布模型已经成为解决濒危物种保护,外来生物入侵风险评估,病虫害防治等多个领域研究中各种问题的重要工具.阐述了物种分布模型的背后理论,介绍了主流的物种分布模型与其实际应用,总结了现有物种分布模型的缺点,并对物种分布模型后续发展提出了展望.
物种分布模型;生态位理论;适生区预测
物种分布模型(Species Distribution Model,SDM)又称生态位模型(Ecological Niche Model,ENM)或物种栖息地模型(Species Habitat Model)[1].由于不同研究者对其研究目的的不同,故产生了不同的名称,本文均以物种分布模型代指.物种分布模型是将目标物种的分布情况和该物种所在地的相关环境因子通过算法关联起来推算物种分布所需的生态要求,并将运算结果投射到未来特定时空条件下预测某地区物种潜在分布情况的模型[2].
1 生态位理论的起源与发展
物种分布模型立足于生态位原理[3].生态位最初由Grinnell[4]提出,Grineell将生态位定义为一个能同时满足物种自身生存且后代能够繁衍的状态下所需要的所有条件的和,即现在通常解释为的空间生态位.而后,Elton[5]又提出了功能生态位的概念,即一个物种在其所处的群落中的功能地位.此后,生态位概念在不同学者的研究中越来越完善,Hutchinson[6]整理了前人的观点,以数学角度提出了著名的超体积生态位,即在多个环境因子所定义的多维空间内能维持稳定的种群状况的超体积(Hyper-volume).Hutchinson认为Grinnell的生态位概念更偏重于物种与环境(生物与非生物因子)的关系,Elton的生态位概念更偏重于物种本身在群落中扮演的角色.在此基础上,Hutchinson又进一步定义了基础生态位(无其它物种竞争下能维持物种本身生存的环境因子条件)以及现实生态位(除环境因子外将物种自身与其它物种的种间关系也考虑进去后,能够维持生存与繁殖的所有条件).基于此,Soberón[7]等提出了影响生态位变化从而影响物种分布的因素有4种:(1)该时空下的气候、土壤情况、地形地势等非生物因素;(2)与物种间的营养关系以及相互作用,包括捕食、竞争、互利共生等生物因素;(3)该物种在原生境受威胁后的迁移能力与扩散能力;(4)该物种进入到新的环境后,为了适应新环境的进化能力,该能力在一般情况下影响力并不明显,但当生境变化较大时,该因素将会是非常重要的因素.从宏观角度来看,这些因素当中影响力最强的是非生物因素(气候等环境因素),因其制约了物种对该生境的生理适应能力及对不同生境的响应,因此很大程度上也决定了该物种在世界范围内的分布格局和分布范围.而非生物因素中影响力最大的是气候因素,这对物种的影响最为直接.
2 物种分布模型
2.1 物种分布模型的发展
从现有文献看,最早探究物种分布和气候之间关系的例子出现于1924年,Johnston预测了一种仙人掌在澳大利亚的入侵风险.Hittinka在1963年评估了影响几种欧洲物种分布的主要气候因素[8].1977年,Nix和他的合作者开始了对物种分布建模的尝试,1986年,第一个广泛使用的SDMs模型——BIOCLIM模型诞生[9],此后的30年,随着计算机和统计科学的并行发展,越来越多的物种分布模型相继出现.近年来,物种分布模型已经成为解决生态学、生物地理学、保护生物学和气候变化等研究中各种问题的重要工具[10].
2.2 物种分布模型介绍
2.2.1最大熵模型(MaxEnt)MaxEnt模型是以最大熵理论为依据构建的一种物种分布模型[11].该模型将物种已知的实际分布情况与对应环境变量结合,根据同一物种所需生长气候相似的原理依据,推算在一定的生态位约束条件下,物种分布规律的最理想状态,即达到熵最大时物种在预测地区的可能分布情况.在众多物种分布模型中,最大熵模型对样本量少、地理范围小、环境耐受能力有限的物种也具有准确率较高的预测结果[12].因此,MaxEnt模型被广泛应用于各种分布数据少、分布范围狭窄的珍稀濒危物种的潜在分布区预测.
2.2.2生物气候分析系统(BIOCLIM)BIOCLIM模型是最早诞生的物种分布模型[13],它的应用原理是通过数字高程模型(DEM)将已知的物种分布区中所含的限制环境因子从地理层面提炼,并与物种已知的分布区进行对比,得到一个研究物种的多维生物气候包络[14],并将该物种所需的环境条件投射到其他物种未知分布的区域,以得到未知区域是否适合物种分布的预测结果.虽然BIOCLIM模型创建较早,但它的算法简单,预测效果良好,操作简便,因此至今仍然被运用于各种物种分布的预测中.但由于该模型将不同的环境变量看成独立的个体,而实际上,不同环境因子之间往往存在关联,故该模型的预测结果会出现一定程度的偏差,且样本量小时该模型的预测精度并不高.
2.2.3生态位因子分析模型(ENFA)ENFA模型是比较了物种分布所需要的生态位与整个研究区域的总环境因子的均值以及方差,通过这种比较计算出物种分布的适宜性以及影响物种分布的环境因子[15].由此可以看出,ENFA模型受物种已知分布点特征的影响较大,因此它的预测结果具有较高的生态学意义,但同样精度较低,且无法分类变量.
2.2.4分类与回归树模型(CART)CART模型可用于创建分类树与回归树,二者的区别在于回归树的预测结果是根据叶子节点的中位数或均值来决定的[16],分类树的预测结果是根据叶节点的类别概率最大决定的.在模拟物种分布中,将物种分布样本的各变量极值作为叶节点而进行分割,由此可知该模型的预测结果不易受到少数特别的分布数据点的影响.同样的,其缺点在于预测结果与生态学理论联系不大,生态学意义不高.
2.2.5广义线性模型(GLM)与广义相加模型(GAM)GLM模型是线性模型的一种拓展,它克服了线性模型对于残差服从正态分布的要求但仍需服从其它指数分布族[17],在物种分布预测方面,它的预测结果代表了物种在多维环境因子空间中的一个响应曲面,即物种分布点数量越多预测结果越合理.与它相比,GAM模型可应用于因变量和自变量不呈线性关系时,即GAM模型具有更广的适用性.但二者均受样本量影响较大,且无法处理分类变量.
2.2.6遗传算法模型(GARP)GARP模型可以看做是一种规则集的生成[18-19],在物种分布预测中则代表物种的地理分布数据与环境变量数据结合运行后的规则集合.通过反复运行的过程最终确定规则的最大参数,即形成适合物种分布的区域预测.GARP模型是在多类规则下产出运行结果的,这代表了不同规则间的互补能很好地提高它的模型预测结果精度,且在样本量充足的情况下过拟合的现象会降低.
2.2.7贝叶斯网络模型(BN)贝叶斯网络形式上是一个有向无环图[20],在这个有向无环图中,结点表示随机变量,结点之间的边表示了节点与节点之间的条件依存关系,这种依存关系也可以看做为概率关系.在物种分布模型中,这种概率关系既可以由实际物种分布数据得到也可以由专家经验得到,这表明该种模型在生态学意义上有较高体现.但同样的,在缺乏足够的样本量数据或专家经验不足时,该模型的精度会大大降低.
除此之外,还有结合物种分布数据与专家前人的经历经验的模糊物元模型(FME)、模糊神经网络模型(FNN),这类模型可以建立更为复杂的模型[21].但同时因为由专家经验建模而主观性过高,且在针对不同的对象建模时需要采用额外的数据补充.
2.3 物种分布模型在实际研究中的应用
自物种分布模型问世以来,各生态学领域学者都对其表现出极大的热情,物种分布模型也被广泛应用于生物入侵风险评估、病虫害防治、濒危物种保护、物种与气候环境间关系分析等方面.在生物入侵风险评估方面,胥勇[22]等利用BIOCLIM模型评估了松材线虫传入云南的风险,王奕晨[23]等运用GARP模型预测分析了福寿螺在中国的潜在适生区.在病虫害防治方面,基于BIOCLIM模型,黄芳[24-25]等预测了绿圆跳虫、石蒜绵粉蚧在中国的适生区,徐家文[26]等分析了扶桑绵粉蚧在中国的适生性.韩雨昊[27]等利用GART算法对虫害进行了预测分析.在濒危物种保护方面,邹丽丽[28]利用GARP模型预测了湿地水鸟的空间分布;利用MaxEnt模型,李一琳[29]等对濒危物种褐马鸡进行了保护空缺分析,塔旗[30]等对中华穿山甲的潜在适生区进行了预测.在物种与气候环境关系研究方面,GLM与GAM 2种模型应用较多,朱源[31]等人论述了GLM模型和GAM模型在植物种与环境关系研究中的应用,武亚苹[32]对吉尔伯特群岛海域中黄鳍金枪鱼的栖息地综合指数进行了分析,郑波[33]等研究了东黄海鲐渔场与环境因子的分析,李增光[34]分析了南黄海帆张网的主要渔获物分布等.
2.4 物种分布模型在实际研究中的评价
物种分布模型在被广泛应用于生态学中各物种分布预测的同时,还有不少生态学者对不同模型的表现进行了横向对比和评价.曹铭昌[35]等利用中国15个树种的地理分布数据,对比分析了GLM模型、GAM模型、CART模型各自的优缺点,通过表现结果,他认为这3种模型均有比较不错的表现,且其中GAM模型的预测结果最好.左闻韵[36]等利用20种杜鹃花属中国特有种为检验对象比较SVM(支持向量机模型)与GARP 2种模型性能,最终认为SVM模型解决了“高维小样本”的物种分布预测难题,且无论在计算速度还是在预测效果上SVM模型都远优于GARP模型.Elith[37]等使用了不同的物种分布模型对来自全球6个地区的226种物种分布数据进行预测和模拟,在其结论中,MaxEnt模型表现最佳.通过预测结果对比,GLM模型、GAM模型、GARP模型表现结果虽次于MaxEnt模型,但也均有不错的预测结果.Tsoar[38]等使用4种模型共模拟了42种以色列蛇类、鸟类和蝙蝠类物种的分布情况.通过对比,他认为其中表现较好的是GARP模型和MD模型(马氏距离模型),表现相对较差的是DOMAIN模型(领域模型)和ENFA模型.
3 物种分布模型展望
物种分布模型的出现对生态学是一个巨大的里程碑,因为无论是生物入侵、病虫害防治、还是濒危物种保护,都需要掌握该物种的分布情况,但人为采集这些分布数据常有物种分布范围广、数量多导致工作量大或物种分布范围狭窄,野外生境难以到达,工作开展艰难等情况.合理运用物种分布模型可以高效快速地判断出物种的潜在分布区,以便于下一步防治或保护政策的制定.同时也能根据该类模型,基于未来时空的环境因子预判该物种未来的分布情况,提前制定相应的保护或防治计划,更大程度地维持物种丰富度.
目前看来,没有任何一种模型可以被称之为“万金油”模型,现有的物种分布模型只能处理部分特定案例,每个模型都有各自擅长与不擅长的地方.
在理论方面,有些模型仅依赖于专家经验,导致其预测结果虽然有较高的生态学意义,但具有很大的主观性,如BN模型,FME模型,FNN模型等.而有些模型仅依赖于算法逻辑而对生态学意义并没有很好的诠释,在生态学上还需谨慎对待使用,如BIOCLIM模型、GLM模型、GAM模型等.还有些模型受样本的质量和数量影响较大,在样本所代表的环境特征不明显或样本量小时容易产生预测结果不佳的情况,如ENFA模型、BIOCLIM模型、GLM模型、GAM模型、GARP模型等.即使是目前公认的受样本量影响小,预测结果较好的MaxEnt模型,也有预测结果容易过拟合的缺点存在.除模型的欠缺外,在实际操作方面,很多学者在使用物种分布模型时对其背后的生态学理论和算法的理解并不透彻,既不明白为什么选用某一种物种分布模型,也不了解模型的算法与参数设定,单纯套用软件和默认参数,所得结果并不能很好解释实际上物种分布的真实情况.且物种分布模型对环境因素的选取要与研究物种的特性相结合,各类环境因子和分布数据如不筛选可能会出现过拟合现象.此外,我国的物种分布模型研究在物种分布数据和环境数据的来源上都有所欠缺,很多学者所依赖的GBIF数据平台关于中国的物种分布信息非常少且更新缓慢,Worldclim的全球气候数据对国内研究也有着种类单一、精度不足的问题.而国内各气象数据平台虽然可以获取更精准的环境气象数据,但往往格式难以统一,需要研究人员手动二次加工,加大了工作难度.
总的来说,物种分布模型是热点研究方向但尚未成熟,在未来的研究中,我国学者应该建立更完善的物种分布信息和环境数据的大数据平台,随时更新新的物种分布信息,方便研究者的相关研究.与此同时,研究者应该更好地结合理论与实际,考虑加入生物因子影响(如竞争、捕食等)以及物种自身的迁入迁出能力与适应新环境的能力.在使用物种分布模型预测分布区时,要更加深入系统地学习不同模型背后的算法与理论支撑,考虑同一软件下不同参数的调整以及不同的软件处理同一个物种的分布预测,结合分析考虑最好的分析结果.如果有可能,也希望研究者自己建立算法与生态学理论连接更紧密,受限更小且预测结果更好的新物种分布模型.
[1] Jane Elith,John R Leathwick.Species Distribution Models:Ecological Explanation and Prediction Across Space and Time[J].Annual Review of Ecology,Evolution,and Systematics,2009,40(1):21.
[2] Dyderski Marcin K,Paź Sonia,Frelich Lee E,et al.How much does climate change threaten European forest tree species distributions?[J].Global change biology,2018,24(3):14.
[3] Guisan Antoine,Thuiller Wilfried.Predicting species distribution:offering more than simple habitat models[J].Ecology Letters,2005,8(9):993-1009.
[4] Grinnell Joseph.The Niche-Relationships of the California Thrasher[J].The Auk,1917,34(4):427-433.
[5] Elton C S.Animal ecology[M].London:Sidgwick and Jackson,1927:63-68.
[6] Hutchinson G E.Concluding remarks-cold spring harbor symposia on quantitative biology.Reprinted in 1991:classics in theoretical biology[J].Bulletin of Mathematical Biology,1957,53(1507):193-213.
[7] Soberón J,Peterson A T.Interpretation of Models of Fundamental Ecological Niches and Species′ Distributional Areas[J].Biodiversity Informatics,2005,2:1-10.
[8] Pearson R G,Dawson T P,Berry P M,et al.SPECIES:A Spatial Evaluation of Climate Impact on the Envelope of Species[J].Ecol Model,2002,154(3):289-300.
[9] Busby J R.BIOCLIM:A bioclimate analysis and prediction system[M].Melbourne:Plant Protection Quarterly,1991,6:64-68.
[10] Kevin J Gaston.Species-range-size distributions:patterns,mechanisms and implications[J].Trends in Ecology & Evolution,1996,11(5):197-201.
[11] 邢丁亮,郝占庆.最大熵原理及其在生态学研究中的应用[J].生物多样性,2011,19(3):295-302.
[12] 甘桂春,邹亚,刘郁林,等.利用最大熵模型预测贵州省南方红豆杉潜在适宜区[J].内蒙古林业调查设计,2021,44(5):67-71.
[13] 王一凯,张蒙蒙,段卫虎,等.基于BIOCLIM模型的元江干热河谷稀树灌木草丛空间分布研究[J].绿色科技,2015(3):1-3.
[14] 邵慧,田佳倩,郭柯,等.样本容量和物种特征对BIOCLIM模型模拟物种分布准确度的影响:以12个中国特有落叶栎树种为例[J].植物生态学报,2009,33(5):870-877.
[15] 杨瑞,张雅林,冯纪年.利用ENFA生态位模型分析玉带凤蝶和箭环蝶异地放飞的适生性[J].昆虫学报,2008(3):290-297.
[16] 邓镇坤,张鹏林.基于CART决策树的黄河源区域生态地类的遥感解译研究[J].黑龙江农业科学,2022(2):24-29,35.
[17] 任学敏.太白山主要植物群落数量分类及其物种组成和丰富度的环境解释[D].咸阳:西北农林科技大学,2012.
[18] 李红梅,韩红香,薛大勇.利用GARP生态位模型预测日本松干蚧在中国的地理分布[J].昆虫学报,2005,48(1):95-100.
[19] 曹向锋,钱国良,胡白石,等.采用生态位模型预测黄顶菊在中国的潜在适生区[J].应用生态学报,2010,21(12):3063-3069.
[20] 毛亚娟.基于贝叶斯网络的濒危植物生境适宜性评价[D].西安:陕西师范大学,2016.
[21] 郭彦龙,赵泽芳,乔慧捷,等.物种分布模型面临的挑战与发展趋势[J].地球科学进展,2020,35(12):1292-1305.
[22] 胥勇,周平阳,王扬,等.应用BIOCLIM生态位模型对松材线虫传入云南的风险评估[J].云南农业大学学报,2008(6):746-753.
[23] 王奕晨,郑鹏,潘文斌.运用GARP生态位模型预测福寿螺在中国的潜在适生区[J].福建农林大学学报(自然科学版),2018,47(1):21-25.
[24] 黄芳,张文俊,张建成,等.基于BIOCLIM模型的绿圆跳虫在中国的适生区分析[J].浙江农业学报,2021,33(11):2098-2103.
[25] 黄芳,张文俊,张建成,等.基于BIOCLIM模型的石蒜绵粉蚧在中国的适生区分析[J].浙江农业学报,2019,31(8):1331-1336.
[26] 徐家文,史家浩,任强,等.基于BIOCLIM模型的扶桑绵粉蚧在中国的适生性分析[J].湖北农业科学,2015,54(11):2631-2633.
[27] 韩雨昊,曹丽君,王友起,等.基于决策树CART算法的虫害预测模型分析[J].现代化农业,2022(1):45-47.
[28] 邹丽丽.基于GARP生态位模型湿地水鸟空间分布模拟研究[J].湘潭大学自然科学学报,2016,38(3):118-121.
[29] 李一琳,丁长青.基于GIS和MaxEnt技术对濒危物种褐马鸡的保护空缺分析[J].北京林业大学学报,2016,38(11):34-41.
[30] 塔旗,李言阔,范文青,等.基于最大熵生态位模型的中华穿山甲潜在适宜生境预测[J].生态学报,2021,41(24):9941-9952.
[31] 朱源,康慕谊.排序和广义线性模型与广义可加模型在植物种与环境关系研究中的应用[J].生态学杂志,2005(7):807-811.
[32] 武亚苹.基于QRM、GLM和GAM的吉尔伯特群岛海域黄鳍金枪鱼栖息地综合指数比较[D].上海:上海海洋大学,2012.
[33] 郑波,陈新军,李纲.GLM和GAM模型研究东黄海鲐资源渔场与环境因子的关系[J].水产学报,2008(3):379-386.
[34] 李增光.基于GAM模型的南黄海帆张网主要渔获物分布及海州湾鱼卵、仔稚鱼集群特征的初步研究[D].青岛:中国海洋大学,2013.
[35] 曹铭昌,周广胜,翁恩生.广义模型及分类回归树在物种分布模拟中的应用与比较[J].生态学报,2005(8):2031-2040.
[36] 左闻韵,劳逆,耿玉英,等.预测物种潜在分布区:比较SVM与GARP[J].植物生态学报,2007(4):711-719.
[37] Elith J,Graham C H,Anderson R P,et al.Novel methods improve prediction of species′ distributions from occurrence data[J].Ecography,2010,29(2):129-151.
[38] Tsoar A,Allouche O,Steinitz O,et al.A comparative evaluation of presence-only methods for modelling species distribution[J].Diversity and Distributions,2007,13(4):397-405.
Research progress and prospect of species distribution models
WU Yan,WANG Hongfeng,MU Liqiang
(School of Forestry,Northeast Forestry University,Harbin 150036,China)
The species distribution model is a very hot research direction in the current ecology field.Since the concept of niche was proposed,species distribution models have also emerged.From the initial exploration of species distribution and environment only relying on the experience of experts and scholars to the parallel development of computer technology and ecological theory behind species distribution,there have been various species distribution models based on different theories.In recent years,species distribution model has become an important tool to solve various problems in the research of endangered species protection,exotic biological invasion risk assessment,pest control and other fields.Expounds the theory behind the species distribution model,introduces the mainstream species distribution model and its practical application,summarizes the shortcomings of the existing species distribution model,and puts forward the prospect for the follow-up development of the species distribution model.
species distribution model;ecological niche theory;prediction of suitable area
1007-9831(2022)05-0066-05
Q94
A
10.3969/j.issn.1007-9831.2022.05.012
2022-01-18
吴艳(1996-),女,青海西宁人,在读硕士研究生,从事资源植物保护与利用研究.E-mail:775720669@qq.com
穆立蔷(1966-),女,黑龙江宁安人,教授,博士,从事资源植物保护与利用、植物抗逆性及树种筛选研究.E-mail:mlq0417@163.com