APP下载

基于物种分布模型的精确采样提高目标物种发现率
——以黑颈鹤(Grusnigricollis),白头鹤(Grusmonacha)为例

2017-09-01宓春荣郭玉民HuettmannFalk韩雪松

生态学报 2017年13期
关键词:黑颈鹤物种森林

宓春荣,郭玉民,*,Huettmann Falk, 韩雪松

1 北京林业大学自然保护区学院,北京 1000832 EWHALE Lab, Department of Biology and Wildlife, Institute of Arctic Biology, University of Alaska Fairbanks (UAF), AK 99775, USA

基于物种分布模型的精确采样提高目标物种发现率
——以黑颈鹤(Grusnigricollis),白头鹤(Grusmonacha)为例

宓春荣1,郭玉民1,*,Huettmann Falk2, 韩雪松1

1 北京林业大学自然保护区学院,北京 1000832 EWHALE Lab, Department of Biology and Wildlife, Institute of Arctic Biology, University of Alaska Fairbanks (UAF), AK 99775, USA

明确野生动植物的地理分布是基础生态学和应用生态学领域的一个基础但关键的步骤,为后续分析提供了重要的信息。而野生动植物分布调查是一项需要投入大量人力,精力和资金的工作,特别是稀有物种的调查。物种分布模型越来越受到广泛引用尤其是在生物保护方面。为了证明物种分布模型在野生生物调查中精确采样方法的可行性,以全球易危物种黑颈鹤和白头鹤的实际繁殖分布预测为例,使用随机森林(Random Forest)算法加以验证。比较发现物种分布模型预测实际调查分布点,随机样方法生成的随机点,系统样方法的规则点在空间相对出现概率具有显著差异(P<0.001),实际分布点具有较高的相对出现概率。该结果表明若在物种分布相对出现概率较高区域设置样方能够减少实际调查区域,有效提高发现目标物种的概率,从而减少调查投入。基于物种分布模型的精确采样方法将有效地提高我们对稀有物种分布的了解,有利于野生动植物的保护规划。

物种分布模型;随机森林;精确采样;黑颈鹤;白头鹤

明确物种的空间分布是许多保护工作如虫害防治,保护区建设的首要工作[1]。野外调查野生物种尤其是稀有物种是一项需要投入大量人力、时间和资金的艰巨任务。使用传统样方法和样线法调查野生物种时由于其数量稀少,大多数样方内并不能找到相应物种,所以样方的设计需要和物种分布情况相适应[2];而对于某一物种分布情况的了解程度常受限于是否有专家可以咨询以及由于专家所处位置的地理限制而造成的知识偏见[3]。因此,有助于在野外快速而有效地发现特定目标物种的方法具有重要的实用价值。

物种分布模型(Species distribution models,SDMs)或生态位模型(Ecological niche models)[4],是将物种的分布信息和对应的环境变量信息依据一定的算法得出物种分布与环境变量之间的关系,并将这种关系应用于所研究的区域,进而对目标物种分布进行估计的模型[5, 6]。物种分布模型越来越成为生态学,生物地理学,保护生物学[7],影响评价[8],气候变化研究[9, 10]的一个重要研究工具。物种分布模型在生物保护方面的其中一个重要应用是为稀有和濒危物种制作空间分布图,了解这些物种在哪些区域更可能出现[11- 13]。

黑颈鹤(Grusnigricollis)是世界15种鹤类中唯一生活在高原的鹤类,被IUCN列为全球易危物种(VU)[14]。黑颈鹤是鹤科中科学纪录最晚的一个种,俄国探险家Przhevalsky于1876年在青海湖取得标本,但自此以后的100多年来,人们对黑颈鹤的状况几乎是一无所知[15]。近40年来,黑颈鹤的研究取得迅速进展, 积累了较丰富的资料。黑颈鹤目前种群数量约11000只,繁殖地点相对集中于西藏中西部、青海东部,四川北部[16],甘肃南部和北部。同时,有小部分种群分布于不丹和印度[15]。白头鹤(Grusmonacha)被IUCN列为易危物种(VU)[14],目前全球数量为11160只[17]。白头鹤繁殖于俄罗斯西伯利亚东南部以及黑龙江流域;大部分个体越冬于日本南部鹿儿岛地区,另外有少量个体越冬于韩国和我国的长江中下游地区。白头鹤的第一个繁殖巢于1974年在俄罗斯被发现[18],在我国首个白头鹤繁殖巢在1993年黑龙江小兴安岭地区的通北发现[19]。

虽然物种空间预测分布图已被应用于诸多领域,如保护区规划,但是空间预测结果的可信性尚未被野外调查真实数据充分证明。基于此,本文以易危物种黑颈鹤和白头鹤的繁殖空间分布预测为案例,采用随机森林模型算法来评估基于物种分布模型的精确采样方法的有效性和可行性。

1 材料和方法

1.1 研究区域

根据现有的黑颈鹤和白头鹤繁殖分布点,将其所在位置作为主体,再向外延伸一定距离作为研究区域,黑颈鹤研究区域为78°13′—104°54′E,25°40′—42°31′N;白头鹤研究区域为120°20′—145°55′E,43°18′—56°17′N(图1)。

图1 黑颈鹤和白头鹤研究区图,其中红点表示建立模型所用的训练点,黑点表示验证模型准确度的验证点Fig.1 The study area of Black-necked Crane and Hooded Crane. Red dots display the Training samples used to construct species distribution models, black dots display the Test samples used to evaluate model accuracy

1.2 物种数据

在2002—2014年间,通过收集文献资料和当地居民提供的黑颈鹤信息,借助高倍望远镜辅以实地地毯式调查。记录观察点经纬度,黑颈鹤距观察点的角度和距离,然后确定黑颈鹤出现位置经纬度信息,共收集到黑颈鹤繁殖点58个,在本研究中作为黑颈鹤模型的训练点;调查范围包括甘肃、青海和四川三省,基本涵盖已知的黑颈鹤所有繁殖分布区。2014年在西藏南部的定结定日县湿地发现17个黑颈鹤繁殖点,系为首次调查发现[20],将其作为黑颈鹤模型验证点。2002—2014年期间运用黑颈鹤调查相同方法在中国境内共发现白头鹤繁殖巢33个,本研究中作为白头鹤模型训练点;这些点涵盖已知的国内所有繁殖分布区。2014年利用GPS-GSM卫星跟踪器对白头鹤跟踪。繁殖期间个体移动速度为0的跟踪点大量聚集(>200)在一个半径为2—3km的区域,则将该区域中心经纬度作为繁殖点。以此在俄罗斯境内共发现繁殖点12个,在本研究中作为白头鹤模型的验证点(图1)。

1.3 环境变量

选取了21个分辨率为30弧秒的环境变量作为模型自变量,包括4个地形地理变量(海拔、坡度、坡向、离海岸线距离),2个水源变量(离河流距离、离湖泊距离),3个人为干扰变量(离公路距离、离铁路距离、离居民点距离),1个土地覆盖因子,11个生物环境气候变量(表1)。

1.4 模型建立

本研究选择随机森林(Random Forest[21])作为物种分布模型算法。选择随机森林模型是基于其出色的预测能力和被研究人员广泛应用[22- 24]。随机森林是一种相对新颖的机器学习方法,属于组合模型(Ensemble models)的一种。其基本算法思想是:假设建模人知道单个分类树的构建,随机森林通过自举法(bootstrap)随机选择变量生长成分类“树”,每棵树都会完整生长而不作修剪(pruning)。并且在生成树的时候,每个节点的变量都仅由随机选出的几个变量中产生[25]。一般情况下,随机森林随机地生成几百个至几千个分类树,然后选择重复程度最高的树作为分类和回归的最终结果[26]。随机森林能够得到很高的预测准确性而不产生过拟合现象[21, 27],然而这点尚有争议[26, 28]。本研究使用Salford Predictive Modeler (SPM)软件中的Random Forest 算法构造模型及分布于预测。SPM软件对随机森林模型进行了内部优化[29]。

表1 环境变量图层描述

分别在黑颈鹤和白头鹤的研究区内生成10000个“伪不存在 (Pseudo-absence)”点。用Geospatial Modeling Environment(GME)软件分别为两个物种的分布点和“伪不存在点”提取21个环境变量信息,然后用Salford Predictive Modeler (SPM) 软件建立预测模型。模型设置1 000棵树,权重为平衡(Balance),其他设置选择默认[10]。

为了进行空间预测,用GME软件分别在黑颈鹤和白头鹤研究区域内生成5 km×5 km规则格网点(regular points),同时提取经纬度和21个环境变量信息。使用SPM软件将之前生成的黑颈鹤和白头鹤模型文件预测每个格网点的适宜分布指数,然后在ArcGIS 10.1中使用反距离加权方法(Inverse Distance Weighted, IDW)插值得到预测图。

1.5 模型验证和分析

本研究使用AUC(area under the curve of receiver operator characteristic (ROC) curves)值[30-31]来评价模型,因为AUC值不受阈值的影响,而被广泛的应用于物种分布模型的评价[32- 34]。AUC 评价模型的标准[30]是:极好,0.90—1.00;好,0.80—0.90;一般,0.70—0.80;差,0.60—0.70;失败,0.50—0.60。使用SPM软件分别计算黑颈鹤和白头鹤验证点和在研究区域内生成的100个随机点的相对出现概率,然后利用R软件的SDMTools包计算AUC值。此外,为了比较基于物种分布模型进行采样设计的方法与传统取样方法的差异,在黑颈鹤和白头鹤的研究区内分别生成50 km×50 km的格网点用来模拟系统采样,并比较验证点,100个随机点(模拟随机采样)和规则点的相对出现概率。

2 结果分析

2.1 AUC模型评价结果

黑颈鹤模型的AUC值为0.74,白头鹤模型的AUC值为0.75。根据Swets[24]和Allouche等[35]的分级,模型准确度属于一般等级(Fair)。

2.2 模型准确性空间分析

图2展示了黑颈鹤和白头鹤的预测分布图。从图中可以看到验证点很好地叠加在预测到的适宜分布区范围内。尤其是白头鹤验证点很好的覆盖在狭长的高适宜分布区域内。比较验证点,随机点和规则点所在位置的相对出现概率值 (图3),发现验证点的出现概率要远高于随机点和规则点,方差分析表明具有显著差异(P<0.001)。

图2 黑颈鹤预测图和白头鹤预测图Fig.2 Prediction maps of two cranes. prediction map of Black-necked Crane and prediction map of Hooded Crane其中红点表示建立模型所用的训练点,黑点表示验证模型准确度的验证点

图3 黑颈鹤和白头鹤随机点,规则点和验证点比较的箱线图Fig.3 Boxplots of Random points and Regular points versus Testing points for Black-necked Cranes and Hooded Cranes

3 讨论和结论

本研究结果表明利用物种分布模型预测到黑颈鹤和白头鹤实际分布点验证点的物种相对出现概率要高于传统的随机采样方法,系统采样方法设计的采样点的出现概率,并具有显著差异(P<0.001)。说明物种分布模型具有很好的识别物种真实分布的能力。借助于物种分布模型将物种出现概率高的区域作为实际需要调查区域,将大大缩小实际需要调查的区域,进而提高了调查效率[36],从而减少调查投入,为野外调查提供了一个有效而可靠的工具。

以往研究中对物种分布模型或生态位模型的验证往往是从总体样本中选取部分样本用于验证[10, 25, 37],而本研究的验证数据与训练数据来源不同,并不是从总体中选取部分,且大都位于训练数据围成的不规则区域外,距离远于训练数据内部距离。与来源于与训练数据同一数据集的部分样本来评价模型的方法相比更为客观,对模型验证更具有说服力,虽然模型准确度系数会相对偏低。

本研究的研究对象为黑颈鹤和白头鹤繁殖分布预测,黑颈鹤和白头鹤分别在高原湿地和森林沼泽区域繁殖,环境差异大。在2002—2014年间共调查得到75个黑颈鹤繁殖点和45个白头鹤繁殖点,数据获取困难。所建模型基于的样本数分别为58个和33个,属于小样本模型,但是对实际调查所获得的验证数据仍具有很好的预测能力。说明利用物种分布模型方法对濒危物种和分布数据难以获取(如偏远区域和难以到达区域,像本研究的两个例子)的物种的调查以及保护规划将起到巨大作用。

本文只选取随机森林算法作为物种分布模型,这是因为在前期工作中发现相较于TreeNet (Stochastic Gradient Boosting[38]), CART (Classification and Regression Tree[39]), Maxent (Maximum Entropy Models[40])和4种模型的组合模型, 随机森林模型对小样本具有更好的预测能力。不同物种的生活环境不同,异质性不同,不同物种的空间预测基于的基础单元(grid)是否也需不同,以及环境变量不同需要在未来继续研究。本研究的结论有助于物种分布模型方法在实际保护规划和物种调查中尤其是濒危物种的应用。

[1] Le Lay G, Engler R, Franc E, Guisan, A. Prospective sampling based on model ensembles improves the detection of rare species. Ecography, 2010, 33(6): 1015- 1027.

[2] Yoccoz N G, Nichols J D, Boulinier T. Monitoring of biological diversity in space and time. Trends in Ecology & Evolution, 2001, 16(8): 446- 453.

[3] Murray J V, Goldizen A W, O′Leary R A, McAlpine C A, Possingham H P, Choy S L. How useful is expert opinion for predicting the distribution of a species within and beyond the region of expertise? A case study using brush-tailed rock-wallabiesPetrogalepenicillata. Journal of Applied Ecology, 2009, 46(4): 842- 851.

[4] 朱耿平, 刘强, 高玉葆. 提高生态位模型转移能力来模拟入侵物种的潜在分布. 生物多样性, 2014,. 22(2): 223- 230.

[5] 李国庆, 刘长成, 刘玉国, 杨军, 张新时, 郭柯. 物种分布模型理论研究进展. 生态学报, 2013, 33(16): 4827- 4835.

[6] 许仲林, 彭焕华, 彭守璋., 物种分布模型的发展及评价方法. 生态学报, 2015,. 35(2): 557- 567.

[7] Guisan A, Tingley R, Baumgartner JB, Naujokaitis-Lewis I, Sutcliffe PR, Tulloch AI, Regan TJ, Brotons L, McDonald-Madden E, Mantyka-Pringle C, Martin T G, Rhodes J R, Maggini R, Setterfield S A, Elith J, Schwartz M W, Wintle B A, Broennimann O, Austin M, Ferrier S, Kearney M R, Possingham H P, Buckley Y M. Predicting species distributions for conservation decisions. Ecology Letters, 2013, 16(12): 1424- 1435.

[8] Humphries G R W, Huettmann F. Putting models to a good use: a rapid assessment of Arctic seabird biodiversity indicates potential conflicts with shipping lanes and human activity. Diversity and Distributions, 2014, 20(4): 478- 490.

[9] Zhang L, Liu S R, Sun P S, Wang T L. Comparative evaluation of multiple models of the effects of climate change on the potential distribution of Pinus massoniana. Chinese Journal of Plant Ecology, 2011, 35(11): 1091- 1105.

[10] Mi C R, Huettmann F, Guo Y M. Climate envelope predictions indicate an enlarged suitable wintering distribution for Great Bustards (Otistardadybowskii) in China for the 21st century. PeerJ, 2016, 4: e1630

[11] Griffin S C, Walker B L, Hart M M. Using GIS to guide field surveys for timberline sparrows in northwestern Montana. Northwest Science, 2003, 77(1): 54- 63.

[12] Aitken M, Roberts D W, Shultz L M. Modeling distributions of rare plants in the Great Basin, western North America. Western North American Naturalist, 2007, 67(1): 26- 38.

[13] Edwards Jr T C, Cutler D R, Zimmermann N E, Geiser L, Alegria J. Model-based stratifications for enhancing the detection of rare ecological events. Ecology, 2005, 86(5): 1081- 1090.

[14] IUCN. IUCN Red List of Threatened Species Version 2013. 2013. http://www.iucnredlist.org.

[15] 李来兴. 黑颈鹤(Grusnigricollus)种群生态及濒危等级评估. 生物多样性, 1997, 5(2): 84- 89.

[16] Harris J, Mirande C. A global overview of cranes: status, threats and conservation priorities. Chinese Birds, 2013, 4(3): 189- 209.

[17] Birdlife International. IUCN Red List for birds. 2014. http://www.birdlife.org

[18] Meine C D, Archibald G W. The Cranes: Status Survey and Conservation Action Plan. Gland, Switzerland: IUCN,1996.

[19] 李林. 我国首次发现白头鹤繁殖地. 野生动物, 1993, (5): 16- 16.

[20] Han X S, Guo Y M, Wen L J, Mi C R. New Black-necked Crane Grus nigricollis subpopulation recorded in southern Tibet, China. Forktail, 2015, 31: 116- 118.

[21] Breiman L. Random forests. Machine learning, 2001, 45(1): 5- 32.

[22] Elith J, Graham C H, Anderson R P, Dudík M, Ferrier S, Guisan A, Hijmans R J, Huettmann F, Leathwick J R, Lehmann A, Li J, Lohmann L G, Loiselle B A, Manion G, Moritz C, Nakamura M, Nakazawa Y, Overton J M M, Peterson A T, Phillips S J, Richardson K, Scachetti-Pereira R, Schapire R E, Soberón J, Williams S, Wisz M S, Zimmermann N E. Novel methods improve prediction of species′ distributions from occurrence data. Ecography, 2006, 29(2): 129- 151.

[23] Mi C R, Huettmann F, Guo Y M. Obtaining the best possible predictions of habitat selection for wintering Great Bustards in Cangzhou, Hebei Province with rapid machine learning analysis. Chinese Science Bulletin, 2014, 59(32): 4323- 4331.

[24] 翟天庆, 李欣海. 用组合模型综合比较的方法分析气候变化对朱鹮潜在生境的影响. 生态学报, 2012, 32(8): 2361- 2370.

[25] 张雷, 王琳琳, 张旭东, 刘世荣, 孙鹏森, 王同立. 随机森林算法基本思想及其在生态学中的应用——以云南松分布模拟为例. 生态学报, 2014, 34(3): 650- 659.

[26] 李欣海. 随机森林模型在分类与回归分析中的应用. 应用昆虫学报, 2013, 50(4): 1190- 1197.

[27] Prasad A M, Iverson L R, Liaw A. Newer classification and regression tree techniques: bagging and random forests for ecological prediction. Ecosystems, 2006, 9(2): 181- 99.

[28] Elith J,Graham C H. Do they? How do they? WHY do they differ? On finding reasons for differing performances of species distribution models. Ecography, 2009, 32(1): 66- 77.

[29] Herrick K A, Huettmann F, Lindgren M A. A global model of avian influenza prediction in wild birds: the importance of northern regions. Veterinary Research, 2013, 44: 42- 42.

[30] Swets J A. Measuring the accuracy of diagnostic systems. Science, 1988, 240(4857): 1285- 1293.

[31] Fielding A H, Bell J F. A review of methods for the assessment of prediction errors in conservation presence/absence models. Environmental conservation, 1997, 24(1): 38- 49.

[32] Manel S, Williams H C, Ormerod S J. Evaluating presence-absence models in ecology: the need to account for prevalence. Journal of applied Ecology, 2001, 38(5): 921- 931.

[33] McPherson J, Jetz W, Rogers D J. The effects of species′ range sizes on the accuracy of distribution models: ecological phenomenon or statistical artefact? Journal of applied ecology, 2004, 41(5): 811- 823.

[34] 黄建, Huettmann F, 郭玉民. 黑龙江流域白头鹤繁殖栖息地选择模型预测. 北京林业大学学报, 2015, 37(8): 40- 47.

[35] Allouche O, Tsoar A, Kadmon R. Assessing the accuracy of species distribution models: prevalence, kappa and the true skill statistic (TSS). Journal of Applied Ecology, 2006, 43(6): 1223- 1232.

[36] Guisan A, Broennimann O, Engler R, Vust M, Yoccoz N G, Lehmann A, Zimmermann N E. Using niche-based models to improve the sampling of rare species. Conservation Biology, 2006, 20(2): 501- 511.

[37] 王琦, 魏宇昆, 黄艳波. 中国弧隔鼠尾草亚属(唇形科)的分布格局. 生态学报, 2015, 35(5): 1470- 1479.

[38] Friedman J H. Stochastic gradient boosting. Computational Statistics & Data Analysis, 2002, 38(4): 367- 378.

[39] Breiman L, Friedman J, Stone C J, Olshen R A. Classification and Regression Trees, New York: Chapman and Hall/CRC, 1984.

[40] Phillips S J, Dudík M, Schapire R E. A maximum entropy approach to species distribution modeling // Proceedings of the 21st International Conference on Machine Learning. New York: ACM, 2004.

Species distribution model sampling contributes to the identification of target species: take Black-necked Crane and Hooded Crane as two cases the model-based sampling approach could help to reduce areas to be investigated and it can find target species more effectively re. cost and effort

MI Chunrong1, GUO Yumin1,*, HUETTMANN Falk2, HAN Xuesong1

1 College of Nature Conservation, Beijing Forestry University, Beijing 100083, China2 EWHALE Lab, Department of Biology and Wildlife, Institute of Arctic Biology, University of Alaska Fairbanks (UAF), AK 99775, USA

The identification of the geographic distribution of wildlife is fundamental in applied ecology, since it provides important information for subsequent analyses. However, the investigation of wildlife is often expensive and time consuming, especially for rare species and when using inefficient sampling designs. To determine target species more efficiently, we tried to apply model-based sampling using predictions from species distribution models (SDMs). We used black-necked (Grusnigricollis) and hooded (Grusmonacha) cranes as two examples, and used the Random Forest algorithm combining the breeding location and environmental information to model the breeding geographic distribution of the two crane species. We extracted the relative index of occurrence (RIO) for the breeding locations (testing points, model-based sampling method), random point locations (random sampling method), and regular point locations (regular sampling method) from the prediction map. Then, we used boxplots and ANOVA to analyze these data; the results indicated breeding locations with higher RIOs, and a significant difference was found between the other two methods. Therefore, the model-based sampling method helped to reduce the size of the investigated areas and determine target species more effectively. To conclude, a species distribution model-based sampling method for fieldwork would help to increase our knowledge of rare species distributions. More generally, we recommend using this approach to support conservation plans.

species distribution model (SDM); Random Forest; sampling method; black-necked crane; hooded crane

国家自然科学基金(31570532)

2016- 02- 02; 网络出版日期:2017- 02- 23

10.5846/stxb201602020243

*通讯作者Corresponding author.E-mail: guoyumin@bjfu.edu.cn

宓春荣,郭玉民,Huettmann Falk, 韩雪松.基于物种分布模型的精确采样提高目标物种发现率——以黑颈鹤(Grusnigricollis),白头鹤(Grusmonacha)为例.生态学报,2017,37(13):4476- 4482.

Mi C R, Guo Y M, Huettmann Falk, Han X S.Species distribution model sampling contributes to the identification of target species: take Black-necked Crane and Hooded Crane as two cases the model-based sampling approach could help to reduce areas to be investigated and it can find target species more effectively re. cost and effort.Acta Ecologica Sinica,2017,37(13):4476- 4482.

猜你喜欢

黑颈鹤物种森林
归来吧!精灵(连载六)
归来吧!精灵(连载四)
回首2018,这些新物种值得关注
神奇的黑颈鹤
电咖再造新物种
哈Q森林
世界上的15个最不可思议的新物种
哈Q森林
哈Q森林
哈Q森林