应用MaxEnt模型预测辣椒果实蝇在中国的潜在地理分布
2017-12-06吴淇铭黄可辉
黄 振,吴淇铭,2,黄可辉∗
(1.福建出入境检验检疫局,福建 福州350001;2.福建农林大学植物保护学院,福建福州350002)
应用MaxEnt模型预测辣椒果实蝇在中国的潜在地理分布
黄 振1,吴淇铭1,2,黄可辉1∗
(1.福建出入境检验检疫局,福建 福州350001;2.福建农林大学植物保护学院,福建福州350002)
采用MaxEnt模型和ArcGIS地理信息系统,将影响辣椒果实蝇生存条件因子的环境数据(降水、温度、海拔)等作为模型的变量,以现有分布区的最大相似度来预测辣椒果实蝇在中国的潜在地理分布。
辣椒果实蝇;MaxEnt模型;适生性预测;潜在地理分布
辣椒果实蝇(又名锈腹实蝇)[Bactrocera latifrons(Hendel)]隶属双翅目(Diptera)实蝇科(Tetriphitidae),是我国进境植物检疫性有害生物,目前分布于马来西亚、泰国、印度、老挝、巴基斯坦、斯里兰卡、夏威夷、菲律宾、美国等国家(黄振等,2012;黄振等,2009)。
辣椒果实蝇主要危害果蔬的果实,雌成虫将卵产入寄主果实中,幼虫直接在果实内取食,直至老熟,造成被害果实发霉腐烂。辣椒果实蝇寄主范围广,可危害辣椒、茄子、番茄、黄瓜、蛇瓜、苹果、香蕉、洋桃、咖啡、番石榴、柠檬、荔枝、杧果和甜橙等多种水果、蔬菜作物(黄振等,2010),尤其对辣椒、茄属植物的危害最严重。
辣椒果实蝇繁殖能力强,一年发生4-8代,最多11代,雌虫平均产卵量约256粒(Zigler et al.,2008),辣椒果实蝇的世代周期短,约48 d,世代重叠严重,繁殖量大(黄振等,2009),一旦传入定殖,势必对我国果蔬生产、生态环境造成严重破坏。辣椒果实蝇主要以幼虫为害果蔬,卵、幼虫可随寄主的果实作远距离传播,蛹可随果实的包装物或寄主植物所带土壤传播。
近年来,随着我国对外贸易的发展,进境水果、蔬菜的种类、数量大幅度增加,给辣椒果实蝇的传入带来潜在危险。辣椒果实蝇发育的起点温度为15.68℃,越冬可承受的最低温度为-3.7℃,越夏的最高温度达到36℃。辣椒果实蝇的寿命与环境温度密切相关,环境温度低能够延长其发育,环境温度高会加快其生长发育。因此,开展辣椒果实蝇的适生性预测,了解辣椒果实蝇的潜在分布,为严格控制辣椒果实蝇传入、扩散、蔓延、定殖、危害,确保果蔬生产安全提供科学依据。
1 材料与方法
1.1 研究对象
以辣椒果实蝇作为研究对象,预测其在中国潜在地理分布。
1.2 试验材料
1.2.1 MaxEnt预测模型 MaxEnt预测模型是一种立足于生态位理论的模型,运行时需要两组数据,一是以经纬度形式表示的目标物种的已知地理分布区域,二是目标地区和物种实际分布区的环境变量,主要是气候、植被和地貌等。再经过运算得出预测模型,模拟目标物种在目标地区可能的分布情况(曾辉等,2008)。
1.2.2 环境数据 本文所使用的MaxEnt预测模型统一由该软件的官方网站www.cs.princeton.edu/~schapire/maxent下载,版本为3.3.3k的最新版本,文中所涉及到的20个环境因子变量包括19个生物气候变量以及1个海拔变量ASCII栅格格式数据(表1),这20个环境因子变量从世界气候环境数据库下载得来,具有一定的权威性和准确性,主要是1950-2000年这50 a中的气温、降水和海拔高度。20个环境因子变量的空间分辨率包括30 s、2.5 min、5 min和10 min等几种不同精度版本(Halvorsen,2013),本文所选择的环境因子变量的空间分辨率为5 min,其分析精度足以满足适生性分析要求,可直接在MaxEnt软件中使用(陈新美等,2012)。
表1 MaxEnt模型中所用的环境变量Table 1 The environment variable used in MaxEnt model
1.2.3 ArcGIS软件与地图 ArcGIS软件采用10.0版本,软件使用的中国行政区划分图从国家地理信息系统下载,比例为1∶400万(Halvorsen,2013)。
ArcGIS软件将MaxEnt软件运算出的全球适生区预测结果按照中国行政区分图来叠加和切割,直观地呈现出研究对象在中国各个省份的适生区分布预测的情况(郭水良等,2011)。
1.2.4 软件运行的硬件环境 系统版本为Win7 Sp1 x86旗舰版,处理器为Intel(R)Core(TM)i5 CPU 750@2.67 GHz,系统内存4.00 G,32位操作系统,硬盘500 GB。
1.3 研究方法
1.3.1 获取现有地理分布信息 使用MaxEnt软件对物种进行适生区预测的基础准备就是准确找出物种的现有分布点的经纬度,对物种现有分布点的采集通常有3个途径:(1)进行野外调查以及从普查的数据中直接得出结果;(2)从物种的数据库收录的分布情况取得所需分布数据;(3)通过查阅大量国内外公开文献找出物种的经纬度和分布点,并通过经纬度查询(http://www.earthol.com/)转换得到分布点的经纬度(赵文娟,2009)。将所获得的实蝇的经纬度罗列起来,按照MaxEnt软件的要求,以物种名、分布点经度、分布点纬度顺序排好,以后缀名为.CSV的文件格式存入,其中东经和北纬的值为正,西经和南纬的值为负,建立samples数据表(孙鹏翔等,2010)。
1.3.2 MaxEnt软件的主界面运行 MaxEnt软件的运行界面如图1。运行MaxEnt模型,在“Samples”中分别导入每一种实蝇的格式为.CSV文件的分布经纬度数据库,对软件的参数设置需要依据每一种实蝇搜集到的经纬度点数的实际情况进行调整,当训练数据不少于80的时候,使用auto features选项,则所有的要素类型都将用到,而训练样本在15-79时,则使用linear,quadratic和hinge,10-14之间,则使用linear,quadratic。小于10则只使用linear。在“Enviromental layer”面板中“DirectoryFile”中点击“Browse”选择所需的空间分辨率为5 min的环境变量因子。当需要对环境影响因子进行刀切分析时,需要选择jackknife这一项,这样软件就能够分别对每一个环境影响因子进行刀切图绘出。
图1 MaxEnt软件的主页面Figure 1 Homepage of MaxEnt software
1.3.3 设置界面的选择 settings里Random test percentage一般选择25,意思是随机选取25%的分布点作为测试集,剩余的75%的分布点作为训练集,settings中replicates本试验选择3次重复作为平行试验,最大迭代次数设为500次,收敛阀值设为0.00001,取值范围0-100,其他参数均为默认值,所得到的格式为ASCII栅格的图层(刘欣,2012)。
在数据导入和参数的设置完成后,点击“run”,进行3次重复试验,三次的平行试验AUC值平均数要在0.9以上才能说明此次试验具有一定的可信度。选取重复试验中,AUC值最高的图层导入ArcGIS软件进行叠加切割。
1.3.4 ArcGIS软件的图形分析 MaxEnt软件模型运行生成栅格文件.asc,选择AUC值最高的栅格文件进行分析,按照中国行政区地图,将实蝇的中国适生区分布图从世界分布中叠加切割出来,生成以颜色来区分中国风险区类别。对于适生区分类值的选择决定了试验的结果,带有试验者一定程度的主观意向,因此能否客观合理的做出分布图十分重要,理论上,适生区的分类要依据具体的实蝇种类来进行区分,但是果实蝇属中的这几个重要种类生物学特性相近,在结合实蝇的适生性和部分的参考文献,统一将中国划分为四个风险区,0-1为无风险区,1-10为低风险区,10-30为中风险区,30-100为高风险区(褚庆全等,2003)。
1.3.5 模型精度的验证 相比于GARP模型,MaxEnt软件在进行刀切法时,不用进行手动依次忽略环境因素进行运算,软件可直接自行运算出结果。利用MaxEnt软件自带的刀切法来检验和分析每一个环境变量对此次的适生性预测的贡献程度,所谓刀切法就是每次都忽略一个环境变量,然后基于剩下的环境变量来对物种的适生区进行预测,然后有软件自带程序画出柱形图作为依据评估环境变量因子的重要性。
评估预测结果是否合理,一般采用受试者工作特征曲线(receiver operating characteristic curve,ROC)分析方法,ROC曲线是以预测出的结果的每一个值来作为可能的评判的阀值,凭借这个来得出相应的灵敏度以及特异度,ROC曲线是以假阳性率作为横坐标、以真阳性率作为纵坐标绘成的曲线,AUC的值即代表了ROC曲线下方的面积,并以AUC值的大小来评价模型诊断试验的价值。MaxEnt模型在运行过程中会自行绘制出ROC曲线,并计算出该模型的AUC值,可直接作为模型预测的评判标准(王运生等,2007;冯璐等,2013;Parker et al.,1996)。
2 结果与分析
2.1 辣椒果实蝇在中国的适生区预测
MaxEnt运行得到的B.latifrons(辣椒果实蝇)_2.asc栅格文件的预测结果导入ArcGIS软件中,用1∶400万标准中国行政区地图将中国行政区切分,所得辣椒果实蝇在中国的适生区预测图(图2),按照四类适生区指标,所得预测结果表明,辣椒果实蝇在中国的潜在分布区主要是中国的华中地区、西南地区、华南部分地区、和台湾省等地。具体分类结果如下:
无风险区(0-1,白色):新疆、甘肃大部分、宁夏、内蒙古、黑龙江、吉林、西藏大部分、四川东北部、陕西北部、山西北部、北京、河北北部、辽宁东北部、天津;
低风险区(1-10,黄色):四川西南部、甘肃南部、陕西中南部、山西南部、河北南部、辽宁西南部、江西北部、山东北部;
中风险区(10-30,紫色):云南北部、贵州北部、陕西南部、河南南部、山东南部、安徽、江苏西部、浙江南部、云南北部;
高风险区(30-100,蓝色):西藏南部、四川南部、重庆、贵州、湖南、江西、福建、广西、广东、海南、台湾。
图2 MaxEnt模型预测的辣椒果实蝇在中国潜在风险的等级分布Figure 2 Grade distribution of potential risk in China of B.latifrons predicted by MaxEnt model
2.2 辣椒果实蝇适生区预测中的刀切法分析
应用刀切法对环境影响因子进行分析,黑色条纹的长度越长,说明该变量越重要,如图3所示,对于辣椒果实蝇适生区预测影响较为显著的5个环境影响因子依次为bio18最热季度降水量、bio16最湿润季度降水量、bio13最湿润月降水量、bio12年降水量和bio7年温变化范围,而bio15降水量变化方差、bio14最干旱月降水量和bio19最冷季度降水量3个环境影响因子在此次预测中的影响极小。
2.3 MaxEnt模型精度的验证
模型的验证一般采用ROC曲线的分析方法,ROC曲线下的面积大小为AUC值,AUC值因不受阈值影响,作为常用客观的模型评价指标之一,AUC值越大,证明模型的预测准确度越高,试验结果越可靠。理论上,AUC的值在0.5-0.7时,效果较差;0.7-0.9时,效果一般;0.9以上效果较好。在对辣椒果实蝇的适生区预测效果中训练数据的AUC值是0.939,测试数据的AUC值是0.888,数据的平均AUC值是0.914,而且曲线下方面积值大(图4),表明本次试验预测是有规律的非随机性的存在,证明试验的准确性。
图3 辣椒果实蝇适生区预测中刀切法计算环境因子的贡献值Figure 3 Contribution value of environmental factor calculated by Jackknife method in suitability prediction for B.latifrons
图4 MaxEnt模型预测辣椒果实蝇的ROC曲线Figure 4 The ROC curve of B.latifrons predicted by MaxEnt model
3 小结与讨论
3.1 辣椒果实蝇一旦传入,在中国的危害风险大
根据适生区预测,由中国潜在分布图分析可知,辣椒果实蝇在东南亚均有潜在的适生区分布,且适生性指数极高,东南亚地区东临太平洋,南面印度洋,属于典型的亚热带季风气候,极利于辣椒果实蝇的生存,试验预测结果与辣椒果实蝇的生物学特性吻合。中国属于亚热带季风气候,种植茄科植物的种类多、面积大,辣椒果实蝇一旦传入,在中国的的危害风险很大。
3.2 辣椒果实蝇在中国的适生区可能将会整体向北方扩展
结合MaxEnt模型和地理信息系统GIS技术,预测分析辣椒果实蝇在中国的适生区主要在中国的南部地区,如西藏南部、四川南部、广东、福建、云南、台湾等地,这些适生区在北回归线附近,以亚热带和热带气候为主;在中国的北部地区,如东北、内蒙古、新疆等地,辣椒果实蝇的适生性指数都为零,证明这些地方的气候湿度等环境条件并不适合辣椒果实蝇的生存和繁殖。但是随着工业的飞速发展,由于CO2大量排放,大气中的CO2浓度剧增,温室效应加剧,地球的整体温度也将逐年升高,中国各个地区的气候环境等也将随之发生改变,依试验结果推测,辣椒果实蝇的适生区可能将会整体向北方扩展,未来几年后,辣椒果实蝇的适生区将比现在所预测的范围更广,因此有必要做好中风险区的检疫和防除工作。
3.3 采用MaxEnt模型进行适生性预测的局限性
本研究采用MaxEnt模型进行适生性预测,尽可能多的寻找预测对象现有分布点,样本量对于MaxEnt模型预测物种分布的精度和稳度研究,理论上样本量在120以内要尽量多。但是现有资料并不能将果实蝇的所有分布点和详细的经纬度信息都登记下来,并且试验条件有限,只有通过有限的野外调查记录、查阅检验检疫局截获的实蝇记录,从其来源地区,对所有分布点进行补充和选择,在一定程度上充实物种分布的经纬度点。
在选择现有分布点的经纬度时,一般只获得一个地名范围,而在一个省份里各个城市的气候差异明显,山区和沿海地理及气候也是明显不同,因此我们所能取到的分布点要求越精细越好。其次,在选择确切经纬度的时候,要充分考虑到这个地区是否种植着目标实蝇的寄主植物,如辣椒果实蝇分布点的选择,就应该充分考虑到辣椒等重要寄主植物的分布情况,并作为重要的依据,同时需要借助卫星地图,识别确定所选择的经纬度点是否合理,尽量避开海洋河流、人口聚集地、沙漠和高山,最好选择在辣椒果实蝇寄主植物种植的植被上。同时,在选择经纬度确切位置的时候,最好能够考虑几个已报道有该实蝇的相邻国家的接壤位置,理论上这片区域有实蝇生存。在选择经纬度的时候,我们的做法是每一个现有分布区域选择3个点,形成一个三角形区域,将分布区域包括在内,以提高预测结果的精确度。
陈新美,雷渊才,张雄清,等,2012.样本量对MaxEnt模型预测物种分布精度和稳定性的影响[J].林业科学,48(1):53-59.
冯璐,刘建宏,李永和,等,2013.基于Maxent模型的楚雄腮扁叶蜂潜在分布区预测[J].西部林业科学,42(2):49-55.
郭水良,高平磊,娄玉霞,2011.应用MaxEnt模型预测检疫性杂草毒莴苣在我国的潜分布范围[J].上海交通大学学报(农业科学版),29(5):15-19.
黄振,2010.果实蝇属重要种的鉴定、人工饲料筛选、适生性预测和风险分析[D].海口:海南大学.
黄振,黄可辉,2009.检疫性有害生物——辣椒实蝇的形态、危害与检疫对策[J].武夷科学,25:21-23.
黄振,黄可辉,2012.果蔬重要实蝇属的分布、危害与形态特征比较研究[J].江西农业学报,24(3):73-75.
刘欣,2012.基于GARP和MAXENT的空心莲子草在中国的入侵风险预测[D].济南:山东师范大学.
孙鹏翔,胡昱玲,2010.ArcGIS9.0在水文分析中的应用[J].安徽水利水电职业技术学院学报,10(1):41-42.
王运生,谢丙炎,万方浩,等,2007.ROC曲线分析在评价入侵物种分布模型中的应用[J].生物多样性,15(4):365-372.
曾辉,黄冠胜,林伟,等,2008.利用MaxEnt预测橡胶南美叶疫病菌在全球的潜在地理分布[J].植物保护,34(3):88-92.
赵文娟,2009.玉米霜霉病在中国的适生性分析[D].合肥:安徽农业大学.
褚庆全,李林,2003地理信息系统(GIS)在农业上的应用及其发展趋势[J].中国农业科技导报,5(1):22-26.
Halvorsen R,2013.A strict maximum likelihood explanation of MaxEnt,and some implications for distribution modelling[J].Sommerfeltia,36(1):1.
Parker W E,Turner S T D,1996.Application of GIS modelling to pest forecasting and pest distribution studies at different spatial scales[J].Aspects of Applied Biology,44(14):223-230.
Zigler K S,Lessios H A,Raff R A,2008.Egg energetics,fertilization kinetics,and population structure in echinoids with facultatively feeding larvae[J].The Biological Bulletin,215(2):191-199.
Using MaxEnt model to predict potential geographic distribution of Batrocera latifrons in China
HUANG Zhen1,WU Qi-Ming1,2,HUANG Ke-Hui1∗
(1.Fujian Entry-Exit Inspection and Quarantine Bureau,Fuzhou,Fujian 350001,China;2.College of Plant Protection,Fujian Agricultural and Forestry University,Fuzhou,Fujian 350002,China)
Using the MaxEnt model and ArcGIS geographic information system,and using the environmental data(such as precipitation,temperature,altitude)which involve the influence factors of existence condition of Bacerocera latifrons as a variable,this paper took the largest similarity of distribution area to predict the potential geographic distribution of B.latifrons in China.
Batrocera latifrons; MaxEnt model; suitability prediction; potential distribution
S431.9
A
1001-4276-(2017)01-0028-07
黄振,吴淇铭,黄可辉,2017.应用MaxEnt模型预测辣椒果实蝇在中国的潜在地理分布[J].武夷科学,33:28-34.
2017-10-01。
福建省自然科学基金项目(2011J01066,2012J01061);福建局科技项目(FK2010-27,FK2011-56)。
黄振(1985-),男,在职博士研究生。研究方向:农业害虫与防治。Email:102768560@qq.com。∗
黄可辉(1954-),男,研究员。研究方向:植物检疫。Email:hkhfjciq@126.com。
(责任编辑:陈晓雯)