基于优化MaxEnt模型的板齿鼠犅犪狀犱犻犮狅狋犪犻狀犱犻犮犪在中国适生区预测与分析
2023-08-05林思亮姚丹丹姜洪雪等
林思亮 姚丹丹 姜洪雪等
关键词 板齿鼠;MaxEnt模型;适生区;模型参数优化
中图分类号:S 443.5 文献标识码:A DOI: 10.16688/j.zwbh.2022400
板齿鼠Bandicota indica属鼠科Muridae鼠亚科Murinae,是重要的农业害鼠,亦是多种人兽共患疾病的传播宿主,广泛分布于热带和亚热带地区。中国、印度、缅甸、泰国、尼泊尔、斯里兰卡、老挝、越南、孟加拉国、柬埔寨、马来西亚和印度尼西亚等地都有记载。在我国该鼠主要分布在广东、广西、福建、台湾、江西、云南、贵州和四川等省区[1-2]。板齿鼠是大型野栖鼠类,食量大,对水稻、玉米、甘薯等多种农作物为害极大,在一般发生年份,可造成农作物减产20%~30%[3]。该鼠对水稻为害尤为严重,从苗期至收获期均可发生,导致水稻大面积失收[4-5]。近年来该鼠种群数量出现逐年增长趋势,已成为南方农田优势种之一[5-6]。板齿鼠亦是多种人畜共患疾病的传播媒介,其分布区与人类活动空间高度相关[1-2]。南方沿海地区是我国人口密度较高的地区之一,也是其主要分布区,容易发生疾病传播。此外全球变暖的背景也为适应湿热环境的板齿鼠扩散提供了有利的环境条件,导致其对农业安全生产和人民生命健康威胁加剧[5-6],因此需重视对板齿鼠的监测和研究。持续开展板齿鼠的调查监测,及时掌握其种群动态及其分布区扩散动态,可为板齿鼠的预警及防控提供参考,保障农作物安全。
预测有害生物的适生区是有害生物定量风险评估的重要研究内容之一。近年来,生态位原理模型广泛应用于有害生物适生区的预测[7]。其中最大熵模型(maximum entropy,MaxEnt)是一种基于物种已知分布信息并结合环境数据来预测未知分布情况的统计方法,该模型对样本数量和质量的耐受度高,预测结果优异,是近年来有害生物适生区预测领域最流行的模型之一 [8-10]。国内外学者基于MaxEnt模型对包括病、虫、草、鼠在内多种有害生物的适生区分布预测已有大量研究[11-14]。气候、地形、栖息地、人类活动等因素会影响鼠类的生长发育及分布,生态位模型可较好地模拟当地生态环境用于鼠类的适生区预测。如郑楠等[15]利用MaxEnt模型直观定量地预测了鼠疫宿主长爪沙鼠lVIeriones unguic-ulatus在我国的潜在适生区主要在内蒙古的锡林郭勒盟、乌兰察布市、阿拉善盟、大同市、呼和浩特市、包头市、巴彦淖尔市、鄂尔多斯市、乌海市;宁夏的石嘴山市、银川市、吴忠市、中卫市;甘肃的白银市、武威市、张掖市;河北的张家口市;陕西的榆林市。吴艺楠等[16]比较了不同物种分布模型对高原鼠兔Ochotona curzonzae分布模拟的结果,结果显示推进式回归树模型( GBM)和最大熵模型(MaxEnt)模型的模拟效果最好,并根据最优模型预测了高原鼠兔在青海湖流域的潜在适生区分布于青海湖西岸和北岸,天峻县周边及布哈河流域上游,明确了影响高原鼠兔分布的主导环境因子为距道路距离、距居民点距离、最暖月最高气温、NDVI标准差、最冷季和最干季降水量。喬雪丽等[17]利用MaxEnt模型预测大沙鼠Rhombomys opimus在当前气候和气候变化等不同情景下的潜在适生区,发现其潜在适生区范围波动较大,未来气候越来越适宜大沙鼠的生存,其分布区呈扩张趋势。
板齿鼠的生长发育[18]、繁殖[19]、行为习性[20]、种群数量变动[21]和为害规律[4]等已有研究报道,但对其分布并未开展系统的调查,其分布范围尚无确切数据,更不知其在气候、土地利用变化条件下其分布会如何改变。本研究通过对板齿鼠在我国分布数据进行科学处理,利用优化参数后的MaxEnt模型预测板齿鼠在我国的适生区分布,并从生态位角度筛选影响其分布的主导环境因子,进而分析二者关系,以期为我国板齿鼠的监测、预警及防控提供理论依据。
1材料与方法
1.1物种分布数据的收集及筛选
本文通过查询全球生物多样性信息网络(Glob-al Biodiversity Information Facility, GBIF; http:∥www. gbif. org)获得490个板齿鼠分布点。通过查阅国内外公开发表论文获得了281个分布点。本团队在广东省设置并捕获板齿鼠的监测分布点34个。共获得板齿鼠在我国的分布点805个,分布点信息包括分布点地名、经纬度等。分布点数据中有经纬度的直接使用,只有地名(精确到乡镇)的分布点则通过百度坐标拾取系统(https:∥api.map.baidu.com/lbsapi/getpoint/index.html)获得经纬度。
本文使用ENMTools软件剔除冗余分布数据的功能[22],并参照王茹琳等[23]的方法去除上述805个分布点中的重复数据,具体方法为:采用栅格分辨率为2.5′的气候数据,即每2.5′×2.5′网格(覆盖范围约为5 km×5 km)中只仅保留1个分布点,以此降低因群集效应造成的采样偏差,减少模型过拟合现象,提高预测质量。通过上述筛选程序后保留了411个板齿鼠在我国的分布数据进行建模(图1)。
1.2环境变量的收集及筛选
气候、土壤、地形及生物等生态因子影响着生物对栖息地的适宜性,其中水热条件、土壤、食物等因子更是啮齿动物选择栖息地的重要因子[1]。本研究选取影响板齿鼠分布的38个变量:包括19个生物气候变量、14个土壤数据变量、3个地形变量、1个土地利用类型变量和1个生态系统净初级生产力变量。
19个生物气候变量为1970年-2000年各气候因子的平均值,包括年均温(Bio1)、平均气温日较差(Bio2)、等温性(Bio3)、气温季节性变动系数(Bio4)、最热月最高温(Bio5)、最冷月最低温(Bio6)、气温年较差(Bio7)、最湿季均温(Bio8)、最干季均温(Bio9)、最热季均温(Bio10)、最冷季均温(Bioll)、年降水量(Bio12)、最湿月降水量(Bio13)、最干月降水量(Bio14)、降水量季节性变动系数(Bi015)、最湿季降水量(Bio16)、最干季降水量(Bio17)、最暖季降水量(Bio18)、最冷季降水量(Bio19)。皆从全球气候数据网站(https:∥www.worldclim.org/)中下载,栅格空间分辨率设置为2.5′[24],14个土壤表层土数据变量包括砂砾比例、沙子比例、淤泥比例、黏土比例、质地、容积密度、有机碳比例、酸碱度、黏性层土壤阳离子交换能力、土壤阳离子交换能力、基础饱和度、阳离子交换总量、可交换钠盐、电导率,数据来源于联合国粮农组织的世界土壤数据库(Harmonized World Soil Database, https:∥www. fao. org/soils-portal/da-ta-hub/soil-map s-and-databa ses/harmonized-world-soil-database-v12/en/),用ArcGIS软件从中分别提取表层土壤指标数据[25]。3个地形变量包括海拔、坡度和坡向,海拔数据来自于全球气候数据网站(https:∥www.worldclim.org/),栅格空间分辨率为2.5′,坡度和坡向信息利用ArcGIS软件的表面分析功能获得。2021年的土地利用类型数据来自Esri土地覆盖遥感监测数据库(ht-tps:∥livingatlas. arcgis. com/landcover/),该数据将土地利用类型划分为11类,为分类变量。净初级生产力(net primary productivity,NPP),是生产者能用于生长、发育和繁殖的能量值,也是生态系统中其他生物成员生存和繁衍的物质基础,2021年陆地生态系统净初级生产力数据来源于MODIS数据集(https:∥ladsweb. modaps. eosdis. nasa.gov/)。所有变量的空间分辨率皆设置为2.5′(覆盖范围约为25 km)。
环境变量的选择是决定模拟准确性的关键,本文参照乔雪丽等[17]的方法筛选变量,具体方法为:首先使用全部环境变量建立初始模型,保留对建模贡献率较高的环境变量。其次使用R软件对38个环境变量进行Spearman相关分析评估多重共线性。对变量间相关系数绝对值>0.7的数据,根据板齿鼠的生物学意义和初始模型中各变量的贡献率筛选变量,以减少多重共线性和模型过拟合的影响。经过上述程序最终保留12个环境变量(表1),包括6个生物气候变量(年均温、等温性、最湿季均温、年降水量、最暖季降水量、最冷季降水量)、2个土壤变量(砂砾比例、有机碳比例)、2个地形变量(海拔、坡向)、2个环境变量(土地利用类型、净初级生产力)。
1.3模型参数优化
特征组合(feature combination,FC)与正规化乘数(regularization multiplier,RM)是MaxEnt模型中最重要的两个模型参数,优化这两个参数的选择有助于显著提高模型的预测精度[8-9,26]。其中FC有5种可选项,分别是线性函数(linear,L)、二次项函数(quadratic,Q)、交互函数(product,P)、阈值函数(threshold,T)和线性分段函数(hinge,H)。MaxEnt软件默认参数为RM =1,FC=LQHPT。本研究为了优化MaxEnt模型,RM取值范围为0.5~4,每次运行增加0.5;特征组合设置为6个,分别是L,LQ,H,LQH,LQHP和LQHPT。调用R软件的ENMeval程序包,对上述48个参数组合进行测试[27],并根据deltaAICc(Akaike information criterion,corrected)检验模型的复杂度和拟合程度,AUCdiff (different between training and testingAUC)和OR10(10% training omission rate)衡量模型对物种分布点过拟合程度[29]。其中具有最小deltaAICc值(deltaAICc=0)的模型作为最优模型[10]。
1.4板齿鼠适生区预测
MaxEnt模型参数FC与RM采用1.3筛选的最优模型的参数组合,其他模型参数设置为:25%的分布点作测试集,75%分布点作为训练集,最大迭代次数为5000次,最大背景点数量为10000个,其余选择默认设置,选切刀检验评估环境变量重要性,以10次运算的平均值作为预测结果,模型预测结果采用逻辑值(cloglog)形式输出[10]。MaxEnt模型生成逻辑输出值组成的ASC文件,逻辑值在0~1之间,数值越接近1,物种存在的概率越大。参考李垚的平均间隔法将适生度分为5级[28],即某点的适生度为该点的逻辑值占整个预测区域内最高逻辑值的百分比,当逻辑值在80.1%~100%为高度适生区,60.1%~80%为中度适生区,40.1%~60%为一般适生区,20.1%~40%为低度适生区,0~20%为非适生区,统计各级栅格数量计算板齿鼠在我国适生区的面积。
通过受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)对模型的准确性进行检验[10]。曲线下面积(AUC)取值范围为[0,1],值越大表示模型预估效果越好。MaxEnt模型的评估标准为:当00.9时,结果为“极好”。
1.5环境变量的重要性评估
利用贡献率、置换重要性、刀切法检验评估影响板齿鼠在中国潜在地理分布的环境变量的重要性。MaxEnt模型可以对模型中贡献率高的环境变量进行追踪,通过对单一要素进行逐步修正来提高增益值,然后将增益值分配给该要素依赖的环境变量,并以百分比的形式给出。置换重要性是由该环境变量在训练点(存在点,背景点)的随机置换值和由此导致的AUC值的下降幅度来决定,AUC值的降幅大小体现了模型对该变量的依赖程度。刀切法检验则是通过每次选用单个变量或排除某个变量构建不同的模型,分析由此导致的正规化训练增益、测试增益、AUC值的变化来评价环境变量的重要性。
2结果与分析
2.1板齿鼠适生区预测最优模型
基于板齿鼠的411个分布点和12个环境变量,利用MaxEnt模型对板齿鼠的潜在分布进行模拟和预测。在MaxEnt模型默认参數RM=1,FC=LQHPT设置下,模型的deltaAICc=2.10。而当RM=0.5,FC=H时,deltaAICc=0,该模型为最优模型。并且在该参数下模型的AUC和OR10值均低于默认参数下的MaxEnt模型(图2),分别比默认参数值低5.5%和2.2%。表明RM=0.5,FC=H的参数设置显著降低了MaxEnt模型的过度拟合。
10次重复的训练AUC值的最大值为0.977,最小值为0. 976,平均值为(0.976±0.0002),测试AUC值的最大值为0.977,最小值为0.969,平均值为(0.974±0.003),表明模型预测结果极好。
2.2环境因子对板齿鼠的影响
从环境变量贡献率及其对板齿鼠潜在分布的重要性可看出(表1),最暖季降水量、等温性和年均温3个变量的贡献率累积达80.8%;置换重要性排前三位的变量为年均温、最暖季降水量、等温性,置换重要性累积达91.5%。仅用单独变量模拟时,模型的正规化训练增益、测试增益和AUC值最高的3个变量依次为年均温、最暖季降水量、年降水量(图3),表明这些环境变量与其他环境变量相比具有更多有效信息。用除去这些变量以外的其他变量模拟时模型的正规化训练增益、测试增益和AUC值下降幅度最大的3个变量依次为年均温、等温性和最暖季降水量(图3),表明这些环境变量对模型结果影响较大。综合来看,影响板齿鼠分布的主导环境因子为生物气候变量(年均温、等温性和最暖季降水量)。
进一步分析这3个主导环境因子的单因子响应曲线来判断板齿鼠的存在概率与环境因子之间的关系(图4),并以存在概率0.5为阈值,对应的环境因子值有利于板齿鼠的栖息。
最暖季降水量(贡献率52%,置换重要性24%)达到250mm左右,板齿鼠的存在概率开始迅速增加,约在690mm时存在概率增加至0.5,达到1892mm时,存在概率达到最大值(0.93),随后存在概率随着降水量增加开始下降,在3350mm左右时存在概率开始降低到0.5以下。所以适合板齿鼠栖息的最暖季降水量适宜范围为690~3350mm。
等温性(贡献率16.8%,置换重要性6.8%)达到25%左右,板齒鼠的存在概率开始迅速增加,等温性30.5%时存在概率增加至0.5,等温性达到35.7%时,存在概率达到最大值(0.88),随后开始下降,等温性39.1%左右时存在概率降低到0.5以下。所以适合板齿鼠栖息的等温性适宜范围为30.5%~39.1%。
年均温(贡献率12%,置换重要性60.5%)达7℃左右时,板齿鼠的存在概率开始增加,年均温升高至19.6℃时存在概率增加至0.5,到22.5℃时存在概率达到最大值(0.86),随后下降,年均温达23.9℃时存在概率降低到0.5以下。所以适合板齿鼠栖息的年均温适宜范围为19.6~23.9℃。
其他适宜板齿鼠栖息的环境因子变量范围见表1。
2.3板齿鼠的适生区分布格局
411个板齿鼠分布点在不同等级适生区中所占比例分别为:高适生区39.9%、中适生区30.7%、一般适生区15.1%、低适生区9.2%和非适生区5.1%。表明MaxEnt模拟的板齿鼠潜在适生区基本覆盖板齿鼠的分布记录点。411个板齿鼠分布点的平均适宜度为0.674,最高值为0.967(台湾宜兰县),最低值为0.054(云南西双版纳州勐腊县)。板齿鼠适生区基本涵盖广东、广西、台湾的全部,福建、云南的大部,西藏东南部、四川南部、贵州南部、海南北部、江西南部与广东交界区域、江西东部与福建交界区域、浙江南部的少数地区(图5)。总适生面积共计68.6万km,占整个研究区面积的7.23%。高度适生区主要集中分布在广东、广西、台湾等地(图5),面积为4. 07万km。
3结论与讨论
3.1优化后的模型表现
本研究使用ENMeval程序包对多个FC和RM参数组合进行测试,筛选确定MaxEnt模型的最优参数组合为RM=0.5,FC=H。此时,delatA-ICc=0,构建的MaxEnt模型的训练AUC数值和测试AUC数值都>0.97,模型结果属于极好。本研究模型结果优于其他使用MaxEnt模型预测啮齿动物适生区的结果,如大沙鼠[29](AUC=0.94)、黄胸鼠Rattus tanezumj[30](AUC=0.94)、褐家鼠Rattus noroegicus[30](AUC=0.96)、屋顶鼠Rat-tus rattus[30](AUC=0.89)、四川短尾鼩[31] Anou-rosorer squamipes(AUC=0.91)、川西缺齿鼩[31]Chodsigoa hypsibia(AUC=0.90)等啮齿动物,表明模型预测精度有所提高。说明通过参数优化后的模型具有较好的表现,不但有利于整体掌握环境因子变量如何影响板齿鼠的分布,对于预测板齿鼠在我国范围内的适生区分布也具有较好的说服力。
3.2主导板齿鼠分布的环境变量
在大的时空尺度上,物种分布主要受到非生物因素的限制,预测的物种适生区为“潜在分布区”;而在较小的时空尺度上,物种更多受到本地群落相互作用的限制,如资源因素、扩散、捕食和竞争等,预测的物种适生区为“实际分布区”[32-33]。啮齿类动物栖息地选择通常与当地食物、地形和植被覆盖情况密切相关[34-37]。本研究在考虑影响板齿鼠环境因子时,充分考虑对其“潜在分布区”和“实际分布区”具有生态意义的指标,筛选了指示气候、土壤、地形、食物资源、地被覆盖等共12个变量纳入MaxEnt模型中对其适生区进行预测,能够较好地掌握板齿鼠的生态位信息。
我们的结果表明,指示气候条件的最暖季降水量、等温性和年均温是影响板齿鼠分布的主导非生物因子,这3者的累计贡献率达到80.8%。板齿鼠适宜在最暖季降水量为690~3350mm,年均温介于19.6~23.9℃,等温性在30.5%~39.1%的区域分布,表征板齿鼠喜好湿热的环境条件,且温度和降水在年内或日内分配特征可能是板齿鼠分布的重要限制因子,这与板齿鼠地理分布属于印度一中国南部热湿型的特征是一致的[1]。
3.3板齿鼠在我国的适生区分布
我们的预测结果显示,板齿鼠的适生区分布于广东、广西、台湾、福建、云南、四川、贵州、江西、海南、西藏、浙江等省份,其中高适生区主要位于我国南岭以南华南地区的广东、广西、台湾等地,基本覆盖文献报道的该鼠在我国已知的分布区[1,38]。其中模型预测在西藏东南部、海南北部、浙江南部等地区亦存在板齿鼠的适生区,但这些地方并未有历史或文献数据证明有板齿鼠的存在。可能西藏东南部、浙江南部的环境条件已接近板齿鼠适宜栖息环境的临界,属于种群分布的边缘;而海南的环境条件虽然符合板齿鼠喜好的热带湿热环境,但可能由于琼州海峡的存在,限制了板齿鼠扩散到此地。这些地区板齿鼠的种群规模非常小,且未针对板齿鼠种群进行系统调查,故建议在这些地区开展进一步的系统调查监测,探明掌握板齿鼠的分布及动态,为板齿鼠的预警、防控提供参考。
我们利用优化的MaxEnt模型对板齿鼠的潜在适生区进行预测及等级划分,结果显示板齿鼠在我国适生范围较小,主要集中在东南沿海省份。林思亮等[39]对比分析了2018年—2020年广东南雄与新会农田鼠类群落结构差异,发现粤北南雄农田的板齿鼠捕获数占比达9.02%,且生物量占比可达18.26%;姚丹丹等[40]使用物联网智能监测系统在南雄市珠玑镇开展农田鼠类监测,发现监测到的板齿鼠数量占比达到21.97%,说明近年来板齿鼠在广东有逐步向北扩散的趋势。本研究结果表明,四川南部、贵州南部、江西南部等地区为板齿鼠的适生区,说明这些区域具备适宜板齿鼠定殖的气候条件,未来板齿鼠有进一步向北移扩散的可能,且在全球变暖的背景下,预计板齿鼠的北移趋势将逐步加快。因此对那些预测为适生区且已有板齿鼠发生的地区,应着重开展防治工作;而尚未发现板齿鼠而预测为适生区的地区,农业部门应该高度重视,加强调查和监测工作,防止板齿鼠的发生。
虽然我们通过模型分析描述了该物种的基本生态位,但仍需要实地调研来进一步了解该物种的现实生态位,以更好地开展针对性的防控工作。同时我们在多重共线性检验中,发现生物气候变量之间存在高度共线性,导致难以选择模拟的生物气候变量。因此,需要开展更具体的研究来解释气候等因素在板齿鼠生境决定中的重要性。因此建议加强对板齿鼠的监测和研究,这对板齿鼠的预警、防控具有参考意义,预防该害鼠在我国的大规模发生有十分重要的作用。