APP下载

基于最大熵模型对长角血蜱在中国潜在分布特征的研究

2022-10-12黄禹然肖建华王洪斌

动物医学进展 2022年10期
关键词:宿主植被概率

孙 卓,黄禹然,高 翔,肖建华,王洪斌

(1.东北农业大学动物医学学院,黑龙江哈尔滨 150030;2.黑龙江省动物疾病防治重点实验室,黑龙江哈尔滨 150030)

长角血蜱(Haemaphysalislonghornis)原分布于东亚和俄罗斯西南部,因其生存能力强,对各种气候环境适应性强,已成为我国许多地区的优势种和分布种[1-3]。长角血蜱为不完全变态发育,整个生命周期需要经历卵-幼蜱-若蜱-成蜱4个阶段,每个阶段都需要在宿主表面寄生吸血,以获得营养完成发育。长角血蜱一生之中要更换3个宿主,当需要寄生时,长角血蜱会爬到植被顶端等待,叮咬经过的宿主[4]。长角血蜱可以寄生于多种宿主,包括人类、家畜和野生动物[5]。长角血蜱在叮咬吸血的过程中,会将其体内携带的各种病原体带入宿主体内,如无形体、细菌、真菌、立克次体、病毒、螺旋体和原生动物等[6]。其中,重症发热伴血小板减少综合征因其12%~50%的高致死率和大流行传播的可能性被世界卫生组织列为十大传染病之一[7]。研究证实,长角血蜱还可传播牛巴贝斯虫病,每年给畜牧业造成约30亿美元的经济损失[8]。因此,由于蜱寄生宿主的广泛性和蜱传疾病的严重威胁性,研究长角血蜱在中国大陆地区的适宜分布区具有重要意义。

生态位模型基于生态位概念,现已被广泛应用于外来生物入侵、生物多样性保护、物种潜在分布、疾病空间传播等领域[9]。其中,MaxEnt模型作为最常用的生态位预测模型,基于已知物种分布数据和环境数据,可预测物种在研究范围内的潜在地理分布,普适性强,预测效能出色[10]。

环境数据的质量直接影响模型预测结果,基于前人研究选择合适的环境变量是应用MaxEnt模型最先解决的问题[9]。温度和湿度很大程度上会影响蜱的数量和活动模式[11]。一些研究人员甚至提出,降水可能是杀死或抑制长角血蜱的重要因素,因为它不利于蜱的捕猎活动[12]。同样,风速也会影响蜱狩猎宿主的活动[13]。研究发现,太阳辐射对蜱虫的存在产生积极影响,因为在更多暴露于阳光的地区,蜱虫发育的有利季节更长[14]。此外,一些研究人员还在草地、灌木和林地中采集到蜱虫。草地中蜱的存在明显高于灌木和林地,表明植被覆盖会影响蜱的分布[15]。一些研究表明,增加的动物密度会吸引环境中的血蜱,导致血蜱大量聚集在局部地区并咬伤畜群[16]。人类在蜱存在区域的频繁活动也会大大增加人感染蜱传疾病的风险[17]。综上所述,我们初步选择了温度、湿度、降水、风速、太阳辐射、植被覆盖度、动物密度和人口密度作为纳入模型的环境变量。

本研究通过收集长角血蜱的分布位点,结合生物气候因素、地理景观因素和社会经济因素,利用MaxEnt模型预测长角血蜱在中国大陆地区的潜在分布,评估影响其分布的主要风险因子,为制定中国大陆地区长角血蜱和蜱传疾病的防控策略提供参考。

1 材料与方法

1.1 长角血蜱分布数据的获取

基于中国知网(CNKI)、Web of Science、PubMed、百度学术、Google Scholar等学术文献搜索引擎,全面检索有关“长角血蜱”和“Haemaphysalislongicornis”1970年至2020年间公开发表的所有文献,通过百度地图收集较高精确度的分布点经纬度坐标,共整理得到219条长角血蜱的分布点记录。剔除重复数据后,利用ENMTools软件中“ENM measurements and tools”工具栏下的“Trim duplicate occurrences”功能对物种分布数据进行纯化,共整理得到209条长角血蜱的分布数据。

1.2 环境变量的获取

本研究考虑了包括生物气候因素、地理景观因素和社会经济因素在内的27个环境变量。其中,生物气候因素方面主要选择了21个生物气候变量,包括19个生物气候变量(BIO1-BIO19),年平均风速(WIND)和年平均太阳辐射(SRAD)。这些生物气候数据来自WorldClim 2.1数据集(http://www.worldclim.org/),其空间分辨率为2.5弧分(5 km×5 km)。地理景观因素考虑了4个变量,包括土地覆盖类型(LC)、归一化差异植被指数(NDVI)、土壤湿度(SW)、土壤pH(SPH)。土地覆盖类型(LC)、归一化差异植被指数(NDVI)共同反映植被覆盖度对长角血蜱分布的影响。LC获取自地理大数据科学工程数据共享服务系统(http://data.casearth.cn/)提供的2020年全球30 m地表覆盖精细分类产品。NDVI由地理空间数据云平台(http://www.gscloud.cn/)提供。SW来自国家青藏高原科学数据中心(http://data.tpdc.ac.cn/)提供的中国土壤水分数据集(SMC)。SPH从国家冰川冻土沙漠科学数据中心(http://www.crensed.ac.cn/)提供的基于世界土壤数据库(HMSD)的中国土壤数据集中获取。社会经济因素考虑了动物密度(AD)和人口密度(PD)。从联合国粮食及农业组织网站(http://www.fao.org/livestock-systems/en/)获取黄牛密度(CD)、水牛密度(BD)、山羊密度(SH)、绵羊密度(GD)、猪密度(PIGD)、禽类密度(CHD),并通过ArcGIS中栅格计算器工具进行图层合并,得到动物密度(AD)。人口密度(PD)来自国际地球科学信息网络中心网页(CIESIN,http://sedac.ciesin.columbia.edu)提供的世界网格人口数据(GPWv4)。

1.3 环境变量的筛选与处理

在建模中,生物气候变量之间明显的多重共线性会导致模型过拟合。本研究采用相关系数-变量贡献率-方差膨胀因子的方法进行变量的共线性诊断和筛选。利用ENMTools的Correlation工具对生物气候变量图层进行相关性分析,得到相关系数矩阵;将26个生物环境变量和长角血蜱分布数据纳入MaxEnt模型中,得到各变量的贡献率;剔除贡献率为0的变量,保留相关系数小于0.8的变量,如果两变量的相关系数大于0.8,保留变量贡献率更大的变量[18];将剩余生物气候变量用ArcGIS中多值提取到点工具提取数值,采用SPSS软件进行共线性诊断,得到方差膨胀因子(VIF),保证所有剩余变量的方差膨胀因子小于10。操作在ENMTools、ArcGIS 10.2和SPSS 22中完成。

去除共线性后,所有剩余变量通过 ArcGIS 重采样到2.5 弧分的分辨率,并根据中国行政国家地图进行掩膜提取,然后将其转换为 ASCII 格式并存储。操作在ArcGIS 10.2中完成。

1.4 长角血蜱的分布预测模型的建立

长角血蜱的预测分布使用MaxEnt软件3.4.4建模。选择包含长角血蜱精确经纬度坐标的数据集作为样本集,处理好的变量作为环境变量集;选择输出格式为logistic,设置输出文件夹;选择进行折刀法测试,评估不同变量对长角血蜱潜在地理分布的相对影响;选择绘制响应曲线,直观展示出各个环境变量对长角血蜱分布的具体影响;选择输出预测地图,得到长角血蜱潜在地理分布区地图;交叉验证重复运算10次后,检查受试者工作特征曲线下的面积(AUC)值以评估模型准确性[19]。

1.5 长角血蜱分布预测模型的评估

AUC值越大,模型预测精度越高,在0.5~0.6之间为不合格,在0.6~0.7之间为差,在0.7~0.8之间为一般,在0.8~0.9之间为好,在0.9~1之间为优。根据刀切法测试结果和环境变量的贡献百分比和排列重要性共同确定主要环境因子。

2 结果

2.1 长角血蜱潜在地理分布预测模型性能的检验结果

通过10次交叉验证运算得出的平均AUC值对模型预测性能进行评估。经计算,平均AUC值为0.937>0.9(图1),表明模型性能优,可以准确地预测长角血蜱的潜在地理分布区。

图1 长角血蜱分布预测最大熵模型的受试者工作特征曲线Fig.1 The receiver operating characteristic (ROC) curve of the MaxEnt model perdicating the distritation of Haemaphysalis longhornis

2.2 确定影响长角血蜱潜在地理分布的主导环境因子

经过环境变量之间的多重共线性检测后,筛选出7个生物气候变量(BIO2,BIO5,BIO6,BIO12,BIO15,WIND,SRAD)。最终,共有13个环境变量被纳入最终预测模型(表1)。表1显示了13个环境变量对长角血蜱潜在地理分布影响的平均贡献百分比(PC)。其中,土地覆盖类型(LC)39%、人口密度(PD)23.1%、年平均降水量(BIO12)14.1%,累计平均贡献率高达76.2%。MaxEnt模型依据单个环境变量数值随机排列产生的模型AUC值下降百分比进行评估,得出排列重要性(PI)最大的环境因子依次为年平均降水量(BIO12)42.3%、归一化差异植被指数(NDVI)23.8%、最暖月最高温(BIO5)12.7%、最冷月最低气温(BIO6)10.9%。

表1 最大熵模型中各变量的贡献率和排列重要性Table 1 The percent contribution and permutation importance of variables in the MaxEnt model

另外,折刀法测试可以通过变量增益值反映各变量对潜在地理分布的相对影响(图2)。红色条带表示使用所有变量建模时的模型性能,深蓝色条带表示单独使用该变量建模时的模型性能,浅蓝色条带表示忽略该变量建模时的模型性能。结果显示,总训练增益为0.94,单独使用土地覆盖类型(LC)、人口密度(PD)、动物密度(AD)、归一化差异植被指数(NDVI)这4个变量时,模型增益值分别是0.86、0.86、0.83、0.80,表现出了良好的模型性能。所有变量被单独忽略后,都没有表现出明显的增益值下降。

图2 折刀法测试检验结果Fig.2 Jackknife test result

综合上述结果,植被覆盖度、降水、人口密度、温度、动物密度是决定长角血蜱地理分布的重要环境因素。

2.3 主导环境因子适宜值范围

响应曲线可以直观反映各个环境变量对长角血蜱潜在地理分布的具体影响(图3~图9)。该响应曲线坐标系横轴表示环境变量的值,纵轴表示长角血蜱的分布概率。分布概率>0.5时的环境变量取值为长角血蜱的适宜生存范围。结果表明,归一化差异植被指数(NDVI)对长角血蜱地理分布影响最大,NDVI约为0.28时,长角血蜱分布概率到达0.5,在NDVI=0.36时分布概率上升到峰值,之后逐步下降,NDVI=0.56时分布概率再次降到0.5,然后不断下降。因此,NDVI适宜值范围为0.28~0.56。人口密度(PD)对长角血蜱潜在地理分布有重要影响,在0~3000 人/km2时,长角血蜱的潜在分布概率迅速上升,之后随着PD的进一步增加,继续缓慢上升,直到维持在一个稳定的分布概率(P=0.92)。年平均降水量(BIO12)对长角血蜱的潜在地理分布有较大影响,BIO12约为530 mm时,长角血蜱分布概率为0.5,随着BIO12的增加长角血蜱的分布概率也不断增加,在577 mm时长角血蜱的分布概率达到峰值,当BIO12继续增加时,分布概率逐步下降后上升然后再次下降,直到维持在一个稳定的分布概率(P=0.29),BIO12适宜范围值约为531 mm~1017 mm和1453 mm~1671 mm。最暖月最高温(BIO5)对长角血蜱的潜在地理分布也有一定影响,BIO5约为29.7℃时,长角血蜱分布概率到达0.5,在BIO5=31.5℃时分布概率上升到峰值,之后逐步下降,BIO5=33.8℃概率再次降到0.5,然后不断下降。BIO5适宜值范围为29.7℃~33.8℃。最冷月最低气温(BIO6)的变量平均贡献率为2.5%,排列重要性却高达10.9%,这说明BIO6对长角血蜱潜在地理分布的影响同样不容忽视,长角血蜱能承受的最冷月最低气温(BIO6)适宜值范围为-14.0℃~3.4℃。动物密度(AD)的变量平均贡献率和排列重要性都很低,但折刀法测试的正则训练增益值却是除土地覆盖类型(LC)和人口密度(PD)之外最高,这说明长角血蜱潜在地理分布一定程度上也受动物密度(AD)的影响。

图3 土地覆盖类型的响应曲线Fig.3 The response curve of land cover type

图4 归一化差异植被指数的响应曲线Fig.4 The response curve of normalized differential vegetation index

图5 年平均降水量的响应曲线Fig.5 The response curve of average annual precipitation

图6 人口密度的响应曲线Fig.6 The response curve of population density

图7 最暖月最高气温的响应曲线Fig.7 The response curve of max temperature in the hottest month

图8 最冷月最低气温的响应曲线Fig.8 The response curve of min temperature in the coldest month

图9 动物密度的响应曲线Fig.9 The response curve of animal density

2.4 长角血蜱的分布预测结果

利用ArcGIS的重分类工具对长角血蜱分布预测结果地图划分长角血蜱适生区等级,分布概率<0.2为不适生,分布概率0.2~0.4为适生,分布概率0.4~0.6为较适生,分布概率>0.6为最适生[20]。利用ArcGIS软件计算长角血蜱适生面积。长角血蜱在中国的适生区面积为363.97×104km2,约占全国陆地总面积的37.78%。长角血蜱适宜生存地区主要位于我国东北部、华北、南部沿海地区以及西藏的南部。

3 讨论

最大熵原理由Jaynes E T于1957年提出[21],其本质就是利用已知部分知识,选取符合已知知识同时熵值最大的推断,即为最随机、最不确定却又最不偏不倚的推断。MaxEnt模型采用最大熵原理,通过一组已知的物种分布数据和环境变量可以模拟潜在的物种分布。因为它可以在仅获得少量物种分布坐标时就能准确地进行预测,是最受欢迎的生态位模型之一。MaxEnt模型的使用自2004年以来呈指数增长,是研究人员用来预测物种分布的首选方法之一[22]。本研究利用MaxEnt模型预测了长角血蜱在中国大陆的潜在地理分布,交叉验证10次,平均AUC=0.937,模型分辨能力很高。同时,本研究通过综合考虑变量平均贡献率、排列重要性、折刀法测试正则训练增益值3个指标,评判影响长角血蜱地理分布的主要环境因素,相较于只考虑一个指标更加全面。

NDVI和LC两个变量共同说明植被覆盖率对长角血蜱的潜在地理分布有显著影响。NDVI值会随着植被覆盖度的增加而增加。当NDVI值在0.28~0.56之间时,长角血蜱的地理分布适宜性随着植被覆盖度的增加先升高后降低,NDVI值为0.36时最适合长角血蜱生存。这说明长角血蜱不适合在植被极其茂密的地区生存。长期降雨导致外部环境湿度增加后,植被落叶层的相对湿度增加,为真菌的生长提供了条件,如绿僵菌和白僵菌,可能导致蜱死亡[23],这也许能够解释高植被地区蜱分布减少的原因。先前对蜱分布的研究表明,以杂草植物为地表基质的环境比以掉落针叶为地表基质的环境更有利于蜱虫的生存[16],因为它们通常在低密度植被上等待宿主,这与我们的研究一致。从土地覆盖类型(LC)响应曲线图可以看出,水体、湿地两种土地类型对长角血蜱影响最大,这两种土地类型多处于降水丰富、空气湿润的区域,与本研究中降水在长角血蜱分布影响中发挥的特性相一致。

降水是影响长角血蜱地理分布的重要因素。年平均降水量(BIO12)约在531 mm~1017 mm和1453 mm~1671 mm之间最适宜长角血蜱的分布。这表明环境湿度过小或过大都会对长角血蜱产生不利影响。长角血蜱作为三宿主蜱,寻求宿主的时间可以占到其生活史的90%[24]。蜱在植被顶端等待宿主时,需要不断爬向植被底部吸取水分,空气干燥会增大长角血蜱脱水的风险,不利于它的寻觅活动[25]。在适宜湿度范围内,蜱可长期在植被顶端等待宿主[26]。而且,适宜的湿度不仅可以增加长角血蜱的存活概率,还有利于其产卵和孵化[27]。相反,湿度过大时,植被表面形成露水,不利于蜱在植被上的寻觅活动[28]。

人口密度(PD)对长角血蜱的平均贡献率为23.1%,正则训练增益值为0.86,对长角血蜱地理分布有一定影响。高于843 人/km2的人口密度(PD)适宜长角血蜱的分布。人类是长角血蜱侵袭的宿主之一,其密度在一定程度上会影响长角血蜱的种群密度[17]。但人类密度(PD)排列重要性仅有0.4%,省略该变量正则训练增益值几乎不会下降。我们认为,深入远离人类的野外区域采集蜱虫存在困难,导致蜱虫记录点存在样本偏差,可能是人类密度贡献率和训练增益高但排列重要性和增益下降值低的原因。

温度同样会影响长角血蜱的潜在地理分布。以>0.5的分布概率为适宜区间,最暖月最高气温(BIO5)的适宜范围为29.7℃~33.8℃。最冷月最低温度(BIO6)的适宜范围为-14.0℃~3.4℃,表明长角血蜱具有较高的温度适应性和较强的极端温度耐受性。先前研究表明,长角血蜱可以承受从其初始发育温度(-12℃)到致死极限(40℃)的大范围温度变化[28],这与我们的研究结果大体一致,也在一定程度上解释了长角血蜱在我国分布广泛的原因。此外,长角血蜱若虫耐寒性强,可在野外越冬,在-30℃以下仍能保持生存适宜性,说明长角血蜱具有较强的耐寒能力[29]。这或许可以解释长角血蜱在中国大陆低温地区分布的原因。

动物密度(AD)的变量平均贡献率和排列重要性都很低,但折刀法测试的正则训练增益值却是除土地覆盖类型(LC)和人口密度(PD)之外最高,这说明长角血蜱地理分布一定程度上也可能会受到动物密度(AD)的影响。长角血蜱水平移动能力有限,主要靠宿主扩散传播。在宿主数量多、活动频繁的地区,蜱种群数量也较高[30]。长角血蜱宿主丰富,可以侵袭牛、羊、鸡等家养动物以及多种野生动物[5]。本研究将牛密度、羊密度、猪密度、禽类密度整合为一个动物密度图层,探究动物密度对长角血蜱的分布影响,但其平均贡献率和排列重要性并不高,故在后续研究中应考虑其他宿主丰富度对长角血蜱分布的影响。

本研究仍然存在一定的局限性。长角血蜱宿主广泛,除人类密度和家畜家禽密度以外,我们应该更加全面地考虑长角血蜱其他宿主对其分布的影响,进一步提高长角血蜱分布预测的准确度。

基于MaxEnt模型,本研究预测了长角血蜱在中国大陆地区的潜在地理分布。研究表明,长角血蜱在中国的适生区面积为363.97×104km2,约占全国陆地总面积的37.78%。长角血蜱适宜生存地区主要位于我国东北部、华北、南部沿海地区以及西藏的南部。植被覆盖度、降水、人口密度、温度和动物密度是决定长角血蜱地理分布的重要环境因素。本研究结果可以为长角血蜱监测工作和蜱传疾病的预防控制提供参考。

猜你喜欢

宿主植被概率
基于高分遥感影像的路域植被生物量计算
媒介取食偏好和宿主群落组成对多宿主-媒介系统疾病风险的影响
概率统计中的决策问题
概率统计解答题易错点透视
基于Landsat-8影像数据的北京植被覆盖度时空特征与地形因子的关系
追踪盗猎者
概率与统计(1)
概率与统计(2)
第一节 主要植被与自然环境 教学设计
鸟界“神偷”——大杜鹃公审案