APP下载

外来入侵物种的大数据获取及预测分析方法研究进展

2022-02-15苏梦可高灵旺

植物保护 2022年6期
关键词:物种数据库生物

苏梦可,高灵旺

(中国农业大学植物保护学院,北京 100193)

根据国际植物检疫措施标准(international standards for phytosanitary measures,ISPM)第5号标准《植物检疫术语表》中的明确规定[1],外来入侵物种指其定殖或扩散伤害植物或通过风险分析表明潜在伤害植物的外来物种。《生物多样性公约》(convention on biological diversity,CBD)将引入和/或扩散威胁生物多样性的外来物种定义为外来入侵物种[1]。国际自然保护联盟(International Union for Conservation of Nature,IUCN)将对本土生物多样性、生态系统或人类福祉产生负面影响的被引入其自然范围之外的动物、植物或其他生物称为外来入侵物种[2]。随着经济全球化、世界一体化趋势的不断加强,全球气候的不断变化,国际、国内贸易往来和旅游业的不断发展,使得某些物种可以通过多种方式由原发地移居到新的生存地,并自此定殖,稳定栖息繁殖。外来入侵物种会破坏本地物种、群落的生存环境,对本地生态平衡造成严重的破坏以及成为生态多样性丧失和物种灭绝最重要因素之一,同时会严重影响当地的经济收入,威胁人类的健康[3-7]。福寿螺PomaceacanaliculataLamarck,来自于巴西亚马逊河流域,曾作为高蛋白食物被引入亚洲[8],2003年及2012年,我国将福寿螺先后列入首批外来入侵物种名单以及国家重点管理外来入侵物种名录[9]。福寿螺不仅危害生态环境,其作为多种寄生虫的中间宿主,甚至会对人类生命健康产生威胁[10]。豚草AmbrosiaartemisiifoliaL.产自北美洲,20世纪30年代前以人为携带的方式传入我国[11]。豚草严重危害农业生产安全,其花粉更是花粉过敏症的病原之一,危害人类生命健康,造成肺气肿等病,损害劳动能力,严重者甚至导致病人出现心力衰竭[12]。美国白蛾HyphantriacuneaDrury发源于北美洲,1940年传入欧洲,1979年传入中国辽宁省丹东地区[13],给当地农、林业生产造成了重大经济损失,其幼虫会侵入住户家中化蛹,给人们的精神和生活带来了很大的困扰[14]。还有素有“植物杀手”之称的外来入侵杂草微甘菊MikaniamicranthaH.B.K,危害人类健康的外来入侵动物红火蚁SolenopsisinvictaBuren,危害松树的红脂大小蠹DendroctonusvalensLeConte等都是入侵我国且危害极大的外来物种。

入侵生物的传播和扩散过程是其产生危害最重要的过程,不负责任的人为因素、监测管理机制不严格、检疫体系不全面以及缺乏科学的外来入侵物种的风险评估导致部分外来物种成功入侵[15]。由此可见,在生产实践中通过对入侵生物进行数据采集,以便为生物入侵的控制及其管理提供依据是非常重要的[16]。数据,这一概念早已渗透到当今社会生活中的各行各业技术领域,作为国家基础性战略资源,已经成为重要的生产因素[17-18]。在学术界及产业界,已经对大数据形成了一个被大众所广泛接受的定义:大数据是指通过汇聚多种类型数据源,采用现代信息技术和构架,从而能够高速处理分析、具有高度的使用价值和决策支撑功能、拥有多种类型的数据及其技术的集成[19]。与传统数据相比,大数据具有数据量大、种类和来源多样化、数据价值密度相对较低、速度快、数据的准确性和可信度高等5大主要特征[20],在推动经济转型方面作为发展新动力,起到稳步加快的作用。传统数据技术是通过数据库分析工具处理数据规模相对较小的结构化数据,但无法处理海量数据以及图像、声音、文件等非结构化数据。由于大数据规模和非结构化数据等因素,需要用到大数据技术来分析大数据。其可在成本可接受的范围内,进行快速的数据发现、采集和分析,能够在大量的数据中提取到真正有意义、有价值的信息[21]。大数据技术包括数据采集、数据访问、基础设施、数据处理、统计分析、数据挖掘、模型预测和结果展示等8种技术[22]。与传统统计学分析方法相比,大数据技术通过建立一个完整的机制,对数据信息进行分析和观察,可以得到完整的数据信息,进行全面的分析工作,精确度较高[23]。现如今,大数据技术早已广泛应用于生物学、环境生态学等各个领域。

全球一体化的加速和国际贸易的开展,加剧了有害生物跨境传播、扩散和危害的风险,外来入侵物种随着贸易往来进入我国的可能性逐步增加。2021年4月15日我国开始正式施行《中华人民共和国生物安全法》,确立了生物安全风险监测预警制度等11项基本制度。因此要加强外来入侵物种防控管理,做好检查监测、入境检疫、国内防控等工作。2022年2月,国务院发布了《关于印发“十四五”推进农业农村现代化规划的通知》,要求建立和推广应用农业农村大数据体系[24-25]。如今,以物联网、大数据、云计算、移动互联等为代表的信息技术已经深度融合于农业生产技术。随着防控外来入侵物种积累的数据越来越多,将大数据技术应用于动植物疫情防控工作至关重要。为提高外来入侵物种识别和风险评估水平,迫切需要信息化、大数据的支撑和助力,去应对越来越多的数据信息[26]。本文对外来入侵物种的大数据获取与预测分析方法进行综述,旨在为外来物种入侵早期预警和快速反应提供信息技术支撑。

1 外来入侵物种大数据采集方法

外来入侵生物野外数据来源包括人工实地直接观测和传感器自动记录两种。对于生态系统的观测而言,人工实地观测是经典采集方法,灵活性较高,面对规模大、时间长、精度高的观测需求以及恶劣的野外条件,人类身体条件会成为收集数据的限制因素。近年来,利用传感器观测生态系统并收集相关数据成为主要方式[16]。但由于外来入侵物种传播和扩散的影响因子较为复杂,调查过程中无法通过机器全自动采集完成,人工实地观测仍然是目前最主要的调查外来入侵物种的方法[27]。在数据信息高速发展的时代,应用地理信息系统(Geographic Information System,GIS)、移动互联网、智能手机等现代化信息技术开发建立的外来入侵物种的大数据采集方法进入快速发展阶段。

基于个人数字助理(personal digital assistant,PDA)设计实现的外来入侵物种数据采集系统[28],实现了对外来入侵物种的数据采集、汇总、储存以及上传等功能,大大提高了外来入侵物种数据采集工作的准确性和时效性。基于服务架构(service-oriented architecture,SOA)的Web GIS设计开发的中国外来入侵物种地理分布信息系统[29],实现了入侵生物发生数据的可视化和分析评估的图形化,为中国外来入侵物种大范围调查与研究协作提供数据管理与共享利用的工具。基于全球卫星导航系统(global navigation satellite system,GNSS)、GIS和移动互联网等现代信息技术的野外外来物种入侵大数据采集调查工具—农林科学数据云采集平台(简称“云采集”)[27],在福建省红火蚁疫情普查等项目中应用,并根据实际工作需要,在福建、广西、云南、新疆、北京等省市自治区开展了100多个入侵生物大数据野外调查的应用试验。提高了外来入侵物种野外调查数据的质量和检疫工作效率。基于大数据的外来入侵物种的数据采集技术通过收集入侵物种的信息,实时定位,实地拍摄物种生境情况,将传统的数据采集记录从纸质记载变为精准的数据库记载,提高了数据统计分析的准确性,为外来物种入侵的野外调查大数据采集提供了信息化支持。

2 外来入侵生物数据库

ISPM第5号标准中明确规定,有害生物记录是指提供有关在所述情况下特定有害生物在特定时间、某个地区(通常是一个国家)内存在或不存在的文件[1]。《生物多样性公约》呼吁“汇编和传播关于威胁生态系统、栖息地或物种的外来物种的信息,用于任何预防、引入和缓解活动”[30]。数以万计的数据库现已用于商业管理、政府管理、科学数据管理等许多其他领域[31]。在动植物疫情防控领域的科学研究和实践活动中经常需要查询特定有害生物的相关信息,而互联网或纸质资料中记录的信息较为分散,不同来源的信息质量不尽相同,数据的精准性、标准化程度存在差异,使得在查询时费时费力,工作效率较低。针对这一情况,一些国家或机构开发了在线的共享数据库网站,方便使用者查询相关信息,提高工作效率[32]。数据库是“根据数据结构组织、存储和管理数据的仓库”。它是长期存储在计算机中的、可共享的、统一组织和管理的大数据的集合[33]。建立入侵生物数据库,是通过数据分析进一步探索生物入侵的发生规律,进而预测生物入侵的可能性及其扩散规律,从而为入侵机制研究、疫情防控等提供信息技术支持[34]。面对日渐严峻的外来物种入侵,构建基于植物检疫的大数据平台,需要充分利用各种资源,不断充实数据库的建设与发展[34]。截至目前,国内外已成功开发多个外来入侵生物数据库[32,36-37]。

2.1 国内数据库

中国外来入侵物种数据库系统(http:∥www.chinaias.cn/wjpart/index.aspx)由中国农业科学院植物保护研究所建设。该数据库包含中国外来入侵物种地理分布信息系统、中国外来入侵物种数据库系统、外来入侵物种野外数据采集系统、外来入侵物种安全性评价系统、中国主要外来入侵昆虫DNA条形码识别系统和中国重大外来入侵昆虫远程监控系统等6个子系统,是我国入侵物种种类最齐全、信息量最大的权威网络信息平台,包括754种入侵生物、2 773张物种图片,管理和发布外来入侵物种相关数据信息,为相关人员提供了外来入侵物种信息交流和科普宣传的信息化平台。

中国国家有害生物检疫信息系统(http:∥www.pestchina.com)是由海关总署动植物检疫司、进出口食品安全局与标准法规研究中心共同开发建设。该系统由有害生物信息系统、法规标准信息系统、有害生物风险评估应用系统和有害生物检疫信息系统等4个子系统构成。风险评估应用系统和有害生物检疫信息系统不对外开放。该系统在动植物检疫、植物保护和有害生物风险分析方面提供了准确有力的信息支持和技术服务,真正实现了信息资源的整合与共享。

动植物检验检疫信息资源共享服务平台(http:∥info.apqchina.org)是由中国检验检疫科学研究院建设。该平台包括疫情动态、口岸截获、有害生物和风险分析等7个模块,但该数据库不对外开放,需要用户权限才可以使用。拥有该平台权限的使用者经常通过最新有害植物截获、有害生物查询和进境检疫要求等模块查询并获取相关信息。

中国外来入侵物种信息系统(http:∥www.iplant.cn/ias/)是由中国科学院植物研究所建设。该系统包括入侵名录、图像识别、DNA条形码、入侵动态、政策法规和参考论著6个模块。入侵名录模块包括中国入侵植物名录、中国自然生态系统外来入侵物种、农业重大外来入侵生物、国家重点管理外来入侵物种记录(第一批)、生物入侵:中国外来入侵植物图鉴。该系统为我国防范植物疫情提供了信息支持和技术服务。但是该数据库截至2019年就没有发布任何入侵动态相关信息,数据需要及时更新。

2.2 国际数据库

国际自然保护联盟入侵生物专家组(IUCN Invasive Species Specialist Group,IUCN ISSG)研发了全球入侵物种数据库(Global Invasive Species Database,GISD,http:∥www.iucngisd.org/gisd)。在该数据库中检索某一物种,可以得到其生态学信息、地理分布信息、生活史信息、危害影响以及针对该物种的管理措施等。该数据库还有一个特色功能,即提供全球100种最危险的入侵生物的相关信息。

国际农业和生物科学研究中心(Centre for Agriculture and Biosciences International,CABI)研发了CABI-ISC(CABI-Invasive Species Compendium,http:∥www.cabi.org/isc)数据库。该数据库记录了威胁全球生计和环境的入侵物种,汇集了不同类型广泛的基础科学信息,以支持全球入侵物种管理决策。在该数据库中检索某一外来入侵物种,可以得到其地理分布信息、形态特征信息、针对其提出的管理措施等。

欧洲和地中海国家植物保护组织(European and Mediterranean Plant Protection Organization,EPPO,https:∥www.eppo.int/index)是运用国家战略来防止对农业、林业和环境构成威胁的有害生物的引入和传播,并通过推广安全有效的有害生物防治方法来保护植物的组织。EPPO开发了EPPO Global Database(EPPO GD,https:∥gd.eppo.int/)数据库。该数据库旨在收集所有由EPPO制作或汇编的特定有害生物信息,包含植物和害虫的学名和通用名称,以及他们相关的EPPO代码、EPPO数据集、EPPO标准、地理分布信息、寄主植物名录和图片。

3 外来入侵物种的大数据预测与分析方法

大数据预测作为大数据技术的核心是用已有数据建立的模型去预测未来某一事件的可能发生程度,并且据此进行一定程度上的人为干预,使得未来这一事件向理想的方向发展的技术[38]。

ISPM第5号标准中明确规定[1],检疫性有害生物风险包括其传入和扩散的可能性及相关的潜在经济影响程度。检疫性有害生物风险评估是指对检疫性有害生物传入和扩散的可能性及相关的潜在经济影响程度进行评估,为后续的分析提供有力的数据支撑。CBD将利用科学资料对外来物种的引入的影响和定殖可能性进行的评估称为风险分析[1]。

随着全球合作的加深,外来入侵物种不仅影响当地的生态环境治理,甚至造成了巨大的经济损失。因此,在针对外来入侵物种的防控管理中,加强对有害生物的风险分析是至关重要的。

3.1 预测潜在地理分布

预测某一物种的潜在地理分布是有害生物风险分析的重要组成之一。潜在地理分布的预测是指通过有害生物的分布信息、生物学信息以及气候地理数据等一系列信息,预测目标有害生物在所研究地区的适生范围以及适生程度[39]。在以往有害生物潜在地理分布的大量研究中,生态位模型占据主导地位。生态位模型是利用某一物种的已知分布数据和相关环境变量来判断其生态需要,预测其在不同时空中的实际分布和潜在分布[40]。近年来有很多用于预测有害生物潜在地理分布的模型,较为常用的有地点比较模型CLIMEX[41],生态位因子分析模型DIVA GIS,基于遗传算法的规则组合预测模型GARP[42]以及最大熵模型MaxEnt[43]。其中DIVA GIS包括基于环境包络理论的BIOCLIM模型[44]和DOMAIN模型[45]。不同的生态位模型的适应性会根据所选物种的差异而有所不同,同一物种的分布数据应用于不同的模型,结果也不尽相同[46-47]。在Web of Science数据库中检索关键字“ecological niche models”,在结果中分别检索上述模型,结果表明现在被广泛使用的是MaxEnt生态位模型。

国外学者利用MaxEnt模型预测了近期入侵印度中部半岛各州的南美番茄潜叶蛾TutaabsolutaMeyrick在印度的扩散风险及其在印度的适生区[48];基于MaxEnt生态位模型和ArcGIS预测了草地贪夜蛾SpodopterafrugiperdaJ.E.Smith在中亚地区的潜在地理分布[49]。

目前,我国学者基于MaxEnt生态位模型和GIS空间分析技术预测了马缨丹LantanacamaraL.在我国的适生区[50];基于MaxEnt和Arc GIS软件预测了猕猴桃溃疡病菌Pseudomonassyringaepv.actinidiaeTakikawa 在四川的适生区[51];基于MaxEnt和SDMtoolbox工具预测了番茄潜叶蛾TutaabsolutaMeyrick在我国的适生区[52]。

3.2 预测定殖的可能性

在评估有害生物定殖可能性方面,要综合考虑有害生物可靠准确的生物信息,如生命周期、寄主范围、繁殖对策等信息,还要考虑有害生物风险分析区的环境适宜性、栽培技术和防治措施[53]。有害生物入侵后定殖可能性分析,是有害生物风险分析的重要内容[54]。这就要求从已有的数据中挖掘到有用的数据信息用于预测定殖的可能性。数据挖掘是发现知识的一种手段,是从数据中提取隐含的且先前未知的和潜在作用的信息的过程[30]。数据聚类是数据挖掘的重要技术之一[55-56],是根据数据的相似程度把数据划分为不同的聚合类群,在一个聚合类群中的相似性很高,不同聚合类群之间的相似度很低。基于聚类元素加权分析的方法调查一个区域的昆虫物种组合,可以表明新害虫入侵的风险,这为外来物种造成的潜在入侵风险分析提供了改进工具[57]。聚类分析方法包括自组织映射(SOM)、k均值聚类法、层次聚类法等,其中SOM广泛应用于生物入侵定殖可能性的评估[54,58]。如运用SOM工具分析全球486种广泛分布的真菌病原体,证明SOM非常有效,可以被世界各地的生物安全机构所使用,从而更好地全面评估外来物种的入侵风险[59];通过使用专家评估法和SOM聚类分析方法有效地筛选了植物检疫性有害生物名单[60];基于SOM聚类分析方法研究了重要经济实蝇在全球的定殖风险[61],并指出在中国、美国、南非、阿根廷、意大利和澳大利亚6个国家定殖可能性最高的实蝇物种,从而证明SOM分析可以进行潜在入侵生物的风险评估,排列出一个潜在生物入侵风险名单,可用于有害生物的初步筛查以及外来入侵物种的早期预警。

3.3 定量预测潜在经济损失

评估某一有害生物在我国可能造成的潜在经济损失可以在防范外来生物入侵方面发挥极其重要的作用。目前,对有害生物进行潜在经济损失评估的方法主要有两种。一是利用生态位模型与ArcGIS结合预测该有害生物的潜在地理分布范围,然后构建潜在损失估算模型评估其对相关产业能够造成的潜在经济损失。如使用GARP生态位模型结合ArcGIS栅格数据图成功预测了尚未入侵我国的油菜茎基溃疡病在我国的适生区,并构建潜在损失估算模型,评估了其对我国油菜生产造成的潜在经济损失[62]。二是基于随机模型利用@RISK软件对某一有害生物造成的潜在经济损失进行预测。@RISK软件是基于蒙特卡洛随机模拟方法,构建不同场景下潜在经济损失模型,模拟有害生物潜在经济损失的软件[54]。Taylor等[63]使用该软件评估了葡萄霜霉病菌Plasmoparaviticola(Berk.&Curt.) Berl.&.de Toni给西澳大利亚葡萄栽培产业带来的经济损失。目前应用@RISK软件评估入侵生物造成的潜在经济损失已有许多报道,如草地贪夜蛾、瓜实蝇ZeugodacuscucurbitaeCoquillett、小麦印度腥黑穗病菌TilletiaindicaMitra[64-66]等。

4 展望

研发和完善数据库离不开数据的支持,建立入侵物种相关的数据库需要大量的入侵物种的基础数据,这就要求学者们在今后的研究中相互合作,共享数据,建立全面、标准一致、更新及时、数据来源准确的生物入侵数据库[35-37]。在查阅文献以及浏览主要数据库时,发现有些数据库,如中国外来入侵物种数据库对一般用户不开放,使得用户不能在该数据库查询信息。今后,应该将数据库中记载的信息在最大程度上实现全民共享,使得使用者可以在第一时间了解到最新的动植物疫情相关的信息。

建立外来入侵物种大数据平台,不仅能够整合国内外动植物疫情发生发展等数据,还可以利用现代化信息分析技术优化资源,同时也能更好地为检验检疫和其他领域开展工作提供强有力的技术支持[26]。随着大数据、云计算、人工智能的发展,构建植物检疫预警大平台越来越离不开大数据技术的支持。要发展外来入侵物种的数据采集技术,完善针对入侵生物的风险分析方法。不同外来入侵物种的分布模式、所处环境不同,因此要选择影响物种分布的关键环境变量和相对准确的模型来进行风险分析。这就意味着要有一定量精确又有代表性的地理分布点数据,要充分了解该物种的生物学以及生态学特性,并结合多种模型,综合考虑其他因素,从而得到相对准确的预测结构[47]。伴随着全球经济一体化的不断深入发展,理应在针对外来入侵物种的检验检测与防控工作中运用大数据技术,充分合理利用检疫过程中积累的数据,在对外来入侵物种的预报、预测预警及其后期检测工作方面提供足够的信息技术支持。

猜你喜欢

物种数据库生物
生物多样性
生物多样性
上上生物
第12话 完美生物
回首2018,这些新物种值得关注
电咖再造新物种
数据库
世界上的15个最不可思议的新物种
数据库
数据库