2013-2018年中国主要作物田杂草发生危害数据集
2022-01-15张翔鹤满芮王晓丽樊景超黄红娟魏守辉
张翔鹤,满芮,3,王晓丽,3,樊景超,3*,黄红娟,魏守辉*
1.中国农业科学院农业信息研究所,北京 100081
2.国家农业科学数据中心,北京 100081
3.农业农村部农业大数据重点实验室,北京 100081
4.中国农业科学院植物保护研究所,北京 100193
数据库(集)基本信息简介
2013-2018年中国主要作物田杂草发生危害数据集images/BZ_196_709_1718_1122_1803.pngimages/BZ_196_709_1802_1122_1883.png魏守辉images/BZ_196_709_1883_1122_1963.png樊景超(fanjingchao@caas.cn);魏守辉(weishouhui@caas.cn)2013-2018年images/BZ_196_709_1963_1122_2044.pngimages/BZ_196_709_2043_1122_2280.png地理范围为28.4824°N-45.8273°N,111.4499°E-127.0559°E,其中包括中国安徽省、河南省、湖北省、吉林省、江苏省、山东省和浙江省。地理区域范围涉及的国家有中国。images/BZ_196_709_2279_1122_2360.png1.62 GBimages/BZ_196_709_2360_1122_2440.png*.xls,*.jpgimages/BZ_196_709_2440_1122_2520.pnghttp://dx.doi.org/10.12205/asda.j00003.00005images/BZ_196_709_2520_1122_2679.png中国农业科学院创新工程(2020CX017);科技部科技基础性工作专项(2013FY113200)。数据库(集)组成数据集主要包含作物田杂草发生危害的文本属性数据和图像数据,其中:(1)3392个作物田杂草文本数据,涵盖281个杂草种类,约1.7 MB;(2)3392张作物田杂草资源图像,数据量约1.62 GB。
引 言
作物田杂草是威胁农业生产的重要生物灾害之一,兼具野生植物特点和栽培作物习性,通常对环境的适应和抗逆性均很强[1],与作物激烈竞争光照、水分、养分和生长空间等资源[2]。目前,我国农田杂草有1454种,其中难治恶性杂草有130种,通常造成作物减产10%-20%,严重时可减产50%以上甚至颗粒无收[3]。我国杂草发生危害面积年均超过14亿亩次,在每年投入235亿元草害防治费用的情况下,杂草仍会导致粮食减产达5000万吨,每年直接经济损失近千亿元[4]。保障我国粮食安全和生态安全,发展绿色高质量农产品生产,已成为现代农业发展的重要战略目标之一。
阐明作物田杂草发生分布和危害状况,对草害的监测预警和精准防控具有重要意义。当前,我国作物田杂草信息数据的研究,主要集中于图像数据,通过遥感等前沿采集技术,对田间杂草进行数据采集和识别等,而缺乏对杂草实际发生危害的数量调查。张茹飞[5]等人通过低空遥感技术,测得相关数据后,创新建立了一套杂草识别和定位方法研究模型。李颖[6]等人收集田间杂草的地面成像光谱数据,提出了一种综合面向对象与高光谱特征匹配的杂草识别方法。王生生[7]等人改进传统和积网络为轻量和积网络,基于无人机遥感图像,对大豆田杂草识别方法开展研究。此外,对于有记载的可信度高的同类调查数据集,高海峰[8]等人以喀什地区泽普县为主,对喀什、和田等地的杂草种类进行了调查,形成2018-2020年南疆果麦间作麦田杂草种类调查数据库,体现了不同间作模式、不同杂草种类和麦田杂草的多样性。中国热带农业科学院环境与植物保护研究所[9],对广东省果园多种常见杂草生物学特性进行了分析,形成分析调查数据集,含有采样地点、植物种类、处理方法、环境控制、光合作用、根系特征、化感作用等数据。
本研究主要调查了玉米、小麦、茶园等农作物田杂草发生数量与危害程度,采用的调查方法为倒置“W”九点取样法[10-11],其他可用调查方法还有七级目测法[12]和三层三级目测法[13]等。调查遍及安徽、河南、湖北、江苏、山东、浙江、吉林等省份。通过对我国主要作物田杂草组成、实际发生危害情况的实地调查,同时结合历年发生危害的资料调研,数据经过研究人员规范化整理、鉴定和录入,得到了我国主要作物田杂草的发生危害数据,填补了当前我国杂草相关数据资源的空白。
本数据集共记载了3392条发生量记录。每条记录记载了每个物种的中文名、学名、调查对象、资源归类编码(可选)、调查省份、调查地点、经度、纬度、海拔、作物种类、作物生育期(可选)、寄主(可选)、图像、调查人、调查时间、调查编号、用药情况(可选)、发生密度、发生频度、植株高度(可选)、发生盖度(可选)、植株鲜重(可选)、发生优势度等信息,可以提供给相关技术人员使用和分析。
1 数据采集和处理方法
本数据集是基于中国农业科学院创新工程(2020CX017)、国家科技基础性工作专项“主要农作物有害生物及其天敌资源调查”(2013FY113200),对其完成的主要作物田杂草实际发生数量的调查内容,进行数据信息的规范化整理,结合历年文献数据等资料调研,最终得到的我国主要作物田杂草发生危害数据。
1.1 数据采集
本数据集通过野外实地调查,记载我国主要作物田草害组成、发生危害情况,同时与历年发生危害的资料调研相结合。其中经纬度、海拔等地理数据是根据Garmin系列手持GPS接收信息填写,照片通过Canon相机、Leica显微镜相机以及Huawei、iPhone各型号手机等拍摄。株高、鲜重等数据为米尺、卷尺、电子秤或弹簧秤等科学仪器观测产生,盖度、频度等为现场调查值,由实验操作人员仔细记录。现场记录表格如表1所示。最初获得发生危害有关的原始数据,经过加工筛选,剔除不完整有缺失的数据后,或与其他有记载的同类型可信度高的调查数据比较后,逐一整理汇交。数据采集时间为2013年7月至2018年4月。
表1 主要作物田杂草调查表
1.2 杂草群落调查方法
本数据集采用倒置“W”9点取样法进行取样,每块样方面积不小于0.25 m2(50 cm×50 cm),用GPS测量样地的经度、纬度、海拔,记录样地的地理信息、土壤类型、种植制度及除草剂应用历史,记载杂草的发生种类、密度、危害作物(具体品种、生长状况)、杂草覆盖度(百分比)、株高或鲜重等。如地块面积为240×280步,在田间调查时,可沿地边向前走70步,向右转后向地里走24步,开始倒置“W”9点的第一点取样,第1点调查结束后,向纵深前方走70步,再向右转后向地里走24步,开始第2点取样,用同样的方法(如图1所示)完成9点取样。
图1 倒置“W”9点取样示意图
1.3 数据数字化加工
作物田杂草发生危害数据集的主体部分是文本信息,形式为表格文件。每一条数据都是以真实的野外调查情况为数据来源,经由实验操作人员认真仔细记录,比对处理后,整合成完整的数据集。各指标的单位确定和计算公式均严格遵循《农田杂草调查技术规范》[14]。
作物田杂草发生危害数据集的整理加工步骤为:第一步,实验操作人员参考《中国杂草志》[15]或《中国植物志》[16],熟悉常见的作物田杂草种类;第二步,根据《农田杂草调查技术规范》[14],实验操作人员进行野外实地调查,并仔细记录在Excel文件中;第三步,研究人员对数据进行规范化整理,鉴定、加工、筛选不合理数据;第四步,研究人员对同一数据项不同调查单位不同仪器进行对比测量,或与其他有记载的同类型可信度高的调查数据比较后,逐一整理汇交;第五步,研究人员把经过加工整理过的数据上传到数据汇交系统,开放共享。
在杂草发生危害数据的采集过程中,研究人员逐条对数据进行审核后,提交的数字化数据经由专业领域专家进行审核,形成Excel表格文件,实体储存介质为硬盘,作为原始文件进行归档保存。此外,本数据集通过国家农业科学数据中心的数据汇交系统,提交到共享平台,实现网络共享。
2 数据样本描述
作物田杂草发生危害数据集涵盖281种杂草资源,调查遍及安徽、河南、湖北、江苏、山东、浙江、吉林7个省份,共3392条记录,形成一个Excel表格文件。其中,数据集中描述规范的字段数量分别为:安徽省小麦作物田杂草记录383条,河南省玉米作物田杂草记录904条,湖北省小麦作物田杂草记录275条,江苏省小麦作物田杂草记录237条,山东省小麦作物田杂草记录220条,浙江省茶叶田杂草记录818条,吉林省玉米作物田杂草记录555条。
2.1 文件说明
本数据集记载的文本属性数据,共有3392条发生量记录。数据要素项包括:发生ID、中文名、学名、调查对象、资源归类编码(可选)、调查省份、调查地点、经度、纬度、海拔、作物种类、作物生育期(可选)、寄主(可选)、图像、调查人、调查时间、调查编号、用药情况(可选)、发生密度、发生频度、植株高度(可选)、发生盖度(可选)、发生优势度、调查单位、共享方式、获取途径(可选)、联系人、单位、地址、邮编、电话、E-mail。内容说明如表2所示,可以提供给相关技术人员分析使用。数据集内容表征的时间频度,为杂草的年发生数量;内容表征的空间粒度,分省、分县、分村、农场、团场等。
表2 数据要素项内容说明
要素项(字段) 字段度量单位 字段代码说明发生盖度(可选) % 杂草盖度植株鲜重(可选) g 杂草地上部植株的总鲜重发生优势度 % 发生优势度调查单位 / 调查人所在单位共享方式 / 完全开放共享获取途径(可选) / 邮寄联系人 / 联系人单位 / 联系人所在单位地址 / 联系人所在单位地址邮编 / 联系人所在单位邮编电话 / 联系人所在单位电话E-mail / 联系人邮箱
其中,调查编号的命名规则为:省份首字母+城市首字母+作物种类编号+杂草种类编号,小麦编号为X,玉米编号为Y,茶编号为C;例如,山东省临沂市兰陵县二庙乡小麦田采集的第3个样方的杂草,调查编号为:SLX3。发生密度为单位面积内某种杂草的株数或分蘖数。发生频度为某种杂草出现的样方数占调查总样方数的百分比。植株鲜重为单位面积内某种杂草地上部植株的总鲜重。发生优势度为某种杂草在杂草群落中所占的比重,即该种杂草的相对频度、相对鲜重、相对密度之和的平均值。相对频度=(某种杂草的频度/各种杂草的频度和)×100%。相对鲜重=(某种杂草的平均鲜重/各种杂草的鲜重和)×100%。相对密度=(某种杂草的平均密度/各种杂草的密度和)×100%。所有指标的计算方式均严格遵循《农田杂草调查技术规范》[14]。
2.2 数据资源实体共享
本数据集的共享方式为完全开放共享,相关网络访问和下载服务交由数据汇交管理机构(国家农业科学数据中心)提供。
3 数据质量控制和评估
3.1 数据来源
作物田杂草发生危害数据信息的主要来源有野外监测、考察调查、实验试验数据等。结合历年发生危害的资料调研,由专业人员规范记录。数据由专业技术人员使用工具测量生产,均保留有原始数据,未经加工处理,从而保证数据的原始可靠性。杂草种类的鉴定和命名主要依据《中国杂草志》[14]和《中国植物志》[15],调查前预先悉知作物田杂草种类,并在野外实地调查过程中,对一些罕见杂草进行识别确认,保证了数据资源的准确性。
3.2 数据处理规范
本研究中,数据采集方法严格按照《农田杂草调查技术规范》[16]进行,严格遵守该规范所规定的农田杂草调查的内容、取样方式、数据处理以及分析方法。该规范由中国农业科学院植物保护研究所制定,经由国家农业科学数据中心整理发布。该规范是在分析相关已有调查方法的基础上研究制定的,具有科学性和历史逻辑性,适用于调查主要作物田杂草的发生分布、种群动态和危害水平。
在该规范下建立的作物田杂草发生危害数据集,能够对我国常见作物田杂草的种类以及发生危害数量进行全面、统一、科学、完整收集和整合。并且本数据集收集记录的数据均为原始数据,并未进行大量加工处理,只完成了不合理数据的剔除,因此能够反映最真实的田间调查结果。再通过国家农业科学数据中心对其进行整理发布,开放共享,合理提高数据集的开发利用价值。
4 数据价值
本数据集通过野外实地调查,获得原始、真实、反映实际情况的杂草发生危害数据资源。通过对本数据集的分析与利用,可以明确我国主要作物田主产省份的杂草发生危害状况,分析其发展趋势,从而提出因地制宜的草害防治对策[17-18],并结合生物生态或化学方法进行杂草防控[19]。此外,针对本数据集中的图像数据资源,可以对杂草的图像识别进行研究,开发杂草识别模型系统等,为我国杂草的智能防控提供技术支撑[20-21]。
致 谢
数据调查人张朝贤、姜翠兰协助制定了杂草调查技术方案,并且参与了大量田间调查和数据分析工作,为本数据集的完成奠定了重要基础。特此致谢!