2016年辽宁兴城富士、华红、嘎啦苹果叶片光谱与图像数据集
2022-06-30王晓丽樊景超刘婷婷曹姗姗
高 飞 王晓丽 胡 林 樊景超 刘婷婷 闫 燊 曹姗姗
(1.中国农业科学院农业信息学研究所,北京 100081;2.中国农业科学院作物科学研究所,北京 100081)
数据库(集)基本信息汇总表
1 引言
健康植物的波谱特征主要取决于它的叶子,叶片的生长状态决定了不同的特征光谱信息。不同植物叶片的色素含量、细胞结构、含水量不同,光谱响应也不相同。利用光谱和图像分析等技术,可以识别植物类型、反演植物营养元素含量、监测植物生长状态。胡钰炜等研究不同葡萄品种叶片组织结构及其光谱响应差异,采集了意大利、夏黑、秋黑、红宝石、秋黑4个葡萄品种的叶片光谱数据[1]。张晓东等利用近红外光谱技术进行甜椒营养物质监测,采集了自行培养甜椒品种叶片的光谱数据,其中甜椒叶片样本量为120[2]。彭要奇等采集了55组不同生育期的玉米叶片光谱和水分数据,构建基于多光谱图像的玉米叶片含水量反演模型,实现对玉米含水量的快速检测[3]。刘维等在北京主要农副产品基地均匀设置50 个试验点,在室外无风晴朗天气里采集桃树叶片光谱数据,同时测定该试验点土壤重金属含量,研究土壤砷元素含量与光谱反射率之间关系[4]。韩庚等探索马铃薯叶片光谱特征值与叶片氮元素累积含量之间的定量关系,在马铃薯出苗的20 天、35 天、50 天、65 天,采集马铃薯叶片光谱数据[5]。刘燕德等构建基于叶绿素荧光光谱数据的茶叶藻斑病模型,采集了270 个样本的茶叶叶片光谱数据,其中健康茶叶叶片、轻度斑藻病病害叶片、重度斑藻病病害叶片数量各占1/3[6]。
在植物叶片图像数据利用方面,王浩等构建基于SVM 和CNN 算法的黄瓜病斑叶片识别模型,采集12000 张黄瓜叶片图像,其中病斑样本8890 张,非病斑样本3110 张[7]。苗荣慧等采用机器视觉检测技术进行菠菜重叠叶片与杂草识别,采集具有菠菜和灰菜重叠区域的图像55 幅[8]。乔虹等对大田环境中的葡萄生长状态与病害进行长期自动检测,采集正常的葡萄叶片、病害叶片以及不同品种的葡萄叶片图像共1635 张[9]。鲍文霞等利用图像识别技术进行小麦病害严重程度研究,采集小麦条锈病、白粉病两类病害图像各180幅[10]。
根据之前的研究,在使用光谱与图像数据进行研究时,通常需要植物生长某一阶段的数据,数据采集周期长。而在进行图像智能识别算法研究时,图片样本量越大得到的训练结果约准确。因此,针对某一特定品种开展长期的光谱与图像数据收集是十分有意义的。本研究以辽宁兴城富士、华红、嘎啦苹果为研究对象,建立采集其标准叶片的光谱与图像数据集,为苹果树生长状态监测、病虫害识别等研究提供基础数据。
2 数据采集和处理方法
2.1 选叶、采叶及叶片预处理
本研究选用苹果品种为富士、华红、嘎啦,来自辽宁兴城中国农业科学院果树研究所资源圃。每个品种随机选取1 株果树,采摘健康生长叶片。为降低采摘叶片对果树的伤害,叶片每周采集一次,每次采摘15个叶片作为样片,本研究叶片采集持续12周:2016年8 月5 日—2016 年10 月21 日。为保持叶片的新鲜,在测定前将采摘叶片样本保存在带冰块的恒温箱中。
2.2 叶片近红外光谱数据采集
本实验使用美国ASD 公司的FieldSpec3 便携式光谱辐射计,其有效光谱范围为350~2500nm,光谱分辨率为1nm。在windows 系统中运行FieldSpec3RS3软件采集叶片光谱数据。叶片光谱数据采集在室内进行,选用光谱仪配套的5W 卤化灯作为室内光源,距离叶片45厘米左右,入射角为45度,以黑色不反光棉布做背景。使用裸光纤探头,前视场角为25 度。测量时垂直固定于样品正上方10 厘米,叶片正面朝上放置。
光谱仪预热80 分钟后,进行光谱采集,每隔10 min 进行一次白板校正优化。每采集10 次光谱数据求平均后存储在指定文件夹中生成1 条.asd 数据,每个叶片样本采集保存10 个.asd 数据。数据可使用ViewSpecPro软件查看,并可转化为.txt等格式。
2.3 苹果叶片图像采集
本实验使用佳能EOS6D 相机进行叶片图像采集,图像感应器为CMOS 约2020 万像素,尺寸为35.8mmx23.9mm,具有自动、手动、添加除尘功能。该相机支持JPEG、RAW 两种图像格式,可以同时记录RAW+JEG,记录像素最大为5472x3648。
将叶片放置在带有标尺的蓝色平板上,采集图像同时记录叶片的长度和宽度。在平板左右两侧放置摄影灯,保持光强稳定,避免阴影。拍摄时相机垂直位于叶片上方约45厘米。
3 数据样本描述
3.1 苹果叶片近红外光谱数据
本实验数据采集周期为12 周,每周的数据保存在1 个文件夹中,每个样本采集10 个光谱数据,保存格式为.asd,例如,光谱数据spectra-20160801-fushi-01-01.asd~spectra-20160801-fushi-01-10.asd 均为样本1的光谱数据。光谱数据命名方式为“光谱+日期+品种+样本编号+光谱序号”,所在文件夹命名方式为“光谱+日期+品种”。部分样本示例如图1所示。
图1 部分样本光谱反射率Fig.1 Remote sensing reflectance spectra of some samples
3.2 苹果叶片图像数据
苹果叶片图像数据为JPEG 格式,分辨率为5472x3648。每周的图像数据保存在1 个文件夹中,每个样本保存1 张拍摄图片。图像数据文件夹命名方式为“图像+日期+品种”,图片命名方式为“图像+日期+品种+样本编号”。部分样例图片见图2。
图2 部分样本8月12日叶片图像(单位:cm)Fig.2 Leaf images of some samples on August 12(Unit:cm)
4 数据质量控制和评估
本实验采集辽宁兴城富士、华红、嘎啦苹果叶片的光谱、图像数据,质量控制主要从以下两个方面进行:一是确保叶片为标准富士、华红、嘎啦苹果叶片。本实验所用苹果叶片样本均来自于国家级苹果标准资源圃,由果树专家进行品种鉴别和试验操作,如果样本叶片存在斑点、颜色异常等问题,使用仪器进行检测,检测结果显示样本叶片带病,则剔除该样本。二是数据采集操作规范。光谱数据采集按照国际通用操作规范进行,每次采集的光谱数据,可根据曲线图,删除异常曲线,其他曲线取平均值。叶片图像数据采用高清相机拍摄,拍摄完成后检查图片是否清晰,如果出现重影或模糊的情况,删除照片重新拍摄。光谱采集和图像采集为同一环境。
5 数据使用方法和建议
不同品种的苹果叶片在理化成分、颜色、形状、尺寸等方面都会不同,体现在光谱反射率和图像上也会有所差异,因此可使用此数据集探索光谱、图像和不同苹果品种之间的关系。同时本数据集加入时间因素,因此数据更具有代表性。
数据作者分工职责
高飞(1988—),女,河北省石家庄人,博士,助理研究员,主要从事科学数据管理相关研究。本研究主要工作:数据汇总整理与论文撰写。
王晓丽(1982—),女,河北省石家庄人,博士,助理研究员,主要从事科学数据管理相关研究,本研究主要工作:数据整理。
胡林(1967—),男,内蒙古商都县人,博士,研究员,主要从事科学数据管理相关研究。本研究主要工作:总体设计与组织实施。
樊景超(1980—),男,辽宁省沈阳市人,博士,副研究员,研究方向为农业科学数据管理。主要承担工作:苹果叶片光谱数据采集。
刘婷婷(1985—),女,北京人,硕士,助理研究员,研究方向为科学数据管理。主要承担工作:苹果叶片图像数据采集。
闫燊(1987—),男,山东省菏泽市人,博士,助理研究员,研究方向为农业大数据。主要承担工作:数据集的整合与处理。
曹姗姗(1984—),女,黑龙江哈尔滨人,博士,副研究员,研究方向为农业时空信息智能分析。主要承担工作:数据分析。
引用数据
[1]高飞;王晓丽,胡林,等.2016 年辽宁兴城富士、华红、嘎啦苹果叶片光谱与图像数据集.[DB/OL].国家农业科学数据中心.DOI:10.12205/A0007.20211029.36.is.1909
Gao F,Wang X L,Hu L,et al.Spectra and Images of Fuji,Huahong and Gala Apple Leaves in Xingcheng,Liaoning Province,in 2016.[DB/OL].National Agriculture Science Data Center.DOI:10.12205/A0007.20211029.36.is.1909