中国果树花期2016年近红外光谱和图像数据集
2021-05-24王晓丽胡乾浩刘婷婷
王晓丽 胡乾浩 满 芮* 刘婷婷
(1.中国农业科学院农业信息研究所,北京 100081;2.北京农业职业学院信息中心,北京 100081;3.国家农业科学数据中心,北京 100081;4.农业农村部农业大数据重点实验室,北京 100081)
数据库(集)基本信息简介
1 引言
在使用遥感技术进行果树理化性状研究时,首先需先进行果树树种的识别,否则会导致张冠李戴的现象,而不同果树花器在性状上较叶片更容易区分,因此在花期对果树树种进行识别是即经济又有效的方法。本研究收集了不同果树花期的光谱和图像数据,对开展果树树种识别提供基础数据,同时也为今后利用遥感技术对果园进行精准管理提供参考。
目前,在果树花期近红外光谱和图像数据的研究方面,朱永宁[1]通过2018—2019 年宁夏16 套枸杞农田小气候站上的实景监测系统,于枸杞生长季(4 月1日—11 月15 日)采集枸杞开花期和果实成熟期室外特征图像共3000余张,处理后收集图像样本7260张。刘颖[2]在试验果园采集了99 株矮砧‘嘎啦’苹果树花期室外冠层高光谱图像数据。雷彤[3]采集了129棵苹果树的室外冠层光谱和图像数据,对数据样本进行筛选形成54 棵苹果树的光谱和图像数据集。刘艳丽[4]采集了100 个哈姆林甜橙花朵室内高光谱图像数据。从前人的相关工作来看,多数是对单品种的花期图像或光谱数据进行收集。多品种的数据采集也仅限于室外冠层光谱数据,同时采集室内和室外光谱和图像数据的研究较少。
为弥补以上不足,本研究利用ASD FieldSpec3便携式光谱分析仪采集了梨花、苹果花和杏花3 种果树花期室内和室外的光谱数据,为记录花朵状态采集了果树花期室内和室外图像数据集,为今后探寻利用地面光谱测试数据对果树树种进行科学识别提供数据基础。
2 数据采集和处理方法
2.1 样品采集
2016年4月28日—5月10日,于辽宁兴城国家级标准资源圃选取盛花期的早酥梨、华红苹果和银白杏三种果树进行样本采集,每个品种选取树高和胸径基本一致的10 株,每株选取3~4 个花簇作为测定点。每个测定点选取的标准为花束比较紧凑的部位。之后采集每个测定点的一朵花朵,将其放置于干净透明的保鲜袋中并编号(如图1 所示),放入恒温箱中带回实验室。为确保样品新鲜,在恒温箱中放入冰块。由于杏花室内图片在质量控制时被剔除,因此形成了苹果和梨的室内图像数据集,苹果、梨和杏花的室外图像数据集。
图1 样品装袋编号Fig.1 Sample bag number
2.2 果树花期近红外光谱数据采集
本实验使用美国ASD(AnalyticalSpectralDevice)公司的FieldSpec3 便携式光谱辐射计进行光谱测量;该仪器的有效光谱范围在350~2500 nm 之间,光谱分辨率为1nm。光谱仪需搭配Windows 系统环境的笔记本,并安装配套的采集软件。本实验使用Field‐SpecRS3(一下简称RS3)软件进行光谱采集、仪器优化和白板校正等。为保证仪器状态稳定,开机预热时间不少于1小时[5-6]。
室外测量时,选择无云无风的晴天,于北京时间上午11:30 至下午2:30 之间进行测量,测量时要先进行白板校正,确认基线为100%后,再进行数据获取。并且仪器探头垂直向下,以确保与卫星传感器探测方向一致。
室内测量时,使用黑色不反光的棉布为背景,尽量将花朵正面朝上放置;探头为裸光纤,前视场角25°。测量时固定在样品正上方10cm 处,垂直于花朵;使用光谱仪配套的50W 卤化灯作为室内光源(约3100 K 色温,模拟太阳光),45°的入射角,距离样品45cm 左右,;为提高数据准确性,每隔10min 左右进行一次白板校正;采集时,1朵花采集10条光谱。
采集的数据格式为ASCII文件,后期可通过ASD公司的ViewSpecPro 软件查看,并可转化为.txt 等格式,按照约定的协议进行数据分析读取工作。
2.3 果树花期图像采集
本实验使用尼康D90 型数码相机和尼克尔镜头进行图像数据采集。D90 采用了有效像素为1230 的DX 格式CMOS传感器;感应器尺寸为23.6×15.8mm;感光度为200~3200;具有11点自动对焦区域;快门时滞大约65 毫秒;具有测光控制和自动D-Lighting 功能,可弥补图片中的细节丢失;支持NEF、JPEG、AVI图片存储格式,文件自动编号;文件最大尺寸4288 像素×2848像素,最多可拍1850张左右。
室内测量时,将花朵置于配有标尺的黑色平板上,通过标尺可测量花朵的宽度和长度。为避免阴影产生,同时确保光照强度稳定,分别在左右两侧架设一盏摄影灯。将相机无倾斜的置于距离花朵上方40cm 左右,并使用自动曝光模式进行拍摄。图像格式为JPEG,尺寸为4288像素×2848像素[7]。
室外测量时,保持与光谱数据采集的位置相同,对准被测点进行拍摄,后期使用Photoshop 对图像进行裁剪,选取被测点花簇,生成1088 像素×1088 像素的图像。图像存储格式统一为JPEG格式。
3 数据样本描述
3.1 果树花期近红外光谱数据
不同果树品种光谱数据单独保存为一个文件夹,每10 条连续的.asd 数据为同一样本的光谱数据,如:“001-01-01”~“001-01-10”为同一花朵的光谱数据。文件夹命名方式为“序号+品种名+室内/室外”。部分样本示例如图2所示。
图2 不同果树树种花的反射光谱特征Fig.2 Characteristics of remote sensing reflectance spectra of fruit trees in flowering stages
3.2 果树花期图像数据
果树花期图像数据中每个品种的图像按品种和室内外分类保存在不同的文件夹中,一个花朵样本对应一张图像。文件夹命名方式为"序号+品种名+室内/室外”。部分样本示例如图3所示。
4 数据质量控制和评估
为确保数据质量和可靠性,所有果树花朵均采集于国家级标准资源圃,由中国农业科学院果树研究所的专业人员进行果树品种鉴别和实验操作规范指导。采用国际通用的光谱采样方法采集花朵近红外光谱数据。采用高清相机进行图像采集,并使用国际通用的JPEG格式进行存储。室内图像采集时使用标准刻度尺作为参考,刻度单位为毫米,可为使用者提取花朵大小提供依据。
图3 部分样本的花期图像(单位:cm)Fig.3 Flowering images of some samples(Unit:cm)
数据采集与整理过程中,由果树所专业人员,对样本颜色和形状等进行检查,如发现异常则认为样本数据可疑。光谱数据采集后对数据质量进行审查,剔除反射率不在正常范围内的光谱数据。杏花室内数据出现光谱连续点跳跃的现象,为提升数据质量,使用ViewSpec 软件自带的Splice Correction 功能对数据进行修正。拼接校正[8-10]对数据的质量提升有着重要作用。对图像数据进行筛选,剔除模糊不清的图像数据。
5 数据使用方法和建议
室外光谱数据为自然环境,更接近卫星传感器所获得的数据,而室内光谱数据测试环境稳定,能更好的反应花朵的光谱反射特征,可结合室内室外两种光谱数据,探寻各品种光谱共性,分析光谱特征,进行果树识别。
另外,使用室内拍摄的图像数据,可提取花的形状、颜色和尺寸等信息,通过这些信息进行树种识别。
数据作者分工职责
王晓丽(1982—),女,河北人,博士,助理研究员,主要从事农业科学数据管理与分析研究。本研究主要工作:数据汇总整理。
胡乾浩(1993—),男,北京人,硕士,研实员,主要从事农业科学数据获取与分析研究。本研究主要工作:图像数据采集。
满芮(1985—),女,北京人,博士,助理研究员,主要从事农业科学数据管理与共享研究。本研究主要工作:总体方案设计与组织实施。
刘婷婷(1985—),女,北京人,硕士,助理研究员,主要从事农业科学数据获取与研究。本研究主要工作:光谱数据采集。