利用植被指数非相似性监测水稻病虫害方法研究
2020-05-23李福根张保辉段玉林
李福根,张保辉,段玉林
(1.中国农业科学院农业资源与农业区划研究所/农业部农业遥感重点实验室,北京100081;2.中国科学院空天信息创新研究院 遥感科学国家重点实验室,北京100101)
0 引言
水稻作为我国最主要的粮食作物,种植面积约占全国粮食作物种植面积的28%,每年为全国60%以上的人口提供主食供应[1]。水稻的安全健康生长对保障国家农业生产,维护国家粮食安全起到了举足轻重的作用。然而,每年因病虫害爆发造成的水稻产量损失约占总产量的15%~40%[2],成为制约我国水稻高产、优质和可持续发展的主要限制因素之一,严重威胁国家粮食安全。
为降低水稻病虫害对农业生产的危害,各地在种植一线建立了多个植保站来监测水稻病虫害发生的地点、范围和严重程度。但这种基于人工调查鉴别的方法费时费力且主观化严重[3]。随着物联网技术的发展,各种农情监测设备可以通过网络传输实现水稻病虫害集中监测[4],但这些设备在监测方面往往具有滞后性,且在较大尺度内形成空间全域布设监测短期内仍是不可能实现的,难以满足实际生产需求。遥感技术作为一种宏观性强、时效快、经济成本低且数据综合力强的新技术,在水稻病虫害监测方面具有广阔应用潜力[5-6]。
利用遥感技术监测水稻病虫害的物理基础主要是当水稻受到病虫害胁迫时,往往会发生不同的应激症状或植株损伤,引发水稻植株光谱反射的变化,从而被遥感传感器捕捉[7]。为证明这一理论,研究人员开展了大量的地面研究。Wang 等[8]利用ASD Fieldspec3地物光谱仪发现水稻褐斑病和水稻纹枯病发病早期会引起990 nm 附近的红边波段发生异常,但由于人类视觉的限制,这一异常难以被人工察觉;Yang 和Cheng[9]的研究发现水稻受褐飞虱侵扰时,737~925 nm 范围内的近红外波段反射率会发生改变;Liu等[10]通过对水稻稻穗的光谱分析发现水稻颖枯病会引发850 nm 附近波段的反射率发生变化;刘占宇等[11]研究发现水稻细菌性褐斑病同样可以通过光谱异常现象监测出来;黄建荣等[12]的研究发现水稻受稻纵卷叶螟危害后,水稻叶片的光谱会发生明显变化,且受到的危害程度不同,波段也不同;Yang 等[13]研究发现水稻褐飞虱和卷叶螟危害后有相似的光谱异常发生。以上研究表明,水稻受不同病虫害侵扰时,其光谱反射率会在一定波段范围内发生变化,但这些波段可能会有一些重叠。因此,利用遥感技术监测水稻光谱反射异常从而监测水稻病虫害是可行的,但要监测具体某一种病虫害还需要进一步探索。
虽然利用遥感技术观测水稻病虫害的可行性已经在多次地面试验中被证实,但是鲜有在区域尺度利用对地观测技术监测水稻病虫害的研究。这可能是因为水稻生长过程中下垫面土壤含水量较高,甚至要经历水淹过程,造成下垫面属性发生改变,从而使得水稻田整体的光谱曲线影像出现“蓝移”现象[14],与其他大田作物的反射光谱曲线形成了鲜明差异。Qin 和Zhang[15]研究发现,在区域尺度,考虑了蓝光波段的植被指数对水稻病虫害的发生更为敏感,并以此提出了水稻病虫害指数和水稻病虫害比值指数,其与水稻病虫害的拟合结果优于其他传统植被指数。袁建清[16]利用无人机观测到的健康水稻和受穗颈瘟病侵蚀的水稻影像做对比,发现传统的基于近红外、红光、绿光波段计算的几种植被指数对水稻病虫害的分类精度并不理想。由此看来,通过计算植被指数来实现区域尺度(基于遥感监测)水稻病虫害仍是目前主要的研究方向。尽管植被指数在监测甜菜[17]、小麦[18-19]、棉花[20]等作物病虫害方面已有许多成熟研究,但在水稻病虫害监测领域尚未形成实际可操作普适性方法。然而,利用遥感技术监测农田区域水稻病虫害是保证水稻病虫害在宏观尺度快速、及时、准确识别监测的主要手段。因此,建立一套可操作性强、准确度高的区域尺度遥感监测水稻病虫害方法具有重要的现实意义。
文章研究了区域尺度水稻作物的植被指数计算,将植被指数(基于遥感数据反演)假设成具有概率统计特性的信息源,并基于信息理论[21]和光谱信息散度(SID,Spectral Information Divergence)模型[22]推导出植被指数非相似性(VID,Vegetation Index Divergence)计算方法。根据VID的计算方法,计算无病虫害水稻田与病虫害水稻田之间的植被指数VID。将计算出的VID与地面实测的水稻病虫害等级数据进行回归分析,确定二者的相关程度。最后选取与地面实测的水稻病虫害等级数据相关程度较高的植被指数VID进行K-fold 交叉验证[23-24],得出利用植被指数非相似性监测水稻病虫害的准确性(精度)。
1 研究区与数据
1.1 试验区域
该文选择四川省成都市崇州市作为试验区域(图1),为研究提供不同病虫害程度的水稻采样数据,以实现监测模型的拟合与验证。四川省崇州市位于四川盆地向青藏高原过渡地带的第一、二阶梯,位于东经103°07′~103°49′、北纬30°30′~30°53′之间,东邻成都市温江区和双流区、南同新津县毗连、西与大邑县相接、北与都江堰市相依、西北部与汶川县接壤,总面积1 090 km2。崇州市属亚热带湿润季风气候,年平均气温16.4℃,年平均降水量969.2 mm,适合水稻等粮食作物生长,是我国主要的农业粮食生产区,素有“西蜀粮仓”的美誉。但由于阴雨寡照的气候因素,该地区也是水稻病虫害发生的重灾区[25]。据不完全统计,崇州市发生的水稻病虫害有30 余种,包括水稻螟虫、稻飞虱、稻瘟病和纹枯病等,严重时病虫害发生面积占水稻种植面积的90%左右[26]。近年来,受多种因素影响,水稻病虫害具有发生面积广、危害程度重的特点[27],将其作为利用植被指数非相似性监测水稻病虫害方法的试验区域具有现实意义。
图1试验区域Fig.1 Test area
1.2 参考区域
该文选择四川省农科院现代农业科技创新示范园区作为参考区域(图2),为研究提供健康水稻的光谱信息,以实现植被指数非相似性的计算。四川省农业科学院现代农业科技示范区位于四川省成都市新都区,占地面积约1.71 km2,与试验区域直线距离约70 km。该示范园是集农业科技创新、成果示范、产业孵化等功能为一体的国内一流现代农业示范园,示范区分为七大功能区,其中最主要、占地面积最大的便是大田作物科研区[28]。
图2参考区域Fig.2 Reference area
大田作物科研区主要分为大春作物区和小春作物区。其中,大春作物区主要从事水稻新品种选育、育种新材料和新方法研制以及科技成果转化等研究工作。该示范园的水稻田均采用精细化管理,实施病虫害早期监测预警,确保示范园中水稻田尽量不出现病虫害,或在出现病虫害情况下也不会造成危害。这也为研究提供了良好的无病虫害水稻的光谱参数数据。
1.3 遥感数据源
该文主要采用Planet 公司提供的PlanetScope小卫星星群(简称PS群)数据[29]。PS群现有在轨卫星共170 余颗,是全球最大的卫星星座,可实现每天监测全球一次,这对其在农情监测方面的应用有十分重要的意义。每个PS群卫星成员都是一颗3U立方体(10 cm×10 cm×30 cm)小卫星Dove,每个Dove航天器均装备一个光学系统和相机,能够拍摄地面分辨率为3~4 m 的多光谱影像,符合大田农情监测的实际需求。
表1 Planet 卫星主要载荷参数Table 1 Specifications of the Planet main payloads
为提高数据的稳定性和研究的可靠行,研究使用了3B级PlanetScope正射影像产品,该产品经过传感器校正、辐射校正、大气校正、几何校正等处理,形成幅宽为24×7 km,空间分辨率为3 m 的正射影像。影像采用UTM坐标系,定位精度的均方根误差(RMSE)小于10 m。在辐射校正方面,3B级Planet 产品采用了一种十分严谨的辐射校正算法,该算法将发射前校正、月球校正和与在轨的RapidEye和Landsat8等传感器交叉校正相结合,大气层顶(TOA)辐射精度在±10%范围内,星座的整体不确定性在5%~6%之间,符合研究需求。为消除大气效应的影响,产品采用6S大气校正算法和大气状态数据,利用不同传感器的光谱响应函数、特定场景视图和光照几何模拟不同场景下的大气校正系数,从而获得真实的地表反射率,使得定量反演地表各类参数更加准确。
由于研究区地处四川盆地,受周围地形、水汽和风力等因素影响,云层覆盖率高,对多光谱卫星数据的选取与应用产生较大影响,因此可获得的高质量研究影像十分有限[30]。综合影像质量和水稻生长周期,研究选用6组Planet 卫星影像作为研究数据,日期分别为2019年4 月25日、5月12 日、5月27日、6月29日、7月14 日和8月6日。
1.4 地面实测数据源
地面实测数据为研究提供了样本区域、训练数据以及验证依据,是研究的重要组成部分。为保证卫星影像反演的植被指数与水稻病虫害信息的耦合性,提高研究的可靠性,该研究选用了崇州市农业技术推广综合服务中心在崇州市燎原乡、公议乡、道明镇、怀远镇、江源镇、桤泉镇和隆兴镇(2个,分别称为隆兴1站和2站)布设的8处水稻田植保站采集到的水稻病虫害信息作为研究的地面实测数据。
崇州市农业技术推广综合服务中心依据成都市农业发展要求和《植物检疫条例》的有关规定,根据农作物生育期及气候等条件对农田主要的病虫草鼠害进行监测预报,并及时发布病虫发生范围和趋势预报,提供防治信息,指导全区农作物病虫防治工作[31]。
研究选用的8处水稻田植保站均位于较大面积水稻田中,播种方式为插秧式播种。植保站在水稻田中心位置附近安装了虫情监测系统和高清摄像头,并有专业的植保人员定期对农田进行巡视、采样、数据统计及分析。虫情监测系统可实时监测水稻田中各种害虫的数量,高清探头和专业人员巡视、采样可以较为全面的监控、判别水稻病害情况。根据《四川省病虫测报规范和标准》,植保人员将统计的水稻病虫害信息总结归纳为5 个等级:1级为有发生但不造成危害,2 级为轻度危害,3级为中度危害,4 级为较严重危害,5级为严重危害。
根据获取的卫星数据和水稻的插秧日期,研究整理统计了卫星过境时刻8个植保站点的水稻病虫害监测结果分级(表2)。其中,道明、怀远、公议、燎原、隆兴2号和江源6个站点由于2019年4月25 日并未插秧,造成数据空缺。
表2卫星过境时刻8 个植保站点的水稻病虫害检测结果分级Table 2 Statistical results for the diseases and pests in rice from 8 plant protection stations at satellite overpass time
2 研究方法
该文利用遥感技术,通过遥感数据和数学运算定量分析水稻病虫害的严重程度。遥感数据本质是地物对特定电磁波反射能力的记录。对于植被而言,根据其独特的反射特性,对传感器获取的各波段反射率进行重组计算,形成各种植被指数,从而实现对地表植被状态的度量是常用的简单、可靠的数学手段。同时,基于光谱计算出的植被指数既包含了光谱对地表植被的度量,又消除了冗余信息,可以认为是对地表植被信息的一种更加准确的量化测度。因此可以使用信息理论相关原理对不确定性引起的相同植被指数间的变化进行模拟。
当水稻受到病虫害胁迫时,植株叶片中叶绿素会受到破坏,甚至会出现叶片枯萎,从而影响植株的光谱反射,进而影响植被指数的信息表达。因此,该文假设健康水稻和受病虫害胁迫的水稻在植被指数信息测度方面会形成一定差异,这种差异可以通过随机模型表达。为证明这一假设,根据Planet 卫星参数特点,研究选择了10种常见的植被指数进行讨论,并提出了植被指数非相似性定量化计算方法,通过植被指数的非相似性与地面实测水稻病虫害等级数据的回归分析,研究利用植被指数非相似性监测水稻病虫害的方法。同时,通过回归分析选择出与水稻病虫害等级数据相关程度较高的几种植被指数非相似性,通过K-fold 交叉验证判断植被指数非相似性监测水稻病虫害的精度,从而分析利用植被指数非相似性监测水稻病虫害方法的可行性。具体流程如图3所示。
2.1 数据选择
利用植被指数非相似性监测水稻病虫害研究的前提是保证参考区域和试验区域的水稻涨势尽可能相同或相近。由于8处试验区域均为插秧式播种,该文根据试验区域插秧时间来挑选参考区域相对应的地块,从而使得两处数据之间具有较高的耦合性。
图3利用植被指数非相似性监测水稻病虫害研究流程Fig.3 Flowchart of the study on detection and discrimination of pests and diseases in rice using vegetation index divergen
根据统计数据,试验区8个植保站所在的水稻田的插秧时间主要集中在两个时段,分别是2019年4月下旬(桤泉站为4月20日,隆兴1站为4月22日)和2019年5 月上旬(道明站为5月6日,怀远站和隆兴2 站为5月7日,公议站、江源站和燎原站为5月8日)。根据试验区插秧时间,研究从参考区多个地块中筛选了2 个与试验区插秧时间最为接近的地块(表3),地块一的插秧时间为2019年4月20日,对应讨论的试验站点为桤泉站和隆兴1站;地块二的插秧时间为2019年5月7日,对应讨论的试验站点为道明站、怀远站、公议站、燎原站、隆兴2站和江源站。
表3 参考区域与试验区域及二者插秧时间对应表Table 3 Correspondence between reference area and test area and their transplanting time
2.2 植被指数计算
研究使用的Planet 卫星数据含有可见光和近红外4 个波段。根据卫星数据特点,研究选择了10种相对应植被指数进行讨论,如表4。其中,NDI[32]和GLI[33]是基于可见光波段 计算的植被指数,NDVI[34-37]、GNDVI[38]、SAVI[39]、OSAVI[40]、MSR[41]和RDVI[42]为基于可见光、近红外波段计算的植被指数,这些指数已经被证实可以较好的模拟作物的物候现象以及一些理化参数。DI14和RI14为Qin等人[15]研究发现的与水稻病虫害相关程度最高的水稻病虫害指数。
同时,根据植被的光谱特性,这10种植被指数在水稻生长阶段都应为正数,这也为之后的研究提供了较充足的便利条件。
表4 10种植被指数及其表达形式Table 4 The 10 selected vegetation indices examined in this research,together with their band-specific formulations and associated principal reference
2.3 植被指数非相似计算
由于植被指数是一种通过光谱计算获取地表植被信息的度量手段,通过假设每种植被指数变量随机分布,该文提出基于信息理论[21]和光谱信息散度模型(SID)[22]的一种计算相同植被指数之间相似性差异的方法。该方法通过信息测度原理,将每个植被指数向量视为具有概率统计特性的信息源,从而将植被指数相似性问题假设为植被指数向量之间概率行为差异问题。
具体而言,将植被指数影像根据列优先原则转换成一组植被指数向量x=(x1,…,xL)T,其中xl代表指数向量中的第l个指数值,O≤l≤L。假设{λi}I(i=1)是一个植被指数I的集合,集合中每一个元素代表一种植被指数。以x为随机变量进行建模,定义概率空间(Ω,∑,P),Ω是样本空间,∑是事件空间,P 为概率测度。因为x代表水稻生长期间水稻田区域的植被指数,因此x为非负的。根据以上假设,可以定义概率测度:
式(1)中,向量p=(p1,p2,…pI)T是由像素向量x得到的期望概率向量。因此,任何植被指数向量x=(x1,…,xL)T可以看作是一个单一的信息源,其统计数据受向量p=(p1,p2,…,pI)T约束,从而使得向量p可用于描述植被指数的可变性。
根据Fano信息理论,定义参考区域(x)和试验区域(y)的自信息:
式(2)和(3)中,pi和qi分别为参考区域和试验区域的期望概率。
y相对于x的相对熵(即散度)可以定义为:
对应的,x相对于y的散度可以定义为:
因此该文基于SID模型定义植被指数非相似度参数为:
VID可以看作是SID在植被指数领域的变形和应用,它通过度量两组相同植被指数之间的互信息大小确定两组相同植被指数之间的相似程度。VID值越高,说明两组相同植被指数之间的相似性越低;反之,VID值越低,则两组相同植被指数之间的相似性越高。但具体的非相似性度量区间还需进一步研究。
2.4 单变量回归分析
地面实测水稻病虫害等级数据将水稻病虫害的严重程度进行了量化分级,为VID 与水稻病虫害建立模型关系提供了数学基础。研究将计算出的10种植被指数VID与植保站监测的水稻病虫害等级数据进行单变量回归分析和曲线拟合,以此建立植被指数非相似性监测水稻病虫害的方法模型以及评估监测能力。在分析过程中,每种植被指数VID 与水稻病虫害等级数据逐一进行回归建模,包括线性拟合、二次拟合、多次拟合、指数拟合、对数拟合和幂函数拟合等趋势分析方法。
由于VID为离散变量,水稻病虫害等级为类别变量,二者拟合时很难计算准确的均方根误差,因此研究主要根据决定系数(R2)确定最佳拟合模型。同时,根据规范标准,水稻病虫害总共分为5个等级,但由于缺乏第5等级的训练数据,容易出现高等级水稻病虫害区域欠拟合和训练模型整体过拟合现象,因此最佳拟合模型筛选时不能仅考虑R2,还要考虑模型在实际监测水稻病虫害过程中的可行性。
虽然单变量回归分析原理简单,普适性不强,但研究获取到的并不特别复杂空间变量难以满足更高级的数据分析方法,在未充分掌握高度复杂和更高维度空间数据的前提下,简单单变量回归不失为一种快速、简便建模的方法,
2.5 K-fold 交叉验证
研究通过单变量回归分析确定了各植被指数VID与水稻病虫害等级的定量关系。由于变量类型不同,简单的单变量拟合回归无法定量描述VID监测水稻病虫害的精度状况。为更加准确评估VID监测水稻病虫害的能力,确定监测精度,研究将水稻病虫害等级人为设置为离散变量,同时选择拟合程度较高的几种植被指数通过K-fold交叉验证来对VID监测水稻病虫害的精度进行讨论。
K-fold 交叉验证是通过将整个拟合数据集分成一个训练数据集和一个测试数据集,这个过程是随机进行,并不会将数据集固定分成训练数据集和测试数据集,这个过程就像是把数据折叠成K 份,然后进行迭代运算。每次迭代运算都会利用(K-1)/K 个数据集作为训练数据,然后评估另外1/K 个子集的精度。经过K 次迭代之后,使用每次迭代的测试数据集得到的估算值的平均值作为最终的估算值,并进行误差分析。虽然K-fold交叉验证会因为减少训练数据的数据量而降低估算的精度,但是该方法独立测试的属性和通过迭代运算弥补训练数据量的损失还是能比较客观的评价模型反演的精度。
根据该研究的数据特点和K-fold交叉验证理论,研究选择6-fold交叉验证的方式。即将全部拟合数据随机分成6份。每次迭代运算时选择其中的5份作为训练数据进行拟合分析,确定拟合参数,同时用另外一份对拟合模型的精度进行测试。经过6 次迭代运算,每份数据都经过了6次训练和验证,我们可以根据这6次训练和验证的平均结果生成最终的监测精度。
3 结果
3.1 回归分析
在遥感领域,植被的生理参数通常通过与植被指数的特定联系来进行估算,这些联系往往是在现场测量的基础上拟合标准回归函数来建立的。为了判断研究提出的基于植被指数计算的变量VID是否能够准确监测水稻病虫害,该文对每种植被指数的VID与地面实测水稻病虫害等级进行了回归分析。在对各种类型的回归分析进行评价(根据R2和可行性)后,为每种植被指数的VID选择最佳拟合模型,并记录相关参数(图4)。
图4 10 种植被指数回归分析和曲线拟合结果Fig.4 Regression analysis and curve fitting results of the 10 vegetation indices
如图4 所示,每种植被指数VID都与水稻病虫害等级有很高的相关性,R2的值在0.63~0.95之间,说明植被指数VID在监测水稻病虫害方面有较强的可行性。其中,拟合最好的是水稻病虫害指数(DI14)(图4(i)),其多次拟合的R2为0.95。为了防止由于训练数据量的限制多次拟合方程发生过拟合现象,研究还记录了其线性拟合的相关参数,结果表明R2为0.90。说明DI14与水稻病虫害等级有很强的相关性。相反的,在所选的10种植被指数中,与水稻病虫害等级拟合最差的是绿波段归一化植被指数(图4(d)),其R2仅为0.67。这可能是因为绿波段归一化植被指数所选用的两个波段(绿光波段和近红外波段)在植被反射光谱中均为高反射波段,对植被的敏感性与其他植被指数相比相对较差,同时易受到大气逆辐射、环境辐射、太阳辐射等外界因素的影响。
作为可见光波段的植被指数,NDI 的VID与水稻病虫害等级在10种植被指数中具有最强的线性相关性(图4(a)),R2达到了0.94。这主要是因为研究是在已知水稻作物的样方影像中进行的分析,排除了其他地类信息的干扰。但同样作为可见光波段植被指数的GLI,由于其较高的敏感性(图4(b)),通常只作为可见光影像植被与非植被的分类使用,造成了其VID与水稻病虫害的相关程度较低,R2仅有0.78。
对于其他传统植被指数,NDVI 的VID与水稻病虫害等级相关程度最高(图4(c)),其R2达到了0.90。这与其在遥感领域普遍的应用性相吻合。但SAVI(图4(e))和OSAVI(图4(f))的VID与水稻病虫害等级的相关程度较差,R2分别为0.79和0.81。这主要是因为SAVI和OSAVI 主要是消除植被下垫面的土壤对光谱影响的植被指数,但水稻下垫面主要是水体和土壤的混合物,该指数对水稻的生理参数反演是否适应还需进一步的讨论。
综上所述,研究最终选用与水稻病虫害等级数据相关程度最高的DI14、NDI和NDVI的VID进行进一步的监测精度讨论。
3.2 K-fold 交叉验证结果
为了验证利用植被指数VID监测水稻病虫害的精度,在还未获得最新配套数据的情况下,该文将水稻病虫害等级数据由类别数据假设为离散数据,基于已采集到的拟合数据通过6-fold 交叉验证方法验证了DI14、NDVI和NDI这3种植被指数VID监测水稻病虫害的精度。
结果如图5所示,通过对交叉验证反演得到的水稻病虫害等级和实测水稻病虫害等级比较发现,3种植被指数VID监测到的水稻病虫害等级与实测水稻病虫害等级数据有较好的耦合。精度最高的植被指数是NDI(图5(a)),R2达到0.97,RMSE仅有0.16,这可能受益于研究所选卫星影像均为已知水稻地块,无其他地类干扰。精度第二高的植被指数为DI14(图5(c)),其R2为0.91,RMSE为0.19,这与Chong 等人的研究结果类似。这可能是因为水稻种植过程中下垫面土壤含水量较高,尤其是水淹之后,下垫面几乎为水体,所以通过遥感技术研究水稻生理参数时,利用考虑水体反射率较高的蓝光波段计算的植被指数可能有更好的反演效果。精度相对较差的为NDVI(图5(b)),其R2为0.92,RMSE为0.24。这可能是因为NDVI在反演作物生理参数时常会因为其饱和性的缺点造成对植被的生理变化不敏感。
图5 K-fold 交叉验证结果Fig.5 Results of K-fold cross validation
交叉验证反演到的水稻病虫害等级数据根据“四舍五入”原则取整,使其重新变为类别变量。如图5,结果发现3种植被指数的VID对水稻病虫害监测都取得了很高的精度。其中,DI14和NDVI的监测精度都达到了100%;NDI 由于4 级病虫害出现了低估,造成了监测精度下降,但也达到了97.62%,这可能是因为NDI易受其他辐射影响,造成植被指数差异性降低造成的。同时,利用3种植被指数监测4 级病虫害时都出现了较大误差,这主要是由于训练数据集中仅有一组4级病虫害的数据,可能会导致交叉验证时假设空间变小。这说明利用植被指数VID监测水稻病虫害的方法在实际农业生产有广阔的应用前景。但由于受限于训练数据量,该结果还缺乏一定的公信力,需要在日后的研究中进一步完善拓展。
4 讨论
该文提出了植被指数非相似性的计算方法,并通过两种途径讨论了植被指数非相似性监测水稻病虫害能力:(1)将植被指数非相似性与实测的水稻病虫害等级进行回归分析,判定植被指数非相似性与水稻病虫害之间的相关性;(2)采用K-fold 交叉验证的方法判定植被指数非相似性监测水稻病虫害等级的精度。结果表明,植被指数非相似性与水稻病虫害等级具有普遍相关性,利用相关性较高的3种植被指数非相似性监测水稻病虫害同样具有相当高的监测精度。该方法具有以下特点。
(1)研究将空间特性的植被指数影像假设成了具有概率统计特性的信息量,并基于信息理论和SID 模型首次提出了植被指数非相似性(VID)计算方法。该方法的提出,可以将遥感对植被区域的单一观测由静态转换成动态,为利用遥感技术对植被区域进行变化监测提供了全新手段和思路。研究过程中,已经证明VID与水稻病虫害有很强相关性。随着日后研究的深入,可以将VID应用到作物长势监测、灾害恢复监测、植被覆盖度变化等多个领域。
(2)研究方法原理简单、可操作性强。研究所需数据均选择目前已有数据,提高了研究方法的普适性。同时,首次将四川省农科院现代农业科技创新示范园区精准化管理的农田影像作为参考,根据地理学第一定律[43-44]对附近水稻田间的病虫害进行监测。这也为现代化农业科技创新示范园创造了新的应用途径,增加了其内在价值。随着全国各地农业科技创新示范园以及标准化农田的建设,该研究可基于充足的参考数据扩展该文方法的应用范围。
(3)研究方法可移植程度高。该文选用了高分辨率的多光谱Planet 卫星数据,讨论了可见光、多光谱波段的多种植被指数。其中,可见光波段的NDI和多光谱波段的DI14、NDVI 在监测水稻病虫害方面取得了较高的精度。因此该方法在未来可以完全移植到其他中高分辨率卫星数据(如Landsat、Spot、Quickbird 等)以及无人机遥感影像中。随着研究的进一步深入,可以将该方法理论扩展到具有红边波段的多光谱数据以及高光谱数据中,进一步提高该方法的稳定性和准确性。
当然,像许多首次提出的方法一样,该研究方法还有一些局限性。
(1)受限于研究区域,研究获取到的可用卫星数据十分有限。尽管研究选用了时间分辨率为1 d的Planet卫星数据,但是因为成都地区多云天气,只在水稻生长周期中获取到了6景可用的遥感数据,使得研究可用的训练数据十分有限。这在一定程度上降低了研究成果的公信力。在之后的研究中,应将该方法扩展到其他区域,并增加更多训练数据对该方法进行进一步讨论。
(2)受限于水稻插秧期和已知信息,研究没有对植被指数非相似性进行敏感性分析,因此不能排除植被指数非相似性的偶然误差对实验结果产生的影响。这需要在日后的研究中精心设计试验去进一步论证。
(3)该研究是在已知水稻地块情况下进行的讨论分析,这就意味着在未来的应用中需要依托准确的地块作物分类信息。但是目前尚无精度较高的地表作物分类影像产品,这对研究方法的实际应用带来了一定障碍。
5 结论
遥感技术被认为是一种快速、经济且高效的水稻病虫害监测手段。该文为探索遥感技术有效监测水稻病虫害的方法,将植被指数(基于遥感数据反演)假设成具有概率统计特性的信息源,并基于信息理论和SID模型提出了植被指数非相似性(VID)计算方法,通过VID与地面实测数据建立起的回归关系,估算水稻病虫害等级。
该文根据选用的多光谱卫星数据的特点,选择了10种有可操作性的植被指数进行评估。利用四川省农科院现代农业科技创新示范园区内精准化管理的水稻田作为参考区域,四川省崇州市8处具有病虫害监测系统的水稻田作为试验区域,通过计算二者的VID得到两处研究区同时间段的定量化植被指数非相似性。将VID 与植保站统计的水稻病虫害等级进行回归分析,发现10 种植被指数的VID与水稻病虫害等级具有较高的相关性,R2的范围在0.67~0.95之间。其中相关程度最高的3种植被指数为DI14、NDI和NDVI。为进一步讨论利用植被指数非相似性监测水稻病虫害的精度,研究将水稻病虫害等级数据由类别数据假设为离散数据,采用K-fold 交叉验证方法对VID的监测精度进行了进一步的论证。结果发现,NDI的VID监测水稻病虫害精度最高,R2为0.97,RMSE为0.16;其次是DI14,R2为0.91,RMSE 为0.19;相对较差的NDVI,R2也达到了0.92,RMSE 为0.24。将交叉验证反演后的离散的水稻病虫害等级数据根据“四舍五入”原则重新转换成类别数据,发现NDI、DI14和NDVI这3种植被指数的VID监测水稻病虫害的精度分别为97.62%,100%和100%。该研究虽受限于训练数据集中的数据量,结果公信力有待进一步提升,但该方法的提出也为之后利用遥感技术监测水稻病虫害的研究应用提供了新思路。