基于植被长势的香蕉区域估产信息扩散模型*
2020-09-18蔡大鑫刘少军陈汇林田光辉
蔡大鑫,刘少军,陈汇林,田光辉
基于植被长势的香蕉区域估产信息扩散模型*
蔡大鑫,刘少军,陈汇林,田光辉
(海南省气象科学研究所/海南省南海气象防灾减灾重点实验室,海口 570203)
基于Landsat-8和MODIS数据,首先采用面向对象方法对海南岛香蕉种植区的空间分布进行初次提取,然后采用基于时序植被指数的马氏距离方法进行二次提取,最后对两次提取结果进行空间叠加,采用随机选点实地验证的方法对分类精度进行评价。针对区域估产样本数量少的问题,统计2014−2015年的MODIS数据和2015年的香蕉区域产量数据,以全生育期香蕉长势为输入变量建立信息扩散区域估产模型,利用交叉验证方法评价估产精度,同时评价估产模型对于产量增减变化趋势模拟的准确性。通过组合多个生育阶段构建三种信息扩散估产方案,对比各方案的估产精度。结果表明:(1)采用面向对象和马氏距离的综合分类方法精度较高,总分类精度和Kappa系数分别为82.5%和0.7338,一致性检验的结果较好。(2)基于全生育期香蕉长势的信息扩散模型估产精度较高,平均相对误差为26.0%,决定系数为0.9216,解释能力和稳定性较好;对年际间产量趋势变化的预估准确率达到83.3%。(3)基于全生育期构建的单变量信息扩散估产方案精度最高,相比其它两种多变量建模方案平均相对误差分别降低2.9个百分点和10.4个百分点。可见,信息扩散方法对于小样本数据的处理能力较强,以全生育期为输入变量构建的估产模型精度较高,适应性较好,可为热带经济作物区域估产提供重要参考。
信息扩散;估产模型;遥感;经济作物;香蕉
受限于气象灾害和生产技术水平,海南岛香蕉产量稳定性差,年际间波动较大,因此,开展香蕉估产研究,准确把握产量的变化趋势,对于香蕉种植产业的规划布局和稳定发展具有重要意义。遥感估产是目前应用最广泛的作物估产方法之一,特别适用于大面积、分布均一的种植类型。大面积作物产量遥感估算模型主要包括经验模型、半机理模型和机理模型[1]。许多学者应用遥感方法开展了广泛的研究,如赵东妮等[2−3]利用HP滤波法、Logistic方法模拟水稻趋势产量,分析气象条件对产量波动的影响。Dettori等[4]通过试验及分析30a数据集校准CERES-Wheat模型,调试后的模型在预测小麦产量和开花期方面表现出相当好的性能。刘红超等[5]以冬小麦关键生育期遥感数据与产量建立统计模型,其估产精度在95%以上。张祎等[6]选用作物机理模型APSIM模型开展气候变化对玉米产量的影响研究,发现其对玉米生长发育和产量形成有很好的模拟能力。解毅等[7]通过粒子滤波算法同化LAI、土壤含水量、地上干生物量和CERES-Wheat模型状态量,构建小麦同化估产模型,分析同化变量组合估产的精度。
经验方法建模简便,精度较高,研究成果也较多,如聚类分区[8]、混合光谱分析[9]、卷积神经网络[10]、蒸散发模型[11]、随机森林回归[12]、时序定量遥感[13]等。但以往的研究多以小麦、水稻等大宗粮食作物为主,对经济作物尤其是下垫面复杂的热带经济作物研究不多,有关作物模型的研究也较少见,而且影响产量形成的因素复杂,因此采用何种方法预估能够取得较好效果仍需开展研究加以验证。另外开展大面积区域估产时经常会面临样本数量不足的问题,制约了模型的精度和适用性。信息扩散是一种对样本进行集值化的模糊数学处理方法,可以将不完备的单值样本基于扩散函数扩散到不同的控制点上,以实现挖掘更多的信息;还可以通过求取论域的控制点所确定的信息矩阵,获得论域之间的模糊关系[14]。但目前的信息扩散方法多见于灾害风险评估领域,而在作物产量预估方面应用较少。鉴于此,本研究以热带经济作物香蕉为研究对象,利用信息扩散方法构建估产模型,评价其精度及适用性,同时分析生育期对建模精度的影响,以期为及时了解不同生态区域香蕉产量丰歉变化趋势,制定贸易和宏观调控政策提供参考。
1 资料与方法
1.1 研究区概况
海南岛(18°10′−20°10′N,108°37′−111°03′E)面积约3.4万km2,地势四周低平,中间高耸,山地、丘陵、台地、平原构成环形层状地貌,梯级结构明显。气候类型属热带季风海洋性气候,主要特点是光照充足,热量丰富,降水充沛。香蕉种植区主要分布在北部和西部,品种有香牙蕉、大蕉、粉蕉、龙牙蕉等。
1.2 数据来源及处理
香蕉没有固定的生育期,一年四季都可种植。海南以春植为主,当年2−4月种植,第二年4−6月收获,以避开夏、秋季台风对成熟期香蕉的影响[15]。选定2014年3月−2015年5月为香蕉生育期,此时段的MODIS数据来源于国家卫星气象中心网站(http://satellite.nsmc.org.cn/)。Landsat-8数据来自美国地质勘探局(USGS),1−7波段分辨率为30m,全色波段分辨率为15m,覆盖海南全岛共4景,时间及数据信息见表1。海南岛18个市县2014年和2015年香蕉种植面积、总产量数据来自《海南统计年鉴》2015版和2016版。
表1 数据源Landsat-8数据
MODIS数据提取前4个波段(0.459−0.876μm),经投影、校正、插值、裁切后的空间分辨率为250m。由MODIS数据计算NDVI,利用NDVI提取香蕉种植区面积和构建估产模型。对逐日NDVI数据采用最大值合成法合成为月度数据,即2014年3月−2015年5月逐月NDVI序列数据集。采用遥感影像处理软件ENVI(The Environment for Visualizing Images)处理高分辨率卫星数据。下载的数据级别为L1T,已经进行过较为精确的几何校正,满足分类提取的要求。之后进行辐射定标,对多光谱数据和全色数据进行图像融合,最后进行镶嵌、匀色和增强。由于高分辨率影像仅用于香蕉面积提取,不参与指数计算,因此未进行大气校正。
1.3 香蕉种植区提取
利用面向对象分类和马氏距离两种方法,通过对卫星影像资料的处理提取香蕉种植区。海南岛山地丘陵面积超过三分之一,成片分布的蕉园较少,大量蕉地为分散种植,存在同物异谱或同谱异物的问题,因此采用面向对象分类技术对大面积蕉园种植区进行提取。面向对象分类技术以邻近像元组成的对象为目标,在考虑对象光谱信息的同时,兼顾其形状和纹理信息,通过对图像进行分割和分类得到准确的输出。之后根据香蕉与其它植被生育期内NDVI序列的差异,利用马氏距离方法对分散蕉地进行提取[16]。马氏距离表示数据的协方差距离,可以用来计算两个未知样本集的相似度或一个样本点与数据分布集合的距离。NDVI序列是生育期内样本NDVI月合成值曲线,待分类像元的NDVI序列与训练样本集之间的马氏距离越小,表明该像元种植香蕉的概率越高。
1.4 香蕉产量估算的信息扩散模型
1.4.1 基于全生育期NDVI的模型
据研究[17],生育期内NDVI累积值与产量存在较好的相关性。以各市县香蕉全生育期的NDVI累积值作为信息扩散模型的输入变量,其数据生产过程的详细流程如下:
(1)逐日MODIS影像计算NDVI。
(2)NDVI按月进行最大值合成,即同位置像元取当月最大值。
(3)NDVI月合成值求和得到全生育期NDVI累积值。
(4)利用提取到的香蕉种植区矢量文件,得到各市县香蕉全生育期NDVI累积值。
(5)由于NDVI累积值和产量数据的数量级较大,因此为便于计算,采用对数标准化方法进行处理,即求取二者以为底的对数。
标准化之后的全生育期NDVI累积值即为模型输入变量,产量为输出变量。信息扩散估产方法的一般步骤是将输入输出样本在论域进行扩散,建立由信息增量构成的信息矩阵。然后由信息矩阵得到NDVI累积值与产量之间的模糊关系,即模糊关系矩阵。最后通过模糊近似推理方法,由输入样本得到模拟输出产量。
X = {(x1, y1), (x2, y2),…, (xn, yn)} (1)
两个分量的论域分别为U和V,其中的离散点为uj,j=1,2,…,m和vk,k=1,2,…,t。本文的样本点经标准化处理后的值无量纲,在8.5~12.5之间,因此将论域U和V的区间设为8~13,包含样本序列,论域离散点等步长取100个。
U = {u1, u2,…, um}, V = {v1, v2,…, vt} (2)
通过正态信息扩散函数将样本信息扩散到论域空间U×V的离散点上。
式中,μ(xi, yi)是X×U×V到区间[0,1]的映射,hx、hy为函数的扩散系数,表示信息扩散的控制范围[14],按以下经验公式计算。
式中,b、a分别为样本序列的最大值、最小值,n为序列长度。本文NDVI累积值和产量的扩散系数依式(4)计算,分别为0.4633和0.5780。
式中,Quv为X赋给U×V的信息增量,则矩阵
为X在U×V上的信息矩阵。由下式得到模糊关系矩阵。
通过模糊近似推理计算产量输出采用文献[18]的方法。
(1)根据输入的单个验证样本x0,即NDVI累积值,利用信息分配方法建立论域U的模糊子集。下式中uj为U的离散点,Δ为步长。
(2)由模糊子集和模糊关系矩阵μR(u, v)得到模糊推论,其隶属函数为
(3)取模糊子集向量与模糊关系矩阵乘积的最大值为权重向量W(w1, w2,…,wp),其对应的产量论域的vk组成估计向量G(g1, g2,…,gp),其中p为论域离散点个数。
(4)对估计向量G和权重向量W进行加权组合,得到产量估计y0。
1.4.2 基于分生育期NDVI的模型
作物敏感生育期的长势变化对产量具有重要影响[19],因此,通过分析香蕉各生育期的特点,综合一般发育期和敏感发育期,构建不同生长阶段NDVI累积值与产量之间关系,建立分生育期NDVI的产量估算模型。
1.5 模型验证
香蕉种植区提取结果利用总分类精度与Kappa系数检验,方法见文献[20]。采用交叉验证的方法比较分析18个市县估测值与实测值之间的相对误差(RE)、均方根误差(RMSE)和决定系数(R2),评价信息扩散估产模型的适用性。
2 结果与分析
2.1 香蕉种植区植被长势信息提取结果
统计《海南统计年鉴》2015版中2014年各市县的香蕉种植面积,由于后期建模是利用MODIS资料,因此依MODIS影像分辨率将种植面积换算得到总像元数量N。利用ENVI的面向对象图像分类模块对Landsat-8影像中的大面积蕉园进行提取。影像分割基于“边缘检测”,分割阈值设为30;合并基于“具有类似颜色和边界大小相邻节段”,合并阈值设为90;纹理内核大小设为10。将样本分成香蕉、林地、草地、水体和其它五个类别,在分割图中分别选择对应样本作为训练样本,分类方法选择K邻近法。初次分类后的影像依MODIS分辨率进行重采样,其中香蕉像元数量为N1。将野外实地调查得到的香蕉分布点作为训练样本集,以这些香蕉像元生育期内的NDVI序列作为总体特征维度,对Landsat-8影像中分类得到的非香蕉区图层,在MODIS数据中分别计算各像元与香蕉样本总体之间的马氏距离,并将所有像元依距离由小到大排成序列,由前往后取N−N1个像元。两种方法得到的图层进行空间叠加,即为海南岛的香蕉分布,结果见图1。
由图中可见,海南岛的香蕉主要分布在北部和西部。为评价分类精度,在分类图中随机选取40个样本像元,通过实地调查获取地物类型,计算得到总分类精度和Kappa系数分别为82.5%和0.7338,一致性检验的结果较好。
图1 综合面向对象方法和马氏距离方法提取的海南岛香蕉种植区分布
2.2 基于全生育期NDVI估算香蕉产量的效果
以各市县全生育期(3月−翌年5月)标准化NDVI累积值作为输入变量,以总产量为输出变量,构建信息扩散模型。将模拟结果与2015年各市县实际产量对比。结果见表2。由表中可见,信息扩散法模拟的2015年海南岛18个市县香蕉产量的平均相对误差为26.0%,均方根误差RMSE为34.2×103t,产量与实际产量的决定系数较高(R2=0.9216),偏离程度较小,模拟效果较好。
预测当年产量与上一年的增减动态变化,可以为经济决策和生产规划提供参考。利用作物长势反映产量的变化趋势,并根据距平大小推断变化程度,在大区域尺度下可以取得较好效果[21],但随着研究区域空间尺度的降低,预测误差会随之增大。由《海南统计年鉴》2015版和2016版分别得到2014年和2015年各市县香蕉的实际产量,2015年实际产量与2014年实际产量的差值表示实际产量变化,2015年模拟产量与2014年实际产量的差值表示模拟产量变化,结果见表3。由表中可见,增减趋势一致的站点占83.3%,预测效果较好。
表2 基于全生育期NDVI累积值的信息扩散估产模型模拟的2015年各市县产量与实际产量对比
2.3 基于分生育期NDVI估算香蕉产量的效果
2.3.1 生育阶段划分方案
按照生育进程将香蕉的生育期依次划为幼苗期、营养生长期、花芽分化期、抽蕾期和果实发育期,各时期遭遇气象灾害均会对产量造成影响,但影响程度有所差异。幼苗期为抽出大叶之前的时期,历时2~3个月。营养生长期为抽出大叶−花芽分化前,期间抽生20~25片叶,主要是积累营养物质,为后期的花芽分化奠定基础,此期生物积累量占全生育期生物产量的10%~16%。香蕉生长前期受害主要影响植株长势和干物质积累,推迟花芽分化。花芽分化期和抽蕾期为花芽分化−断蕾,此期易遭受冷害,干冷主要危害叶片,尤其是嫩叶、果穗和果实;湿冷主要危害未抽蕾的植株生长点或花芽花蕾,造成烂心。果实发育期为断蕾至果实成熟,此期遇低温阴雨易造成果实细小,果皮灰黄,同时滋生病害。香蕉进入花芽分化后以生殖生长为主,对气象条件的变化较敏感,为敏感生育期,发育状况与产量直接相关。
以不同生育期NDVI累积值的组合作为信息扩散模型的多维输入变量构建模型,比较不同发育阶段对产量形成的影响。综合香蕉的一般发育期和敏感发育期,共构建三种估产方案。方案I:以整个生育期的NDVI累积为输入变量;方案II:以幼苗初期−营养生长末期的NDVI累积为输入变量1,以花芽分化初期−果实发育末期的NDVI累积为输入变量2;方案III:以抽蕾期的NDVI累积为输入变量1,果实发育期的NDVI累积为输入变量2。三种方案的生育期及各输入变量的扩散系数见表4。
表3 2015年各市县模拟/实际香蕉产量相比2014年增减趋势对比
注:“+”表示2015年产量比2014年增加,“-”表示2015年产量比2014年下降。
Note: “+”means that yield in 2015 is up (positive change) compared with 2014, “-”means down (negative change).
2.3.2 产量估算效果
基于不同生育期NDVI累积值构建信息扩散模型,比较不同发育阶段对产量形成的影响。由表5可见,三种方案的平均相对误差分别为26.0%、28.9%和36.4%,决定系数分别为0.9216、0.9229和0.8287,以全生育期建模方案(方案I)的精度最高,相比方案II和方案III的平均相对误差分别降低了2.9个和10.4个百分点,而以生育后期NDVI值作为单独输入的方案III估产结果误差最大,表明营养生长期的长势变化对产量影响较大。
表4 三种生育阶段建模方案的生育期和扩散系数
表5 三种方案的信息扩散模型模拟结果比较(2015年)
3 结论与讨论
3.1 讨论
研究发现,作物长势与产量之间存在非线性关系[22],许多学者也尝试应用多种方法进行模拟以提高估产精度[10,23],并取得了较好的效果。但在进行大范围遥感估产实践中,常常会面临实测数据不足的问题,而许多算法模型均建立在大样本的基础上[10]。本研究选择的信息扩散方法既可以对样本进行集值化处理,弥补信息不足,又具有一定的非线性模拟能力,在区域估产中表现了较好的适应性。
作物的生殖生长期新陈代谢旺盛,是产量形成的关键时期,此时的长势状况与产量的相关性最强[19],刘红超等[5,24]的研究都基于这一理论,也取得了较好的效果。但本文对2015年香蕉产量分生育期建模估产结果表明,全生育期建模方案的效果最好,而仅考虑果实生长关键期的方案误差较大,其原因可能与海南2014年的气候状况有关。海南每年的台风季为6−10月,此时正值香蕉的营养生长期,一般影响较小的台风可以通过采取防台措施,如合理选址、种植抗风品种、打防风桩、施肥培土等措施减轻灾害,但2014年海南遭遇史上最强登陆台风“威马逊”,两个月后又受“海鸥”侵袭,大风、暴雨使香蕉的株体断倒,叶片破损,光合作用降低,养分运输受阻,因此,导致产量对生长前期长势变化的响应高于后期。香蕉生育期长,气象灾害对产量影响大,前期受害严重会导致光合产物的分配发生变化[25],而孕蕾后的作物长势不能完全反映这种变化,有关生理过程对长势影响的机理性研究也较少,因此选用全生育期构建的模型更符合热带香蕉种植区的实际。
3.2 结论
(1)信息扩散估产模型通过构建模糊集合,建立香蕉长势与产量之间的模糊关系,估计的产量精度较高,平均相对误差为26.0%,解释能力和稳定性均较好,对于年际间产量变化趋势预测的准确率也较高,可以满足实际业务需求。
(2)通过建立分生育期估产方案对比各发育阶段对估产精度的影响,发现以全生育期香蕉长势作为输入变量的信息扩散模型效果最好,优于分阶段的多维信息扩散方案,可以兼顾气象灾害和敏感生育期长势对产量的影响。以营养生长期和生殖生长期同时输入的估产方案Ⅱ的精度又要高于仅考虑生殖生长期的方案Ⅲ,表明热带地区香蕉营养期长势对于产量的影响较大。
(3)信息扩散方法在小样本数据的处理中具有优势,而且对于非线性关系的模拟能力较好,构建的全生育期估产模型在香蕉种植区具有较好的适用性。本文构建的估产模型可以在香蕉果实膨大后期应用,也可以在进入抽蕾后开展定期滚动预报,以提高时效性,为农业部门和农户合理安排生产销售提供科学依据。
[1] 陈仲新,任建强,唐华俊,等.农业遥感研究应用进展与展望[J].遥感学报,2016,20(5):748-767.
Chen Z X,Ren J Q,Tang H J,et al.Progress and perspectives on agricultural remote sensing research and applications in China[J].Journal of Remote Sensing,2016,20(5):748-767.(in Chinese)
[2] 赵东妮,王艳华,任传友,等.3种水稻趋势产量拟合方法的比较分析[J].中国生态农业学报,2017,25(3):345-355.
Zhao D N,Wang Y H,Ren C Y,et al.Comparative analysis of three fitting methods of rice trend yield[J].Chinese Journal of Eco-Agriculture,2017,25(3):345-355.(in Chinese)
[3] 胡慧芝,刘晓琼,王建力.气候变化下汉中盆地水稻产量变化研究[J].自然资源学报,2018,33(4):609-620.
Hu H Z,Liu X Q,Wang J L.Study on the change of rice yield in Hanzhong basin under climate change[J].Journal of Natural Resources,2018,33(4):609-620.(in Chinese)
[4] Dettori M,Cesaraccio C,Motroni A,et al.Using CERES-Wheat to simulate durum wheat production and phenology in Southern Sardinia,Italy[J].Field Crops Research,2011,120: 179-188.
[5] 刘红超,梁燕,张喜旺.多时相影像的冬小麦种植面积提取及估产[J].遥感信息,2017,32(5):87-92.
Liu H C,Liang Y,Zhang X W.Winter wheat area extraction and yield estimation using multi-temporal images[J].Remote Sensing Information,2017,32(5):87-92.(in Chinese)
[6] 张祎,赵艳霞.多模式集合模拟气候变化对玉米产量的影响[J].中国生态农业学报,2017,25(6):941-948.
Zhang Y,Zhao Y X.Multi-model ensemble for simulation of the impact of climate change on maize yield[J].Chinese Journal of Eco-Agriculture,2017,25(6):941-948.(in Chinese)
[7] 解毅,王鹏新,王蕾,等.基于作物及遥感同化模型的小麦产量估测[J].农业工程学报,2016,32(20):179-186.
Xie Y,Wang P X,Wang L,et al.Estimation of wheat yield based on crop and remote sensing assimilation models[J]. Transactions of the CSAE,2016,32(20):179-186.(in Chinese)
[8] 李昂,王洋,曹英丽,等.基于无人机高清数码影像的水稻产量估算[J].沈阳农业大学学报,2017,48(5):629-635.
Li A,Wang Y,Cao Y L,et al.Rice yield estimation based on high-definition digital image of UAV[J].Journal of Shenyang Agricultural University,2017,48(5):629-635.(in Chinese)
[9] 刘雅婷,龚龑,段博,等.多时相NDVI与丰度综合分析的油菜无人机遥感长势监测[J].武汉大学学报(信息科学版), 2020,45(2):265-272.
Liu Y T,Gong Y,Duan B,et al.Combining multi-temporal NDVI and abundance from UAV remote sensing data for oilseed rape growth monitoring[J].Geomatics and Information Science of Wuhan University,2020,45(2):265-272.(in Chinese)
[10] 周亮,慕号伟,马海姣,等.基于卷积神经网络的中国北方冬小麦遥感估产[J].农业工程学报,2019,35(15):119-128.
Zhou L,Mu H W,Ma H J,et al.Remote sensing estimation on yield of winter wheat in North China based on convolutional neural network[J].Transactions of the CSAE,2019,35(15): 119-128.(in Chinese)
[11] 蒋磊,尚松浩,杨雨亭,等.基于遥感蒸散发的区域作物估产方法[J].农业工程学报,2019,35(14):90-97.
Jiang L,Shang S H,Yang Y T,et al.Method of regional crop yield estimation based on remote sensing evapotranspiration model[J].Transactions of the CSAE,2019,35(14):90-97.(in Chinese)
[12] 王鹏新,齐璇,李俐,等.基于随机森林回归的玉米单产估测[J].农业机械学报,2019,50(7):237-245.
Wang P X,Qi X,Li L,et al.Estimation of maize yield based on random forest regression[J].Transactions of the Chinese Society for Agricultural Machinery,2019,50(7):237-245.(in Chinese)
[13] 刘新杰,魏云霞,焦全军,等.基于时序定量遥感的冬小麦长势监测与估产研究[J].遥感技术与应用,2019,34(4): 756-765.
Liu X J,Wei Y X,Jiao Q J,et al.Growth monitoring and yield prediction of winter wheat based on time-series quantitative remote sensing data[J].Remote Sensing Technology and Application,2019,34(4):756-765.(in Chinese)
[14] 王学林,黄琴琴,柳军.基于信息扩散理论的南方双季早稻气象灾害风险评估[J].中国农业气象,2019,40(11):712-722.
Wang X L,Huang Q Q,Liu J.Risk assessment for meteorological disasters of early rice in the southern double-season region based on information diffusion theory[J].Chinese Journal of Agrometeorology,2019,40(11): 712-722.(in Chinese)
[15] 许林兵,高爱平,蒲金基,等.香蕉、芒果安全生产技术指南[M].北京:中国农业出版社,2011:49-50.
Xu L B,Gao A P,Pu J J.Technical guide for safe production of banana and mango[M].Beijing:China Agriculture Press,2011:49-50.(in Chinese)
[16] Li Z,Fox J M.Mapping rubber tree growth in mainland Southeast Asia using time-series MODIS 250m NDVI and statistical data[J].Applied Geography,2012,32:420-432.
[17] 高学慧,黄淑娥,颜流水,等.基于MODIS遥感资料的江西省双季早稻估产研究[J].江西农业大学学报,2013, 35(2):290-295.
Gao X H,Huang S E,Yan L S,et al.Yield estimation on Jiangxi early rice based on MODIS data[J].Acta Agriculturae Universitatis Jiangxiensis,2013,35(2):290- 295.(in Chinese)
[18] 黄崇福.自然灾害风险评价:理论与实践[M].北京:科学出版社,2005:83,110-114.
Huang C F.Risk assessment of natural disaster:theory & practice[M]. Beijing:Science Press,2005:83,110-114.(in Chinese)
[19] 谭昌伟,杜颖,童璐,等.基于开花期卫星遥感数据的大田小麦估产方法比较[J].中国农业科学,2017,50(16):3101-3109.
Tan C W,Du Y,Tong L,et al.Comparison of the methods for predicting wheat yield based on satellite remote sensing data at anthesis[J].Scientia Agricultura Sinica,2017,50(16):3101- 3109.(in Chinese)
[20] 毛学刚,杜子涵,刘家倩,等.基于无人机LiDAR的天然林与人工林林隙提取[J].农业机械学报,2020,51(3):232-240.
Mao X G,Du Z H,Liu J Q,et al.Extraction of forest gaps in natural forest and man-made forest based on UAV LiDAR[J]. Transactions of the Chinese Society of Agricultural Machinery,2020,51(3):232-240.(in Chinese)
[21] 钱永兰,侯英雨,延昊,等.基于遥感的国外作物长势监测与产量趋势估计[J].农业工程学报,2012,28(13):166-171.
Qian Y L,Hou Y Y,Yan H,et al.Global crop growth condition monitoring and yield trend prediction with remote sensing[J].Transactions of the CSAE,2012,28(13):166-171. (in Chinese)
[22] 王恺宁,王修信.多植被指数组合的冬小麦遥感估产方法研究[J].干旱区资源与环境,2017,31(7):44-49.
Wang K N,Wang X X.Research on winter wheat yield estimation with the multiply remote sensing vegetation index combination[J].Journal of Arid Land Resources and Environment,2017,31(7):44-49.(in Chinese)
[23] 孙擎,杨再强,杨世琼,等.多种格点作物模型对中国区域水稻产量模拟能力评估[J].中国农业气象,2019,40(4): 199-213.
Sun Q,Yang Z Q,Yang S Q,et al.Evaluations and projections of rice yield from multi-gridded crop model over China[J]. Chinese Journal of Agrometeorology,2019,40(4):199-213.(in Chinese)
[24] 朱婉雪,李仕冀,张旭博,等.基于无人机遥感植被指数优选的田块尺度冬小麦估产[J].农业工程学报,2018,34(11): 78-86.
Zhu W X,Li S J,Zhang X B,et al.Estimation of winter wheat yield using optimal vegetation indices from unmanned aerial vehicle remote sensing[J].Transactions of the CSAE,2018, 34(11):78-86.(in Chinese)
[25] 刘溢健,任建宏,殷俐娜,等.马铃薯块茎膨大期不同程度干旱后复水的源库补偿效应[J].应用生态学报,2019,30(11): 3777-3786.
Liu Y J,Ren J H,Yin L N,et al.Compensation effect of re-watering after different drought stresses on source-sink metabolism during tuber expansion period of potato[J]. Chinese Journal of Applied Ecology,2019,30(11):3777- 3786.(in Chinese)
Information Diffusion Model of Banana Yield Estimation Based on Vegetation Growth
CAI Da-xin,LIU Shao-jun,CHEN Hui-lin,TIAN Guang-hui
(1. Research Institute of Hainan Meteorological Bureau/Key Laboratory of Meteorological Disaster Preventing and Reducing of South China Sea, Haikou 570203, China)
Banana is an important tropical fruit in Hainan. Limited by meteorological disasters and the level of production technology, banana production has weak stability and large inter-annual fluctuations in Hainan. Remote sensing yield estimation is currently one of the most widely used crop yield estimation methods, especially suitable for large-area, uniformly distributed planting types. Therefore, carrying out research on banana yield estimation by remote sensing and accurately grasping the change trend of yield is of great significance to the planning and stable development of the banana planting industry. Based on Landsat-8 and MODIS data, the object-oriented method was first used to extract the spatial distribution of banana growing areas in Hainan Island, and then the Mahalanobis distance method based on the time series vegetation index was used for the second extraction, and finally the results of the two extractions were spatially overlaid. The method of field verification at random selected points was used to evaluate the classification accuracy. Aiming at the problem of the small number of regional yield estimation samples, the MODIS data from 2014 to 2015 and the banana regional yield data in 2015 were collected. The growth of banana throughout the growth period was used as an input variable to establish an information diffusion model for regional yield estimation. NDVI data was calculated by daily MODIS images, and synthesized to monthly data. The monthly composite values of NDVI was summed to obtain the cumulative value of NDVI throughout the growth period. Using the obtained vector files of banana planting areas, the cumulative NDVI values of bananas were extracted in 18 counties during the whole growth period. As the input and output variables of the information diffusion model, the cumulative value of NDVI and yield data were logarithmically normalized. The normal diffusion function was used to diffuse the sample information into the whole field, and an information matrix composed of information increments was established. Then the fuzzy relationship between the cumulative value of NDVI and the yield was obtained from the information matrix, that was the fuzzy relationship matrix. Finally, through the fuzzy approximate reasoning method, the simulated yield was obtained from the input samples. The cross-validation method was used to evaluate the accuracy of production estimation, and at the same time, the accuracy of the production estimation model for the simulation of production change trends was evaluated. Three kinds of information diffusion estimation schemes were constructed by combining multiple growth stages: scheme I was the NDVI cumulative value modeling scheme for the whole growth period; scheme Ⅱ was the scheme of joint input of vegetative growth stage and reproductive growth stage; scheme Ⅲ was the scheme of joint input during the budding stage and fruit development stage. The estimation accuracy of each plan was compared at last. The results showed that: (1) the comprehensive classification method using object-oriented and Mahalanobis distance had a higher accuracy. The total classification accuracy and Kappa coefficient were 82.5% and 0.7338 respectively, and the result of the consistency test was better. (2) The information diffusion model based on banana growth during the whole growth period had high yield estimation accuracy, with an average relative error of 26.0%, a coefficient of determination of 0.9216, and good explanatory power and stability; the accuracy of the estimation of inter-annual yield change trends reached 83.3%. (3) The univariate information diffusion estimation scheme based on the entire growth period had the highest accuracy, and the average relative error was reduced by 2.9 and 10.4 percentage point respectively compared with the other two multivariate modeling schemes. Based on the above results, it could be found that a fuzzy relationship was established with the information diffusion method between banana growth and yield by constructing a fuzzy set. The model was estimated with high accuracy, good explanatory ability and stability, and the accuracy rate for predicting the inter-annual yield change trend was also high, which could meet actual business needs. Through the establishment of a phase-by-growth yield estimation program to compare the impact of each developmental stage on the yield estimation accuracy, it was found that the effect of information diffusion model with whole growth period as the input variable was the best, which could take into account the impact of meteorological disasters and sensitive growth periods on yield. The accuracy of the yield estimation scheme II, which inputted both the vegetative growth period and the reproductive growth period, was higher than that of the program III, which only considered the reproductive growth period. The performance of information diffusion method with advantages in the processing of small sample data and ability to simulate nonlinear relationships was better. Applicability of yield estimation model based on full growth period in banana planting areas was judged satisfactory. The yield estimation model could be applied in the late stage of banana fruit expansion, and could also be used to carry out regular rolling forecasts after budding, to improve timeliness and provided scientific basis for agricultural departments and farmers to rationally arrange production and sales.
Information diffusion; Estimated model; Remote sensing; Cash crops; Banana
2019−12−03
国家自然科学基金(41765007;41465005;41675113);海南省基础与应用基础研究计划(自然科学领域)高层次人才项目(2019RC359);海南省气象局科研项目(HNQXMS201502)
蔡大鑫,E-mail:cdxxxhyn@126.com
10.3969/j.issn.1000-6362.2020.09.005
蔡大鑫,刘少军,陈汇林,等.基于植被长势的香蕉区域估产信息扩散模型[J].中国农业气象,2020,41(9):587-596