基于普通数码影像的单株桃树估产方法
2018-09-10刘玉婵胡阳
刘玉婵 胡阳
摘要:[目的]探讨基于普通数码影像的单株桃树估产方法,为实现桃树产量的高精度、低成本估测提供参考。[方法]以安徽省滁州市张山桃园为试验区,利用数码相机分别从西北、东南两个方向对抽取的成熟期单株桃树进行拍摄,通过改进的分割算法和特征空间的优化进行果实信息提取,进而选取斑块数量、周长和面积作为特征参数估测单株桃树产量。[结果]采用双方向拍摄的斑块数量之和的建模(y=0.9748x+0.3995)精度最高,预测值与实际值间的决定系数(R2)达0.9049,均方根误差(RMSE)达0.21,而仅采用西北方向拍摄的斑块数量作为建模参数的效果最差,R2仅0.0687,RMSEJ为30.64。[结论]可以利用普通数码影像提取斑块数量作为特征参数构建估产模型对成熟期果树进行产量预测,其精度较高,该方法具有一定科学性和应用前景。
关键词:桃树;数码影像;模型;估产
中图分类号:S662.1 文献标志码:A 文章编号:2095-1191(2018)03-0606-06
0引言
[研究意义]近年来,随着我国农业遥感等信息技术的发展,为果品的自动化监测提供了便利(易时来等,2009;吴尚蓉等,2013)。对果树产量进行预测可帮助果农根据市场实际需求量制订合理的生产计划和销售方向(刘军弟和霍学喜,2010)。目前,果樹估产的准确性及可推广性仍是限制其发展与应用的主要因素(雷彤等,2010;刘璐等,2012;卢军和桑农,2014)。利用普通数码摄影技术对单株果树产量进行估测,具有操作简单、成本低、可推广性强的特点,可为实现果树生产现代化提供科学依据。[前人研究进展]已有学者利用普通数码摄影技术对苹果(Elfving and Schechter,1993;Linker et a1.,2012;程洪等,2015)、猕猴桃(Wijethunga et a1.,2008)、柑橘(张亚静等,2009)、芒果(Payne et a1.,2013)进行了产量估测研究,其结果均表明基于图像处理技术提取的个数、面积等特征参数与产量问存在着较高的相关性,尤其在苹果估产方面研究诸多。何传江和唐利明(2007)通过对果树进行单方向摄影,提取面积、周长、个数作为特征参数,构建单株果树产量估算模型,取得了较好生产效益;苏哲斌(2009)结合灰色系统与马尔柯夫链理论,建立灰色马尔柯夫估测模型,以陕西省为试验区进行了苹果产量估测;雷彤等(2010)通过实测苹果冠层反射光谱,估测了山东省栖霞市的苹果产量;Rozman等(2012)利用苹果果树多个时期的图像,以提取的苹果个数为输入值,成功建立了基于神经网络模型的苹果成熟期单株果树实际产量估测方法;钱建平等(2013)利用图像处理技术,对识别出的成熟期苹果数码影像果实图斑构建产量估测模型。[本研究切入点]虽然前人的研究均构建出不同果实在特定区域的估产模型,但由于果实的生长存在不均衡性,单一方向的影像数据估产难免会产生较大误差,导致现有的理论模型无法落实在具体的果树估测应用中。[拟解决的关键问题]针对当前研究存在的不足,以桃树为研究对象,对单株桃树的西北、东南两个方向的成熟期果树进行数码摄影,通过分割算法的改进和特征空间的优化进行果树信息提取,进而选取特征参数构建单株桃树产量估测模型,实现对桃树产量的高精度、低成本估测。
1数据来源与研究方法
1.1数据来源
试验区位于安徽省滁州市来安县张山桃园,面积约5 ha,桃园内桃树南北纵向成行分布,树形为改良杯状形,大部分树龄为5年。通过分析该桃园2012~2016年的生产和管理记录,单株桃树产量平均为100kg。本研究在桃树成果期进行图像数据的采集,选取50株生长较好的健壮桃树,对每株进行编号。本研究使用佳能EOS 600D数码相机采集数据,有效像素1800万,传感器尺寸22.3mm×4.9mmCMOS。于2016年9月8~9日12:00~14:00对每株桃树分别从西北和东南方向进行照片拍摄,要求整株果树都能拍摄到,且焦距一致,共获取100幅影像。为提高处理影像的效率,进行批量裁剪以去除影像多余部分,保留目标区域,裁剪后的像素为640x640。2016年9月12~20日采摘50株桃树的果实,同时详细记录每株桃树的实际产量,将50株果树的产量按从低到高顺序排列,并分为奇数和偶数两组,每组各25株(表1)。
1.2基于几何活动轮廓模型的影像分割
几何活动轮廓模型(Geodesic active contour,GAC)基于水平集方法及曲线进化理论,曲线进化与参数无关。曲线进化的基本原理:首先将作为零水平集的曲线插入到高一维的函数中,再对其进行不断更新,从而完成对其中隐含曲线的进化。基本的GAC模型满足以下方程:
对于传统GAC模型,g函数是定义在影像梯度场上的非负单调递减函数,其目的是使演化曲线在目标边界上的速度为零。然而,根据g函数的定义,演化曲线在目标边界上的速度不仅不会为零,还会在弱边界上较大,造成边界泄露,即演化曲线会陷进目标内部。针对基本扩散模型在演化曲线方面的缺陷,通过总结前人关于阈值研究的经验(何传江和唐利明,2007),本研究定义控制参数6c为0.35,β为0.55。
2结果与分析
2.1特征空间构建及果实信息提取
颜色信息、形状信息和纹理信息是识别果实目标与背景的重要因子,也是遥感数据识别的基础。通过选取颜色、形状和纹理信息构建特征空间,可准确、有效地将果实从背景中识别出来。本研究选取比值特征(某波段影像斑块的均值光谱除以全部波段的斑块均值光谱之和)和亮度特征(将光谱层的均值亮度与影像对象数量相除)作为颜色指标;选取斑块周长、面积、最小外接矩形长和宽及圆形度等作为形状指标;选取小梯度优势、梯度不均匀性、灰度均方差、惯性、灰度不均匀性、能量不均匀性、相关和逆差距等作为纹理指标。对成熟期的桃树利用改进GAC模型的影像分割方法进行影像分割,得到分割后的果实信息提取结果如图1所示。
2.2特征参数选取及单株产量估测模型构建
基于前人采用影像分割结果的斑块个数、周长和总面积等3个特征参数对单株果实产量进行估测研究(张亚静等,2009),其中,识别斑块个数是从图像中识别到的成熟桃数量,即从数量方面反映桃的产量;识别总周长是图像中识别到的桃子轮廓像素和;识别面积是图像中识别到的桃子面积。周长越长、面积越大,桃子的体积可能就越大,即以重量反映桃子的产量。综上所述,本研究提出以下9个特征参数为自变量:(1)从西北方向提取的斑块数;(2)从东南方向提取的斑块数;(3)从西北和东南方向提取的斑块数之和;(4)从西北方向提取的斑块周长;(5)从东南方向提取的斑块周长;(6)从西北和东南方向提取的斑块周长之和;(7)从西北方向提取的斑块面积;(8)从东南方向提取的斑块面积;(9)从西北和东南方向提取的斑块面积之和。同时,采用奇数组的25株实测桃树单株产量作为因变量,构建桃树单株产量估测回归模型。
本研究采用预测值与实际值问的决定系数R2和均方根误差RMSE两个指标来评价估产模型的性能,R2越大表明预测值与实际值相关性越好,RMSE越小說明估算模型估测精度越高。计算公式如下:式中,yi为样本实际产量,yie为样本预测产量。由构建的模型(图2)及评价结果(表2)可知,采用斑块数量为估产建模参数时,总体效果比斑块面积和斑块周长优,其中,采用东南和西北双方向拍摄斑块数量之和的建模精度最高,R2达0.9049,RMSE达0.21,通过F=O.01显著性检验;而仅采用西北方向的斑块数量作为建模参数时效果最差,R2仅为0.0687,RMSE为0.64。在采用斑块面积作为建模参数时,不管是采用西北或东南单方向的斑块面积,还是双方向斑块面积之和,建模的效果相差不明显;而采用其他两种参数建模时,西北方向参数的建模效果明显比东南方向和双方向之和参数的建模效果差。其原因可能是拍摄果树影像时,东南方向获取的影像光线较佳,果实斑块识别更准确;也可能是树木本身的生长特性所致,东南方向果实的生长较好,该方向的影像能反映整棵果树的大致产量。
2.3单株产量估测模型分析
2.3.1模型验证 基于前期试验中构建的9个特征参数模型,采用精度最高的双方向斑块数量之和为特征参数,对奇数组的25株果树的产量进行预测,同时利用实际产量进行精度验证,结果如图3所示。由图3可知,总体上果树产量预测值与实际产量值差距较小,单株果树实际产量平均值为56.3kg,预测产量平均值为56.1kg,二者基本一致。但单株果树产量预测值与实际产量值问仍存在或大或小的差异,其中,编号为11的果树差异最明显,预测值比实际产量低12.0kg,其次是编号为17的果树,预测值比实际产量高11.0kg。
2.3.2模型误差分析 从整体上看,单株果树产量预测值偏低的有14株,偏高的有11株。通过对研究过程进行分析,认为产生误差的因素大致分为以下几种:(1)对于预测产量偏低的情况:一方面可能是果实被树叶遮挡使得影像无法识别果实斑块;另一方面可能是若干果实挤在一起生长使得影像分割时将其识别为一个整体斑块(图4-a);(2)对于预测产量偏高的情况:一方面是由于双方向影像采集时,会将同一果实进行重复数据获取,导致重复计算;另一方面是由于单个果实被树枝或树叶遮挡,在影像分割时将单个果实识别为多个斑块(图4-b)。
3讨论
本研究以桃树为研究对象,利用数码相机分别从西北、东南两个方向对成熟期的单株桃树进行数码拍照,通过改进后的分割算法和特征空间的优化,进行果实信息提取,选取了斑块数量、斑块周长、斑块面积作为特征参数,进行单株桃树产量估测。结果表明,在单株桃树产量估测模型构建时采用斑块数量作为估产建模参数效果最优,其中采用双方向斑块数量之和的建模精度最高,R2达0.9049,RMSE达0.21,其模型为y=0.9748x+0.3995。因此,本研究选用y=0.9748x+0.3995模型作为单株桃树产量预测模型。
在前人关于构建特征空间研究的基础上,本研究选取颜色、形状、纹理指标作为特征空间构建因子,研究结果与以往单纯依靠图像中的果实个数与大小信息构建的估测模型(周嵘,2011;程洪等,2015)相比,提取的准确度有所提高,且更加全面地反映了果实信息。从与桃树的实际产量比较来看,总体上预测值与实际值基本一致,说明利用普通数码相机对成熟期果树进行产量预测的方法具有一定的科学性和良好的应用前景,预测结果可为果农根据市场实际需求量提前制订合理的生产计划和销售方向,从而增加经济收益。但针对单株果树产量预测仍存在部分误差,因此,该模型在今后研究中需结合多种误差因素,进一步提高本模型预测准确度,修正和完善估产模型。
4结论
利用普通数码像片提取斑块数量作为特征参数构建估产模型对成熟期果树进行产量预测,其精度较高,该方法具有一定科学性和应用前景。
(责任编辑 邓慧灵)