APP下载

基于RGB 模型的大豆叶片叶绿素含量预测

2020-06-22宋一帆姚雨晴张嫚嫚刘连忠

关键词:特征参数叶绿素聚类

宋一帆,张 武,姚雨晴,洪 迅,张嫚嫚,刘连忠

(安徽农业大学 信息与计算机学院,安徽 合肥 230036)

叶绿素是光合作用最重要的产物,叶绿素含量也是植物重要的生理指标之一[1-2]。传统的叶绿素含量测定方法主要有分光光度法和叶绿素仪(SPAD- 502)法[3-5]。虽然分光光度法可以准确地测定叶绿素含量,但耗时且费力,并且会破坏叶片;叶绿素仪虽然能快速测定叶绿素含量,但测量面积小,且需要重复测量才能得到较准确的数据[6-7]。运用数字图像技术可以在不破坏样本的前提下,根据红、绿、蓝3 个波段,利用不同颜色模型量化数字图像的颜色信息,实现快速、准确地估算植物叶绿素含量[8-9]。

近年来,许多学者对简单、准确、快速地获取植物叶绿素值进行了大量研究,对水稻、番茄、小麦、苹果和其他植物叶片进行了定量分析,建立了植物叶片相对叶绿素(SPAD)与植物叶片彩色图像分量之间的关系模型[10-12],如龚刚猛[13]通过定量分析水稻叶片颜色特征值的RGB 分量与SPAD 值之间的关系,建立了水稻叶色模拟模型,得到了它们之间显著的相关性。张楠[14]分析了获得水稻图像的颜色参数,发现水稻叶片的SPAD 值与水稻序列图像相应部位的RGB 颜色参数具有显著的非线性相关性。李岩等[15]通过处理番茄上部的彩色图像,提取RGB 的颜色特征值进行组合,并用SPAD 值进行回归分析,根据统计测试,大量的颜色特征与SPAD 高度相关。陈诚等[16]通过计算机视觉采集水稻叶片的多种颜色参数,结合神经网络的回归方程,建立了叶绿素相对含量的计算模型,模拟预测值与大田实测数据之间的误差极小。

日本的穗波信雄等[17]使用计算机视觉技术对蘑菇叶片的露天图像进行采样,这些叶片缺乏钙、铁和镁的营养成分。以整个叶片图像直方图的形状和位置为特征,通过阈值方法将病变部分与叶片上的正常部分的面积比作为特征进行分割。Sasaki[18]研究了正常部分和病变部分的反射光谱以确定作物病变的原因。

本文利用数码相机获取叶片图像,对大豆叶片图像进行预处理,通过k- means 聚类方法对叶片主成分进行分割,提取叶片图像颜色参数,根据处理的结果分析叶片颜色特征参数和叶绿素含量的相关性,建立SPAD 估算模型,预测叶绿素含量。

1 材料与方法

1.1 样本采集

研究对象为大豆,试验地点位于安徽省合肥市安徽农业大学试验基地(31. 85°N,117. 23°E,海拔29. 8 m),试验区域属温带半湿润大陆性季风气候,四季分明,平均降水量1 000 mm 左右,年均气候15. 7 ℃,无霜期228 d。将试验的盆栽放置在设有遮雨设施的钢架大棚中。供试大豆品种为‘豌豆13’,2019 年6 月16 日播种。供试土壤为黄褐色,各盆栽内土壤质地相同,基肥按照225 km/hm2施用,无病虫害和杂草。在大豆成熟时对大豆叶片进行取样,每株大豆随机选取一片叶子,总共24 片。

1.2 图像采集

将采集的24 片大豆叶片平铺在长宽已知的白色纸张上,在自然光照下,使用尼康D7100 数码相机,采用自然曝光模式垂直对大豆叶片进行拍照,手动调节光圈和焦距,采集整个叶部图像,图像保存为JPG 格式,分辨率为2 000 × 1 328。

1.3 叶绿素含量测定

采用SPAD- 502 叶绿素仪测量叶片的叶绿素含量。为减少测量误差,每片叶片至少测量6个点,然后取其平均值作为该样本的SPAD 值。试验共测定24 个样本,建模样本、验证样本各12组。得到的建模样本叶绿素含量与验证样本叶绿素含量见表1。

表1 建模样本和验证样本叶绿素含量Tab. 1 Chlorophyll content of modeling samples and verification samples

2 图像分割

2.1 图像预处理

获取和传输图像的过程中会受到各种因素的干扰,例如拍摄者水平限制、拍照时光照条件不佳等,因此通常要对原始图像预处理,进行消除噪声、畸形矫正和图像增强等操作。通常图像预处理采用高斯滤波和中值滤波等。

中值滤波器是一种非线性滤波器,可有效消除边缘和噪声的影响,基本原理:计算K×K像素的模板内每个像素的灰度值中值,并且将图像中每个像素的灰度值替换为中值。计算方法为

式中,f(x,y)、g(x,y)分别为原始图像和处理后的图像。图1(a)是原始图像,图1(b)是中值滤波处理后的图像,可以看出,中值滤波对噪声的处理有较好的效果,并且中值滤波不会边缘模糊。因此,本文使用中值滤波进行图像预处理,去除噪声。

2.2 k-means分割

在图像处理中,k- means 聚类算法是常用的算法之一,是一种简单有效的聚类算法。kmeans 算法是基于欧式距离[19-20],将n个对象划分为k个簇,其公式如下:

图1 中值滤波消除噪声Fig. 1 Noise removal with median filtering

式中,Xij表示第i个聚类第j个样本,Ci是第i个聚类的聚类中心,Ni为第i个聚类的样本数。kmeans 算法分割步骤如下:

步骤一任意选取图像中k个对象,k为初始化聚类中心;

步骤二计算每个样本到聚类中心的距离,将每个对象分配给最靠近聚类中心的类;

步骤三更新新类的聚类中心并计算每个对象的平均值;

步骤四确定聚类中心是否发生变化,如果没有发生变化,则完成迭代,算法终止;否则,重复步骤三。

在本文中,k- means 算法用于分割大豆叶片图像。首先读取要分割的叶片图像,提取每个像素点的3 个颜色分量;其次,随机选定k个聚类中心以对所有像素点进行分类;最后通过不断迭代更新类簇中心的位置,直到所有像素点离聚类中心的距离之和为最小值时停止算法,计算最优中心值E,判断中心值是否收敛;否则,重新计算聚类中心。分割流程图见图2。

图2 分割流程图Fig. 2 Flow chart of segmentation

图3 k-means分割结果Fig. 3 Segmentation results with k-means

3 叶片图像颜色参数提取

颜色直方图所描述的是整个图像中不同颜色的比例,特别适合描述难以分割的图像和不需要考虑对象空间位置的图像。所以本文通过直方图的方法提取图像颜色参数。

颜色直方图是最基本的颜色特征表示方法,它反映了图像中颜色的成分分布,即出现的颜色和各种颜色的出现概率。其函数表达式为

式中,k代表图像的特征取值,L代表特征值数量,nk是图像中具有特征值k的像素的数量,N是图像像素的总数。表2 是通过颜色直方图提取的颜色特征参数。

4 SPAD 估算模型

4.1 组合颜色特征参数与SPAD 的相关性

使用SPSS25.0 统计分析软件进行图像特征参数和大豆叶片SPAD 的线性回归分析。考虑到各个颜色特征参数与SPAD 的相关性并不显著,需要结合多个颜色参数进行相关性分析。选取3 个颜色特征参数进行4 种组合,分别是R/G/B、R/(R+G-B)、G/(R+G-B)和B/(R+GB),将其进行线性回归分析,得到线性回归方程及决定系数R2见表3。表3 对不同颜色组合进行了SPAD 线性回归分析,由表3 可知,颜色特征只有G、R+G-B时,决定系数R2的值为0. 408,相关性最小;颜色特征有B、B+ G- B时,决定系数R2的值为0. 438,相关性最大。考虑到建模数据量较少,需对上述模型进行误差分析,选出最优建模方程。

4.2 最优SPAD 估算模型

用建模数据对4 个方程进行误差分析,将建模样本的各颜色特征参数值带入表3 中的回归方程,得到SPAD 估算值进行误差分析,结果见表4。由表4 可知,第3 个线性回归方程即颜色特征值为G、(R+ G- B)时的最小相对误差为0. 80% ,最大相对误差为23. 84% ,平均相对误差为8. 41% ,均方根误差为2. 492,误差是4 个当中最大的;第4 个线性回归方程即颜色特征值为B、(R+ G- B)时最小相对误差为0. 09% ,最大相对误差为23. 54% ,平均相对误差为7. 65% ,均方根误差为2. 434,误差是4 个当中最小的。其余两种组合的误差介于两者之间。所以将第4 种即B/(R+ G- B)颜色特征值组合的方程确定为最优SPAD 估算模型,用于估算叶片的叶绿素含量。

表2 直方图提取的颜色特征参数Tab. 2 Color feature parameters extracted from histogram

表3 颜色特征参数与SPAD 的线性回归分析结果Tab. 3 Color characteristic parameters and SPAD linear regression analysis results

表4 误差分析Tab. 4 Error analysis

4.3 模型的验证

用验证样本数据对最优SPAD 估算模型进行误差分析,由表5 可知:验证样本的最小相对误差0. 59% ,最大相对误差为25. 93% ,平均相对误差为9. 58% ,均方根误差为2. 862。由此可见,估算模型的相对误差小于10% ,用来预测大豆叶片叶绿素含量是可行的。图4 为预测值与实际值的曲线图。

表5 验证样本误差分析Tab. 5 Error analysis of verification samples

图4 颜色特征为B、R+G-B 时预测值与实际值曲线Fig. 4 Curves of predicted value and actual value when color characteristics are B and R+G-B

5 结语

本文通过获取图像的RGB 值,选取R/G/B、R/(R+G-B)、G/(R+G-B)、B/(R+G-B)构成4 个颜色特征组合参数,使用SPSS 软件对颜色特征参数和SPAD 进行回归分析,在误差分析的基础上建立SPAD 估算模型,将该模型运用于样本,得到SPAD 估算值与实际值的平均相对误差为9. 58% ,均方根误差为2. 862。

通过分析大豆叶片图像特征与SPAD 的相关性,得到一个近似计算叶绿素含量的数学模型,结果表明,通过图像诊断大豆叶绿素含量的方法是可行的,在后续研究中,需要优化诊断模型,以得到适用于不同季节、不同大豆品种的大豆叶绿素诊断方法。

猜你喜欢

特征参数叶绿素聚类
冕洞特征参数与地磁暴强度及发生时间统计
提取叶绿素
基于K-means聚类的车-地无线通信场强研究
基于交通特征参数预测的高速公路新型车检器布设方案研究
锌对白菜和香葱叶绿素含量的影响研究
桃树叶绿素含量与SPAD值呈极显著正相关
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现