基于图像颜色与形状特征的幼龄沉香全氮含量预测
2023-05-30王鹏王雪峰
王鹏 王雪峰
关键词:沉香;可见光图像;K-Means 聚类分割算法;图像特征提取;氮素诊断
中图分类号:S757.9 文献标识码:A
沉香(Aquilaria sinensis)为瑞香科(ThymelaeaceaeJuss.)沉香属(Aquilaria Lam.)乔木,是我国重点保护的珍贵树种之一,可用于制香、制药以及工艺品制造,具有极高的经济价值[1]。近年来,由于人为的过度砍伐以及生态环境的破坏,野生沉香数量不断减少。为了保护该树种并满足供应需求,海南省开始大力推广种植沉香[2]。但幼龄沉香对养分的敏感性较高,在实际培育中,由于经营者无法实时掌握养分信息,导致沉香发育不良甚至死亡。因此,为了保证沉香的健康生长,有必要探索一种快捷、可靠的营养诊断方法[3]。
氮素是植物生长的必要元素之一,氮素供应不足或过量都会对植物的生长发育产生不良影响,因此植物氮素诊断技术被广泛应用于农林业中。但是,早期的氮素诊断多以化学分析法为主,既耗费大量人力物力又无法实现实时诊断。近年来,无损检测技术应运而生,其中的数字图像处理技术更是以其高效便捷性为植物氮素诊断提供了一种新的思路。例如,NIU 等[4]通过获取甜瓜数字图像及测量甜瓜氮素含量,训练并构建了基于人工神经网络的甜瓜氮含量预测模型,通过与传统氮素诊断技术进行对比,指出了数字图像处理技术在甜瓜氮素含量预测中的高效性。袁媛等[5]运用数字图像处理技术,分析了黄瓜叶片图像特征与叶绿素值的相关性,并以此建立了黄瓜氮素预测模型,结果表明红光标准值、深绿色指数以及色调与叶绿素值有明显的线性关系,证明了数字图像处理技术在黄瓜氮素诊断中的可行性。
WATT 等[6]分析了森林高光谱图像不同波段与森林养分含量的关系,结果表明高光谱影像不同波段的灰度信息可用于构建森林氮、磷含量的精准预测模型。陈珠琳等[7]提取了檀香可见光图像的9种颜色特征并对传统BP 神经网络进行改进,提出了一种基于檀香叶片全氮含量预测模型,为檀香的无损营养诊断提供了理论依据。TANG 等[8]将橡胶叶片多光谱图像各波段的均值作为自变量,构建了一种橡胶叶片氮含量检测模型,为快速检测橡胶叶片的氮含量提供了技术支撑。张沛健等[9]利用数码相机获取了5 种红树林植物的可见光图像,通过提取图像的RGB 分量计算了相关组合值,建立了叶片颜色参数与叶绿素含量的回归模型,为红树林植物生长及诊断营养状况提供了一定的技术支撑。
当前研究的重点在于提取图像参数信息,对于图像的分割过程少有探讨,且多数研究选用颜色特征作为自变量,未能将形状特征考虑在内。因此,本研究通过改进K-Means 聚类分割算法对获取的幼龄沉香可见光图像进行了分割,在此基础上提取了图像的颜色特征及形状特征,分别以颜色特征、形状特征、颜色特征+形状特征为自变量,建立了3 种幼龄沉香全氮含量预测模型,旨在为林木的氮素诊断提供一种更为高效、应用性强的技术方法,为精准林业提供一定的参考。
1 材料与方法
1.1 试验地概况
试验地位于海南省文昌市(19°20′~20°10′N,108°21′~111°03′E),平均海拔42.55 m,年平均气温23.90 ℃,属热带北缘沿海平原地带。文昌市干湿季分明,常年降水量1721.60 mm,年平均湿度达到了87%。试验地主要土壤为滨海沙瓤土,pH 为5.0~6.6,适宜沉香生长[10-11]。
1.2 试验设计与数据获取
试验所用沉香采用种子育苗,待生长2 年后,选择生长正常、长势均匀且无病虫害的45 株树苗,移入高34 cm、半径17 cm 的花盆中,每盆装入5 kg 风干滨海沙瓤土,其中有机质含量为50 g。为了更为准确地构建幼龄沉香全氮含量模型,使模型更好地应用于实际,试验中将45 株树苗平均分为3 组,每株施氮水平分别设置为0、20、40 g,以模拟不同氮含量下的沉香生长。待3周缓苗期后,将沉香移入1 m×1 m×2 m 的暗箱中,在暗箱上部4 个边缘分别安装LED 灯以消除光照影响,在暗箱的底部放置校正板和幼龄沉香植株,采用佳能1300D 相机按照东、南、西、北4 个方位对所有幼苗进行拍摄,共计获得180 张图像,图像大小为5184×3456 像素。在拍摄结束后,按照上、中、下3 个层次对每株沉香采集老叶与新叶共计10 g,使用便捷式养分测定仪进行全氮含量测定。
1.3 研究技术流程
本研究的技术流程包括图像采集、图像分割、特征提取、特征优化、模型构建、模型验证(图1)。
1.4 图像分割与特征提取
本研究圖像分割与特征提取工作均在配置Opencv3.1.0 的Visual Studio 2013 软件中进行,在获取幼龄沉香可见光图像后,选用每株幼苗前、后、左、右4 个方位图像各1 张,运用改进的K-Means 聚类分割算法对图像进行分割处理,结束后提取前景图像的颜色特征与形状特征。其中,K-Means 聚类分割算法是一种基于距离的硬分类方法,该算法通过设置聚类个数K,在初始时生成K 个聚类中心,将数据划分为K 个聚类集合,然后通过不断变换聚类中心以达到最佳的分类效果[12-14]。虽然K-Means 聚类分割算法简单快捷,但此算法中的K 值是事先给定的,这导致K 值经常难以估计,使分类结果具有较大的不确定性[15]。因此,本研究提出一种改善K 值选取方式的方法,具体方式如下:(1)若初步判断图像颜色种类为K-1,代入K 值运行K-Means 算法得到K 个聚类。(2)若存在边界距离小于设定误差的聚类,将其归为一类,若不存在,则此时K 值最佳。(3)若步骤(2)中没有获得最佳K 值,则继续对样本集运行K-Means 算法,得到新的K 个聚类。(4)重复步骤(2)与步骤(3),直到数据获得最佳划分。
确定K 值后,具体分割流程如下:(1)使用imread 函数读取幼龄沉香RGB 图像。(2)使用GaussianBlur 函数进行3×3 高斯滤波处理。(3)输入K 值并使用Scalar 函数设置预定义分割颜色。(4)设置前景像素灰度值设置为0,背景像素灰度值为1。(5)与原图进行掩膜操作。分割结束后,为了验证K-Means 聚类分割算法的精度,随机选取4 张幼龄沉香可见光图像, 运用Photoshop CC2014 中的磁性套索工具进行手工分割,分割时将图像放大至像素级,逐像素点选取前景边缘,以保证手工分割精度达到99%以上,进而以此结果为基准计算K-Means 算法分割得到的图像像素误差,计算方法如下:
式中,Pr为像素误差;Pi 为K-Means 的像素值;Pj 为手工分割的像素值[16]。
本研究选用了9 个颜色特征及4 个形状特征(表1)。其中,颜色特征分别为RGB 颜色空间的红色通道(R)、绿色通道(G)、蓝色通道(B)的均值,HIS 颜色空间的色调(H)、饱和度(S)、明度(I)的均值,Lab 颜色空间的亮度(L)、红到绿通道(a)、黄到蓝通道(b)的均值;形狀特征分别为前景图像的面积(contour area, CA),前景图像最小外接矩形的面积(rectangular area,RA)、周长(rectangular circumference, RC)以及矩形度(rectangular degree, RD)。
提取图像的颜色特征时,使用split 函数分离各图像的R、G、B 三通道,使用meanStdDev 函数计算图像R、G、B 三分量的均值并进行归一化处理。根据图像颜色空间的转换公式,分别计算图像的H、S、I、L、a、b 分量的均值,计算方法参见式(2)~(10)[7]。提取图像形状特征时,使用findContours 函数寻找CA,通过minAreaRect函数以及arcLength 函数分别计算RA 与RC,同时根据式(11)计算RD。
1.5 变量筛选与模型构建
为了对比不同自变量对模型的影响,将自变量分为颜色特征、形状特征、颜色特征+形状特征三大类。同时,为了消除自变量中各图像特征间的共线性,使用主成分分析法对3 类自变量分别进行降维处理。提取主成分后,绘制散点图,根据散点图特征构建多项式方程,主成分分析与模型构建过程均在MATLAB 2018a 软件中完成。模型构建完成后,计算模型的平均残差MR、均方根误差RMSE 以及决定系数R2以验证模型的精度,计算方法参见式(12)~(14)[17]。
2 结果与分析
2.1 图像分割与特征提取结果
根据算法改进方式确定聚类分割的初始中心点个数K=4,在获取二值图像后与原图进行掩膜操作,得到最终的图像分割结果(图2)。同时,根据特征提取的相关方法,计算分割后图像R、G、B 三通道的均值。为了验证分割的精度,随机选取4 组幼龄沉香可见光图像,分别记为①~①,利用Photoshop CC2014 软件中的磁性套索工具手工分割幼龄沉香可见光图像,并以此为基准计算分割图像的总体像素误差以及R、G、B 三通道的像素误差。如表2 所示,各图像的像素误差均小于5%,且各通道像素误差均小于3%,说明改进后的K-Means 分割算法的分割精度较好,可以实现对幼龄沉香可见光图像的有效分割。
根据图像通道分离方法,提取图像的R、G、B 三通道图像,同时根据图像颜色空间转换公式,将图像分别转换到HIS、Lab 颜色空间下,得到H、S、I、L、a、b 各通道图像。以K1 为例,各通道图像如图3 所示。计算图像各通道均值后,共计得到9 种颜色特征。根据形状特征提取方法,获得沉香轮廓所包含的CA、RA 及RC,同时根据式(11)计算得到RD,共计得到4 种形状特征。
2.2 主成分分析
在获取各图像特征后,计算幼龄沉香东、南、西、北4 个方位图像的颜色特征及形状特征的均值,在此基础对颜色特征、形状特征、颜色特征+形状特征3 类自变量分别进行主成分分析,提取特征值大于1 的主成分以消除图像特征间的共线性。其中,颜色特征共提取2 个主成分,分别记为C1、C2,主成分综合得分记为C(color);形状特征共提取1 个主成分,记为S(shape);颜色特征+形状特征共提取4 个主成分,分别记为CS1、CS2、CS3、CS4,主成分综合得分记为CS(color+shape),提取结果及3 类自变量的主成分得分如表3 所示。由表3 可知,提取的3 类自变量的主成分累计贡献率均达到85%以上,说明提取的主成分能够有效表达3 类自变量,通过主成分分析实现了在损失较少信息情况下的数据降维。同时,根据主成分分析的结果计算每种图像特征在3 类主成分的权重,如式(15)~(17)所示。在建模后可以此为基准将图像特征直接代入模型中,进而有效缩短建模时间,提升建模效率。
2.3 模型构建与检验结果
使用便捷式养分测定仪测定45 株沉香的全氮含量,建立沉香图像特征主成分与全氮含量的对应关系,在此基础上绘制全水平下的幼龄沉香氮含量散点图,结果如图4 所示。分别以颜色特征、形状特征、颜色特征+形状特征的主成分为自变量,幼龄沉香含氮量Y 为因变量,建立多项式方程。将每种图像特征在3 类主成分的权重代入3 类多项式方程,得到最终的3 种幼龄沉香全氮含量预测模型,建模结果如表4 所示。
由表4 可知,3 种模型的R2 均在0.75 以上,说明3 种模型的拟合效果均表现良好。其中,模型②与模型①的MR、RMSE 与R2 基本一致,说明形状特征同颜色特征一致,也能够较好地反映出幼龄沉香的含氮量。虽然模型②的精度略低于模型①的精度,但模型①的自变量为9 种颜色特征的主成分,而模型②的自变量仅为4 种形状特征的主成分,相对而言使用形状特征构建的模型参数更少,建模效率更高。在3 类模型中,模型③的精度最高,这是因为模型③自变量为颜色特征与形状特征共同的主成分,包含的图像特征数量最多,因此拟合的模型的可解释性最高、效果最好。由此可知,基于双特征构建的氮含量模型相较于单一特征氮含量模型拟合优度和预测精度更高。
3 讨论
运用数字图像处理技术构建预测模型可以实现对植物营养元素含量的快速、高效测定[18-19]。其中,图像分割的精度决定了提取的图像特征的准确程度,影响预测模型的最终拟合优度。当前研究重点在于寻找反映目标植物营养特征的图像参数,对于图像的分割过程少有探讨。因此,本研究通过比较边界距离与设定误差的大小确定最佳K 值,以此实现了对K-Means 聚类分割算法的改进,在此基础上对获取的幼龄沉香可见光图像进行了分割,同时参照手工分割的结果对算法的分割效果进行了检验,结果表明在改善K 值的选取方式后,K-Means 聚类分割算法的不确定性降低,分割效率增强,同时分割精度可以达到95%以上,可以实现对幼龄沉香可见光图像的精准分割。
目前已有多项研究通过提取数字图像的颜色特征构建了植物氮含量的精准预测模型。例如,王远等[20]提出了一种基于数字图像颜色特征的水稻氮含量线性预测模型,通过对模型进行验证证明了图像特征与水稻叶绿素含量具有较高的相关性。王玉娜等[21]利用无人机获取了冬小麦的高光谱图像,通过分析图像光谱参数,利用多元回归方程、最小二乘法以及随机森林分别构建了冬小麦氮素指数模型,证明了任意两波段的光谱指数与氮素指数的高度相关性。张培松等[22]通过提取橡胶树叶片图像的R、G、B 通道,计算了3个波段的组合指数特征,在此基础上构建了9 种橡胶树叶片氮含量的回归模型。本研究构建了基于图像颜色特征的全氮含量模型,结果表明所构建的模型精度良好,可以实现对幼龄沉香全氮含量的合理预测。不同氮含量下的树高、冠幅会存在明显差异,通过林木图像的形态特征可以反映这种不同[9, 23]。但是,当前研究多以颜色特征作为自变量,未能将形状特征考虑在内。因此,本研究构建了基于图像形态特征的幼龄沉香的全氮含量模型,结果表明该模型与基于图像颜色特征的全氮含量模型精度基本一致,并且使用形状特征构建的模型参数更少,建模效率更高。为了验证图像特征个数对建模结果的影响,本研究构建了以图像颜色特征+形状特征为自变量的双特征全氮含量预测模型,结果表明该模型较单特征全氮含量模型的拟合优度和预测精度更高。因此,在实际应用中应根据具体情况合理选择图像特征构建模型,从而更好地实现对幼龄林木全氮含量的无损估测。
本研究对幼龄沉香的分割、特征提取以及全氮含量预测进行了深入探讨,可以进一步促进对沉香等珍贵树种的保护,为精准林业提供一定的参考。但研究未构建不同梯度下的氮含量预测模型,因此下一步研究将会以此为重点。同时,为了减少误差,在后续研究中会将微量元素考虑在内,深入探究微量元素与幼龄沉香图像特征的对应关系。