基于可见光光谱的檀香图像分割与植株全铁含量预测*

2018-10-17陈珠琳王雪峰

土壤学报 2018年5期

陈珠琳王雪峰

(中国林业科学研究院资源信息研究所，北京 100091)

铁是土壤中含量较高的微量元素，也是植物生长必需的营养元素之一［1-2］。虽然铁在土壤中的含量丰富，但可供植物直接利用的铁离子（Fe2+）含量并不高，植物易出现缺铁胁迫；但在天然的酸性土壤或者矿区附近，土壤中过多的Fe2+会产生铁毒，迫使植物产生生理病变。

自植物营养无损检测技术成为农林业研究的热点后，植物在大量元素（氮（N）、磷（P）、钾（K））胁迫下的光谱特征研究［3］已较为成熟，并成功应用于田间管理。近年来，国内学者致力于研究植物对微量元素［4］胁迫的光谱特征变化［5-6］。与其他重金属不同［7］，铁在微量矿物元素中需求量最大［8］。当植物受到铁胁迫时，其生理特征会发生变化，从而影响色谱信息。川梨受到缺铁胁迫时，其叶绿素含量明显降低，叶色变黄［9］。水稻在进行铁过量胁迫试验时，叶片中铁含量增加，光谱反射率在可见光波段升高，同时明显抑制水稻地上部和根系的生长，降低下位叶片的叶绿素含量［10-12］。玉米发生铁毒胁迫时，绿峰反射率升高、绿峰位置红移、红边蓝移，且绿峰反射率与红边蓝移变幅随浓度增加而增大［13］。

植物营养无损诊断方法多样，但数字图像处理技术因其快捷方便、价格低廉的特点得到了广泛应用［14］。由于田间和林内环境复杂，对图像分割造成影响，所以研究者们针对不同的试验环境提出了多种图像分割方法［15-18］。由于自然图像的复杂性较强，传统的红绿蓝（RGB）颜色系统无法满足分割的精度，而亮度色彩模型（CIE Lab）具有对光照变化不敏感的特性［19］，增强了适应性［20-21］，所以该颜色模型常用于分析野外自动获取的图像。

在回归预测方面，人工神经网络（Artificial neural network, ANN）应用较为普遍。其中，反向传播神经网络［22-24］（Back propagation neural network, BPNN）在网络理论和性能方面均较成熟，但BPNN学习速度慢，易陷入局部极小值，需结合各类优化或迭代算法，以提高预测准确率。

目前，珍贵树种营养诊断研究陆续展开［25］，但均围绕大量元素进行。微量元素胁迫尚处于初步研究阶段［26］，且均为实验室获取光谱信息，人为消除了田间或林内影响因素，应用性较差。本文基于数字图像技术预测檀香（Santalum album L.）叶片全铁含量，对野外获取图像进行分割，并根据铁胁迫下檀香出现的颜色变化提取颜色因子，使用优化后的BPNN进行反演，旨在为珍贵树种的微量元素营养诊断与监测提供更准确、应用性强的技术方法。

1 材料与方法

1.1 试验地概况

研究区设在海南省文昌市岛东林场（1 9°4 3′5 8″～1 9°4 4′5 8″N，110°57′34″～110°57′50″E）。该林场位于沿海平原地带，海拔5～10 m，属热带海洋季风气候，年平均温度23.9℃，年平均降水量1 808.8 mm，台风较多，常风2～3级，年平均湿度为86%。主要土壤类型为初育土土纲的滨海沙土，试验地土壤pH 5.0～6.6，有效氮98.3～114.8 mg·kg-1，有效磷3.38～4.56 mg·kg-1，速效钾69.9～78.2 mg·kg-1，有效铁2.33～4.89 mg·kg-1。该区域植被类型为热带季雨林，人工经营树种主要有木麻黄（Casuarina equisetifolia Forst）、椰子（Cocos nucifera L）、琼崖海棠（Calophyllum inophyllum L）和桉树（Eucalyptus robusta Smith）等。

1.2 试验设计及数据采集方法

研究所用的檀香采用种子育苗，待生长4.5 a后，选取生长良好的幼龄檀香进行试验。本研究所用铁源为乙二胺二邻羟苯基大乙酸铁钠（EDDHAFeNa），采用根部埋施法。单因素试验设计，包括4个Fe浓度水平，分别为每棵苗0、10、15、20 g-1，记为CK（不施Fe）、Fe1（低浓度）、Fe2（中浓度）、Fe3（高浓度），每个浓度水平下种植8棵檀香。使用加拿大植物营养公司的普罗丹高浓度水溶性复合肥施入其他元素，采用叶面喷施，施加量为每棵树200 mg。

于2017年2月（铁胁迫之前）测量东西冠幅（w01）和南北冠幅（w02），之后每个月进行一次铁胁迫，施肥量与初始施入量一致，其他营养元素不再施加。数据采集时间为2017年4—12月，每隔两个月进行图像、冠幅、养分数据获取，测量5次，数据总量为160个。图像获取选择天气晴朗少云少风时进行，拍摄时间为10：00—14：00，拍摄距离为1.5 m，使用Canon ESO700D相机拍摄，图像大小为5 184×3 456像素。获取图像时，分为东、西、南、北四个方向进行拍摄。之后进行叶片采样，分为上内、上外、中内、中外、下内、下外共6个层次，每棵檀香共采集约15 g叶片。使用便捷式养分测定仪（Reflectoquant RQflex，德国）进行全铁含量测定，该仪器使用10点校正和双光束测量，校正数据精度高。试验对每个样品进行3次测定，所有数据的变异系数均在3%之内。

1.3 颜色系统的计算

红绿蓝（RGB）、色度饱和度亮度（HSI）、亮度色彩（Lab）是常用的三种颜色模型，其中，RGB最为常用，它是一种与人的视觉系统密切相连的模型［17,27］。由于不同模型、不同分量对颜色的表述不同，本文通过计算上述颜色系统各分量的颜色值，描述全铁含量对叶片颜色的影响。

1.4 图像法确定新叶区域

所有的图像数据处理均在Matlab R2012a中实现。由于Fe2+胁迫对新叶和老叶的影响不同，可根据新老叶表现出的色谱差异来判定全铁含量。但考虑到檀香长势并不相同，本研究通过定义4个方向（东、西、南、北各拍摄一张图像）上同心圆的方式来确定新叶区域，如图1所示，具体步骤如下：

首先完成檀香图像分割，然后寻找最小外接圆，半径记为Ri（i=1～4，分别代表东、西南、北拍摄的图像）；确定同心圆ri的值（若该图像为在南、北方向拍摄，则；若该图像在东、西方向拍摄，则分别代表本次试验测得的东西、南北冠幅，代表上一次试验测得的东西、南北冠幅)；圆环部分叶片ARi-ri既为从图像中获取的新叶（如图1所示），最终新叶部分为。

图1 图像确定新叶区域方法Fig. 1 Method using images to determine new leaf area

通过上述方法确定了两个同心圆的大小，可获得3个区域，即ARi（半径为R的圆中叶片区域）、Ari（半径为r的圆中叶片区域）和ARi-ri（圆环中的叶片区域）。因此，本研究进行4组对比试验，所提取的颜色因子分别为：ARi的单通道颜色值（红（R）、绿（G）、蓝（B）、色调（H）、饱和度（S）、强度（I）、亮度（L）、横轴颜色（a）、纵轴颜色（b））、ARi-ri的单通道颜色值（同上）、ARi-ri与ARi的单通道颜色比值（同上）、ARi-ri与Ari的单通道颜色比值（同上）。

1.5 不同神经网络预测模型构建及检验

BPNN的隐含层神经元个数对预测精度影响较大，过多过少均会导致训练效果不佳，本文使用经验公式，即

式中，n为隐含层神经元个数；ni为输入层神经元个数；n0为输出层神经元个数；a为1～10之间的常数。

BPNN易出现过拟合等现象，所以常与其他寻优或增强算法结合使用。常见的有遗传算法［28-29］（Genetic algorithm, GA）、粒子群优化算法［28］（Particle swarm optimization, PSO）和Adaboost迭代算法［29-31］。本文对三种优化算法（下文分别缩写为GA-BPNN、PSO-BPNN、BPNN-Adaboost）不做详细介绍，具体参考文献［28］～［33］。

试验共获取160个数据，随机抽取110个为拟合样本，剩余50个为检验样本。同时选择拟合和检验样本的决定系数R2、平均残差、均方根误差RMSE对模型进行评价。

2 结果与讨论

2.1 基于Lab颜色模型的檀香图像分割

本研究基于地面获取檀香图像进行全铁含量的反演，如图2A所示，檀香图像背景复杂，除土壤、杂草外，还有其他树种，对图像分割造成了很大难度。所以，为保证后期工作的质量，有必要提出准确的图像分割算法。

大津（Otsu）法是1979年日本学者大津提出的一种自适应性阈值确定方法，其基本原理是确定一个最佳阈值，使最佳分类状态的类间分离性最好［16-17］。本研究将图像分别转换至Lab通道、L通道、a通道和b通道（图2）并做Otsu法分割。通过大量试验发现，Lab通道使用Otsu法分割失败，仅能将极小部分的土壤与绿色植物区分开。a通道和b通道均可将檀香叶片与背景土壤区分开，但b通道保留的叶片更完整。L通道则弥补了a、b通道的弱点，将檀香叶片与寄主等绿色植物区分开，所以本文选择结合b通道和L通道对自然图像中的檀香进行分割。

分割算法流程如下：（1）对b通道进行Otsu法分割，并进行7×7的中值滤波处理。（2）与原图进行掩膜并提取L通道，并使用原图L通道得到的最佳阈值进行分割。（3）使用7×7模板的中值滤波进行平滑处理，然后使用半径为5的圆形结构元素腐蚀膨胀各2次。分割结果如图3所示。

算法所使用的模板以及结构元素均为在大量的对比分析后得到的最佳方案。为验证该分割算法的效果，使用Photoshop CS5软件中的磁性套索工具（相当于目视解译法）手动分割檀香，并将此结果作为评价基准。将使用本文提出算法（编号为①）、ENVI 5.1软件中的支持向量机分类法（编号为②）和Photoshop CS5处理(编号为③)得到的结果进行比较，结果如表1所示。从表中可以看出，本文提出算法在像素数和颜色误差方面均要优于支持向量机处理结果，这是因为支持向量机算法对土壤和叶片的分割效果较差，易出现误分割，导致像素误差较大，G均值降低，R均值和B均值升高。而本文提出算法像素数误差在5%之内，各通道误差控制在3%之内，说明该算法可行。

图2 大津（Otsu）法分割檀香不同通道图（A. 原图， B. Lab， C. L通道， D. a通道， E. b通道）Fig. 2 Graphs of channels in Sandalwood images segmentation using Otsu’s method (A. Original image, B. Lab, C. Channel L, D.Channel a, and E. Channel b)

图3 檀香图像分割过程及结果（A. b通道Otsu法分割结果，B. 7×7中值滤波后腌膜图像， C. L通道大津法分割及7×7中值滤波处理结果，D. 形态学处理， E. 最终图像）Fig. 3 Process and results of sandalwood image segmentation (A. Segmentation using Otsu’s method via Channel b; B. Masked image after 7×7 median filtering; C. Segmentation using Otsu’s method via Channel L and masked image after 7×7 median filtering;D. Morphological processing; and E. Finalized image)

表1 分割方法评价Table 1 Segmentation method evaluation proposed in this paper

续表

2.2 数据样本划分及光谱反射率变化

表2所示为样本的全铁含量以及檀香图像的RGB单通道值统计信息。试验采集的原始图像数据包含RGB三个通道，通过颜色系统的转换，最终得到R、G、B、H、S、I、L、a、b共9个通道的颜色值。

表2 檀香叶片全铁含量及RGB单通道值统计信息Table 2 Statistical information of total iron content and RGB single channel color value

本研究将获取的拟合数据按100为梯度划分为6组，并求得平均值，分析不同全铁含量对光谱反射率的影响，如图4所示。可以看出，R和B通道值先下降后上升，而G通道值先上升后下降。这说明，全铁含量的上升促进了叶绿素浓度增加，叶片向纯绿色变化；而随着全铁含量持续增高，叶片开始失绿，说明檀香受到了铁毒胁迫作用，叶绿素遭到了破坏，生长也会随之受到影响。

2.3 主成分分析及预测结果

由于9种颜色因子之间存在较大的相关性，为了缩短建模时间、提高模型的精度，对其进行了主成分分析，结果得到四种试验的前四个主成分的累计贡献率均达到99%，所以本文选择前四个主成分作为输入因子。试验构建4种神经网络模型，参数设置分别为：BPNN使用4-10-1的网络结构，其输入、输出层传递函数分别为Tansig和Purelin，训练函数使用L-M优化算法，迭代次数为100；PSOBPNN中种群粒子数为20，每个粒子的维数为4，算法迭代进化次数为100；GA-BPNN种群大小为20，遗传代数为100，交叉概率为0.6，变异概率为0.005。BPNN-Adaboost中预测器个数选择10，预测时迭代次数为20。

对4组试验得到的结果进行分析，结果如表3所示。可以看出，单个评价指标对不同试验的结果说明不同，例如，BPNN模型中，试验2的决定系数 R2高于试验1，但平均残差高于试验1，为综合考虑各评价指标，本研究分别对建模和验证数据得到的决定系数 R2、平均残差、均方根误差RMSE进行打分，指标最优的记为1，最差的记为4，得分最低的为最佳试验方案。排名结果如表3最后一列所示。

图4 红绿蓝（RGB）颜色值随檀香叶片全铁含量浓度变换趋势Fig. 4 Variation of RGB color value with content of total iron in sandalwood leaves

表3 不同神经网络模型和不同试验的预测结果Table 3 Prediction results of different neural network models and different tests

由表3可知，试验1和试验2无论在拟合优度和预测精度方面均相差不显著，且在使用BPNN和GA-BPNN时，试验1的结果优于试验2，而在使用PSO-BPNN和BPNN-Adaboost模型时，结果相反。但试验3和试验4的结果在各项指标均有明显提高，同时，所有模型均显示试验4结果最佳，即使用新叶与老叶的颜色比值结果优于新叶与整体的颜色比值，这是因为在缺铁状态时，新叶失绿，老叶保持绿色，若计算整体比值，则新老叶的光谱特征差异减弱；而在铁毒情况下，叶绿素受到破坏，新叶最先受到影响，叶片由绿变黄，所以新叶与整体的颜色比值同样削弱了光谱特征差异，导致精度降低。

从表3中还可以看出，相同试验下，综合分析拟合优度以及预测精度，4种神经网络模型优劣排名为GA-BPNN＞PSO-BPNN＞BPNNAdaboost＞BPNN。这说明优化后的神经网络确实减小了出现过拟合的概率，同时，寻优算法（G A、P S O）的效果要优于迭代增强（Adaboost），也说明合适的初始值与阈值对网络预测能力的提高更明显。

3 结论

以海南省文昌市岛东林场栽植的檀香为试验对象，通过施加不同梯度的螯合铁对檀香进行铁胁迫，从而研究植株叶片光谱参数与植株体内全铁含量之间的关系。结果表明，叶片从缺铁向正常含量变化过程中，叶绿素含量增加，颜色变得浓绿；当超过最佳值（250～300 mg·kg-1）时，叶绿素含量开始减少，产生铁毒效应。研究通过将Lab系统中的b通道、L通道与大津法、中值滤波以及形态学运算相结合完成檀香分割，计算冠幅生长量占总冠幅的比例确定新叶区域，将新叶与老叶光谱参数比值作为GA-BPNN的输入因子，得到较好的预测结果。与前人的研究相比，本文在模型输入因子方面进行了改进，提出了图像法确定新叶，并验证得出，通过该方法获得的新老叶颜色比值作为输入因子得到的结果最优。同时，由于海南地区土壤类型多样，不同土壤类型对试验结果是否产生较大的影响，也需要后期的讨论分析。