APP下载

基于冠层图像的海南粗榧苗期生长状态无损监测方法研究

2023-12-25石蒙蒙王雪峰陈飞飞黄川腾陈星京

植物营养与肥料学报 2023年11期
关键词:基径特征参数叶绿素

石蒙蒙,王雪峰*,袁 莹,陈飞飞,黄川腾,王 鹏,陈星京

(1 中国林业科学研究院资源信息研究所,北京 100091;2 国家林业和草原局森林经营与生长模拟重点实验室,北京 100091;3 海南省林业科学研究院,海南海口 571100)

海南粗榧(CephalotaxusmanniiHook.f.)在我国主要分布于南部的热带地区[1-2],是重要的药用植物,提取出的多种生物碱在癌症治疗方面具有较好疗效[3],同时也是优良用材树种。长期过度砍伐和不合理管理,海南粗榧成为濒危树种[3],被列为国家Ⅱ级保护植物[4]。但对于海南粗榧的林业相关经营、管理方式目前仍以传统经验为主[5],缺乏科学指导和现代信息技术应用。为保护和抢救这一珍贵资源,林业学者研究了海南粗榧的种群特征,并在种苗繁育技术方面取得了一些重要进展[6-9]。杜道林等[8]研究发现,土壤湿度、pH、有机质含量、氮含量等因素与海南粗榧叶片气孔结构特征密切相关。因此,加强海南粗榧的养分管理是培育和维护其健康生长的重要手段,对海南粗榧生长状况的实时监测是实现其养分精准管理的前提。近年来,我国遥感、激光雷达在不同时空尺度的林业研究和应用方面取得重大进展[10-11]。基于计算机视觉的人工智能技术具有实时动态监测、简单精准操作等特点,结合5G 物联网技术支持,已成功应用于生长监测[12]、营养状况诊断[13-14]等农业生产中,林业由于经营周期长、自然条件复杂,相关研究应用较少。

叶绿素作为重要的光合作用载体,其含量反映了植物的养分状况[15-16],已被用于多种植物氮的营养诊断[17-18]。叶绿素测定仪通过测定叶绿素在红光和近红外区域的吸收率估测植物叶绿素相对含量(SPAD),操作简便且不损害植物。由于海南粗榧为针叶形态植物,叶片细窄,不便于仪器操作,且极易产生误差。鉴于此,本研究尝试通过分析冠层图像数据与叶绿素含量间的相关关系,建立基于图像的叶绿素含量无损预估模型,并通过试验验证模型预测的可靠性。

1 材料与方法

1.1 试验设计

盆栽试验于海南省海口市琼山区云龙镇海南省林业科学研究院海南粗榧培育生产基地(110°28′E,19°52′N)进行。该地属热带季风气候,年均气温24.4℃,年均降水量1696.6 mm,年均最低气温18℃,年均最高气温28℃。

供试材料为健康且生长状况一致的海南粗榧1年生苗木。盆栽育苗盆钵大小为:底部直径26 cm,上部内径36 cm,高31.5 cm。苗木种植前,以500 g/盆的腐熟羊粪作为基肥,与土壤充分搅拌后填入盆中,装土量约为0.015~0.018 m3/盆。土壤类型为砖红壤,土壤呈酸性,土壤有效氮含量为45.8 mg/kg,土壤有效磷含量为20.3 mg/kg,土壤速效钾含量为113 mg/kg。盆栽试验在控水棚内进行。

试验采用3 因素3 水平正交设计[L9(34)]和单因素试验设计。依据传统管理经验,选取影响海南粗榧生长的3 个主要因素为:氮肥量(N)、遮阴(S)、水分(W),每个因素设置3 个水平,具体见表1 和表2。

表1 试验设计因素与水平Table 1 Experimental design factors and levels

表2 正交试验设计L9(34)Table 2 Orthogonal experimental design

遮阴(S)采用空隙均匀的遮阴网,相对透光率分别为:30%、10%、5%。氮肥选用尿素(N 46%),每月初追施1 次,共追施15 次,环施于距树基部20 cm 处。每日上午7 点进行灌溉,平均流速约为500 mL/min,通过控制灌溉时长控制灌溉量。

1.2 基础数据调查方法及结果

2021年7月开始试验,幼苗首先进行1 个月的适应性生长,自2021年9月—2022年9月,测量海南粗榧的基径、苗高、冠幅,测量周期为2 个月,共测定7 次数据(表3)。

表3 海南粗榧植株性状Table 3 Plant traits of Cephalotaxus mannii

2022年9月,测量SPAD 值和侧枝长度(表3)。在各处理中随机选取3 株海南粗榧幼苗,每株幼苗上标记两枝健康且反映整株平均生长状况的侧枝,使用米尺测量侧枝长度;每枝选取3 片小叶,使用植物营养测定仪TYS-4N 无损测量SPAD 值,于上午7:00 测定,以SPAD 均值代表整株叶绿素相对含量。

1.3 冠层图像获取及处理

1.3.1 冠层图像获取 于2022年9月,对各处理选定的3 株海南粗榧在暗室完成了1 次拍摄。暗室高约2 m,顶端中心固定有1 个相机固定器,周围固定主动光源(400~830 nm),相机型号为Cannon EOS1300D,相机参数设置快门速度为2″5,光圈为F22,感光度(ISO)为200。暗室中心放置自动转盘,将选取的粗榧置于转盘中央,每株通过控制转盘拍摄水平两个方向的冠层图像。

1.3.2 图像特征提取 本研究的目标图像为绿色,使用MATLAB R2022a 软件依据颜色特征对冠层图像进行分割。首先将图像进行超绿超红差分指数(ExGR,excess green minus excess red index)[19-20]运算转换为灰度图像,然后利用大津法(Otsu)[21]进行图像分割、形态学处理,去除边缘背景,提取中心前景图像,之后将提取的图像由RGB 颜色空间转换为HSV 颜色空间[22]进行运算,设置阈值去除图像中心的多余背景,具体流程如图1。

图1 图像分割提取流程Fig.1 Image segmentation process

将分割后的图像提取RGB 颜色空间中红色(R,red)、绿色(G,green)、蓝色(B,blue)分量;HSV 颜色空间中色相(H,hue)、饱和度(S,saturation)、色明度(V,value)分量;Lab 颜色空间中一个明度因子(L)和两个色度因子(a、b)均值作为基础颜色特征参数,计算多个特征参数,其中r=R/(R+G+B),g=G/(R+G+B),b=B/(R+G+B),详见表4。

表4 颜色特征参数Table 4 Color feature parameters

1.4 数据统计

采用正交方差分析和单因素重复测量方差分析对基径、苗高、冠幅、侧枝长、SPAD 值分别进行统计分析。选用Duncan 法进行多重比较,比较结果差异显著较低的为幼苗生长不适宜环境,记为0,否则记为1。

1.5 模型构建

1.5.1 分类模型 研究选用主成分分析对40 个颜色特征参数降维,采用支持向量机(SVM,support vector machines)进行监督分类,处于适宜生长环境(记为1 类)和处于不宜生长环境(记为0 类)。模型分类结果共包括以下4 种:

真阳性(TP,true positive):适宜环境被正确识别,即1 类被正确识别;

真阴性(TN,true negative):不宜环境被正确识别,即0 类被正确识别;

假阳性(FP,false positive):不宜环境被误分为适宜环境,即0 类被误分为1 类;

假阴性(FN,false negative):适宜环境被误分为不宜环境,即1 类被误分为0 类。

样本按照分层抽样的方式以7∶3 的比例分为训练集和测试集,训练集针对数据不平衡问题,采用合成少数类过采样技术(SMOTE,synthetic minority over-sampling technique),通过在少数样本k 邻近中随机挑选样本进行线性插值扩充样本。

1.5.2 回归模型构建 研究将样本以8∶2 的比例分为训练集和测试集,针对变量共线性问题,本研究选用PLSR 和SR 模型,为保证模型的稳定性进行重复10 次五折交叉验证(5-Fold),选取平均绝对误差(MAE,mean absolute error)最小模型对测试集进行拟合。

2 结果与分析

2.1 生长指标和颜色参数相关性分析

对2021年9月份调查数据的相关性分析结果表明,评价因子基径、苗高、冠幅、侧枝长以及SPAD 值间呈显著线性相关(图2a)。因此,选用SPAD 值和基径作为主要的海南粗榧幼苗生长状况评价指标。

图2 生长指标间及其与颜色特征参数间的相关性热图Fig.2 Correlation heat map between growth traits and the color parameters

颜色特征参数相关分析结果表明,颜色特征间存在显著相关性,其中(G-R)/(G+R)和G/R存在强烈正相关(相关性为1),r和g+b存在强烈负相关(相关性为-1),因此,变量间存在共线性。SPAD 值与多个颜色特征参数存在显著线性相关,与g相关最为显著,相关系数达到0.74,与R+B-G显著负相关,相关系数为-0.80(图2b)。因此,颜色特征参数可以用于估测SPAD 值。

2.2 方差分析

研究采用2021年8—9月份调查数据进行正交方差分析,结果表明,正交试验交互项误差不显著(P>0.1),幼苗主要受单因素影响。海南粗榧幼苗在不同遮阴条件下差异显著,5%透光率下幼苗更加矮小,而在30% 透光率条件下状态最佳;水分处理中,幼苗多个指标(基径、冠幅、SPAD 值)在1、3 水平间差异显著,在第一水平下幼苗状态最佳,第三水平下幼苗状态最差;氮肥处理中各水平间没有显著差异(表5)。因此,本研究中遮阴和水分是影响海南粗榧生长的主要环境因素。

表5 正交试验方差分析Table 5 Analysis of variance of orthogonal experiments

由于研究样本量较少,为增强结果稳定性,采用基径重复测量数据(2021年9月—2022年9月,共7 个周期)进行单因素方差分析。单因素方差分析结果表明,在0.1 的显著水平下遮阴处理中30%透光率基径最大,且氮肥处理在各水平间差异不显著,在氮肥处理第二水平基径最大,与正交试验结果一致;水分处理中,第二水平基径最大,第一水平基径最小,且两者在0.1 显著水平下存在差异,与正交试验结果有一定偏差。

进一步通过普雷斯勒生长率公式计算各处理基径生长率发现,在5%透光率和高灌溉量条件下,幼苗生长更为迟缓,和正交试验中该条件下幼苗更矮小的结果一致,依据方差分析和多重比较结果,认为这两种环境条件不利于海南粗榧幼苗生长(图3)。

图3 基径及其年生长率单因素方差分析Fig.3 One-way ANOVA for the ground diameter and annual growth rate

2.3 生长评估模型

本研究发现海南粗榧幼苗在5%透光率和高灌溉量条件下生长缓慢,研究将所有处于该环境下的样本标记为0 类,其余样本标记为1 类, 0 类样本基径和SPAD 值均显著低于1 类。

训练集样本数量1 类∶0 类约为1.6,研究旨在精准识别处于不适宜环境下的幼苗样本,以对其生长发育进行预警,节约管理成本。因此,为高效识别0 类样本,针对样本不平衡问题采用SMOTE 技术选择10 邻近将0 类样本扩大1 倍,此时1 类∶0 类约为0.8(图4a)。

图4 数据处理Fig.4 Data processing

研究通过主成分分析法对40 个自变量降维,选取前10 个主成分累计贡献率达到99.98%(图4b),利用SVM 进行监督分类,核函数为二次项函数,参数优化通过随机搜索方法迭代300 次,五折交叉验证结果显示模型准确率为0.89,假阳性率(FPR,false positive rate)为0.03,假阴性率(FNR,false negative rate)为0.22,AUC(area under curve)为0.94,特异性为0.97,测试集中模型准确率为0.84,假阳性率为0.14,假阴性率为0.17,AUC 为0.93,特异性为0.86。模型总体识别效果较好,尤其在对处于不宜环境下的幼苗样本识别更高,Kappa 系数大于0.6,一致性较高(图5)。

图5 分类模型性能评价Fig.5 Evaluation of the classification model performance

2.4 叶绿素含量预估模型

研究将颜色特征参数作为自变量,建立SR 和PLSR 叶绿素含量预估模型,选用决定系数(R2,Rsquare)、均方根误差(RMSE,root mean squared error)及平均绝对误差(MAE,mean absolute error)对模型进行评价,由于本研究样本量较少,为增强模型稳定性,本研究进行重复10 次五折交叉验证。

研究结果表明,PLSR 较SR 模型更具稳定性,SR 可能存在过拟合风险(表6)。对于参与建模的变量数量而言,SR 建模的变量共11 个,而PLSR 仅采用前两个成分进行建模(表6),且由图6 可以看出PLSR 较好地解决了变量间的共线性问题,而SR 仅通过剔除贡献小的变量实现降维,然而筛选的变量间仍存在较强的线性关系,且VIF>10。采用 MAE最小对测试集进行预测,SR 和PLSR 模型拟合结果R2分别为0.6270 和0.7422,RMSE 分别为6.6017 和5.4453,PLSR 模型预测能力和适应能力更好(图7)。

图6 建模变量的相关性Fig.6 Correlation of modeling variables

图7 SPAD 值拟合效果Fig.7 Fitting effect for SPAD value

表6 回归模型性能评价Table 6 Evaluation of regression model performance

研究将二分类转换为哑变量加入PLSR 模型中,模型整体拟合效果没有明显提高,重复10 次五折交叉验证结果RMSE 为6.5999,R2为0.5961,MAE 为5.4326。然而,对于0 类样本SPAD 拟合效果较好,R2达到0.8198(图8)。利用该模型对生长环境较差的单株粗榧冠层图像进行SPAD 反演,由图9 可以看出上部叶片叶绿素相对含量较高,下部叶尖处叶绿素相对含量最低,且叶尖逐渐呈现失绿趋势。

图8 非适宜环境样本(0 类)SPAD 值拟合效果Fig.8 Fitting effect for SPAD value of dataset under unsuitable growth environment(class 0)

图9 叶绿素含量分布Fig.9 Distribution of chlorophyll content

3 讨论

3.1 不同处理下海南粗榧生长表现差异

不同的生长环境下海南粗榧幼苗生长表现差异较大,本研究发现遮阴和水分处理对海南粗榧幼苗的基径、SPAD 值等有显著影响,低透光率条件下植物接受阳光机会较少,光合能力弱,无法提供充足的物质能量满足植物生长,因此海南粗榧幼苗较为矮小,且生长发育迟缓,与本研究正交试验和单因素试验结果一致;粗榧幼苗根系较浅,生长所需水分较少,高灌溉量远超其需求量,长时期的高灌溉量使土壤间隙被水充满而含氧量降低,植株根系无法正常进行呼吸作用,发生烂根,因此粗榧幼苗在高灌溉条件下生长速率缓慢,本研究中在高灌溉下正交试验幼苗显著低于其他水分处理,且其生长速率最低,然而单因素试验在水分处理中结果存在一定偏差,可能是试验初期植株选择的结果;祁珊珊等[23]研究发现适当增加光照和肥料对海南粗榧幼苗基径和叶绿素含量增加有促进作用,而本研究中,氮肥处理各水平间基径和叶绿素含量没有显著差异,可能由于氮肥试验设计梯度过小或者试验前期基肥施加过多导致。

植物具有特定的光谱学、形态学等特征,可以通过外部颜色、形态特征等直观的表达其生长状态,以判断植物对环境的响应。本研究中低透光率和高灌溉量处理下海南粗榧生长能力表现最差,并能通过外在颜色特征进行有效识别。以图像颜色特征为自变量,通过SVM 方法诊断海南粗榧幼苗是否处于不适宜的环境中,结果显示模型对不宜环境下幼苗诊断效果较好(图5)。

3.2 海南粗榧幼苗叶绿素含量估测与反演

数字图像能够实时捕捉植物信息,通过图像处理技术分析、估计植物状态,在植物生长发育过程中具有重要作用[24-26]。多个研究发现颜色特征参数与SPAD 值有强烈的相关性,DGCI 与SPAD 值呈现正相关性[27],而本研究中DGCI 与SPAD 值呈显著的负相关性(图2b),可能由于不同时期、不同部位及植物个体间光谱反射存在差异,本研究采用9月份冠层图像,植物处于生长发育阶段,叶绿素含量较高的植株其新叶茂盛,而且新叶主要集中在植株顶端和枝条外缘,在冠层图像中呈现为亮绿色,而叶绿素含量较低的植株生长缓慢,在冠层图像中以老叶居多、新叶较少,颜色呈深绿色。

PLSR 结合主成分分析、多元线性回归和典型相关分析优势,能够解决自变量的共线性问题,同时考虑对因变量的贡献实现降维[28-29]。SR 则是通过F检验剔除贡献较少的自变量实现降维[30],然而自变量间仍存在严重的相关性。本研究中冠层图像颜色特征参数能够较好的反映植物叶绿素含量,PLSR和SR 模型对SPAD 值估测效果差别不大,但PLSR能更好的解决共线性问题,且比SR 模型适应能力更强。研究将哑变量加入PLSR 模型有效的提高了0 类样本SPAD 值的预测精度,而对于1 类样本模型精度有所降低,可能由于其冠幅较大,而SPAD 值采样点主要位于中部的标准叶片,且取样点过少不能完全代表整个冠层。

植物不同部位含氮量差异明显,多数学者认为氮素作为光合作用的重要元素,将优先分配给植物上部叶片以提高光利用率[31-32]。邵增明[33]发现红叶石楠下部叶片由于光照条件不足,叶绿素含量显著低于上中部叶片。土壤含水率过多会严重影响根呼吸,翟丽婷等[34]研究提出随灌溉量增加,冬小麦叶片氮含量先增加后减小,且长期水淹胁迫环境下老叶最先衰落,开始卷曲黄化,逐渐变红、脱落[35]。研究利用PLSR 加入哑变量模型对处于不适宜环境的幼苗叶绿素分布进行反演,发现其顶端叶绿素含量较高,下部叶片叶绿素含量相对较低,且下部叶片叶尖叶绿素含量最低,已呈现失绿趋势。

4 结论

海南粗榧幼苗在高度遮阴和高灌溉量环境下生长发育迟缓,生长状态可通过叶片颜色反映,图像颜色特征参数与SPAD 值存在显著线性关系。反过来,采集图像颜色特征参数能较好的估测SPAD值,其中偏最小二乘回归模型适应能力更强,并且支持向量机模型可以较为及时准确地诊断处于不适宜环境下的海南粗榧幼苗,为海南粗榧幼苗管理提供预警。

猜你喜欢

基径特征参数叶绿素
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
提取叶绿素
九寨沟自然保护区大熊猫取食利用的主食竹特征
不同施肥处理对塞罕坝华北落叶松生长的影响
大别山野生杜鹃基径与年轮相关关系的初步研究
桃树叶绿素含量与SPAD值呈极显著正相关
基于PSO-VMD的齿轮特征参数提取方法研究
叶绿素家族概述
黄花倒水莲播种育苗的影响因子研究