基于高光谱的烤烟叶绿素含量估算模型研究**
2022-04-13蒋柏春李德仑韦克苏张富贵王杰刘红芸
蒋柏春,李德仑,韦克苏,张富贵,王杰,刘红芸
(1.贵州大学机械工程学院,贵阳市,550025;2.贵州省烟草科学研究院,贵阳市,550025;3.四川矿产机电技师学院,成都市,611230)
0 引言
叶绿素是绿色植物光合作用的重要色素,影响到作物与外界的物质能量交换及作物的物质积累,其含量的高低对植物光合效率、发育状况及烘烤工艺等有重要的指示作用[1-2],因而烟叶叶绿素含量的估测是监测烘烤烟叶烘烤状态的有效手段。
同时,作物叶片的叶绿素含量与作物反射光谱之间联系紧密。高光谱具有波段多、图谱合一和分辨率高的特点,把二维图像和光谱技术融为三维的图谱信息。
用高光谱成像技术检测的叶绿素具有安全、快速、无损、定量等特点,并能对叶片大区域叶绿素含量的检测,有较大的应用潜力[3]。
国内外学者在玉米、草丛及葡萄等叶片的叶绿素含量的高光谱估测方面都有研究。Kaasalinen等[4]利用雷达高光谱技术建立了叶绿素快速和无损预测模型。
李敏夏等[5]分析了苹果叶片高光谱特征与叶绿素含量和SPAD值的关系,研究了叶片的SPAD值和叶绿素含量与微分光谱之间的相关性,李方舟等[6]做了基于高光谱数据的水旱地冬小麦叶绿素含量监测,取得了比较理想的结果,杨杰等[7]通过修正光谱指数建立了水稻上部叶片叶绿素含量的高光谱估算模型,杨峰等[8]利用高光谱技术研究了不同生长期下小麦与水稻两种作物的叶绿素含量和冠层光谱之间的变化,将两种作物的叶绿素含量与其冠层光谱数据的相关性进行比较,进而确定了监测两种作物叶绿素含量的最佳植被指数,但对于在烟叶烘烤过程中实时检测烟叶不同烘烤温度下叶绿素含量的相关研究较少。
文章以贵阳市平坝区云烟87为研究对象,探讨合适的光谱参数和反演方法,为叶绿素含量快速准确估算提供参考,进而为烟叶烘烤工艺提供依据。
1 材料与方法
1.1 试验设计
试验于2019年在贵州省贵阳市平坝区天龙实验基地进行,挑选不同地块烟叶,取下部烟叶为实验对象,供试烤烟品种为云烟87,试验设置尚熟、成熟、完熟三种成熟度,按照442烘烤工艺进行烘烤,分别在烤前、40℃后、45℃后进行取样分析,每次每个关键点取样3片为一个重复,取10个重复,每个样本都进行如下处理:从烤房中取样,编号,进行高光谱数据采集,采集完高光谱数据后带回实验室进行干燥杀青及粉碎,运用分光光度法测定叶绿素含量。
1.2 烤烟叶片光谱测定
叶片光谱测量采用双利合谱公司生产的GaiaSky—mini2光谱测定仪,这种探测器内置石英卤化灯,光源稳定,波长测量范围400~1 000 nm,光谱分辨率3.5 nm,测量时叶片置于密闭的采集光箱中标定的固定位置,摊开叶片,在采集光谱数据时,使光谱相机垂直向下,正对烟叶,且在测定时其距离烤烟烟叶的高度为1.6 m。每次测量前进行标准白板校正,每次记录3组数据,最后以其平均值作为该样本的光谱反射值。
1.3 烤烟叶片叶绿素浓度的测定
采用分光光度法测定叶绿素含量[9],将进行完光谱测定的烟叶带回实验室进行干燥杀青及粉碎,每个样本做3个重复,取其平均值作为该烟叶的叶绿素值和类胡萝卜素值计算公式
Ca=13.95A665-6.80A649
Cb=24.96A649-7.32A665
式中:Ca——叶绿素a浓度,mg/L;
Cb——叶绿素b浓度,mg/L;
Cc——类胡萝卜素浓度,mg/L;
A665——叶绿素提取液在波长为665 nm下的吸光度;
A649——叶绿素提取液在波长为649 nm下的吸光度;
A470——叶绿素提取液在波长为470 nm下的吸光度。
1.4 数据处理分析
采用SpecView,ENVI5.3.1 整理光谱数据,SPSS22.0,Excel进行数据分析,Matlab 16b,Python3.6进行模型构建,最后对模型精度进行评价,比较各模型的决定系数、均方根误差及均方误差。
2 结果与分析
2.1 不同成熟度烤烟叶绿素含量和光谱反射率的变化
运用分光光度法测定云烟87不同成熟度,不同烤烟烘烤温度点色素含量,每个关键点色素含量取其平均值结果如表1扬示。可以看出,随着烘烤过程中温度上升,烤烟叶片叶绿素含量随之降低,其中,叶绿素含量在烘烤至40℃时降解速率最快,类胡萝卜素先降低后升高,其中,类胡萝卜素含量在烘烤至40℃时降低,40℃~45℃时升高。鲜烟叶叶片叶绿素含量扬占的比例高于类胡萝卜素,烘烤过程中叶绿素含量比例迅速降解,烘烤至45℃时,类胡萝卜素含量扬占比例高于叶绿素。叶绿素含量于不同成熟度间与不同程度烘烤处理间差异显著。对于不同成熟度烤烟叶片在烘烤过程中不同温度点时,叶绿素含量表现为:尚熟>成熟>完熟。
表1 云烟87不同成熟度,不同烤烟烘烤温度点色素含量变化Tab.1 Changes in pigment content of Yunyan 87 with different maturity and different curing temperature points mg/L
2.2 原始光谱反射率及一阶导数光谱反射率
图1分别反映了烤烟在尚熟,成熟,完熟下随着烘烤温度的上升烟叶叶片光谱反射率的变化。由图1可知,随着烘烤过程中温度的上升,各成熟度烟叶叶片光谱反射率间的差异表现较为明显。3种不同成熟度的鲜烟叶光谱在400~480 nm的反射率都小于0.1,主要是烟叶叶绿素和类胡萝卜素对紫外光和蓝紫光的吸收,光线的投射和反射量很小,这个波段的反射率曲线较为平缓且反射率很低,400~700 nm可见光区域内,反射曲线呈现“一峰两谷”的现象,在550 nm处出现波峰,此处为叶绿素的强反射区,称为“绿峰”。在近红外波段(700~1 000 nm),各种处理及成熟度烟叶光谱反射率都较高,40℃烘烤烟叶光谱反射率在可见光谱区域内高于鲜烟叶,45℃烘烤烟叶光谱反射率高于40℃烘烤烟叶,表明随着烘烤温度的上升,叶绿素含量逐渐降低,光谱反射率上升,不同成熟度烤烟光谱反射率随温度变化大致相同,但对于40℃与45℃的原始光谱反射率曲线区分不够明显。
图1不同成熟度云烟87在不同烘烤温度点高光谱反射率Fig.1 Hyperspectral reflectance of Yunyan 87 with different maturity levels at different baking temperatures
针对原始光谱曲线没法直接区分40℃与45℃的烤烟叶片,对原始光谱曲线进行一阶导数求导,其结果如图2扬示。由图2可知,一阶导数光谱曲线具有多峰现象,在可见光范围内具有明显的峰值,峰值出现在490~510 nm,560~570 nm,580~720 nm等,而 在400~700 nm以及大波段范围内,跳跃性较大,这是由一阶导数的计算方法扬决定的[10]。而处理这些峰的位置、大小,以及轴与峰之间扬包围的面积差异,是构建光谱特征参数的依据,对于尚熟的3条一阶导数光谱曲线都在490~500 nm,690~700 nm出现波峰但波峰高度不同,可以明显区分不同烘烤温度点烘烤烟叶,从烟叶的一阶微分光谱数值中提取位置变量,面积变量等光谱特征参数用于烤烟叶片叶绿素含量反演模型的构建。
图2 不同成熟度云烟87在不同烘烤温度点一阶导数光谱反射率Fig.2 First derivative spectral reflectance of Yunyan 87 with different maturity at different baking temperature points
2.3 特征波长选择
连续投影算法[11](SPA)是一种新兴的敏感波长选取算法,能够从光谱信息中充分寻找含有最低限度的冗余信息的变量组,有效消除各种波长变量之间的共线性影响,使得变量之间的共线性达到最小,降低模型的复杂度。其简便快速的特点得到越来越多的应用,在多种样品波长的选取中取得了很好的效果[12]。
本文使用ENVI软件从不同成熟度,不同烘烤温度点各选取10片烟叶高光谱图像,共90张烟叶图像,用ENVI5.3.1 软件选取合适的感兴趣区域Region of Interesting(ROI),如图3扬示,首先在每片烟叶图像中随机选择3个感兴趣区域(大小为1像素×1像素的正方形),然后提取每个感兴趣区域内光谱信息,最后将3个区域的光谱取平均值,得到对应的1条原始光谱数据,分别处理云烟87不同成熟度不同烘烤温度点烘烤烟叶,每个烘烤温度点处理10片烘烤烟叶,共得到90条烟叶光谱数据。
图3 叶绿素的ROIFig.3 ROI of chlorophyll
将ENVI软件提取出来的数据处理后输入matlab R2016b,用SPA算法对ROI区域的平均光谱进行筛选,SPA算法优先选10个波长作为叶绿素含量的优选波长组合,这些波段都是叶绿素信息区域波段,含有叶绿素的吸收峰,且此时的预测平均标准偏差最小,运用这些波长建立多元线性回归模型,运算结果如图4扬示。根据云烟87不同成熟度不同烘烤温度点烟叶筛选416 nm,420 nm,465 nm,648 nm,700 nm,775 nm,850 nm,875 nm,916 nm和935 nm作为特征波长。
图4 SPA运行结果Fig.4 SPA running results
2.5 建模方法与模型评价
2.5.1 SPA-BP,SPA-Ridge,SPA-LR模型
BP神经网络实质上实现了一个从输入到输出的映射功能,数学理论证明三层的神经网络就能够以任意精度逼近任何非线性连续函数。这使得其特别适合于求解内部机制复杂的问题,即BP神经网络具有较强的非线性映射能力。BP神经网络在训练时,能够通过学习自动提取输出、输出数据间的“合理规则”,并自适应的将学习内容记忆于网络的权值中,能很好的对光谱数据和理化值进行拟合[13]。将SPA算法筛选出的10个特征波长数据作为输入,建立SPA-BP模型进行不同烘烤温度点烟叶叶绿素含量的预测和验证[14]。训练样本数据共48组,测试样本数据24组,每组有10个特征变量,因此SPA-BP模型的输入层、隐含层、输出层的神经节点各为48,10,1,用BP神经网络建模[15-16],其真实值与预测值对比结果如图5(a)。
Ridge回归模型是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,Ridge回归模型通过放弃最小二乘法的无偏性,避免部分光谱信息的损失从而提高精度来获得回归系数,表明Ridge回归是更为符合实际、更可靠的回归方法[17-18]。
线性回归(Linear Regression)[19]是线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析方法,这种函数是一个或多个称为回归系数的模型参数的线性组合,只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。将SPA算法筛选出的10个特征波长数据作为输入,建立SPA-Ridge模型和SPA-LR模型进行不同烘烤温度点烟叶叶绿素含量的回归预测,建立SPA-LASSO,SPA-LR模型,其真实值与预测值对比结果如图5(b)。
图5 模型结果Fig.5 Model results
通过分析图5,表2可以看出,3种基于SPA连续投影算法的预测模型都能有效预测不同烘烤温度点烟叶叶片叶绿素浓度,其中SPA-BP预测模型效果最好,R²为0.967,RMSE为0.101,SPA-LR预测模型次之,R²为0.956,SPA-Ridge预测模型最低,R²达到了0.916,由于LR和Ridge这类线性模型对原始数据中异常数据过于敏感,Ridge回归进行建模分析前会先原始数据进行正则化处理,这会导致部分有效数据的丢失,因此SPA-Ridge模型的预测能力较SPA-BP模型的精度稍差。LR回归虽未对原始数据进行其他处理,但线性回归鲁棒性很差,受到个别数据噪点的影响很大,导致SPA-LR模型预测和测试表现很差。然而BP神经网络方法因为非线性映射能力和自适应学习能力,从而SPA-BP预测效果要优于线性方法,有更好的寻优能力和预测精度。
表2 不同预测模型建模结果Tab.2 Modeling results of different prediction models
2.5.2 检测结果验证
表3为烟叶叶片叶绿素含量反演值和参考值结果。
最后选取SPA-BP模型对剩余的24组烘烤叶片样本进行反演值和参考值的仿真验证。将24组烟叶叶片样本的10个波段图像的反射率代入反演模型计算出烟叶叶片叶绿素含量反演值。
参照赵红宁等[20]运用近红外光谱法快速测定砂仁中的水分时判别模型稳健性验证方法,以误差率<0.1来判别实测值与预测值相等,其余表示不相等,则SPA-BP预测模型的准确率为83.33%,SPA-Ridge预测模型的准确率为70.83%,SPA-LR预测模型的准确率为75%,基本符合对叶绿素含量的预测。
3 结论
以贵州省贵阳市平坝区天龙实验基地烘烤烟叶为研究对象,在分析烘烤烟叶叶绿素含量与光谱反射率相关性的基础上,选取能够反映烟叶叶绿素差异的光谱参数,分别采用SPA-BP,SPA-Ridge和SPALR3种方法建立了烘烤烟叶叶片叶绿素含量的预测模型,并对各种模型的预测精度进行了比较,得到以下结论。
1)云烟87不同成熟度烘烤烟叶随着烘烤过程中温度上升,烤烟叶片叶绿素含量随之降低,叶绿素含量于不同成熟度间与不同程度烘烤处理间差异显著。对于不同成熟度烤烟叶片在烘烤过程中不同温度点时,叶绿素含量表现为:尚熟>成熟>完熟。
2)由不同烘烤烟叶原始光谱曲线表明:随着烘烤温度的上升,叶绿素含量逐渐降低,光谱反射率上升,不同成熟度烤烟光谱反射率随温度变化大致相同,对于40℃与45℃的原始光谱反射率曲线区分不够明显,而一阶导数光谱反射率中,同一成熟度烟叶不同烘烤温度点光谱曲线特征变化较大,3条曲线都在490~500 nm,690~700 nm等出现波峰但波峰高度不同,可以明显区分不同烘烤温度点烘烤烟叶。
3)通过SPA算法可对高光谱数据进行特征波段筛选,实现数据的降维优化,SPA算法筛选得出的部分特征波段具有较好的合理性,可为叶绿素高光谱监测传感器设计和反演机理研究提供参考。
4)分别用基于SPA算法的SPA-BP,SPARidge,SPA-LR3种预测模型预测不同烘烤温度点烟叶叶片的叶绿素浓度,3种模型的R²分别为0.967,0.916,0.956,都能很好预测叶绿素含量,其中SPABP模型要优于其他两种模型,检验SPA-BP模型时,以误差率<0.1来判别实测值与预测值相等,其余表示不相等,则SPA-BP预测模型的准确率为83.33%,SPA-Ridge预测模型的准确率为70.83%,SPA-LR预测模型的准确率为75%,基本符合对叶绿素含量的预测。