基于高光谱技术的茶鲜叶茶多酚含量的估算模型
2015-07-13张民李银花袁晴春李娟戴思慧刘仲华李明
张民,李银花,袁晴春,李娟,戴思慧,刘仲华,李明,2*
(1.湖南农业大学 a.工学院;b.园艺园林学院,湖南 长沙410128;2.湖南省现代农业装备工程技术研究中心,湖南 长沙 410128;3.国家植物功能成分利用工程技术研究中心,湖南 长沙410128)
为及时掌握茶叶的生长发育状况,通常需根据经验进行外观诊断,可靠性不高;或采用化学方法进行成分分析,但对植株有损伤,且过程较复杂,费时费力。高光谱遥感具有较高的光谱分辨率,通常达到10–2λ 数量级,光谱信息能充分反映茶叶有效成分(包括多酚类、植物碱、氨基酸和蛋白质等含氢基团成分) 的特征信息,在多层次定量分析与应用中显现出良好前景[1–2]。刘建雄等[3]应用近红外光谱技术对茶园病虫害发生进行预测,结果预测值与实际值的决定系数R2为0.97,平均相对误差3.93%;赵杰文等[4]利用高光谱技术研究了茶树叶片中叶绿素含量及其分布;陈全胜等[5]基于高光谱图像技术进行绿茶质量等级的评判研究,建立的等级判别模型预测识别率为94%;胡永光等[6]利用可见–近红外非高光谱成像预测茶鲜叶全氮含量,建立了茶叶含氮量的估计模型。Dutta 等[7]利用卫星遥感和近红外光谱相结合的方法来鉴定TV1 和 S3A3 两种茶叶的质量;Chaseok RYU 等[8]利用高光谱成像技术建立了茶叶产量估计模型。
笔者采用手持便携式光谱分析仪采集茶树冠层光谱数据,通过平滑、微分处理对光谱除噪后,选用主成分分析方法获得特征波段波长和反射率,运用高效液相色谱法测定茶鲜叶的茶多酚含量,建立了茶鲜叶茶多酚含量与高光谱特征波段反射率的估算模型,并进行了验证。现将结果报道如下。
1 茶树冠层高光谱数据的采集及处理
1.1 数据的采集
2013年4月中旬至10月上旬,于湖南省长沙县高桥乡湖南省茶叶研究所(东经113°19′,北纬28°29′),选择晴好天气,使用便携式近红外光谱仪ASD Field Spec Hand Held 2(美国),采集10:00— 14:00 的茶树冠层高光谱数据。选择视场角为25°,光谱仪器与茶树冠层的距离为50 cm,检测区域的直径为22 cm。抽取长势、色泽差异较小的9个茶树品种早白尖5 号、金观音、福鼎大白茶、金萱、南江1 号、碧香早、湘妃翠、寒绿、安徽1 号,每个样本区域测4个样点, 每个样点采集10个光谱数据(通过剔除异样误差之后进行均化处理,设定仪器2 s 扫描1次,为避免干扰每间隔10~15min 重新优化1次),取平均值作为样点的真实测量值。
每个样点采集4个茶鲜叶样品,按照文献[9]高效液相色谱法测定茶多酚含量。9个茶树品种的春、夏、秋茶鲜叶的茶多酚含量列于表1。
表1 茶树品种茶多酚的含量 Table1 Tea polyphenols of content
1.2 茶树冠层高光谱数据的处理
1.2.1 茶树冠层的反射光谱特征
剔除茶树冠层光谱数据粗大误差的光谱曲线,对每个样点的光谱曲线进行均值处理,运用View Spec Pro Version 6.0 软件得到光谱曲线图,如图1所示。
图1 茶树冠层的高光谱图 Fig.1 Spectrum data of the sample tea
从图1 可以看出,在光谱区间范围内,不同茶树品种冠层的光谱曲线的增长与递减是一致的。在波长700 nm 处反射率开始有较大幅度的增大;在波长765~960 nm 处各品种的反射率趋于稳定。
由于外界条件(如光线强度、空气中氧气浓度、仪器系统误差等)的影响,光谱曲线首尾两端出现了比较杂乱的曲线,去除全光谱数据中325~425 nm 和960~1 175 nm 的首尾噪声,以获取信噪比高的波段,截取425~960 nm 的平均光谱曲线进行研究。
在425~900 nm 光谱范围内,9个茶树品种冠层的平均样本曲线虽然走势基本相近,但在520~670 nm 和690~960 nm 波长范围内仍存在相对较大的光谱反射率差异。
1.2.2 光谱数据的预处理
为了减小噪声,提高信噪比,选取4 种典型的平滑方法(“SG 卷积法”“多项式平滑”“相邻平均法” “傅里叶变换滤波”)进行比较分析。
将平滑处理后的数据进行线性拟合,得到不同平滑处理方法的模型精度(表2)。
由表2 可知,平滑处理后的模型预测均方差均优于未处理的,表明平滑处理可以去除由于测量过程中受环境因素影响而产生的大量细小而尖锐的杂峰,提高模型的精度。对比决定系数和预测均方差值,相邻平均法的决定系数最高,预测均方差最小,因而采取相邻平均法对光谱数据进行平滑处理来去除噪音。
表2 不同平滑处理方法的模型精度 Table 2 The model precision based on different smoothing method
通过对茶树冠层光谱数据进行一阶和二阶导数处理,如图2 所示,得到相关性的波段为425~960 nm,一阶导数比二阶导数处理后的光谱线性变化率大,应用一阶导数进行光谱数据处理且设定差分宽度为65,R 为0.98,预测均方差为0.611,预测精度最高,可获得较好的预测效果。
图2 一阶和二阶导数处理后的特征波段 Fig.2 After the 1stDer and 2ndDer of the characteristics wave band
1.2.3 特征波段的选取
在去除噪音较大的325~425 nm 与960~1 175 nm 波段后仍有大量的波点数据。将每个样本的光谱数据中425~960 nm波长的波点通过SPSS 软件进行主成分分析计算,第一主成分的方差贡献率为82.68%,第二主成分的方差贡献率为9.35%,第三主成分的方差贡献率为6.32%,第四主成分的方差贡献率为1.65%。根据主成分载荷阵,可以得到第一主成分波段821 nm 的载荷为0.99,第二主成分波段765 nm 的载荷为0.90,第三主成分中波段940 nm 载荷率最高,第四主成分中波段520 nm 载荷达到0.88,故取4个主成分的波段反射率数据代表整个光谱数据的重要信息,据此可以提取出特征波段和反射率,经过对原始光谱平滑处理与一阶导数预处理,由主成分分析得到特征波点,结合主成分分析中矩阵差,得到特征波段波长为821、765、940、520 nm,特征波的反射率值分别用x1、x2、x3、x4表示。
2 茶多酚预测模型的建立
2.1 高光谱特征波段的选取
由茶树冠层高光谱曲线的特征波段可以看出,不同品种之间的茶多酚含量与反射率存在差异,且同一品种的不同波段反射率也有明显不同。选用春茶茶多酚含量的数据作为建模基准,如表3 所示。
表3 茶多酚含量和不同特征波段反射率 Table 3 Different samples of TP content and characteristics wave band reflectance
表3 数据表明,近红外光谱反射率x1、x2、x3、x4和茶多酚含量存在相关性,多酚含量较高的品种吸收光能力较强,反射率较低。
2.2 茶多酚含量预测模型的建立
运用最小二乘法、多元线性回归、多项式法分 别对4个特征波段进行处理,得到茶多酚估算模型(表4)。其中,y 为茶多酚含量,x 为高光谱特征波段反射率。
表4 不同方法建立的估算模型 Table 4 The model equation based on the different mean
从表4 可以看出,最小二乘法建立的模型相关性最好,相关系数R 达到0.99,预测均方差为1.96。最优模型为y = 40.558 – 12.185x1+ 14.570x2– 11.857x3– 129.111x4。
3 模型的验证
选取23个茶树品种对所建立的模型进行检验,采集茶树冠层的光谱数据,并将其特征波段的反射率值代入定量模型得出预测值,与实测值进行比较,如图3 所示。
图3 茶多酚含量实测值与预测值 Fig.3 The true data and predictive value scatter plot
结果表明,预测值与实测值的相关系数R 为0.97,平均相对误差值为2.99%,说明对茶多酚的预测值与真实值误差小,可以应用于茶鲜叶茶多酚含量估算。
4 结论
通过采集茶树冠层的高光谱数据,对原始数据进行预处理,去除噪音干扰,采用主成分分析方法得到特征波段,提取出特征波段的反射率值。采用高效液相色谱测定样品的茶多酚含量,运用多元线性回归、一元线性回归、最小二乘法建立光谱反射率与茶鲜叶茶多酚含量的回归方程,其中最小二乘法模型精度最高,R 为0.99,预测均方差为1.96。选取23个茶树品种对模型进行验证,预测值与实测值的R 值为0.97,相对平均误差值为2.99%,表明对检验样品中的茶多酚含量预测值与实测值误差较小,可实现利用高光谱技术对茶鲜叶茶多酚含量进行在线估算。
[1] 于海燕,应义斌.农产品品质近红外光谱分析结果影响因素研究综述[J].农业工程学报,2005,21(11):168–171.
[2] Sun D W.Hyperspectral Imaging for Food Quality Analysis and Control[M].San Diego: Academic Press / Elsevier,2009.
[3] 刘建雄,李明,陶栋材,等.基于高光谱技术的茶尺蠖危害程度研究[J].湖南农业大学学报:自然科学版,2013,39(3):315–318.
[4] 赵杰文,王开亮,欧阳琴,等.高光谱技术分析茶树叶片中叶绿素含量及分布[J].光谱学与光谱分析,2011(2):512–515.
[5] 胡永光,李萍萍,母建华,等.基于可见–近红外光谱技术预测茶鲜叶全氮含量[J].光谱学与光谱分析,2008,28(12):2821–2825.
[6] 陈全胜,赵杰文,蔡健荣,等.利用高光谱图像技术评判茶叶的质量等级[J].光学学报,2008,28(4):669–674.
[7] Dutta R,Stein A,Bhagat R M.Integrating satellite images and spectroscopy to measuringgreen and black tea quality[J].Food Chemistry,2013,127:866–874.
[8] Chanseok R Y U,Masahito Suguri,Miki Umeda. Estimation of the quantity and quality ofgreen tea using hyperspectral sensing[J].Journal of the Japanese Society of Agricultural Machinery,2010,72(1):46–53.
[9] 李健.不同季节绿茶中茶多酚、咖啡碱和氨基酸含量分析[J].南京晓庄学院学报,2012 (6):57–59.