小种红茶水浸出物近红外定量分析模型的建立
2020-03-23卢莉程曦刘金仙林燕萍黄毅彪
卢莉,程曦,刘金仙,林燕萍,黄毅彪
(1.武夷学院茶与食品学院,福建武夷山354300;2.中国乌龙茶产业协同创新中心,福建武夷山354300)
小种红茶是世界红茶的鼻祖,起源于武夷山。2005年以来,小种红茶在保留其传统、独特的品质特征的基础上,不断研发创新,开发了奇红等高端红茶产品,使其在市场上再次风靡。水浸出物是茶叶在热水中所有可溶性成分的总称,其含量的高低反映了茶汤的厚薄、滋味的浓强程度,是衡量茶叶质量的重要指标[1]。近红外是波长为780 nm~2 526 nm(波数为12 820 cm-1~3 960 cm-1),介于中红外光谱和可见光谱之间的一种电磁波。近红外光谱技术承载的分析信息主要是有机物质中的含氢基团C-H,O-H,N-H)等振动的倍频和合频特征信息[2]。近红外光谱分析技术是一种绿色分析技术,具有分析快速、处理简单、无需试剂消耗等优点[3]。近年来国内外学者采用近红外技术在茶叶产地溯源[4]、品质分析[5-6]、产品判别[7-8]等方面的应用已有不少的研究,其中在茶叶的化学成分的快速测定及模型构建方面也取得一定进展,Zhiming Guo 等[9]利用近红外光谱结合多元校正方法建立绿茶中表没食子儿茶素没食子酸酯((-)-epigallocatechin gallate,EGCG)含量的校正模型,杨丹等[10]建立绿茶全氮量近红外定量分析模型,赵峰等[11]优选并成功建立武夷岩茶的水分、茶多酚、咖啡因和粗纤维的定量分析模型。沈诗钰等[12]采用偏最小二乘法建立白茶总黄酮含量的定量模型。董春旺[13]建立基于近红外光谱检测技术的小叶种工夫红茶感官品质评分和理化品质指标的定量分析模型。
近红外光谱在绿茶、乌龙茶、白茶、黑茶、红茶等茶类的均有应用,但尚未见到该技术在小种红茶品质成分快速定量测定方面的应用研究。本研究针对小种红茶这一特种茶类单一建模,将近红外光谱分析技术应用于小种红茶品质成分的定量分析,针对性强。建模时可减少不同茶类建模时茶类间物质种类差别较大带来的非建模属性等其他无用信息的干扰,建模效果更好。相比常规的水浸出物检测方法,近红外光谱技术能实现水浸出物的定量快速无损检测,操作简便。
1 材料与方法
1.1 材料
小种红茶茶样:一部分由武夷山正山茶业有限公司等企业提供,一部分采购于武夷山市内各茶企。为保证样品的代表性,收集茶样为2017~2018 年生产的不同品种、不同等级、不同区域、不同类别、不同厂家的茶样,共76 个样品。
1.1.2 仪器与设备
VERTEX 70 傅立叶近红外光谱仪:美国布鲁克仪器公司;HH-4 数显恒温水浴锅:常州国华电器有限公司;SARTORIUS BS224S 电子分析天平:德国赛多利斯公司;FZ-102 微型植物粉碎机:天津市泰斯特仪器有限公司;SHZ-DIII 循环水真空泵抽滤装置:郑州长城科工贸有限公司;ZFD-A5040A 新型鼓风干燥箱:上海精宏实验设备有限公司。
1.2 方法
1.2.1 近红外光谱(near infrared spectroscopy,NIRS)的采集
粉碎后的小种红茶近红外光谱采用傅立叶近红外光谱仪进行光谱采集,光谱谱区采集范围:4 000 cm-1~12 000 cm-1;扫描次数64 次,分辨率8 cm-1。温度控制室温恒定在25 ℃左右。每个样品重复扫描3 次,取平均光谱进行建模。
1.2.2 水浸出物含量的测定
水浸出物含量测定:按国家标准GB/T8305-2002《茶水浸出物测定》[14]。
1.2.3 建模方法
偏最小二乘法是一种矩阵法,具有分析速度快、准确度高、预测性强等特点,能对严重重叠的谱峰进行多元校正,在一定的程度上可以消除谱峰的非线性[15]。因此,本试验采用偏最小二乘法(partial least squares,PLS)建立小种红茶水浸出物定量分析模型。
1.2.4 模型评价方法
通过外部验证和内部交叉验证法对模型进行检验,采用实测集与预测集R2,交互验证均方根误差(root mean square error of cross validation,RMSECV),RMSEP 作为模型性能的评价指标。R2越接近1,RMSECV 与RMSEP 值越小,说明模型的预测效果越好[16]。
1.3 数据处理
使用OPUS 7.5 软件进行数据格式的转换,光谱预处理和模型建立,用Origin 8.0 软件作图。
2 结果与分析
2.1 小种红茶近红外光谱图的采集
采集的76 个小种红茶样品近红外光谱叠加结果如图1 所示。
图1 小种红茶样品近红外光谱图Fig.1 NIRS spectra of Souchong samples
由图1 可知,大于10 000 cm-1波数段主要贡献噪声,4 000 cm-1~10 000 cm-1波数段光谱信息丰富,为有效信息集中段,7 500 cm-1~10 000 cm-1波数段趋向平缓,4 000 cm-1~7 500 cm-1波数段光谱吸收峰多而尖锐。不同品种、不同等级、不同区域、不同类别、不同厂家的小种红茶茶样近红外光谱相似,但是由于不同样品所含化学成分的含量高低不同,导致其近红外图谱存在差异。
2.2 水浸出物含量的测定
校正集和验证集样品含量分布见表1。
表1 校正集和验证集样品含量分布Table 1 Sample content distribution of calibration set and validation set
由表1 可知,76 个小种红茶样品水浸出物含量的测定结果,样品中水浸出物含量的变化范围较大,最大值和最小值都被划分在校正集中,校正集和验证集的平均值接近。将76 个小种红茶样品随机分配为校正集和验证集,校正集∶验证集≈7 ∶3。
2.3 光谱预处理方法的选择
近红外光谱采集时,噪声、散射光、样品背景等因素会影响有效特征信息的提取,导致近红外光谱的基线漂移或平移。因此,需要对原始光谱进行预处理。多元散射校正多元散射校正(multiplicative signal correction,MSC)可以去除漫反射中样品的镜面反射及光谱的不重复性;归一化可以消除多余信息,增加样品间的差异性,标准归一化(standard normal variate,SNV)主要用于消除样品的不均匀造成的噪声,散射以及光程变换对NIR 漫反射的影响;导数处理可消除基线漂移、背景干扰并且忽略谱线重叠,主要用于基线校正与提高光谱分辨率[17-18]。
本试验比较了OPUS 软件中自带的几种光谱预处理方法,包括无预处理(none pretreatment,NONE)、消除常数偏移量(elimination of constant offset,ECO)、减去一条直线(minus a straight line,MSL)、标准归一化、最小-最大归一化(min/max)、多元散射校正法、内部标准(internal standards,IS)、一阶导数(first derivative,FD)和二阶导数(second derivative,SD)等,不同预处理方法对模型效果的影响见表2。
表2 不同预处理方法对定量模型性能的影响Table 2 The effect of different pretreatment methods on the performance of the quantitative model
通过比较发现,预处理方法为内部标准时,相关系数和校正均方差和验证均方差最接近最佳值。因此,得出光谱的最佳预处理方法为内部标准。
2.4 建模光谱波段的选择
全波段光谱数据信息量大,含有冗余信息多,容易对模型建立产生影响和干扰[19]。不同光谱区所包含的信息不同,建模前对光谱波段进行筛选,可防止引入冗余信息,提高模型性能。不同光谱范围对R2和RMSECV 的影响见表3。
表3 不同光谱范围对R2 和RMSECV 的影响Table 3 Effects of different spectral range on R2 and RMSECV
通过表3 对比发现,在 4 000 cm-1~10 000 cm-1波谱区间,R2最接近1,RMSECV 最小,因此选择此波段为最佳建模波段。
2.5 主成分数的选择
主成分数的选择对定量模型的建立至关重要,主成分数太少,会导致部分有用的信息没有包含在模型中,可能欠拟合;主成分数过多,又会导致将无用的噪音信号当作有用信息来建模,模型包含多余信息,可能过拟合。不同主成分数下RMSECV 见图2。
由图2 可见,主成分数为5 时,RMSECV 最小。因此,在本研究中,OPUS 软件选择最佳建模的主成分数为5。
2.6 水浸出物定量分析模型的建立
图2 不同主成分数下RMSECVFig.2 RMSECV in different principal components
经过比较分析,最终选用建立模型的光谱预处理方法为内部标准,主成分数为5,运用OPUS 7.5 软件中的PLS 法建立模型。76 份小种红茶样品中54 份样品作为校正集样品,22 份样品作为验证集样品,建立水浸出物近红外定量分析模型。建模结果见图3。
图3 小种红茶水浸出物含量的NIR 预测值与参考值的相关图Fig.3 Correlation plots of NIR predicted values and reference values of water extract of Souchong
由图3 可知,水浸出物模型校正集相关系数较高,为93.04%,预测集样品相关系数为95.73%,说明模型校正集样品拟合度较好,且模型预测性能较好。
小种红茶水浸出物含量的NIR 预测值与参考值的偏差图见图4。
图4 小种红茶水浸出物含量的NIR 预测值与参考值的偏差图Fig.4 Deviation plots of NIR predicted values and reference values of water extract of Souchong
由图4 可知水浸出物模型的NIR 预测值与实测值的偏差为-1.2~1.3 范围内,说明NIR 预测值与实测值较为接近,模型建立比较成功。
2.7 水浸出物定量分析模型的验证
将22 个小种红茶验证集样品的近红外图谱导入其水浸出物定量分析模型中,预测水浸出物的含量,NIR 预测结果与真实值比较见表4。
表4 22 份验证集样品的预测值和参考值Table 4 NIR predicted values and reference values of 22 samples in validation set
由表4 可知,预测值与真实值比较接近,绝对偏差为0.03%~0.93%,相对误差在2.57%以内,误差率较小,准确度较高。说明建模效果较好,所建立的模型预测结果较为准确,可应用于小种红茶水浸出物含量的无损、快速检测。
3 结论
本试验基于近红外光谱技术,采用现行国标方法测定其水浸出物含量,并与其光谱对应,采用PLS 建立小种红茶水浸出物模型。选用OPUS 7.5 软件内部标准为光谱预处理方法,主成分数为5 建立小种红茶水浸出物含量模型,所建立的模型R2为95.73%,RESEC为0.629,RESEP 为0.513。建立的模型效果较好,可用于小种红茶水浸出物含量的快速测定,达到快速、无损检测的目的。王玉霞等[20]结合PLS 建立了绿茶茶汤水浸出物的定量分析模型,发现其交叉检验和预测模型决定系数均在95%以上。陈美丽等[21]建立茉莉花茶水浸出物的定量分析模型,真实值与预测值的相关系数均达90%以上。说明近红外光谱技术可用于水浸出物含量的快速检测,与本研究结果一致。本次用于建模的小种红茶样本数量为76,在今后的研究中,将进一步扩大样本数量,广泛收集各种类型的小种红茶代表性茶样,进一步优化模型。