APP下载

近红外光谱法快速测定香菇总糖含量

2021-07-08梁振华王金梅康文艺马常阳李昌勤

食品科学 2021年12期
关键词:分析模型总糖香菇

卢 洁,田 婧,梁振华,王金梅,康文艺,3,马常阳,*,李昌勤,*

(1.河南大学 国家食用菌加工技术研发专业中心,河南 开封 475004;2.河南省功能食品工程技术研究中心,河南 开封 475004;3.开封市保健食品功效成分研究重点实验室,河南 开封 475004)

香菇(Lentinula edodes)隶属香菇属,又称香菌、冬菇等[1],味道鲜美、营养丰富,含有大量蛋白质、维生素、膳食纤维及矿质元素,且能量、脂肪较低,广受大众喜爱。香菇富含有纤维素、多肽、多糖等活性成分,现有研究发现其具有免疫调节、抗肿瘤、抗病毒、抗抑郁、抗疲劳、抗氧化、抗衰老和保护肝损伤等作用[2-3],具有开发为保健食品或药品的潜力。

香菇一直是我国食用菌的主要品种,据我国食用菌协会的统计调查表明,其产量常年居我国食用菌生产量和消费量的首位,市场流通量大。由此,快速检测及分析香菇及其产品的关键质量成分对评价其品质愈发重要[4]。糖类作为香菇中的重要营养和功能成分,是评价香菇品质的重要参考指标。目前用于检测香菇中含糖量的国家标准方法为GB/T 15672—2009《食用菌中总糖含量的测定》[5],但此方法耗时长、试剂危险性高[6]。

近红外(near infrared,NIR)光谱技术是集合多种技术优点的综合分析方法,因其操作简便、快捷、成本低、无试剂污染等特点而被广泛研究和应用于制药、食品、石油化工以及农业等各个领域[7-9]。此方法常用于产品质量的快速检测分析以节省时间、提高效率。Diaz等[10]结合糙米的NIR光谱和理化信息建立了测定糙米中直链淀粉含量的精确校准模型;Chen Yi等[11]的实验证明NIR光谱结合偏最小二乘(partial least square,PLS)法可用于灵芝样品中多糖和三萜物质含量的快速测定;解育静等[12]建立了肉桂中香豆素、肉桂醇、肉桂酸、肉桂醛共4 种有效成分的NIR定量分析模型,并具有较好的预测精准性;此外,NIR技术在淫羊藿、茶叶质量的快速预测方面也有研究[13-14]。本实验建立基于NIR技术的快速检测香菇总糖的方法,提高香菇质量的检测效率。

在NIR光谱分析中,常用的建模方法有多元线性回归、主成分回归、PLS、人工神经网络和支持向量机等非线性校正方法。其中,PLS法理论成熟,应用较为广泛,在食用菌领域有很好的应用效果[15-16],故本实验采用PLS法建立NIR分析模型,以期实现对香菇品质的快速评价。

1 材料与方法

1.1 材料与试剂

实验共从市场中随机获取香菇样品106 批,具体信息如表1所示,并未有明确的香菇品种区分。葡萄糖标准物质(批号CS30062-69727) 法国Extrasynthese公司;盐酸 北京化工厂;纯净水 杭州娃哈哈百利食品有限公司。

表1 香菇样品信息Table 1Information about L.edodes samples collected in this study

1.2 仪器与设备

Spot light 400型中-近红外光谱仪 美国铂金埃尔默公司;Multiskan MK3酶标仪 美国Thermo Electron公司;HH-S4数显恒温水浴锅 常州翔天实验仪器厂;SK-1快速混匀器 金坛市华峰仪器有限公司;AB135-S型电子天平 梅特勒-托利多国际贸易(上海)有限公司。

1.3 方法

1.3.1 香菇总糖含量的测定

分别吸取0、0.2、0.4、0.6、0.8、1.0 mL的葡萄糖标准溶液至10 mL具塞试管,用蒸馏水补至1.0 mL。按GB/T 15672—2009的苯酚-硫酸法[5]测定其吸光度,绘制标准曲线,并建立标准曲线方程。

精密称取0.250 g香菇粉(20 目),浸泡于65 mL体积分数23%的盐酸溶液,微沸回流3 h,冷却后取滤液,洗涤滤渣,合并滤液和洗液置于250 mL容量瓶中,定容。准确吸取0.2 mL定容后的样品溶液于10 mL具塞试管,加蒸馏水补至1.0 mL,按照苯酚-硫酸法操作,以1 mL不含葡萄糖的苯酚-硫酸溶液,调其吸光度至零,测定样品溶液的吸光度。根据标准曲线方程计算样品溶液的总糖含量,并核算出原始样品中的总糖含量。

1.3.2 NIR光谱采集与分析

逐一将香菇粉碎至80 目,均匀平铺于测试用平皿底部,分辨率设置为8 cm-1,在4 000~10 000 cm-1光谱范围内扫描64 次,即得样品的原始光谱图(图1)。

图1 香菇样品的NIR原始光谱图Fig.1 Raw NIR spectra of L.edodes samples

1.4 模型建立及验证

使用Spectrum QUANT软件分析数据,选取PLS法建立NIR分析模型。校正均方根误差(root mean square error of calibration,RMSEC)、预测集均方根误差(root mean square error of prediction,RMSEP)、R2、相对分析误差(relative percent deviation,RPD)是评价模型的4 个关键参数。分析模型一般需具有较高的R2,较小的RMSEC和RMSEP及较高的RPD,且RMSEC/RMSEP的值需在0.8~1.2之间。RPD一般采取阈值分割法进行评价[17-19],当RPD>3.0时,模型能够很好地满足预测标准[20-21]。按下式计算RPD:

2 结果与分析

2.1 香菇样品总糖含量值

通过对香菇总糖含量的测定,得出106 批样品中总糖含量的数据制成散点图,结果如图2所示,标记点为106 批样品对应的点。

图2 香菇样品总糖含量的散点图Fig.2 Scatter plot of total sugar content in L.edodes samples

为了开展NIR分析模型的构建过程和验证过程,需首先将样品分成校正集和验证集。将样品随机抽选13 批样品划为验证集,而剩余的93 批样品为校正集,但验证集的样品需包含于筛选后的校正集范围内。

2.2 NIR分析模型中校正集样品的筛选

在建模之前,需要剔除杠杆值异常样品和学生化残差样品。第1类样品含有比较极端的成分组成,如样品中总糖含量信息和NIR色谱信息较突出,属于同批次产品中的极端样品,无法代表样品的一般特性;第2类样品受系统因素的严重影响,相较于一般市场中的香菇样品,贮藏时间的长短也会影响香菇糖类物质的含量,其还受种植条件和管理方式的影响,也不符合样品结果的一般分布规律,亦不适合放入校正集中。通过样品筛选,保留代表香菇特征的样品,可提高构建香菇总糖含量预测模型的精准度。

使用NIR数据分析软件自动识别异常样品的结果如图3所示,将学生化残差和杠杆值远离大多数样品的个体判定为潜在异常样品[13],利用剩余样品建模型,观察模型的R2、RMSEC和RMSEP等各项指标决定异常点的删除,此过程循环往复,直至模型的各项评价指标符合标准且预测结果良好。最终,共筛选出65 批具备香菇一般特征的样品,纳入到NIR分析模型的构建中。

图3 杠杆值与参差异常测试值关系图Fig.3 Relationship between studentized residual and leverage value

对比验证集的13 个样品与校正集的65 个样品信息的结果如表2所示。验证集样品的总糖含量包含于校正集的范围内,即验证集的样品可以使用校正集建立模型进行分析。

表2 校正集和验证集香菇样品中总糖含量范围Table 2 Range of L.edodes samples’total sugar content in calibration set and validation set

2.3 NIR分析模型光谱区间的筛选

不同物质在NIR光谱中吸收效果不同,而构建NIR预测模型首先需要为样品确定吸收度最好的光谱区间[22]。本实验分别利用4 个光谱区间对校正集的香菇样品进行建模,利用评价指标对模型的进行评价,结果如表3所示。

表3 光谱区间的筛选实验结果Table 3Results of screening for spectral ranges

光谱区间为4 000~10 000 cm-1时,即全光谱范围的R2最大,RMSEC和RMSEP相对较小,其最小值分别为1.393、1.557,二者之比为0.895,符合模型构建的基本要求,且RPD值大于3,RPD建模效果最好,且明显优于其他任一光谱区间。

2.4 NIR分析模型光谱预处理方法的选择

在分析过程中,样品的NIR光谱会存在噪声信息,造成吸收光谱出现基线偏移、漂移等情况,这主要是受样品的粒度、表面散射等因素影响[23-25]。因此,NIR光谱数据在使用前还需进行预处理,减少非目标因素对光谱的影响。本实验以多元散射校正(multiplicative scatter correlation,MSC)、标准正规变换(standard normal variation,SNV)、二阶导数(SD,second derivative)、一阶导数(first derivative,FD)共4 种预处理方式组合成不同的光谱预处理方法,且每种方法的降噪点数均为31,校正集样品构建模型的评价结果如表4所示。

表4 光谱预处理方法的筛选实验结果Table 4Results of screening for spectral preprocessing methods

由表4可知,香菇NIR分析模型的最佳预处理方法为MSC、SD,其R2最大,RMSEC和RMSEP最小值分别为1.393、1.557,二者之比为0.895,且RPD值大于3,各指标均符合模型构建的基本要求,由此得到的光谱图如图4。香菇样品的NIR光谱信息经预处理后基线十分平稳,具有多个特定光谱吸收区间且吸收峰尖锐、对称。

图4 香菇样品的最佳预处理NIR光谱图Fig.4 NIR spectra of L.edodes samples after optimal data preprocessing

2.5 NIR分析模型PLS主因子数的确定

在使用PLS建立NIR分析模型时,PLS主因子数也是影响模型质量的关键因素。主因子数过少或过多会出现欠拟合或过拟合情况,导致模型的预测误差增加[26]。利用不同主因子数对校正集样品构建NIR分析模型,评价结果如表5所示。综合模型评价指标可知,当主因子数为10时建模效果最好,其RPD值大于3,因此其结果明显优于其余2 组。

表5 主因子数的筛选实验结果Table 5Screening results for the number of PLS factors

2.6 香菇总糖含量的NIR分析模型

通过使用校正集样品对光谱预处理方法、NIR光谱区间、PLS主因子数的逐一确定,最终得出预测香菇总糖含量的最优NIR分析模型,该模型的各参数如表6所示。

表6 香菇样品总糖的最优NIR分析模型参数Table 6Parameters of the optimal NIR prediction model for the total sugar content of L.edodes samples

2.7 模型的外部验证与评价

用建立的NIR分析模型对验证集样品进行总糖含量的预测,并以预测值和实测值进行对比分析,结果如图5所示。验证集样品的预测值与实测值均围绕在y=x的参考线附近,因此二者十分接近。同时借助SPSS统计学软件将对应预测值与实测值的比值与数值1作显著性分析,结果如表7所示,二者不存在显著差异(P=0.993)。此外通过Pearson相关性分析可知,二者的相关系数为0.971,呈显著相关。由此看出本实验建立基于NIR光谱的定量预测模型的预测值与化学实测值之间无显著差异。

图5 验证集样品的模型预测值与实测值的散点图Fig.5 Scatter plot of model predicted versus measured values for validation set samples

表7 显著性结果分析Table 7Results of significance test

3 讨论与结论

NIR光谱技术已经在食品行业广泛应用,且在国标GB/T 25219—2010《粮油检验 玉米淀粉含量测定 近红外法》[27]、GB/T 24896—2010《粮油检验 稻谷水分含量测定 近红外法》[28]和GB/T 24899—2010《粮油检验 小麦粗蛋白质含量测定 近红外法》[29]中已有应用。Jiang Hui等[30]使用加权可变乘积散射校正算法处理原始光谱,建立PLS回归模型,模型的R2为0.961 5,RMSEP为0.362 6,此模型实现了水稻中脂肪酸值的快速检测;韩洁楠等[31]开发了利用近红外光谱快速检测玉米粉中淀粉含量的方法,光谱预处理方法为旋光法、一阶导数与去一条直线法,利用PLS建立模型,校正集的R2为0.909,RMSEP为0.609 00;孙阳等[32]采用SNV、MSC的光谱预处理方法,利用PLS建模实现了对面粉中水分、灰分和面筋含量的快速、无损检测,验证集的R2分别为0.898 77、0.970 81、0.932 37,RMSEP分别为0.327 10、0.041 39、1.314 70。本实验以我国香菇主产地的106 批香菇为研究对象,以香菇总糖含量作为评价指标,采用NIR光谱技术,结合计量学方法,采用PLS线性回归分析,建立了香菇总糖含量测定NIR模型。

在建立的香菇总糖NIR分析模型时,最佳的预处理方式为MSC、SD,最佳光谱区间为4 000~10 000 cm-1,PLS主因子数为10时,模型预测能力最好。模型的R2、RMSEC、RMSEP和RPD值分别为0.940 04、1.393、1.557和4.08。根据验证集的检验可知,其预测值和化学值之间的不存在显著差异(P=0.993),Pearson相关系数为较理想的0.971。由此可知,相较于GB/T 25219—2010[27]、GB/T 24896—2010[28]和GB/T 24899—2010[29],NIR光谱技术可以用于对香菇总糖含量的快速测定,且结果准确、可靠。本实验为市场中香菇的质量控制和规范提供了便捷的检测方法,有助于促进香菇产业的发展。

猜你喜欢

分析模型总糖香菇
基于BERT-VGG16的多模态情感分析模型
Modeling and Verification of a Sentiment Analysis System Using Aspect-Oriented Petri Nets
香菇接种三招
黄酒中总糖与还原糖含量测定方法比较
传统客家黄酒的发酵条件优化
全启发式语言分析模型
基于Lagrange方法的直升机地面共振分析模型
避雨栽培对川农泡椒1号品质的影响
香菇皮炎二例施为
小香菇的奇遇