近红外光谱结合偏最小二乘法快速测定糖果中水分含量
2018-04-26沈乐丞刘书航邓海玲何美霞吴燕蕙彭建飞黄勇旗
沈乐丞,刘书航,邓海玲,何美霞,吴燕蕙,彭建飞,黄勇旗
(1.深圳市计量质量检测研究院,广东深圳 518131;2.河南工业大学粮油食品学院,河南郑州 450001)
糖果作为一种深受欢迎的休闲食品,在众多的国民消费中居重要的地位,特别是在节日和喜庆消费中,更是必不可少。影响糖果质量有多方面因素,其中水分是影响糖果品质变化的基本因素[1],因此,长期以来糖果工业把成品含水量作为质量控制的重要指标之一[2]。目前糖果水分的常规检测方法有真空干燥法、卡尔费休法等。真空干燥法测定结果精确度高、所需样品量少,但检测速度较慢、对样品破坏性大,不利于快速检测。刘惠敏[3]后来通过提高烘干温度、缩短烘干时间对真空干燥法进行了改进,将检测时间缩短至20 min,但该方法不适用于果糖含量高的糖果样品。卡尔费休法[4]是测定糖果水分的各类化学方法中,最为专一、最为准确的方法,但具有抗干扰性弱、重现性较差、污染环境等缺点。
近年来,近红外光谱凭借其准确、快速、简便、无损、无污染等优点,备受各国学者青睐,其在食品、药品、化工、临床分析等领域应用越来越广泛[5-11],研究和开发糖果品质的NIR相关分析方法渐成为热点。目前,采用近红外光谱测定糖果水分的方法还未见报道。为此,本文应用近红外光谱技术结合最小二乘法,建立了糖果水分的快速测定方法,该方法操作简便、快捷,能达到快速准确测定的目的。该分析方法的建立一方面可实现糖果企业产品的自动化实时监控,另一方面可为近红外测定方法的标准化提供数据支撑和技术依据。
1 材料与方法
1.1 材料与仪器
糖果样品 实验所用的116批糖果样品购买于超市、网上商城等,尽量覆盖市面上在售的主流品牌和种类。
MPA型傅立叶变换近红外光谱仪(配有漫反射积分球、石英样品杯、样品旋转器、OPUS光谱采集器及分析软件) 德国布鲁克;DZF-6030A型真空干燥箱 上海一恒;CPA324S万分位电子天平 德国赛多利斯;2XZ(S)-4型真空泵 上海德英真空照明设备有限公司。
1.2 实验方法
1.2.1 糖果水分含量的测定 糖果水分含量按照糖果国家行业标准SB/T10347-2008附录A进行测定,在真空度0.09 MPa、温度(80±2) ℃下干燥至恒重。
1.2.2 近红外光谱采集 采用积分球漫反射测样系统,分辨率8 cm-1;扫描次数64次;扫描波长范围12500~3600 cm-1;相对湿度30%~35%;室温22~25 ℃;每个样品重复采集5次,取其平均光谱。
1.2.3 数据处理 本实验采用仪器自带光谱定量分析软件OPUS进行数据处理,利用偏最小二乘法(Partial Least Squares,PLS)建立定量校正模型,模型评价指标为相关系数(R2),校正均方根误差(Root Mean Square Error of Calibration,RMSEC),预测均方根误差(Root Mean Square Error of Predication,RMSEP)[12]。
2 结果与分析
2.1 校正集和验证集的选择
将116批样品水分含量从小到大排列,将其按照3∶1的比例进行校正集(87批)和验证集(29批)划分,确保验证集样品水分含量范围处于校正集样品水分含量范围之内。表1列出了校正集和验证集样品水分含量分布范围及其统计结果。
表1 糖果水分含量分布范围Table 1 The distribution of moisture content in candy
从表1可知,样品水分含量分布范围较广,基本涵盖了正常糖果水分含量范围,校正集和验证集样品水分含量平均值和标准偏差分别为8.139%、5.217%,8.044%、4.985%,平均值接近,偏差均较大,说明数据较分散,多态性较丰富,可以满足建模的要求。
2.2 光谱预处理
图1是糖果样品原始光谱图(12500~3600 cm-1),由图1可见,糖果样品受颜色、颗粒均匀度及杂散度等影响,导致了图谱基线漂移及谱带重叠,为提高模型稳健性和准确性,需对原始光谱进行预处理。
图1 糖果样品原始光谱图Fig.1 Original NIR spectra of candy samples
在OPUS软件推荐的光谱范围内,对采集的近红外光谱进行了不同预处理方法的比较。R2越接近于1,RMSEC越小,表明模型越稳健,RMSEP 越小,表明模型的预测性能和推广能力越强。通过比较R2、RMSEC和RMSEP的不同,由表2可知,光谱经过MSC预处理后的建模效果最好。预处理后的图谱如图2所示。
表2 不同光谱预处理方法对 PLS 模型参数的影响Table 2 Effect of different preprocessing methods on PLS model
图2 糖果样品经MSC预处理光谱图Fig.2 NIR spectra of candy samples after MSC
2.3 建模波段的选择
近红外光谱信息主要来源于C-H、O-H、N-H、S-H、P-H、C=O、C=C等基团基频振动的合频和倍频振动吸收,水分子在近红外光谱中的特征吸收谱带为5160~8520 cm-1,主要包含了5176 cm-1处的O-H伸缩振动和弯曲振动合频吸收、6904 cm-1处的O-H伸缩振动一级倍频吸收、8504 cm-1处的O-H伸缩振动和一级倍频合频吸收[13-15]。在建立近红外光谱分析校正模型过程中,剔除一些无关光谱信息,可以有效的提高预测模型的精度。采用OPUS分析软件筛选得到不同最优波段基础上,结合水的吸收峰位置,依据模型评价指标,对校正模型的波数范围进行了优化。如表3所示,最后选择在11682.2~9826.1、8939.0~6267.9、5378.8~4487.8 cm-1范围内的三个波段作为建模波段。
表3 不同波段数对建模的影响Table 3 Effect of different regions on PLS model
2.4 最佳主成分数的确定
主成分分析法的目的是将数据降维,将相关性很高的变量转化成彼此相互独立或不相关的变量。同时,这些变量要尽量多地表征原变量的数据特征而不丢失信息。这几个新变量称为主成分或主因子。因此,在建立回归拟合模型时,主因子数对模型的稳定性有很大影响,选取的主因子数太少,将会丢失原始光谱较多的有用信息,会造成模型欠拟合;如果选取的主因子数太多,会出现过拟合现象[16-17]。本实验用交互验证法,以校正样品集内部校正均方根误差(RMSECV)为优化参数,选择最佳主因子数。不同主因子数对PLS模型参数的影响比较结果见图3。发现当主成分小于15时,RMSECV随主成分的增加而减小;而当主成分大于15,RMSECV随着主成分数的增加而增加,RMSECV最小值对应的主成分数为15,此时主成分数最佳。
图3 RMSECV值随主成分的变化Fig.3 RMSECV value with different factors for moisture
2.5 模型的建立
经过比较不同预处理方法、波段数、主因子数,发现选用MSC对原始光谱图进行预处理,最佳建模区间11682.2~9826.1、8939.0~6267.9、5378.8~4487.8 cm-1,最佳主成分数15,得到定量分析模型的R2为0. 9716,RMSEC为0.97%,RMSEP为1.03%。由图4可知预测值与实测值很接近,建立的定量分析模型预测性能较好。
图4 预测值与实测值的相关及偏差分布图Fig.4 Correlation and difference betweenpredictive values and measured values
2.6 模型验证
29 批验证集样品的近红外光谱图导入到分析模型中,得到了糖果水分含量的预测值,以其与实测值的比值作为预测回收率,得平均回收率,结果见表4。由表4可知,预测值和实测值的平均回收率为103.46%,表明该模型可用于预测糖果水分含量。将29个验证集NIR预测值与实测值进行配对t检验,t=-0.78
表4 验证集预测值与实测值的关系Table 4 Relationships between predictive values and measured values of validation set
2.7 糖果水分模型方法学验证
2.7.1精密度 取同一份糖果样品30 g,重复5次扫描其NIR图谱,输入NIR分析模型计算其水分含量,结果见表5,其相对标准偏差(RSD)为1.087%,表明该模型的精密度良好。
表5 模型精密度实验结果Table 5 Results of model precision test
2.7.2 重复性 分别取同一糖果样品5份,各30 g,分别扫描其NIR图谱,输入NIR分析模型计算其水分含量,结果见表6计算结果RSD值为1.055%,表明该模型的重复性良好。
表6 模型重复性实验结果Table 6 Results of model repeatability test
3 结论
采用漫反射法获得糖果的近红外光谱,经过MSC预处理,在11682.2~9826.1、8939.0~6267.9、5378.8~4487.8 cm-1范围内,主成分数为15时,应用PLS方法建立的糖果水分的定量预测模型效果最佳。糖果水分含量的模型预测值与国家行业标准实测值呈良好的相关性,相关系数为0.9716,RMSEC和RMSEP分别为0.97%和1.03%。该模型准确可靠,且与传统的糖果水分含量测定方法相比较,耗时短、操作简便,研究结果可为糖果质量的现场快速评价提供帮助,为实现糖果水分近红外快速测定方法的标准化提供数据支撑和技术依据。
[1]陈健敏,任斯忱,李汴生,等. 影响传统中式花生糖果贮藏期间氧化稳定性的因素研究[J]. 现代食品科技,2012(12):1667-1671.
[2]朱肇阳. 糖果水分和水分活度[J]. 食品科学,1983(1):55-60.
[3]刘惠敏. 试用显著性检验法判断糖果水分快速测定法的可靠性[J]. 食品科学,1994(10):46-49.
[4]卡尔费休法测定糖果水份的应用报告[J]. 食品工业科技,1984(6):42-53.
[5]刘洪林. 基于近红外光谱技术(NIRS)对工夫红茶茶色素含量测定[J]. 食品工业科技,2017(1):308-311.
[6]Sánchez M T,Pérez-Marín D,Torres I,et al. Use of NIRS technology for on-vine measurement of nitrate content and other internal quality parameters in intact summer squash for baby food production[J]. Postharvest Biology & Technology,2017,125:122-128.
[7]Chiesa L,Panseri S,Bonacci S,et al. Authentication of Italian PDO lard using NIR spectroscopy,volatile profile and fatty acid composition combined with chemometrics[J]. Food Chemistry,2016,212:296-304.
[8]Liu Y F,Chen X,Zheng B,et al. Detection of the contents of the ingredient of food by using the NIR spectroscopy and the backward interval partial least-squares[J]. Advanced Materials Research,2013,731:4337-4341.
[9]Márquez C,López M I,Ruisánchez I,et al. FT-Raman andNIR spectroscopy data fusion strategy for multivariate qualitative analysis of food fraud[J]. Talanta,2016,161:80-86.
[10]Schlegel L B,Schubert-Zsilavecz M,Abdel-Tawab M. Quantification of active ingredients in semi-solid pharmaceutical formulations by near infrared spectroscopy[J]. Journal of Pharmaceutical & Biomedical Analysis,2017,142:178-189.
[11]Shen L,Shen Y,Li F. Optimized utilization of NIR spectrum with interfacial TiO2/SiO2/TiO2,trilayer in hybrid-integrated multijunction architecture[J]. Solar Energy Materials & Solar Cells,2017,160:425-429.
[12]黄晓玮,邹小波,赵杰文,等. 近红外光谱结合蚁群算法检测花茶花青素含量[J]. 江苏大学学报:自然科学版,2014,35(2):165-170.
[13] Deng R,He Y,Qin Y,et al. Measuring pure water absorption coefficient in the near-infrared spectrum(900-2500 nm)[J]. Journal of Remote Sensing,2012,16(1):192-206.
[14]殷哲,雷廷武,董月群. 近红外土壤含水率传感器设计与试验[J]. 农业机械学报,2013,44(7):73-77.
[15]杨柳,徐榕,雷廷武,等. 近红外反射土壤含水率测量仪设计[J]. 农业工程学报,2015,31(20):1-9.
[16]莫欣欣,孙通,刘津,等. 近红外光谱法定性检测菜籽油中多效唑残留[J]. 分析试验室,2017(7):758-763.
[17]刘广军,高洪涛. 化学计量学中的主成分分析[J]. 曲阜师范大学学报:自然科学版,2004,30(3):75-78.