基于近红外光谱的四元调和食用油定量分析
2018-06-25李淑娟卞希慧范清杰陈娇娇
李淑娟,卞希慧,李 倩,范清杰,陈娇娇
(1. 省部共建分离膜与膜过程国家重点实验室,天津工业大学环境与化学工程学院,天津 300387;2. 天津格润赛福科技有限公司,天津 300384)
食用调和油由两种及两种以上的精炼食用油按比例调配而成[1-2],因此在营养方面比单一食用油丰富均衡,受到广大消费者的青睐.但是,由于不同食用油价格存在较大差异,而调和油成分的定量分析又缺乏国家标准,致使许多商家加大低价食用油的比例以降低调和油的成本,从中获取更多利润[3-4].因此,研究一种针对多元调和食用油的定量分析方法具有重要意义.目前调和油的检测方法有多种,如气相色谱法[5]、高效液相色谱法[6]、荧光光谱法[7-8]、紫外分光光度法[9]、红外光谱法[10]、拉曼光谱法[11]和近红外光谱法[12]等.其中近红外光谱(near infra-red,NIR)技术具有快速、准确、无损等优势[12-16],是很有潜力的一种食用油定量分析方法.但是,近红外光谱吸收较弱、谱峰重叠严重,因此需要借助化学计量学中的多元校正技术才能进行定量分析.偏最小二乘回归(partial least square regression,PLS)因其具有简单、快速、参数少、预测效果好等优点成为一种应用最为广泛的多元校正方法[17-19].目前,大多数研究只是采用多元校正方法对二元和三元调和油体系进行定量分析[20-22],更高元数的调和油定量分析体系研究较少[23].另外,除了有用信息外,近红外光谱信号中往往还混有噪声和背景信息,且容易受到温度、样品状态和杂散光等的影响[24-25].因此,需要对光谱进行预处理后再建立模型,才能提高定量分析的准确度[17,25-26].
本研究采用近红外光谱作为检测手段,考察了不同预处理方法的预处理效果,在最佳预处理方法的基础上,建立偏最小二乘回归模型,探讨了化学计量学方法对四元调和油组分定量分析的可行性.
1 材料与方法
1.1 实验样品及仪器
实验中调和油是以玉米油、大豆油、稻米油和芝麻油按不同比例配制而成.超市购买玉米油、大豆油、稻米油和芝麻油这4种植物油若干瓶.配制成51个四元调和油样品,其中每种油的质量分数为 0%,~50%,,间隔 1%,,玉米油样品质量分数按增序排列,其他油的含量随机打乱,保证4种油之间的线性关系最小.在实验前要对每一个油样品进行超声处理10,min,使调和油样品充分混合均匀.选择 2/3为训练集用于定量模型建立,1/3为预测集对模型预测能力进行检验.
主要实验仪器为 Vertex 70型多波段红外/近红外光谱仪(德国 Bruker公司)、FA2004型电子天平(上海舜宇恒平仪器有限公司)、吹风机、2,mm 样品池、装有酒精的洗瓶、一次性塑料滴管和51个10,mL玻璃瓶.
1.2 近红外光谱采集
将上述食用调和油样品取至光程为 2,mm的玻璃比色管中,以空气为参比采集样品的近红外光谱.采样波数范围为 4,000~12,000,cm-1,分辨率为4,cm-1,样品光谱扫描次数 32次,基线扫描 3次,作为背景保存,然后进行待测样品扫描.每个样品扫描3次取平均作为该样品的最终光谱.4种植物油和51个调和油样品的近红外光谱分别如图1和图2所示.
从图1可以看出:4种实验样品油在整个光谱区的近红外图谱均很相似,而局部光谱只是存在略微的不同.从图 2可以看出:调和油光谱也具有非常好的重合度,各个样品的局部光谱也大同小异.图 1和图2相比较可以看出:4种植物油和调和油的近红外光谱也是相近的,很难突出样品之间成分的细小差异,需利用近红外光谱技术结合化学计量学方法,达到各组分定量分析的目的.
图1 4种植物油样品的近红外光谱图Fig. 1 NIR spectra of 4 vegetable oil samples
图2 51个四元调和油样品的近红外光谱图Fig. 2 NIR spectra of 51 quaternary edible blended oil samples
1.3 光谱预处理方法选择
实验采集到的原始光谱除了包含与样本相关的有用信息外,往往也掺杂着干扰信息,这对所建模型的质量和未知样品的预测准确度将产生严重的影响.因此,在建立模型前,对光谱进行预处理以消除各种干扰变得十分关键.常用的预处理方法有平滑、标准正态变量(SNV)、多元散射校正(MSC)、一阶导数、二阶导数和连续小波变换(CWT).理论上讲,平滑主要消除噪声信息,SNV、MSC是背景校正技术,主要消除杂散光信息,求导和 CWT是背景扣除技术,主要消除背景信息.然而,对于具体体系,哪种预处理方法效果最好,需要结合处理效果选取.因此,本研究通过预测均方根误差(RMSEP)考察了上述 6种预处理方法对不同组分的预处理效果,从而得到每种组分的最佳预处理方法.
1.4 模型建立
在最佳预处理方法基础上,本实验采用偏最小二乘回归(partial least square regression,PLS)方法建立调和油定量分析模型.PLS是一种最常用的多元校正方法,其建模过程中的关键一步在于因子数(LV)的确定.因子数是原始光谱数据转换到 PLS空间后应保留的最优模型维数.因子数的多少直接影响到模型的预测能力.因子数太少,会丢失部分有用信息,产生欠拟合;反之,因子数太多,可能将无用的信息也引入到模型中,产生过拟合,二者都会导致模型的预测能力降低.因此,需要确定合适的因子数以提高模型的预测能力.蒙特卡罗交叉验证是最常用的一种确定因子数的方法[27].本文根据蒙特卡罗交叉验证的均方根误差(RMSECV)随因子数的变化确定PLS模型的因子数.采用最佳因子数建立 PLS模型后,将未知样品的光谱代入到模型中,预测各组分油的含量.
2 结果与讨论
2.1 偏最小二乘因子数的确定
为了确定 PLS模型的最佳因子数,因子数从 1变化到 25,间隔为 1,计算不同因子数下每个组分PLS模型的RMSECV值,得到了4种组分油的RMSECV分别随着因子数的变化曲线,如图3所示.
图3 四元调和油样品中各组分的RMSECV随因子数的变化Fig. 3 Variation of RMSECV with latent variables for each component of quaternary edible blended oil samples
从图3可以看出:玉米油的RMSECV随着因子数的增加先急剧下降后缓慢上升,最后趋于平稳.在因子数为11时,其RMSECV最小,即玉米油的最佳因子数为 11.大豆油、稻米油和芝麻油组分的RMSECV虽然开始时随着因子数增加有所波动,但总体上随着因子数的增大先下降,分别在 14、14和20达到最低值后略微上升,最后趋于平稳.因此,大豆油、稻米油和芝麻油组分的最佳因子数分别为 14、14和20.
2.2 不同预处理方法参数的优化
本研究采用的 6种预处理方法中,平滑、一阶导数、二阶导数的窗口大小对预测结果有较大的影响,CWT采用不同的小波函数及分解尺度得到的预测效果差异也较大.因此,需要对平滑、一阶导数、二阶导数的窗口参数及 CWT的小波函数及分解尺度参数进行优化.
平滑、一阶导数和二阶导数的窗口分别设置为3~59,间隔为2,计算不同窗口下的RMSEP,结果如图4所示.
图4 四元调和油样品的RMSEP随着窗口大小的变化Fig. 4 RMSEPs of quaternary edible blended oil samples with different window size
图 4显示了平滑(a)、一阶导数(b)和二阶导数(c)预处理时四元调和油样品中各组分的 RMSEP随着窗口大小的变化.从图 4(a)可以看到:平滑预处理的RMSEP随着窗口大小的增大而迅速的减小,但玉米油和大豆油的RMSEP下降到最小后缓慢上升,最后趋于平稳,因此RMSEP最小对应的最佳窗口大小分别为17和11;而稻米油和芝麻油的RMSEP下降后迅速上升,后来又下降并达到最小值,然后略有上升最终趋于平稳,由此得到最佳窗口大小分别为 59和 59.同样从图 4(b)和图 4(c)可以看出:各组分一阶导数和二阶导数的 RMSEP随着窗口大小的增大而迅速的减小,最后都慢慢趋于平稳.一阶导数RMSEP最小时玉米油、大豆油、稻米油和芝麻油最佳窗口大小分别为 57、47、59和 57,二阶导数RMSEP最小时玉米油、大豆油、稻米油和芝麻油最佳窗口大小分别为59、51、41和41.
图5显示了采用CWT预处理时,四元调和油样品各组分的 RMSEP随着分解尺度和小波函数的变化.本研究考察了 32个小波函数(Haar,db2,db3,…,db20,coif1,coif2,…,coif5,sym2,sym3,…,sym8等),图中以数字代表这32个小波函数.分解尺度从1变化到40,从图5可以看出:最大分解尺度为40是合适的,因为当分解尺度达到40时4个组分的RMSEP都已经趋于稳定.开始时4个组分的RMSEP随着分解尺度的增大而迅速减小,随后缓慢下降,最后趋于平稳,而随着小波函数的改变变化不大.因此,分解尺度对小波变换的影响程度要大于小波函数.每个子图RMSEP最小值对应的分解尺度和小波函数确定为每个组分 CWT的最佳参数,即玉米油、大豆油、稻米油和芝麻油的最佳小波函数和分解尺度分别为 sym4、db13、sym8、Haar以及 40、34、32、34.
图5 四元调和油样品组分的RMSEP随着分解尺度和小波函数的变化Fig. 5 RMSEPs with different decomposition scales and wavelet functions
2.3 不同组分预处理方法的选择
确定了最佳预处理参数后,采用平滑、SNV、MSC、一阶导数、二阶导数和 CWT预处理方法对原始光谱进行预处理,再建立PLS模型,得到了不同预处理方法对四元调和油中各组分预测的RMSEP值,见表1.
表1 各预处理方法对四元调和油各组分预测 RMSEP值比较Tab. 1 Comparison of different pretreatment methods in terms of RMSEPs for each component of quarternary edible blended oil
对于玉米油组分,与未经预处理的 PLS预测结果相比,经过 SNV和 MSC处理后预测准确度的提高效果并不明显.这是因为 SNV和 MSC主要去除杂散光的影响,而从图 2中可以看出,原始数据光谱的重合度非常好,说明信号本身受杂散光的影响较小.经过 CWT处理后的 RMSEP为 2.597,8,为所有预处理方法中的最小值,预测准确度提高程度最大.因此,CWT为定量分析玉米油组分的最佳预处理方法.其他 3种组分的最佳预处理方法通过同样的方法可以得出,大豆油、稻米油和芝麻油最佳预处理方法分别为CWT、平滑和一阶导数.
2.4 预测结果
采用上述讨论得到的各组分最佳预处理方法结合 PLS建立模型,对预测集中的玉米油、大豆油、稻米油和芝麻油组分分别进行预测,预测值与真实值的关系如图 6所示.为了进行比较,四元调和油各组分未经过预处理的 PLS模型的预测结果也显示在图6中.
图6 四元调和油样品的预测值与真实值的关系Fig. 6 Relationship between the predicted and prepared values of PLS
在图中,每个散点都是以真实值为横坐标、预测值为纵坐标的点.经过比较可以看出,经过最佳预处理后的模型的斜率更接近 1,截距更接近于 0,所以得到的拟合效果更好.从图 6可以看出,预处理后比预处理前的预测值与真实值的线性相关性有了很大的提高.玉米油、大豆油、稻米油和芝麻油的相关系数 R 分别从预处理前的 0.884,4、0.964,0、0.956,6、0.977,0提高到预处理后的 0.980,0、0.988,7、0.984,7、0.988,9,4种组分的相关系数都提高到0.98以上.表明经过最佳预处理后所建 PLS模型的预测能力有较大提高,能够获得更准确的预测结果.因此,近红外光谱技术结合适当的化学计量学方法可以很好地实现四元调和油中各组分的准确、快速定量.
采用最佳预处理方法对近红外光谱数据进行预处理,能够更好地滤除非相关因素的干扰,提高模型信噪比.结果表明,经过最佳预处理后PLS法建立的模型为四元食用调和油含量定量分析的最佳模型.帮助.
3 结 语
本研究应用近红外光谱技术对四元食用调和油各组分进行了准确定量检测.运用各组分最佳预处理方法对近红外光谱数据进行预处理,结合 PLS建立了调和油组分含量的定量分析模型.对于未知样品,该模型的预测结果准确度较未经处理过的提高了1%~10%,,相关系数达到 0.98以上.本研究验证了近红外光谱技术结合化学计量学方法对四元调和油进行分析的可行性,有望用于实际调和油中组分的定量分析.实际调和油中油脂种类多达十几种,本研究仍需要进一步研究五元、六元及更高元数的模拟调和油.
[1] 刘燕德,靳昙昙,王海阳. 基于拉曼光谱的三组分食用调和油快速定量检测[J]. 光学精密工程,2015,23(9):2490-2496.
[2] Xu J,Liu X F,Wang Y T. A detection method of vegetable oils in edible blended oil based on three-dimensional fluorescence spectroscopy technique[J]. Food Chemistry,2016,212:72-77.
[3] 徐婧,侯培国,王玉田,等. 基于特征峰值积分法的调和油组分含量的测量[J]. 光谱学与光谱分析,2016,36(1):298-302.
[4] 梁丹. 应用近红外光谱聚类分析法快速鉴别植物油品种的研究[J]. 科学与财富,2015(33):245-246.
[5] 闵征桥,刘金勇,高盼,等. 用气相色谱法测定食用植物调和油配方的研究[J]. 粮食与食品工业,2013,20(3):11-14.
[6] Maíra F,Annibal D P N. Optimization and application of methods of triacylglycerol evaluation for characterization of olive oil adulteration by soybean oil with HPLCAPCI-MS-MS[J]. Talanta,2010,81(3):1116-1125.
[7] Xu J,Wang Y T,Liu X F. A novel quantitative analysis method of three-dimensional fluorescence spectra for vegetable oils contents in edible blend oil[J]. Optics and Spectroscopy,2015,118(4):663-667.
[8] 吴希军,田瑞玲,孙梦菲,等. 基于荧光光谱及矩阵分析的植物油鉴别技术[J]. 光谱学与光谱分析,2016,36(7):2155-2161.
[9] 张霖霖,周勇强,谢浩东,等. 紫外分光光度法直接测定废水中微量油的研究[J]. 光谱学与光谱分析,2001,21(5):716-718.
[10] 李娟,范璐,毕艳兰,等. 红外、近红外光谱-簇类的独立软模式方法识别植物调和油脂[J]. 分析化学,2010,38(4):475-482.
[11] Bin J,Ai F F,Fan W,et al. Rapid determination of unsaturated fatty acids in vegetable oil by Raman spectroscopy and chemometrics[J]. Analytical Letters,2016,49(6):831-842.
[12] Muresan V,Danthine S,Muresan A E,et al. In situ analysis of lipid oxidation in oil seed-based food products using near-infrared spectroscopy and chemometrics:The sunflower kernel paste(tahini)example[J]. Talanta,2016,155:336-346.
[13] Li S F,Zhang X,Shan Y,et al. Qualitative and quantitative detection of honey adulterated with high-fructose corn syrup and maltose syrup by using near-infrared spectroscopy[J]. Food Chemistry,2017,218:231-236.
[14] Alves J C L,Poppi R J. Quantification of conventional and advanced biofuels contents in diesel fuel blends using near-infrared spectroscopy and multivariate calibration[J]. Fuel,2016,165:379-388.
[15] Kang Q,Ru Q G,Liu Y,et al. On-line monitoring the extract process of Fu-fang Shuanghua oral solution using near infrared spectroscopy and different PLS algorithms[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2016,152:431-437.
[16] 褚小立,陆婉珍. 近五年我国近红外光谱分析技术研究与应用进展[J]. 光谱学与光谱分析,2014,34(10):2595-2605.
[17] Bian X H,Chen D,Cai W S,et al. Rapid determination of metabolites in bio-fluid samples by Raman spectroscopy and optimum combinations of chemometric methods[J]. Chinese Journal of Chemistry,2011,29(11):2525-2532.
[18] Wold S,Ruhe A,Wold H,et al. The collinearity problem in linear regression. The partial least squares (PLS) approach to generalized inverses[J]. SIAM Journal on Scientific and Statistical Computing,1984,5(3):735-743.
[19] Mao Z Y,Shan R F,Wang J J,et al. Optimizing the models for rapid determination of chlorogenic acid,scopoletin and rutin in plant samples by near-infrared diffuse reflectance spectroscopy[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2014,128:711-715.
[20] 张严,谢岩黎,孙淑敏. 近红外光谱结合化学计量学方法在油脂检测中的应用[J]. 粮食与油脂,2015,28(1):66-68.
[21] 刘福莉,陈华才. 近红外透射光谱法检测三组分食用调和油含量的研究[J]. 光谱学与光谱分析,2009,29(8):2099-2102.
[22] Jovic O,Smolic T,Primozic I,et al. Spectroscopic and chemometric analysis of binary and ternary edible oil mixtures:Qualitative and quantitative study[J]. Analytical Chemistry,2016,88(8):4516-4524.
[23] 谢岩黎,何保山,任丹丹. 新型食用调和油的配方设计及分析[J]. 河南工业大学学报:自然科学版,2009,30(4):29-31.
[24] Bian X H,Li S J,Shao X G,et al. Variable space boosting partial least squares for multivariate calibration of near-infrared spectroscopy[J]. Chemometrics and Intelligent Laboratory Systems,2016,158:174-179.
[25] 褚小立,袁洪福,陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展,2004,16(4):528-542.
[26] Engel J,Gerretzen J,Szymańska E,et al. Breaking with trends in pre-processing?[J]. Trends in Analytical Chemistry,2013,50:96-106.
[27] Xu Q S,Liang Y Z. Monte Carlo cross validation[J].Chemometrics and Intelligent Laboratory Systems,2001,56(1):1-11.