APP下载

基于色谱和光谱数据融合的不同植物源食用油判别方法与模型

2020-11-09吴鹏飞许晓栋杨增玲

分析测试学报 2020年11期
关键词:玉米油花生油食用油

高 冰,吴鹏飞,许晓栋,杨增玲,刘 贤

(中国农业大学 工学院,北京 100083)

为保障消费者权益,维护市场秩序,植物油的真实性问题受到了广泛的关注与研究[1-2]。现有的植物油真实性检测技术主要为色谱法[3-5]、光谱法[6-9]等,单一方法虽然可以达到检测植物油真实性的目的,但基于单一信息源的分析技术的检测精度不足,且检测模型的鲁棒性差[10-11]。为解决这一问题,数据融合的方法得到了广泛研究[12-16],其中,基于数据融合方法的食用油植物源定性判别研究鲜有报道。

本文以葵花籽油、玉米油、大豆油和花生油4种不同植物源食用油为研究对象,基于气相色谱和近红外光谱技术,获取植物油的多源信息。气相色谱法可对食用油的脂肪酸组成进行量化表征[17],近红外光谱可对食用油中的含氢化学基团产生响应[18],两种技术从不同角度对植物油样本进行分析。理论上,将这两种技术源的数据进行融合分析具有提高模型检测精度以及鲁棒性的潜力,并可为食用油植物源的定性分析提供新思路。

1 实验部分

1.1 样品收集与制备

实验样本共272个,来自山东省金胜粮油食品公司,包括葵花籽油样本41个,玉米油样本40个,大豆油样本40个,花生油样本151个;样本均为不同生产批次的成品油,样本原料的地理来源广阔,加工工艺及品质指标多样。采样前于室温样本库中密封存放。

1.2 气相色谱分析方法

植物油样本经皂化、甲酯化、脱水后得到脂肪酸甲酯,通过气相色谱仪(7820,美国安捷伦公司)进行脂肪酸种类及含量测定,采用氢离子火焰检测器(FID,美国安捷伦公司);石英毛细管柱(聚二氰丙基硅氧烷强极性固定相)长度100 m,内径0.25 mm,膜厚0.25 μm。色谱分析条件:进样量1 μL,进样口温度为250 ℃;分流比为60∶1;初始温度175 ℃,保持10 min,以3 ℃/min速率升温至210 ℃,保持10 min,以3 ℃/min速率升温至225 ℃,保持15 min。检测温度250 ℃,载气为氮气(纯度为99.999%),氢气流速为30 mL/min,氮气流速为12 mL/min,空气流速为300 mL/min,尾吹流速为25 mL/min。每个样品做3次平行。脂肪酸甲酯混合标准品(47885-U)购于Sigma-Aldrich公司(美国)。

1.3 近红外光谱分析方法

室温下,用胶头滴管吸取摇匀后的植物油样本约2 mL于透明平底玻璃圆管中,在25 ℃控温装置内放置5~10 min;采用傅里叶变换近红外光谱仪(QuasIRTM1000,Galaxy Scientific,美国)进行近红外光谱扫描,光谱扫描范围为10 000 ~4 000 cm-1;光谱分辨率为8 cm-1;扫描次数为32次。每个样本重复扫描3次,取平均值作为样本光谱。

1.4 数据处理方法

采用主成分分析(PCA)和偏最小二乘判别分析(PLS-DA)对气相色谱和近红外光谱数据进行探索性分析和建模;算法实现软件为Matlab(R2014a,美国Mathworks公司);使用SPSS20.0程序(美国SPSS公司)中单因素方差分析法(one-way ANOVA)中的邓肯多重检验法对不同植物源食用油的脂肪酸组成与差异进行统计学比较分析。置信水平设为95%(P<0.05);采用残差统计剔除异常值,置信区间设为95%;为避免过拟合,在校正模型中使用“venetian blinds”法进行交互验证(CV)[19],数据级随机划分8次,保留样本比率为13%;采用PLS toolbox自带的Kennard-Stone算法对样品进行分集处理,75%的样品作为校正集,建立定性判别模型,25%的样品作为独立验证集对建立的定性模型进行检验;采用平滑、导数、标准正态变换等方法进行光谱预处理;在数据级上对气相色谱(脂肪酸含量)和近红外光谱(吸光度)数据进行融合,多源数据分别进行归一化处理,连接构建融合数据,继而进行后续数据融合模型的建立;对于定性分析模型,灵敏度(Sensitivity)、特异度(Specificity)越接近于1,分类误差(Classification error)越接近于0,定性判别效果越好[20]。

(1)

(2)

式中,TP为真阳性的样本个数;TN为真阴性的样本个数;FP为假阳性的样本个数;FN为假阴性的样本个数。

2 结果与讨论

2.1 不同植物源食用油脂肪酸组成差异分析

如表1所示,棕榈酸(C16∶0)、硬脂酸(C18∶0)和山嵛酸(C22∶0)含量在4种植物油之间具有显著性差异(P<0.05);玉米油和花生油中豆蔻酸(C14∶0)和反式油酸(C18∶1t)含量与其余两种植物油具有显著性差异,其中花生油中C18∶1t含量显著高于大豆油(P<0.05);油酸(C18∶1)和亚油酸(C18∶2)在4种植物油中的含量均大于21%,其中花生油中C18∶1的含量显著高,C18∶2的含量显著低(P<0.05);玉米油和大豆油中反式亚油酸(C18∶2t)、反式亚麻酸(C18∶3t)、亚麻酸(C18∶3)和反式脂肪酸(TFA)含量显著高于其他两种植物油,其中大豆油中C18∶3含量显著高于玉米油,TFA含量显著低于玉米油(P<0.05);C20∶0、花生一烯酸(C20∶1)、芥酸(C22∶1)和木焦油酸(C24∶0)含量在花生油中显著高,C20∶0和C20∶1含量在葵花籽油中显著低,C24∶0含量在玉米油和大豆油中显著低(P<0.05);花生油中饱和脂肪酸(SFA)含量显著高,葵花籽油中SFA含量显著低。上述分析表明,不同植物油间脂肪酸组成差异较大,该差异性数据具有进一步区分其植物源的潜力。

表1 不同植物油脂肪酸组成差异性统计分析Table 1 Statistical analysis on the difference of fatty acid composition of vegetable oils (%)

图1 基于脂肪酸组成的不同植物油Biplot图Fig.1 Biplot of vegetable oils based on the fatty acid

2.2 食用油植物源气相色谱主成分分析

基于4种植物油的气相色谱数据进行主成分分析,得到不同植物源食用油的Biplot图如图1所示,前两个主成分分别占总变异量的60.28%和12.09%。花生油样本点均分布在第一主成分的正半轴,其余3种植物油分布在第一主成分的负半轴,且玉米油样本均位于第三主成分的负半轴;C22∶0、C20∶0、C24∶0和C18∶1t对鉴别花生油的贡献较大,该结论与上述脂肪酸组成差异性结果一致,花生油中C22∶0、C20∶0、C24∶0和C18∶1t含量相比其余3种植物油差异显著(P<0.05);C16∶0和C18∶2t对玉米油的鉴别贡献较大,玉米油中C16∶0和C18∶2t含量显著高(P<0.05);C14∶0和C18∶2分别与葵花籽油和玉米油样本邻近,且靠近大豆油样本,C14∶0在葵花籽油和大豆油中含量无显著差异,并且显著高于其余两种植物油(P<0.05);大豆油中C18∶2含量显著低于玉米油(P<0.05),这导致C18∶2更靠近大豆油;C18∶0、C18∶3和C18∶3t对于大豆油的鉴别贡献较大,这一结论与上述脂肪酸含量的显著性分析结果一致(表1)。以上主成分分析表明,气相色谱数据具备区分食用油植物源的能力,区分效果良好,脂肪酸的组成差异对主成分区分的贡献较大。

2.3 不同植物源食用油近红外光谱差异分析

图2 不同植物油近红外光谱的差异Fig.2 Differences of near infrared spectra for vegetable oils

2.4 食用油植物源近红外光谱主成分分析

对4种植物油的近红外光谱数据进行主成分分析,得到主成分得分图(图3A)以及PC1和PC2的载荷图(图3B)。第一和第二主成分占总变异量的90.02%,与图2结论相似,花生油样本位于第一主成分正半轴,与其余植物油样本距离较远,区分明显,这与上述光谱差异分析结果一致;葵花籽油、大豆油和玉米油样本相互区分明显,但样本之间的距离较近;葵花籽油样本均位于第二主成分的正半轴;大部分的玉米油和大豆油样本位于第二主成分的负半轴。由主成分得分图可知,光谱波长变量在第一主成分的得分普遍偏高,这可能与花生油的近红外光谱与其余3种植物油在吸收强度上差异较大有关,而第一主成分又将花生油与其余3种植物油明显区分;PC2得分图中,光谱的差异主要由C—H键的一级倍频振动(6 029 cm-1)、二级倍频振动(8 681 cm-1)和合频振动(8 043 cm-1)导致。以上主成分分析结果表明,近红外光谱技术具有区分食用油植物源的潜力,其中光谱的吸收强度差异以及对C—H键振动的表征对定性判别的贡献较大。

图3 基于近红外光谱的不同植物油主成分分析Fig.3 PCA of vegetable oils based on near infrared spectraA.score plots of PCA,B.loading of PC1 and PC2

2.5 食用油植物源判别分析模型结果

进一步对气相色谱和近红外光谱数据进行PLS-DA判别分析,结果如表2所示,气相色谱和近红外光谱均可对食用油植物源进行判别分析,模型交互验证集的灵敏度和特异度均不低于0.929,分类误差不大于0.061;花生油PLS-DA判别分析的灵敏度和特异度均为1.000,分类误差为0.000,这一结果与主成分分析中花生油的区分良好有关;近红外光谱对其余3种植物油的PLS-DA判别分析结果较气相色谱差。与现有文献中基于近红外光谱判别分析食用油植物源100%正确判别率的结果相比,该结论的偏差可能是样本范围扩大导致:植物油的收集包含了不同原料品种、产地、生产工艺和存储时间的样本。采用数据级数据融合方法,融合气相色谱和近红外光谱数据进行建模,结果表明,食用油植物源判别分析的灵敏度和特异度均为1.000,分类误差为0.000;说明数据融合的方法具有提高模型精度的能力,并且数据融合模型对于复杂来源样本的包容性更好。

表2 食用油植物源PLS-DA判别分析结果Table 2 PLS-DA discriminant analysis results of vegetable oils type

进一步对PLS-DA判别分析模型的交互验证平均分类误差进行统计[22],基于气相色谱数据、近红外光谱和数据融合的交互验证平均分类误差对比分析如图4所示。随着建模主成分数的增加,交互验证平均分类误差下降,并在8~20主成分处趋于平稳。单一的气相色谱法和近红外光谱法在判别分析中均表现良好,交互验证平均分类误差在0.1以下。近红外光谱在主成分数小于8时,判别分析效果优于气相色谱,数据融合的分类效果介于两者之间;主成分数大于8时,气相色谱模型的交互验证平均分类误差最低,数据融合方法的交互验证平均分类误差介于两种单一方法模型之间。

图4 PLS-DA判别模型的交互验证平均分类误差Fig.4 Average CV classification error in the PLS-DA models

3 结 论

本研究采用气相色谱技术和近红外光谱技术结合化学计量学方法对食用油的植物源进行判别分析,探究了数据级数据融合的可行性,构建了基于色谱和光谱数据融合区分食用油植物源的方法与模型。气相色谱、近红外光谱和两者的数据融合均可对食用油植物源进行分类,数据融合模型最优,灵敏度和特异度均为1.000,分类误差为0.000,提高了模型的检测精度;交互验证平均分类误差显示数据融合的模型效果介于两种单一方法模型之间,模型的鲁棒性得到了提升。本研究为食用油植物源的分类提供了新的解决思路。

猜你喜欢

玉米油花生油食用油
玉米油精炼加工过程中营养及风险指标的探索
废食用油改性沥青性能研究
开封后的食用油应该怎么存放
2019上海食用油展、食用油包装展览会
2019上海食用油展、食用油包装展览
不同方法提取的花生油品质分析研究
湿法消解-石墨炉原子吸收光谱法测定玉米油中的铅
α-及γ-生育酚对玉米油回色的影响
肉豆蔻挥发油抑菌及抗花生油氧化作用研究
六招挑选优质花生油