APP下载

基于特征波长提取的激光近红外光谱快速鉴别食用植物油种类

2017-05-10何东平

中国油脂 2017年4期
关键词:植物油波长预处理

吴 双,涂 斌,郑 晓,何东平

(1.武汉轻工大学 机械工程学院,武汉430000; 2.武汉轻工大学 食品科学与工程学院,武汉430000)

油脂安全

基于特征波长提取的激光近红外光谱快速鉴别食用植物油种类

吴 双1,涂 斌1,郑 晓1,何东平2

(1.武汉轻工大学 机械工程学院,武汉430000; 2.武汉轻工大学 食品科学与工程学院,武汉430000)

提出了基于CARS、SPA和CARS-SPA特征波长提取的激光近红外光谱技术快速鉴别食用植物油种类的方法。应用光谱仪采集127个食用植物油样本的光谱数据,采用标准正态变量变换算法(SNV)、标准正态变量变换和去趋势技术联用算法(SNV-DT)对其进行预处理,采用CARS、SPA和CARS-SPA 3种方法对经过预处理的光谱数据进行特征波长提取,应用支持向量机分类方法(SVC)建立食用植物油种类定性分类校正模型,选择网格搜索算法对模型参数组合(C,g)进行寻优,确定最优参数组合。结果表明,CARS-SVC、SPA-SVC和CARS-SPA-SVC模型预测集准确率均达到96.77%,预测效果理想,其中SNV-DT-SPA-SVC模型预测效果最优,预测集准确率达到100%。综上基于特征波长提取的激光近红外光谱分析技术能够快速准确鉴别食用植物油种类,为便携式现场检测设备开发提供了理论基础。

激光近红外光谱技术;食用植物油;特征波长提取;支持向量机分类;掺伪

目前,随着计算机技术、光谱分析技术和化学计量学快速发展,近红外光谱分析技术(NIR)以速度快、效率高、样品无需预处理、无损分析和易于实现在线分析等特点在医药、食品、烟草、农业和石化等行业得到了广泛的应用[1-2]。而食用植物油是多种脂肪酸甘油三酯的混合物,其化学成分含氢基团(C—H、O—H)振动的合频和倍频的吸收区与近红外光谱区是一致的,因此近红外适用于食用植物油的快速检测。由于光谱数据中通常包含有噪声等无用信息,需要采用波长筛选方法提取特征波长,提高模型预测性能。常用的光谱特征波长提取方法中后向间隔偏最小二乘法(BiPLS)和联合间隔偏最小法(siPLS)等[3]筛选波长时间长,设置参数多;遗传算法(GA)等[4]优选波长耗时长,且不稳定;无信息变量消除算法(UVE)等[5]有时优选的变量个数较多,需要与其他方法联用。竞争性自适应重加权采样(CARS)是一种最近提出的波长优选方法,不仅能有效去除无信息变量,还可以减少共线性变量对模型的影响[6]。连续投影算法(SPA)能够降低光谱数据间的共线性,有效地提取特征波长[7]。

本文针对食用植物油种类鉴别问题,提出了一种激光近红外光谱结合化学计量学快速分类方法,采用支持向量机分类法(SVC),结合CARS、SPA和CARS-SPA 3种特征波长提取方法建立SVC分类模型,对食用植物油种类进行快速准确分类。

1 材料与方法

1.1 样品及样品集划分

样品来源包括在武汉各大超市购买的不同品牌、不同种类的合格食用植物油共8类。实验采用SPXY(sample set portioning based on joint x-y distances)算法按3∶1的比例选取校正集和预测集样本,选择96个样本作为校正集,其余为预测集。其中校正集样本用于模型建立,预测集样本用于模型预测性能的检验。样本实际种类、编号和校正集及验证集样本数量如表1所示。

表1 样本的种类及数量

1.2 仪器及软件

采用实验室研发的激光近红外植物油品质快速检测仪采集光谱,仪器的主机为Axsun XL410型激光近红外光谱仪。光谱测定范围为1 350~1 800 nm,扫描次数32次,分辨率为3.5 cm-1,测量方式为透射,温控范围为20~100℃。实验中采用仪器自带的软件完成样品图谱采集。数显恒温水浴锅,5 mm石英比色皿,移液枪5~50 μL、200~1 000 μL。分析软件采用Unscrambler 10.1(CAMO AS,Oslo,Norway),以及MATLAB_R2012a。

1.3 光谱采集及数据预处理

光谱采集流程:首先,将装有样本的离心管放入电子恒温水浴锅加热到40℃,恒温静置10 min。然后调试光谱检测仪,使用移液枪将样本注入5 mm的比色皿中,约2/3处,放入样品池中加热至40℃,恒温稳定30 s,采集样本光谱数据。每个样本装样3次,采集3次稳定的图谱后取其平均图谱作为最终图谱,室温下测定。采用上述方法,采集127份样本得到的原始图谱如图1所示。

图1 原始光谱

近红外光谱技术属于二次分析技术,其光谱包含的信息丰富,同时谱带重叠严重,光谱信息专属性差,信噪比低,这些特点使得必须对光谱数据进行预处理。实验中近红外光谱分别采用标准正态变量变换算法(SNV)、标准正态变量变换和去趋势技术联用算法(SNV-DT)进行预处理。图2表示默认参数下SNV-DT预处理后的光谱图。

图2 经过SNV-DT预处理的光谱

1.4 特征波长提取方法

本实验通过CARS、SPA以及CARS-SPA对光谱数据进行特征波长提取。具体参照文献[8-10]。

1.5 建模、参数优化方法及模型评价指标

本实验选用SVC建立食用植物油种类鉴别模型,实现食用植物油的快速准确分类。核函数选择RBF核,此核的参数较少,实际应用表明RBF核具有很强的SVC学习能力[11]。由于选择的SVC建模方法包含惩罚因子C和核函数参数g,不同的参数所建的模型的预测能力存在差异,人为地设置参数,很难建立最优数学模型,本实验选用网格搜索法(CV)对参数组合(C,g)进行寻优,确定最佳参数组合[12]。以分类准确率作为建立的SVC模型的评价指标。

2 结果与讨论

2.1 特征波长的提取

实验中采用CARS、SPA、CARS-SPA 3种方法进行特征波长提取。实验中CARS方法的蒙特卡罗(MC)采样次数设为100次,所选择的波长变量子集采用10折PLS交叉验证建模,根据PLS模型的交互检验均方差(RMSECV)值最小确定最优的波长变量子集。图3为SNV-DT预处理后的光谱数据经CARS方法特征波长变量优选过程。

图3 使用CARS方法特征波长提取的过程

图3中,图3(a)为波长变量优选过程中被选波长变量数量的变化曲线。图3(b)为波长变量优选过程中PLS模型的RMSECV变化曲线。由图3(b)可以看出,在1~38次采样过程中,RMSECV值逐渐减小,表明优选过程中剔除与样品信息无关的变量;而38次采样以后,RMSECV值逐渐增大,表明优选过程中开始剔除与样品相关的有效信息。图3(c)为波长变量优选过程中各波长变量回归系数的变化趋势,“*”所对应的位置为RMSECV值最小即38次采样。图4为SNV-DT预处理后的光谱数据经CARS方法提取的特征变量,提取的变量个数为60。表2为3种方法提取的特征波长变量个数。

图4 使用CARS方法特征波长提取的数量

提取方法波长数RWASNVSNV-DTCARS315660SPA261719CARS-SPA151820

2.2 SVC模型的建立

将全波段光谱和经过CARS、SPA、CARS-SPA压缩原始数据得到的少数主成分作为SVC的输入,建立全波段和非全波段SVC模型。采用CV-SVC建模方法,所建模型的参数以及预测结果如表3所示。

从表3可以看出,SVC模型的校正集和预测集的准确率分别在95.83%和96.77%之上,说明此方法能够实现食用植物油种类的快速准确鉴别分类。未经预处理的原始光谱(RWA)建立的SVC模型的惩罚因子C均达到了1 024,容易减弱模型的泛化能力,影响模型的推广应用,表明预处理方法是建模过程的一个重要环节,需要选择合适的方法对光谱数据进行预处理。对于全波段模型来说,全波段SNV-SVC模型的预测能力较强,预测集准确率达到了100%,但建模变量过多,造成模型参数优化时间过长,降低建模效率。CARS、SPA、CARS-SPA 3种方法结合SVC建立的模型预测集识别准确率均高于96.77%,说明3种方法均能优选出代表待测物品的有效信息,大大减少建模变量,仅为全波段的3.3%~13.3%,建模效率提高。对比3种特征波长提取方法可以看出,SPA-SVC 建立的模型预测能力最好,且选取的建模输入变量较少,建模效率高;其中SNV-DT-SPA-SVC模型的综合性能最好,建模变量数仅为19个,预测集的预测准确率达到100%。研究表明,特征波长提取方法不仅能够保证模型具有较高的预测准确率,而且能够减少建模输入变量,缩短建模时间,提高运算效率,同时为快速食用植物油检测仪的开发设计提供理论支持。

表3 SVC模型参数及预测结果

3 结 论

采用原始光谱、经过SNV和SNV-DT预处理的光谱,结合CARS、SPA和CARS-SPA优选特征波长,利用所选波长建立SVC分类模型,表明建立的SVC模型能够实现食用植物油种类的快速准确分类。预处理方法是建模过程中需要注意的一个重要环节,不同的预处理方法对SVC模型的预测效果产生影响。CARS-SVC、SPA-SVC和CARS-SPA-SVC模型预测集准确率均达到96.77%,预测效果比较理想,其中SNV-DT-SPA-SVC模型的预测集准确率达到100%,表明3种特征波长提取方法不仅能够有效提取样品信息,保证所建模型具有较强的预测能力,而且减少了变量个数,缩短了建模时间,提高了建模效率。结果表明,CARS、SPA、CARS-SPA是有效的特征波长提取方法,近红外光谱分析技术结合特征波长提取方法为食用植物油种类的鉴别提供了一种快速准确有效的方法。

[1] 穆同娜, 庄胜利, 赵玉琪, 等. 近红外光谱法快速检测婴儿配方奶粉中的脂肪酸含量[J]. 现代食品科技, 2015, 31(4):277-281.

[2] 孔翠萍, 褚小立, 杜泽学, 等. 近红外光谱方法预测生物柴油主要成分[J]. 分析化学, 2010, 38(6):805-810.

[3] 吴静珠, 石瑞杰, 陈岩, 等. 食用油油酸的近红外特征谱区优选[J]. 中国粮油学报, 2015, 30(2):118-121.

[4] 刘燕德, 张光伟, 蔡丽君. 基于高光谱的GA和SPA算法对赣南脐橙叶绿素定量分析[J]. 光谱学与光谱分析, 2012, 32(12):3377-3380.

[5] 吴迪, 吴洪喜, 蔡景波, 等. 基于无信息变量消除法和连续投影算法的可见-近红外光谱技术白虾种分类方法研究[J]. 红外与毫米波学报, 2009, 28(6):423-427.

[6] 李水芳, 张欣, 李姣娟, 等. 拉曼光谱法无损检测蜂蜜中的果糖和葡萄糖含量[J]. 农业工程学报, 2014, 30(6):249-255.

[7] 冯雷,陈双双,冯斌,等. 基于光谱技术的大豆豆荚炭疽病早期鉴别方法[J]. 农业工程学报,2012,28(1):139-144.

[8] 郭文川, 刘大洋. 猕猴桃膨大果的近红外漫反射光谱无损识别[J]. 农业机械学报, 2014, 45(9):230-235.

[9] LI H D, LIANG Y Z, XU Q S, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Anal Chim Acta, 2009, 648 (1):77-84.

[10] 肖海斌, 赵进辉, 袁海超, 等. 同步荧光光谱结合CARS变量优选预测猪肉中四环素残留含量[J]. 光学精密工程, 2013, 21(10):2513-2519.

[11] 宋志强,沈雄,郑晓,等.应用近红外光谱对低碳数脂肪酸含量预测[J].光谱学与光谱分析,2013,33(8):2079-2082.

[12] 涂斌, 宋志强, 郑晓, 等. 基于激光近红外的稻米油掺伪定性-定量分析[J]. 光谱学与光谱分析, 2015, 35(6):1539-1545.

Classification of edible vegetable oil based on laser near-infrared spectroscopy combined with extraction of characteristic wavelength

WU Shuang1, TU Bin1, ZHENG Xiao1, HE Dongping2

(1.School of Mechanical Engineering, Wuhan Polytechnic University, Wuhan 430000, China; 2.College of Food Science and Engineering, Wuhan Polytechnic University, Wuhan 430000, China)

To classify edible vegetable oil quickly, the method of laser near-infrared(NIR) spectroscopy combined with extration of characteristic wavelength by heavy competitive adaptive weighted sampling (CARS), successive projections algorithm(SPA) and CARS-SPA was proposed. Spectral data of 127 edible vegetable oil samples were collected by laser NIR spectrometer,and pretreated by standard normal variate transformation(SNV),standard normal variate transformation and de-trending(SNV-DT),then the characteristic wavelength was extracted using CARS, SPA and CARS-SPA, and the support vector machine classification (SVC) method was applied to establish qualitative classification correction model of edible vegetable oil. In the end, the model parameter combination (C,g) were optimized by mesh search algorithm. The results showed that the accuracy rates of prediction set of CARS-SVC, SPA-SVC and CARS-SPA-SVC models all reached 96.77% and the prediction effect was satisfying, in which the prediction effect of SNV-DT-SPA-SVC model was the best with the accuracy rate of prediction set 100%. NIR spectroscopy combined with extraction of characteristic wavelength could identify edible vegetable oil accurately and quickly, and they could provide theoretical basis for develop-ment of portable field testing equipment.

laser near-infrared spectroscopy; edible vegetable oil; characteristic wavelength extraction; support vector machine classification; adulteration

2016-06-28;

2017-01-10

国家“十一五”科技支撑计划项目(2009BADB9B08);武汉市科技攻关计划项目(2013010501010147);武汉工业学院食品营养与安全重大项目培育专项(2011Z06)

吴 双(1989),女,硕士研究生,研究方向为利用光谱技术检测食用油的成分(E-mail)410451112@qq.com。

郑 晓,教授(E-mail)zhengxiao@whpu.edu.cn。

TS225.1;TS207.7

A

1003-7969(2017)04-0072-04

猜你喜欢

植物油波长预处理
求解奇异线性系统的右预处理MINRES 方法
杯中“日出”
QuEChERS-气相色谱-质谱法测定植物油中16种邻苯二甲酸酯
高COD二噻烷生产废水预处理研究
环境温度和驱动电流对LED的峰值波长的影响
LED峰值波长对多光谱组合白光色参数的影响
基于预处理MUSIC算法的分布式阵列DOA估计
中国食用植物油供需平衡表
中国食用植物油供需平衡表
植物油种类及掺杂的荧光光谱鉴别研究