APP下载

基于高光谱技术检测香水梨硬度的研究

2021-08-21孙博康刘贵珊

食品安全导刊 2021年19期
关键词:波长预处理光谱

孙博康,刘贵珊

(宁夏大学 食品与葡萄酒学院,宁夏银川 750021)

香水梨又名软儿梨,属于秋子梨的一个品种,主要分布于甘肃、宁夏境内。在宁夏海原地区,香水梨是当地农民的主要收入来源,近年来种植面积不断扩大,然而目前仍存在很多技术上的问题需要解决[1]。硬度作为梨果的一个重要参数,与香水梨的成熟度,口感,食用性息息相关[2],传统的检测方法具有明显的破坏性,不适用于大规模量产的地区,因此利用光谱学技术建立一种香水梨的硬度检测方法显得尤为重要。高光谱技术作为一种高效、快速、无损的检测技术[3],目前已广泛应用于水果内部指标的检测[4-7]。因此,结合当地需求,本文通过对光谱数据进行4种预处理方法,3种特征波长的提取方法处理后,选择一种最优模型来预测香水梨硬度。

1 材料与方法

1.1 样品采集

实验样品全部来自于宁夏回族自治区海原县方堡村,样品自采摘后于24 h内运输至宁夏大学,在宁夏大学冷库内进行保存,贮藏温度0~2 ℃。样品测试前需将样品从冷库取出,放置在20 ℃恒温条件下24 h,待样品中心温度恢复至20 ℃开始检测。

1.2 数据采集

①光谱采集仪器。Hyper Spec VIS/NIR高光谱成像系统,光谱范围为400~1 000 nm和125波段的超高光谱影像可见/近红外光谱仪系统。包括v10e-qe高光谱影像光谱仪、C8484-05G-CCD-相机、90-254vac线性光源、Dcrih卤素灯、传输装置、计算机和数据采集软件。②硬度检测。硬度计HLY-YD5。③数据处理软件。ENVI5.3,The Unscrambler X 10.4,MATLAB R2014a。以上软、硬件由宁夏大学提供。

2 结果与分析

2.1 PLSR初模型的建立及评价方法

偏最小二乘回归(PLSR)是一种多元回归方法,用于建立分析样品光谱响应与参考值之间的验证模型。相对于其他模型直接考虑因变量和自变量而建立回归模型的方法,PLSR则是重新过滤信息,选择最佳变量,再对筛选出的变量进行建模。因此,其筛选出的光谱值决定了建模成功率的高低。一般来说,评价PLSR模型成功率的指标有3个:预测样本集的标准差(RMSEP)、校正集的均方根误差(RMSEC)、决定系数(R2)。一般情况下,R2值越大,RMSEP和RMSEC越小,表明模型的预测能力越强[8]。

使用ENVI5.3提取香水梨样本的感兴趣区域(Region Of Interesting,ROI)[9]感兴趣区域必需具有一定的代表性,可以代表香水梨样品的硬度指标。为了获得具有代表性的光谱值,在选取ROI时要尽量避免过于灰暗的部分,选择香水梨整体光量部分,记录每个样本ROI的平均光谱。

将每个样品提取出的光谱值和硬度数据导入至The Unscrambler X 10.4,选择PLSR进行初步的模型建立。初始模型效果如图1所示。

图1 初始PLSR建模效果

由图1可知,样品初始模型效果不佳,数据点不连续,R2值为0.782。因此,需要对光谱进行处理后,达到降噪均匀优化光谱的目的,再进行PLSR预测模型。

2.2 光谱预处理

采集到的光谱图像由于光源强度不均匀及噪音等因素的影响,可能在某种程度上会存在基线漂移等现象,为了提取出有效的光谱信号,消除光源强度不均匀的问题,需要对原始光谱数据进行预处理,为后续的光谱数据处理提供更加具有代表性的光谱区域[10]。本文采用以下几种方法进行预处理。

2.2.1 卷积平滑法。

卷积平滑(Savitzky-Golay ,S-G)是一种对光谱进行平滑处理的方式,主要包括移动平均法、高斯滤波法、中值滤波法和S-G卷积平滑法[11]。

2.2.2 归一化法

归一化(Normaliaze)是一种行式转换算法,适用于光谱信号与样品函数关系的分析,或者利用其他光谱值代替样品检测值的方法。通过计算机变换,最终使光谱数据在同一范围内,变量和均值的分布更加均匀[12]。

2.2.3 标准正态变换法

标准正态变换(Standard Normal Variate,SNV)是一种通过样品的方差对光谱进行校正的方法,SNV可以有效的消除光源强度不一、散射噪声等检测时出现的干扰,通过线性变换对初始光谱数据标准化进行校正,减小样本因为表面散射、光谱迁移等因素带来的误差[13]。

经过上述预处理后模型结果如表1所示,归一化法拥有较小的CV值和较大的R2值,表明其对结果的预测效果较好,因此后续的特征光谱提取均采用归一化法作为光谱的预处理方法。

表1 4种光谱预处理的结果对比

2.3 特征波长的提取

2.3.1 竞争性自适应加权算法

竞争性自适应加权算法(CARs)是模仿“适者生存”理论而提出的特征变量选择算法。CARs算法的核心是首先采用自适应重加权采样技术,优选出PLSR模型中绝对值大的回归系数所对应的波长变量点,然后借助指数衰减函数,最后将RMSECV最小的子集定义为最优变量子集[14]。

使用Matlab运行CARs程序多次后,选择CV值最小的波长组作为特征波长,一共12条,将12条特征波长导入Unscrambler后建模得到模型如图2所示,其RMSEC值为0.659,R2为 0.764。

图2 12条特征波长提取后PLSR预测模型效果

2.3.2 区间变量迭代空间收缩法

区间变量迭代空间收缩法(iVISSA)的主旨思想是选择最优区间,然后根据最优选区间再进行建模,该算法来自于VISSA算法,之后结合全局和局部搜索,智能地优化波长的宽度、组合及间隔[15]。在局部搜索上,iVISSA算法使用光谱数据的连续性信息来确定波长间隔的宽度,在全局搜索上,主要搜索信息波长的组合和位置。最终用迭代的方式优化光谱间的数据间隔,确定光谱的组合、位置以及宽度[16]。

使用Matlab运行iVISSA程序多次后,选择CV值最小的波长组作为特征波长,一共66条,将66条特征波长导入Unscrambler后建模得到模型如图3所示,其RMSEC值为0.666,R2为 0.760。

图3 66条特征波长提取后PLSR预测模型效果

2.3.3 变量组合集群分析法

变量组合集群分析(VCPA)是一种新兴的特征变量识别算法,该方法的特点是充分考虑了变量集之间可能存在的影响。方法的计算原理是,首先通过利用二进制矩阵采样法对样本空间进行重采样,之后将数据随机划分为若干子集,针对子集分别建立子模型,最后对子模型一一进行评价[17]。一般情况下,VCPA算法计算过程如下:①先利用二进制矩阵采样法,对样本变量进行采样,选取目标函数CV值最小的变量子集;②计算每个波长点对应的化学值或者实测值,在本次迭代计算过程中出现的概率;③通过衰减函数筛选出概率较小的波长范围或者波长点,达到缩小变量集空间的目的;④最后将保留的变量重复上述过程将剩余变量进行组合,最终得到特征波长变量[17-19]。

使用Matlab运行VCPA程序多次后,选择CV值最小的波长组作为特征波长,共10条,将10条特征波长导入Unscrambler后建模得到模型如图4所示,其RMSEC值为0.351,R2为 0.933。

图4 10条特征波长提取后PLSR预测模型效果

3 结论

对香水梨硬度原始光谱进行了3种预处理后,选择归一化法为最佳方法,以此作为基础光谱,对比3个特征波长建模后的PLSR模型效果,最终选择VCPA法,其提取特征波长10个,建立的PLSR模型优于初始模型,R2=0.933,可以用作一种快速检测香水梨硬度的方法。

猜你喜欢

波长预处理光谱
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
基于三维Saab变换的高光谱图像压缩方法
基于预处理MUSIC算法的分布式阵列DOA估计
双波长激光治疗慢性牙周炎的疗效观察
日本研发出可完全覆盖可见光波长的LED光源
星载近红外高光谱CO2遥感进展
络合萃取法预处理H酸废水
便携式多用途光波波长测量仪
基于自适应预处理的改进CPF-GMRES算法
苦味酸与牛血清蛋白相互作用的光谱研究