APP下载

苹果可溶性固形物的可见/近红外无损检测

2020-10-22孟庆龙尚静黄人帅陈露涛张艳

食品与发酵工业 2020年19期
关键词:波长预处理光谱

孟庆龙,尚静,黄人帅,陈露涛,张艳

1(贵阳学院 食品与制药工程学院,贵州 贵阳,550005) 2(贵阳学院 农产品无损检测工程研究中心,贵州 贵阳,550005)

我国是水果生产大国,其中苹果的种植面积以及总产量排名世界第一,但是因我国苹果的采后分级技术相对落后,使其品质难以把控,不能满足高端市场的需求。水果果实的可溶性固形物含量(soluble solids content, SSC)是衡量水果口感和营养价值的关键指标,也是判断水果成熟度的主要依据,所以检测苹果的SSC对于判断其内部品质和采收时间具有非常重要的意义。

近年来,诸多学者采用折射仪测量果汁的糖度来获取水果的SSC[1-2],该方法的最大缺点就是有损检测,需要破坏被检测对象,而基于高光谱成像技术的无损检测恰好可以弥补不足。高光谱成像技术集图像信息和光谱信息于一体,具有分析速度快、无污染、无损伤等优势,深受国内外学者的青睐,被广泛应用于工业[3]、食品业[4-9]、农业[10-11]等领域。近年来,国内外科研工作者已利用高光谱技术开展了关于猕猴桃[1,12]、梨[13-15]、荔枝[16]和蓝莓[17-18]等水果SSC的无损检测研究,并取得了较好的研究成果。而采用高光谱成像技术结合误差反向传播(error back propagation, BP)网络以及多元线性回归(multiple linear regression, MLR)对苹果SSC的无损检测研究相对较少。

本文采用高光谱图像采集系统采集采后储藏期间“富士”苹果的高光谱图像,并提取感兴趣区域的反射光谱;应用连续投影算法(successive projection algorithm,SPA)和竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)对预处理后的光谱数据进行降维,最终基于特征光谱建立了预测苹果SSC的BP网络模型以及MLR模型,以期为苹果SSC的检测提供一种快速、无损的方法。

1 材料与方法

1.1 材料与仪器

新鲜“富士”苹果,购买于超市,选取表面无损伤的苹果120个,将其编号储藏在室温(22±2)℃条件下,取样间隔为1 d,每次取样30个,共取样4次,这样目的是使建立的预测模型可以预测范围相对较大的SSC值,增加其适用性。

高光谱图像采集系统(GaiaField-F-V10),四川双利合谱科技有限公司,系统结构如图1所示。

1-CCD相机;2-成像光谱仪(图像空间分辨率为696×700); 3-镜头;4-溴钨灯光源;5-电动平移台;6-暗箱;7-高性能计算机图1 高光谱图像采集系统示意图Fig.1 Schematic diagram of hyperspectral imaging acquisition system

ATAGO PAL-α数字手持袖珍折射仪,日本Atago公司;TD4Z-WS台式低速离心机,湖南湘立科学仪器有限公司;JYZ-V911榨汁机,九阳股份有限公司。

1.2 试验方法

1.2.1 高光谱图像采集与校正

将苹果样品放在暗箱中的电动平移台上,调整采集系统的参数确保能采集到清晰又不失真的高光谱图像。相机的曝光时间是9.5 ms,苹果样本距离镜头约40 cm,电动平移台的移动速度是1.35 cm/s。然后,对待检测样本逐一扫描,采集所有苹果样本的高光谱图像。最后,采集全白和全黑的标定图像对原始高光谱图像进行校正。

1.2.2 苹果SSC的测定

在获取苹果高光谱图像后立即进行SSC的测定。先将苹果样本切成小块后榨汁,于3 000 r/min下离心5 min,然后将苹果汁涂抹在折光棱镜的镜面上,连续按测量键按钮多次,当最后液晶显示屏3次显示值一致时记录该值,每个样本分别测量多次的平均值作为其实测值。

1.2.3 样本集划分

采用基于联合X-Y距离的样本划分法(sample set partitioning based on joint x-y distances,SPXY)[19]将120个苹果样本划分为90个校正集样本和30个预测集样本。苹果SSC的统计结果见表1。从表1可知,校正集中苹果样本SSC相比预测集具有较宽的范围,有助于后续建立良好的预测模型。

表1 苹果可溶性固形物含量的统计结果Table 1 Statistics results of SSC of apples

1.3 光谱分析及模型评价

1.3.1 光谱预处理

在建模之前需对光谱数据进行预处理,试验采用二阶导数(second derivative, SD)、标准正态变换(standard normal variation, SNV)、多元散射校正(multi-scatter calibration, MSC)3种光谱预处理方法[20]对光谱数据进行预处理,并比较它们对全光谱模型的影响。光谱数据处理在ENVI 5.4和MATLAB R2016b软件平台中完成。

1.3.2 建模方法及模型评价

试验采用SPA和CARS对原始光谱数据进行降维。采用BP网络和MLR建立苹果SSC的预测模型,其中BP网络是一种多层前馈神经网络,其输入信号从输入层经隐含层到输出层,能够实现输入与输出之间的高度非线性映射,而MLR是建立自变量X(光谱数据)和因变量Y(SSC实测值)之间的线性回归方程。以校正集的相关系数(rc)及其均方根误差(root mean square error of calibration set,RMSEC)和预测集的相关系数(rp)及其均方根误差(root mean square error of prediction set,RMSEP)作为判别模型性能的指标。

2 结果与分析

2.1 光谱反射率及预处理

苹果样本的原始光谱以及经过SNV、MSC和SD预处理后的反射光谱(感兴趣区域为整个苹果样本)如图2所示。为了进一步分析3种光谱预处理方法(SNV、MSC和 SD)对BP网络预测模型的检测效果,分别将原始光谱以及经过3种光谱预处理后的光谱输入BP网络模型中建模,其结果如表2所示。从表2可知,经SD预处理后建立的BP预测模型具有最高的rp(0.87)以及最小的RMSEP(0.52),说明相比于SNV和MSC,SD光谱预处理方法更好,因此本文采用SD对原始光谱数据进行预处理。

2.2 光谱数据降维

2.2.1 采用SPA筛选特征光谱

采用SPA筛选特征光谱时,计算不同有效波长对应的RMSEP,常常依据最小的RMSEP值选定最有效的特征光谱。RMSEP随SPA中有效波长数的变化规律如图3-a所示,RMSEP值随有效波长数的增加而减小,当有效波长数超过5时,RMSEP变化不明显,因此选取5个波长作为特征光谱,采用SPA选取的5个特征光谱分布如图3-b所示。

a-原始光谱;b-SNV预处理;c-MSC预处理;d-SD预处理图2 经过不同光谱预处理后得到的反射光谱Fig.2 Reflectance spectra after different spectra preprocessings

表2 基于不同光谱预处理方法的BP模型对苹果 可溶性固形物含量的检测结果Table 2 SSC prediction results of apples by BP model based on different spectra preprocessing methods

a-RMSEP随SPA中有效波长数的变化规律; b-选取的特征波长图3 基于SPA算法从全光谱中提取特征波长Fig.3 Characteristic wavelengths selection from full spectra by SPA algorithm

2.2.2 采用CARS筛选特征光谱

在采用CARS筛选特征光谱时,将蒙特卡洛采样次数设定为50次,利用5折交叉验证法计算所建立的PLS模型中的交叉验证均方根误差(root mean square error of cross-validation,RMSECV),结果如图4所示。从图4-a可知,RMSECV值随着采样次数的增加呈先减小后增加的趋势,当采样次数达到19时,RMSECV值最小,本文得到的最优波长集包含有43个特征波长,提取的特征光谱分布如图4-b所示。

a-不同采样次数下RMSECV的变化规律; b-选取的特征波长图4 基于CARS算法从全光谱中提取特征波长Fig.4 Characteristic wavelengths selection from full spectra by CARS algorithm

2.3 BP网络模型建模结果

分别将经SPA和CARS筛选的特征光谱输入BP网络模型以及MLR模型中,基于不同波长选取方法的BP网络模型以及MLR模型对苹果SSC的检测结果见表3。

表3 基于不同波长选取方法的BP和MLR模型对苹果 可溶性固形物含量的检测结果Table 3 SSC prediction results of apples by BP and MLR model based on different variable selection methods

从表3可知,SPA-BP模型具有最高的rp(0.87)和最小的RMSEP(0.52),说明SPA-BP模型具有最好的预测性能。SPA-MLR模型的校正性能和预测性能均劣于SPA-BP模型。虽然CARS-MLR模型的校正性能较好(rc=0.95,RMSEC=0.33),但是其预测性能劣于SPA-BP模型。另外采用SPA特征波长选择方法从256个全光谱波段中提取了5个特征变量作为BP网络的光谱输入,明显提升了BP网络模型的运行效率。由此表明基于SPA提取的特征光谱建立的BP网络模型对苹果SSC的无损检测具有良好的预测能力,可实现苹果SSC的快速无损检测。苹果SSC的实测值和预测值如图5所示。

图5 苹果可溶性固形物含量的预测结果Fig.5 Prediction results of SSC of apples

3 结论

(1)原始光谱中除了包含自身有用信息外,外界不确定因素(如光的散射以及环境噪声等)也会对建模效果产生一定影响,因此通过综合比较3种光谱预处理方法(SD、SNV和MSC)对预测模型的检测效果表明,SD预处理方法相比于SNV和MSC更好。

(2)为解决高光谱成像技术在水果品质无损检测中存在数据量冗余的难题,对预处理后的光谱数据降维,结果表明,应用SPA和CARS分别从256个全光谱中筛选了5个和43个特征波长,明显提升了预测模型的运行效率。

(3)为得到苹果SSC最优预测模型,采用BP网络模型和MLR模型对SPA和CARS算法提取的特征光谱分别建模,结果表明:基于特征光谱建立的SPA-BP网络模型预测性能最优,其相关系数rp为0.87,均方根误差RMSEP为0.52,可应用于苹果SSC的无损检测。

猜你喜欢

波长预处理光谱
基于三维Saab变换的高光谱图像压缩方法
一种波长间隔可调谐的四波长光纤激光器
求解奇异线性系统的右预处理MINRES 方法
基于3D-CNN的高光谱遥感图像分类算法
杯中“日出”
高光谱遥感成像技术的发展与展望
污泥预处理及其在硅酸盐制品中的运用
基于针孔阵列型的单次曝光双波长叠层成像*
基于预处理MUSIC算法的分布式阵列DOA估计
苦味酸与牛血清蛋白相互作用的光谱研究