APP下载

近红外高光谱的脐橙粒化检测研究

2022-05-06刘燕德李茂鹏崔惠桢

光谱学与光谱分析 2022年5期
关键词:粒化脐橙波长

刘燕德, 李茂鹏, 胡 军, 徐 振, 崔惠桢

华东交通大学智能机电装备创新研究院, 江西 南昌 330013

引 言

脐橙属于柑橘的优良品种, 各国竞相栽培育种, 种植地区几乎遍布全世界, 是最受人们欢迎的水果之一, 深受人们喜爱[1]。 消费者大多喜欢汁水充足, 酸甜可口的脐橙, 但是人们也会偶尔吃到嘴里有渣的脐橙果肉, 并有干瘪苦涩的口感, 这种脐橙即脐橙粒化。 脐橙粒化会导致脐橙失水, 果肉呈颗粒状, 甜度降低, 粒化严重的脐橙会严重影响口感, 甚至丧失食用价值, 从而影响中国脐橙产业的快速发展。 脐橙采摘期和贮藏期都容易发生果实粒化。 粒化脐橙与无粒化脐橙混杂, 在选购脐橙时难以区分以至于降低商家信誉, 影响消费者的食用体验。 脐橙作为我国出口量较大的水果之一, 对其内部品质检测难度大的问题亟需解决。 脐橙粒化传统检测主要是人工筛查, 但需要丰富的经验, 且存在较大的误判率, 并且难以对脐橙粒化程度进行区分。 探索一种无损、 快速脐橙粒化程度的检测方法, 可以大大降低人力物力, 规范市场, 同时对脐橙商品的出口、 流通具有重大意义[2]。

高光谱图谱合一, 包含丰富的信息, 随着光谱技术的不断完善与发展, 研究者们将高光谱技术广泛应用于果蔬行业的品质检测, 高光谱成像技术在果蔬品质安全检测领域的应用已日臻完善且应用效果较为理想[3]。 Liu等[4]探究使用近红外高光谱成像装置检测猕猴桃早期隐性损伤, 采用基于核函数的偏最小二乘(kernel partial least squares, KPLS)对高光谱波段进行降维, 并结合多种算法进行建模, 最佳精度达到98.27%, 验证了高光谱技术用于猕猴桃的早期隐性损伤检测可行性。 Jan Steinbrener等[5]使用高光谱成像技术结合卷积神经网络对RGB图像数据进行训练, 对颜色形状相类似的水果和蔬菜进行分类, 正确率达到92.23%。 Pu等[6]以香蕉为研究对象, 利用高光谱成像技术对香蕉成熟程度进行检测, 根据特征波段(650, 705和740 nm)建立的偏最小二乘判别分析(partial least squares discriminant analysis, PLS-DA)模型总分类准确率为93.3%, 研究表明香蕉成熟度的判别可以通过高光谱技术实现。 高升等[7]以红提可溶性固形物为研究指标, 同时采集红提的光谱信息和图像信息, 并建立PLSR和最小二乘支持向量机(least squares support vector machines, LS-SVM)检测模型, 提出一种图像和光谱信息结合的糖度检测模型, 建立的LS-SVM预测集相关系数为0.954。 Zhang等[8]利用主成分分析对含有各种缺陷的南丰蜜桔进行定性分类, 分类准确率达到96.63%。 以上研究表明, 高光谱成像技术可以广泛应用于水果和蔬菜的质量和品质分级检测。

以江西特产——赣南脐橙作为研究对象, 探究利用高光谱技术结合多种化学计量学方法识别赣南脐橙粒化程度的可行性。 通过建立PLS-DA[9]和LS-SVM[10]模型并评选出最优模型, 结果表明高光谱检测技术可应用于脐橙粒化的检测, 根据建立的脐橙粒化检测模型, 可实现对脐橙品质准确分级。

1 实验部分

1.1 材料

研究对象选用江西独有的脐橙品种——赣南脐橙。 赣南脐橙在中国脐橙界享有很大的知名度, 畅销国内外, 是深受人们喜爱的脐橙品种之一。 实验样本采摘于江西省赣州市于都县的一个商业果园。 样本包含三种不同粒化程度(无、 轻度、 中度); 重度粒化(粒化面积大于50%)[11]样本无食用价值, 且能通过肉眼轻易分辨, 故不作研究。 样本经采摘后均用纱布洗净擦干后储存在温度控制为5℃的冰箱, 图像和光谱信息采集之前需将脐橙样品取出放置2~3 h, 以达到正常室温。 由于肉眼无法直接观察判断粒化程度, 所以在采集光谱前需要给每个脐橙编号, 采集完光谱信息后, 再将脐橙切开, 观察粒化程度; 其中无粒化(粒化面积为0%); 轻度粒化(粒化面积小于25%); 中度粒化(粒化面积25%~50%)。 图1为采用的三种不同粒化程度的赣南脐橙。

最后挑选出无粒化、 轻度粒化、 中度粒化各58个脐橙样品。 由于脐橙粒化均从底部产生, 每个脐橙选择底部三个不同位置提取平均光谱, 每类174个样本, 共计522个样本。 利用Kennard-Stones算法将样本按照3∶1分成训练集和测试集, 其中每类训练集为131个样本, 测试集为43个样本, 不同粒化程度的脐橙训练集和预测集区分及样本编号如表1所示。

表1 不同粒化程度脐橙的训练集和预测集区分以及样本编号

1.2 装置及参数

实验用双利合谱公司“GaiaSorter”盖亚高光谱成像系统如图2所示, 该装置主要由三部分组成: 成像镜头、 成像光谱仪、 探测器。 采用短波近红外相机的光源波长范围为397.5~1 014 nm, 共计176个波长。 在光谱采集过程中, 为保证图像的清晰度, 将相机曝光时间和电动平移台速度分别设置为15 ms和18 mm·s-1, 分辨率设置为15 ms, 回程速度设置为20 mm·s-1。

图2 高光谱设备成像装置

1.3 高光谱图像采集

采用SpecView软件对不同粒化赣南脐橙样品进行图像采集, 为得到清晰的光谱图像, 系统参数设置后需对图像进行调焦处理。 样品放置在电动平移台的果杯上, 底部朝上且与工作平面平行, 脐橙底部朝向相机镜头。 在原始光谱图像采集后应利用白、 暗基准进行校正, 以避免各波段信息分布不均以及CCD相机存在暗电流效应对图像质量的影响[8]。 在光谱图像校正之前需获得校正参比, 获取参比主要步骤如下: 首先用黑色的盖子盖住CCD相机镜头采集一段全黑图像, 然后去掉镜头盖采集白色参比板的白色参考图像, 利用该图像对样品原始图像进行校正, 校正后的高光谱图像计算如式(1)所示。

(1)

式(1)中,HB,BW和Iλ分别为黑色参考、 白色参考和原始光谱数据。 待对所有光谱图像校正完毕后, 利用ENVI4.5软件在每个脐橙底部均匀选择三个不同的位置, 选择含有1 000个像素点的感兴趣区域(region of interest, ROI)并提取平均光谱, 进行后续分析处理。

1.4 模型评价标准

首先通过高光谱系统采集不同粒化程度脐橙样品的高光谱图像, 并使用ENVI4.5软件提取光谱数据; 在Unscrambler中采用多种预处理方法对原始光谱进行处理, 并建立PLS-DA模型进行评价, 评选最优的预处理方法。 利用多种波长筛选方法对最优预处理之后的光谱数据进行筛选, 建立对应的PLS-DA和LS-SVM检测模型。 模型评价参数为不同粒化程度脐橙鉴别的误判率及总误判率, 误判率是判错样本个数占总个数的比例, 误判率越低, 建模效果越好。 图3为三种不同粒化程度脐橙鉴别流程图。

图3 不同粒化程度脐橙模型建立流程图

2 结果与讨论

2.1 不同粒化程度脐橙的高光谱响应特性对比与分析

高光谱的波长范围为397.5~1 014 nm, 共计176个波段点。 图4为三种粒化程度脐橙的原始平均反射率光谱, 每条光谱代表1 000个像素点的信息。 从图4可知, 三条光谱变化趋势大致相似, 整体上随着粒化程度的加深, 平均光谱反射率会增大, 中度粒化脐橙的平均反射率最大。 400~500 nm波段反射率呈下降趋势, 500 nm处存在一个波谷, 这是因为果皮对类胡萝卜素的光吸收引起的, 500~820 nm波段, 平均反射率单调递增, 在820~1 014 nm之间反射率呈下降趋势且在980 nm波长处有一个波谷, 这可能是由于水分子中O—H键三级倍频的拉伸振动引起的反射率变化, 此处中度粒化脐橙平均反射率>轻度>无粒化[12]。

图4 三种粒化程度脐橙的原始平均反射率光谱图

2.2 高光谱特征变量选择

高光谱包含176个波长, 信息较多, 为了降低实验误差去除噪声, 先采用多种预处理方法处理原始光谱并建立PLS-DA模型评价预处理方法的稳定性。 多种预处理方法未能提高数据精度, 降低误判率, 故尝试采用降维和多种波长筛选方法降低数据维数, 去除无用信息, 提取有效光谱变量信息。

2.2.1 基于PCA的降维方法

主成分分析(principal component analysis, PCA)是常用的数据降维方法之一, 变换后的变量空间是原变量空间变量的线性组合, 并能代表绝大部分信息[13]。 图5为前20个主成分对脐橙高光谱的累积贡献率, 最大主成分因子数设置为20, 当选择6个主成分时, 新的变量空间能代表99%以上原始光谱的信息, 故采用6个主成分因子作为后续建模的输入。

图5 前20个主成分对脐橙高光谱的累积贡献率

2.2.2 基于SPA的特征波长筛选

连续投影算法(successive projections algorithm, SPA)是一种前向循环选择方法, 根据计算不同样本子集的多元线性回归模型的均方根误差获得最佳样本集, 通过向量投影, 选择最小的冗余度和共线性的有效波长[14]。 本模型在MATLAB2014b中建立, 设定最小挑选变量数为10最大挑选变量数为40。 图6是基于SPA算法对样品光谱波段筛选之后的结果, 其中横、 纵坐标分别代表波长和平均光谱反射率。 利用SPA算法在原始光谱176个变量中挑选出17个变量, 与原始光谱相比, 波长数目减少90.34%, 在一定程度上能够消除冗余信息, 使模型得到简化, 后续将使用经SPA挑选后的变量用于模型建立。

图6 SPA波长变量选择结果

2.2.3 基于UVE的特征波长筛选

无信息变量消除(uninformative variable elimination, UVE)方法是建立在偏最小二乘法(PLS)回归系数基础上的波长筛选方法, 采用回归系数来衡量波段的显著性[15]。 图7为样品光谱经过UVE波长筛选的结果, 平行于X轴的两条平行线表示的是UVE波长筛选的阈值, 以光谱矩阵处稳定性最大值的99%作为阈值分隔线, 值为±35.998 3, 稳定性在阈值分隔线内的变量将会被剔除, 取阈值分隔线之外的变量作为输入变量。 176个光谱变量经过UVE筛选后剩下55个变量, 约占原始数据的30.68%, 使模型得到简化。

图7 UVE变量筛选稳定性结果图

2.3 不同粒化程度脐橙的高光谱PLS-DA模型建立

建模之前采用PCA降维方法和SPA、 UVE算法对全光谱进行波长筛选, 然后建立PLS-DA模型并比较建模效果。 如表2为不同波长变量选择方法的PLS模型结果对比, 经UVE算法筛选波长后, 建立的PLS-DA模型效果罪佳, 建模集的相关系数Rp和均方根误差RMSEP分别为0.895和0.261, 主成分个数为7, 误判率最低为5.38%。

表2 基于不同降维方法的PLS-DA模型的比较

2.4 不同粒化程度脐橙的高光谱LS-SVM模型建立

LS-SVM常采用径向基核函数(RBF-Kernel)和线性核函数(Lin-Kernel)两种核函数建立模型,γ和σ2是LS-SVM模型评价的重要参数。 如表3为不同降维方法分别基于两种核函数建立的LS-SVM模型结果对比, 结果表明: Lin核函数的效果低于RBF核函数, 经过UVE波长筛选后, 两种核函数的误判率均为最低, 预测集误判率分别为0.78%和1.55%, 说明LS-SVM模型精度优于PLS-DA模型, 建立的较优的UVE-LS-SVM模型。 因此, 使用UVE波长筛选方法可以很好地实现对不同粒化程度赣南脐橙的定性判别。

表3 不同降维方法与LS-SVM方法建立的模型性能比较

如图8为基于RBF-Kernel的UVE-LS-SVM模型预测集结果图, 从图中可以看出, 轻度粒化脐橙样本仅有一例误判为无粒化, 其他样品均准确判别, 综合PLS-DA和LS-SVM两种建模方法, LS-SVM建模效果整体优于PLS-DA。 经UVE变量筛选后的LS-SVM模型误判率最低为0.78%, 因此, UVE-LS-SVM模型更适合对不同粒化程度脐橙进行高精度判别。

图8 基于RBF-Kernel的UVE-LS-SVM模型预测集结果

3 结 论

以赣南脐橙为研究对象, 验证利用高光谱检测技术对不同粒化程度脐橙定性判别的可行性。 分别利用PCA降维方法和SPA、 UVE两种波长筛选方法缩小矩阵空间, 在一定程度上降低数据空间维数。 利用PLS-DA和LS-SVM与不同波长筛选方法结合建立定性判别模型, 结果表明LS-SVM建模效果整体优于PLS-DA, RBF-Kernel核函数效果优于LIN-Kernel核函数, 经UVE波长筛选后的变量结合LS-SVM中RBF-Kernel建模效果最佳, UVE-LS-SVM误判率达到最低为0.78%。 本实验为脐橙粒化提供了一种快速无损的光谱检测方法, 对柑橘品质分级具有重要意义, 也为粒化水果检测提供借鉴。

猜你喜欢

粒化脐橙波长
脐橙连上物联网 扫码便知“前世今生”
水稻丸粒化种子直播方法研究
我国中药材种子丸粒化研究进展△
杯中“日出”
高丹草种子丸粒化配方的筛选
琯溪蜜柚汁胞粒化影响因素及防控技术综述
奉节脐橙
基于频域分析方法的轨道高低不平顺敏感波长的研究
日本研发出可完全覆盖可见光波长的LED光源
秭归脐橙进入收获季