APP下载

基于高光谱成像技术的水果表面农药残留无损检测

2021-01-25贾世杰

食品与机械 2021年1期
关键词:波长光谱水果

张 萌 贾世杰

(1.吉林铁道职业技术学院电气工程分院,吉林 吉林 132200;2.大连交通大学电子信息工程学院,辽宁 大连 116028)

农药为世界农业的发展和粮食可持续供应提供了极大帮助[1]。中国作为一个农业大国,每年农药使用量超过50万t,居世界第一,是世界平均水平的2.5倍。进入21世纪以来,食品安全逐渐成为社会关注的焦点[2]。由于农药的广泛使用会直接或间接进入人体,危害人体健康,因此农药残留检测已成为重中之重。

目前,常见的食品农药残留检测方法主要为气相色谱法、液相色谱法、气质联用法、液质联用法等,而基于高光谱成像技术的水果表面农药残留无损检测技术研究较少。杨昌标等[3]采用液相色谱—串联质谱分析法快速检测出西红柿中的18种残留农药,该方法具有良好的线性关系,且在批量样品的检测中既快速又稳定。薄璐等[4]在视觉成像技术的基础上,提出了一种番茄表面农残无损检测方法,该方法具有良好的无损检测性能,提高了番茄表面农残的检测能力。姚云恒等[5]提出了一种使用气相色谱—质谱分析技术快速测定苹果梨中19种残留农药的方法,该检测方法简便、准确,适用于苹果梨中19种残留农药的筛选和测定。张晶等[6]建立了一种气相色谱—质谱分析方法,用于检测蔬菜中的8种氨基甲酸酯农残,该检测方法灵敏度高、操作简便、定性和定量分析准确可靠,在植物氨基甲酸酯的检测中准确率较高且稳定。徐洁等[7]提出了一种哈密瓜表面农残判别分析方法,并验证了该检测方法的准确性。李增芳等[8]提出了一种用高光谱成像技术对赣南脐橙样品农药残留进行无损检测,并验证了该检测方法的准确性。赵曼彤等[9]提出了一种利用高光谱成像技术对香梨表面低农残进行检测,通过多元线性回归法建立农残检测模型,并验证了该检测方法的准确性。以上检测技术不仅操作复杂、耗时长等,甚至还会破坏样品,因此需要寻找更加快速、精确、高效的农残无损检测技术。

试验拟基于高光谱成像技术,提出细菌群体趋药性(BCC)算法和最小二乘支持向量机(LS-SVM)算法相结合建立水果表面农残检测模型,通过对采集数据进行预处理和特征提取,建立农药残留浓度检测模型,并与改进前进行试验对比,验证该方法的优越性和准确性,旨在为水果表面农残的无损检测提供依据。

1 系统概述

高光谱成像技术是计算机技术和光学技术的结合。由于其丰富的图像信息和光谱数据,近年来已被应用于医学和农业领域。原始图像所包含的光谱信息不仅仅是特定像素,还有特定波长的图像信息。高光谱成像平台主要由高光谱相机(CCD相机、光谱仪、镜头)、光源(紫外线灯、卤素灯)、电动平台和控制计算机等组成(见图1),采用推扫成像原理,高光谱相机使用分束器将宽波混合反射光散射为各种频率的单波长光。

2 食品表面农残无损检测

2.1 光谱数据预处理

使用标准正态变换(SNV)结合去趋势算法完成数据预处理,用SNV校正由粒子散射导致的误差[10],其原理是每个光谱中不同波长的吸收是不同的,因此有必要校正每个原始光谱,并按式(1)进行计算。

(1)

式中:

XiSNV——第i条光谱经SNV处理后的数据。

去趋势主要解决SNV校正光谱数据中基线漂移问题[11],即使用多项式拟合光谱的吸收率和波长以获得趋势线,用SNV校正光谱数据减去趋势线。

1.CCD 相机 2.光谱仪 3.镜头 4.紫外灯 5.卤素灯 6.试验样本 7.电动平移台 8.光源控制箱 9.电动平移台控制箱 10.计算机图1 高光谱成像采集系统Figure 1 Hyperspectral imaging acquisition system

2.2 特征波长的选择

高光谱图像含有大量光谱数据,由数百个波段构成,并且每个波段都高度相关[12]。对整个频带进行分析和建模不仅会影响试验的准确性,而且计算量大大增加,降低了建模的速度[13]。故采用主成分分析(PCA)和连续投影算法(SPA)提取光谱数据的特征波长进行比较分析。

2.2.1 PCA特征提取 PCA具有降维和降噪的效果。降维后得到一组新的自变量,这些自变量将原始变量的所有信息最大化。处理后的图像如式(2)所示[14]。

(2)

式中:

Pcm——第m个主成分图像;

Ii——第i波段对应的图像;

αi——第i波段图像权重系数;

n——图像的数量。

第一个主成分包含最原始的信息,贡献最大。通常前10个主成分图像的累积贡献为原始图像的99%。因此,只要选择适当的主成分图像,就可以获得高光谱数据的特征波长。

2.2.2 SPA特征提取 SPA可以从光谱信息中充分找到冗余信息最低的变量组,减少信息重叠。同时,减少建模中使用的变量数量,从而提高建模的速度和效率[15]。SPA算法的主要原理是:设置Xn×m为光谱矩阵,其中n为样本数,m为光谱波长数,N为需选择的变量数。

(1) 首先选取j列光谱矩阵xj,初始迭代向量为xk(0)。

(2) 将剩余的光谱数据放入集合S中,S={j,1≤j≤J,j∉[k(0),…,k(n-1)]}。

(3) 计算xj在剩余列向量上的投影,如式(3)所示[16]。

(3)

(4) 记k(n)=arg[max(‖pxj‖)],j∈s,同时令xj=pxj,j∈s。

(5) 令n=n+1 ,若n

对于每个k(0)和N,在一个周期后进行多元线性分析,获得的最小预测标准偏差为k(0)和N对应的最优值。

2.3 数学模型

2.3.1 LS-SVM算法 LS-SVM解决了SVM算法在处理大量数据时训练速度较慢的问题,大大节省了收敛时间[17]。LS-SVM是处理小样本集的最合适算法之一,该算法可以从有限数量的样本中提取信息并预测未知数据[18]。

LS-SVM使用非线性映射函数φ(x)来建立方程,并使用拉格朗日算子求解最优化问题。根据Mercer条件,映射函数φ(x)和核函数K(xi,xj)的对数函数如式(4)所示[19]。

φ(xk)Tφ(x1)=K(xk,x1),

(4)

式中:

xk——第k个输入样本。

文中采用RBF核函数:

(5)

LS-SVM算法的函数方程如式(6)所示[20]。

(6)

式中:

αk——Lagrange乘子;

b——偏差参数。

2.3.2 BCC-LS-SVM算法 LS-SVM算法通常使用RBF内核函数。采用两步网格搜索和留一法确定RBF内核参数,对RBF函数的正则化参数γ和核参数σ2进行优化[21]。γ和σ2反映了算法的学习能力和泛化能力。

BCC算法是一种群体智能算法。细菌不仅依靠自身行为产生的信息,而且优化周围细菌运动产生的信息。BCC算法具有全局搜索功能、收敛速度快、精度高等优点。该方法提高了支持向量机参数选择的效率,避免了人工参数设置的不足,大大缩短了优化时间。

文中提出了基于BCC改进的LS-SVM算法,通过BCC找到最优的γ和σ2。BCC-LS-SVM算法的基本步骤:

(1) 初始化。初始细菌种群、位置、优化参数的限制、初始迭代次数和最大迭代次数等。

(2) 计算参数T0、b1、tc,如式(7)所示[22]。

(7)

式中:

T0——与计算精度ε有关的时间参数;

tc——与细菌在运动方向上的旋转角度有关的细菌移动时间;

b1——与维度无关的参数。

(3) 根据细菌的位置对LS-SVM模型进行训练,对初始目标函数值进行评估,记录最大目标函数及其对应的正则化参数γ和核参数σ2[23]。

(4) 通过BCC算法找到最佳的γ和σ2,为每种细菌计算新位置,并对细菌种群进行更新。

(5) 确定最佳细菌并求得最佳函数值。

(6) 如果前后函数值的差的绝对值小于给定精度或达到最大迭代次数,则执行下一步,否则跳到步骤2.3.2(3)。

(7) 使用最佳细菌位置(γ和σ2)作为LS-SVM模型中的参数。

BCC-LS-SVM算法流程图如图2所示。

图2 BCC-LS-SVM算法流程Figure 2 BCC-LS-SVM algorithm flow

3 结果与分析

3.1 试验设备

CCD相机:ORCA-R2型,日本滨松公司;

光谱仪:V10E-QE型,芬兰SPECIM公司;

超亮紫外线灯:ML3500型,美国SP公司;

光纤卤素灯:DCR III型,150 W,德国肖特公司。

3.2 试验分析

以哒螨灵农药为试验对象,对80份水果样品进行洗涤,置于通风处干燥[24]。随机分为4组,每组20份。从每组中随机选择8个样本作为训练数据,共选择32个样本,其余48个样本作为测试集。提取全光谱数据的特征波长后,PCA提取的特征波长分别为500,580,680,850,930,980 nm;SPA提取的特征波长分别为461,549,600,680,740,830,900,960 nm。建立LS-SVM和BCC-LS-SVM检测模型,输出数据在样本类别中。水果表面上哒螨灵残留浓度(V哒螨灵∶V水)可分为4类[25]:1∶400,1∶800,1∶1 500以及无哒螨灵残留。

3.2.1 LS-SVM模型试验分析 使用PCA、SPA提取的特征波长作为输入数据,建立LS-SVM模型判别水果表面农药残留浓度。基于PCA特征波长的LS-SVM判别水果表面农药残留浓度如图3所示。由图3可知,基于PCA特征波长的LS-SVM模型成功预测了43个样本,准确率为89.58%。

图4为基于SPA特征波长的LS-SVM判别水果表面上的残留农药浓度,其成功预测了44个样本,每种类型吡哒螨均存在误判,准确率为91.67%。

比较图3、4可知,基于PCA和SPA的LS-SVM模型检测水果表面农药残留浓度准确度分别为89.58%,91.67%,采用SPA的模型优于PCA的。这是因为采用SPA算法挑选出的有效波长能充分代表原始光谱的有效信息,预测效果较好。因此,将LS-SVM模型应用于水果表面残留农药检测的连续投影更为有效。

3.2.2 BCC-LS-SVM模型试验分析 使用PCA和SPA提取的特征波长作为输入数据,建立BCC-LS-SVM模型,用于水果表面农药残留浓度的判别,基于PCA特征波长结合改进的最小二乘支持向量机模型(BCC-LS-SVM)检测水果表面农药残留如图5所示。由图5可知,基于PCA的特征波长的BCC-LS-SVM成功预测了45个样本,准确率为93.75%。

图6为基于SPA的特征波长信息的BCC-LS-SVM模型检测水果表面上的残留农药浓度。由图6可知,该模型成功预测了47个样本,准确率为97.92%。

比较图5、6可知,基于PCA和SPA这两种特征波长提取方法建立的改进的最小二乘支持向量机模型(BCC-LS-SVM)可以检测水果表面上残留的农药浓度,准确率分别为93.75%,97.92%,SPA选择特征波长的模型精度高于PCA的。因此,BCC-LS-SVM模型可用于检测水果表面残留的农药浓度,其中连续投影更为有效。

图3 基于PCA的LS-SVM模型判别图Figure 3 PCA based LS-SVM model discriminant graph

图4 基于SPA的LS-SVM模型判别图Figure 4 SPA based LS-SVM model discriminant graph

图5 基于PCA的BCC-LS-SVM模型判别图Figure 5 PCA based BCC-LS-SVM model discriminant graph

图6 基于SPA的BCC-LS-SVM模型判别图Figure 6 SPA based BCC-LS-SVM model discriminant graph

3.2.3 不同模型对比分析 特征波长提取方法分别选择PCA和SPA,并分别使用LS-SVM和BCC-LS-SVM进行建模,预测模型的结果见表1。由表1可知,基于连续投影法(SPA)的特征波长的检测模型整体精度高于基于主成分分析(PCA)的特征波长的检测模型,说明连续投影法的特征提取效果极好。在SPA特征波长下,BCC-LS-SVM模型的准确度为97.92%,优于LS-SVM模型,是因为BCC算法找到最优的正则化参数和核参数,使BCC-LS-SVM模型更加精准。

4 结论

试验表明,在高光谱成像中,连续投影结合BCC-LS-SVM模型可以有效地检测水果表面上残留的哒螨灵浓度,且优于LS-SVM模型,通过BCC算法找到最优的LS-SVM模型参数,将检测准确率从93.75%提高至97.92%。该检测方法仍处于起步阶段,后续将不断改进检测模型的性能,完善基于高光谱成像技术的水果表面残留农药的无损检测方法。

表1 不同建模结果对比Table 1 Comparison of different modeling results

猜你喜欢

波长光谱水果
基于三维Saab变换的高光谱图像压缩方法
杯中“日出”
高光谱遥感成像技术的发展与展望
使用滤波器和探测器阵列的光纤陀螺光源平均波长漂移监测
基于针孔阵列型的单次曝光双波长叠层成像*
四月里该吃什么水果
水果篇之Cherry
水果畅想曲
基于GPU的高光谱遥感图像PPI并行优化
苦味酸与牛血清蛋白相互作用的光谱研究