高光谱成像技术在农产品无损检测中的应用
2023-02-10熊春晖佘永新
熊春晖,佘永新✉,焦 逊,邵 勇,贾 莉,王 淼,肖 明,王 静
(1. 中国农业科学院 农业质量标准与检测技术研究所,北京 100081;2. 青海大学 农林科学院,青海,西宁 810016)
近年来,近红外光谱技术已经逐渐被应用于农产品的无损检测中。近红外光谱技术可以为原子间的化学键提供振动信息,由于不同化学键在不同环境中对近红外光的吸收波长有明显差别,从而根据原子间化学键的振动信息(拉伸和弯曲)来分析农产品样品的生物化学变化[1-3]。但近红外光谱技术仅能提供光谱信息,不能提供样本的空间信息,从而限制了近红外光谱技术在结构属性研究中的应用[4]。高光谱成像技术(Hyperspectral imaging,HSI)将近红外光谱技术和图像技术相结合,同时获得农产品的光谱信息和图像信息。将获取的图像信息用于检测农产品的外部品质,如纹理、色泽、形态等。光谱信息则用于检测农产品的内部品质和食用安全性。结合了光谱与图像,它可以快速,非破坏性和非接触式的分析单个或多个农产品[5-7]。随着人们对高品质鲜活农产品的需求增加,开发并运用快速、准确、无损的农产品品质与质量安全检测方法具有重要意义。
目前,我国常用的传统农产品品质检测方法,大多以化学分析方法为主,包括蛋白质电泳、标准系列比色法、凯氏定氮法、薄层色谱法、质谱联用法、高效液相色谱法等[8-17],这些方法通常准确度高,精密度好,但也存在许多缺点,例如需要繁琐的前处理过程,检测时间较长,对农产品产生结构性破坏,经济成本较高。高光谱技术作为一种快速发展的农产品无损检测方法,凭借其快速、无损、无污染、可重复的优点,在农产品品质与安全检测方面逐渐凸显其优势,截至目前,高光谱成像技术已经在农产品种质资源表型鉴定、品种优选、品质分级、营养成分快速判定、有毒有害物质筛查与预警等方面进行了诸多研究报道[18-25]。
近年来虽然高光谱成像技术在农产品品质与安全检测方面发展较快,但目前系统阐述基于高光谱成像技术在农产品品质与食用安全性检测等方面的基本原理、研究进展、应用场景等报道相对较少。为了深入了解高光谱成像技术的成像原理和国内外最新的研究成果[2],本研究总结了高光谱成像技术的设备组成和检测机理,并对特征融合、关键检测步骤及相关算法进行归纳。其次,综述了高光谱成像技术在农产品品种分类鉴别、理化性质检测和食用安全性无损检测中的应用场景。同时,针对近五年基于高光谱成像技术进行的农产品检测研究进展进行总结。最后,在此基础上展望了高光谱成像技术在农产品无损检测方面的发展前景。
1 高光谱成像技术进行无损检测的理论基础
1.1 HSI系统的原理及主要组成部分
HSI技术可以在不同的连续波长带下产生大量相同样品的图像。这些不同波长的图像形成一个超立方体,其具有光谱维度(波长λ轴)和两个空间维度(X轴和 Y轴)。空间维度可以描绘每个像素的位置,光谱维度可以描绘每个像素的光谱数据。由于不同特定波长下,对应不同分布的化学成分,成像样品具有不同光谱反射率,从而反映农产品样品的不同化学成分分布。
图1为Specim IQ便携式高光谱成像仪,由软件和硬件两方面组成。硬件包括:三角支架;两个照射样品的光源,为卤素灯;三角支架夹具和相机夹具,固定支架和相机位置;检测器(Specim IQ相机),获取高光谱图像和光谱信息;用于调整焦距的镜头;可供检测器左右移动的中置杆和一个控制检测器拍摄的计算机。所需要的软件都在计算机上,包括高光谱图像的采集软件和可以进行预处理及数据分析的软件。
图1 高光谱成像仪Fig.1 Hyperspectral imager
1.2 图像采集
对于高光谱图像的获取,一般分为点扫描、线扫描和面扫描三种方法。点扫描是在空间维度中(X轴和Y轴)对所有像素逐一扫描并累加,从而形成高光谱图像。对于线扫描,每次沿X轴的空间维度获取一条样本图像,并记录线中所有像素的光谱信息,从而汇集为一个高光谱图像。对于面扫描(波长扫描),区别于以上两种扫描方式,它每次获取单个波长的样品图像,并在每个波长上重复获取图像。最后将所有波长对应的图像叠加从而形成高光谱图像。在三种采集方式中,线扫描是农产品质量分析中最常用的图像获取方式,也非常适用于食品加工的流水线工作[1]。
1.2.1 图像特征融合
在利用高光谱技术获得农产品图像时,颜色、纹理和形态是最常见的特征,它们可以揭示农产品的品质、所受病虫害及其内外部缺陷等信息。这些特征比较容易获取但往往需要结合标准的化学物理检测方法对感兴趣区域进行测量,或者通过专家和经验进行描述。如表1所示,针对农产品最常见的特征有三种分析方法:颜色分析、图像纹理分析和形态学分析,它们可以作为新的特征与光谱信息融合,结合光谱信息来训练模型,能起到提高算法准确性、提高模型稳定性的作用。
表1 图像特征融合分类Table 1 Classification of image feature fusion
1.3 光谱数据信息处理方法
面对大量待扫描的样本,一般按 Kennard-Stone算法[7]将样本随机划分为训练集和预测集,训练集用来估计模型中的参数,使模型能预测其他未知信息。由于高光谱信息量巨大导致光谱表现不佳,可以结合化学计量学算法筛除冗余信息并提取重要信息[2]。
1.3.1 光谱预处理
由高光谱系统采集到的光谱数据除了包含样本有效信息外,还存在背景干扰信息、电流产生的噪声和杂散光干扰等。为建立性能稳定的高光谱预测模型,可以根据产生噪声的不同来源,对高光谱数据进行预处理操作[8]。
使用最广泛的预处理方法包括平滑、归一化、导数、基线校正、标准正态变量(Standard Normal Variate,SNV)、去趋势、多元散射校正(Multiplicative Scatter Correction, MSC)和正交信号校正(Orthogonal Signal Correction, OSC)。目前,常用的平滑方法包括Savisky-Golay平滑滤波器(S-G Filtering)、Gaussian滤波器、平均滤波器和中值滤波器等。也可以将以上预处理方法组合使用,从而提高模型的预测性能。
1.3.2 特征波长提取
特征波长选择是筛选出与目标属性相关的最有效关键波长。然后,基于这些选定的关键波长,进行误差较小的定性或定量研究。优化波长选择的方法有很多,如回归系数(Related Coefficient,RC)、连续投影算法(Successive Projections Algorithm,SPA)、竞争性自适应重加权采样(Competitive Adapative Reweighted Sampling,CARS)、模拟退火(Simulated Annealing, SA)、主成分分析法(Principal Component Analysis,PCA)、无信息变量消除法(Uninformative Variables Elimination, UVE)、随机蛙跳(Random Frog, RF)算法、遗传算法(Genetic Algorithm,GA)等。由于高光谱数据的复杂性,不同的最佳波长选择算法可能会产生不同的结果。因此,在选择最佳波长时,应组合不同预处理方法使用,比较几种不同的算法以获得预测效果最佳的一种。
1.3.3 模型的建立与验证
由于高光谱图像的高维度和多重共线性,需要使用多元分析方法来分析和建立光谱数据与样本目标特征之间的关系。一般来说,多元分析方法分为定量分析和定性分类。
对于定量分析,其目的通常是建立样品中的某个属性与光谱数据之间的关系。通过使用这种回归关系,我们通过该属性在样品内部的分布情况进行定量分析。定量分析方法可以是非线性的,也可以是线性的。典型的非线性定量分析方法主要包括人工神经网络(Artificial Neural Network,ANN)、支持向量机(Support Vector Machine,SVM)和支持向量回归(Support Vector Regression,SVR)。线性分析方法主要包括偏最小二乘回归(Partial Least Squares Regression, PLSR)、逐步线性回归(Stepwise Linear Regression, SLR)和多元线性回归(Multiple Linear Regression,MLR)。常用的预测模型性能评价指标有决定系数(R2)、均方根误差(RMSE)、相对误差(RE)和残差预测偏差(RPD)。一般来说,验证结果较好的预测模型,其训练集和预测集应该有接近1的R2值,大于3的RPD值和尽量小的RMSE、RE。
对于定性分类,一般包括有监督分类和无监督分类。光谱数据分析常用的监督分类方法包括k-近邻(K-Nearest Neighbor, KNN)、ANN、线性判别分析(Linear Discrimination Analysis, LDA)、支持向量机(SVM)和偏最小二乘判别分析(Partial Least Square Discriminant Analyses,PLS-DA)。用于光谱数据分析的典型无监督分类方法包括主成分分析(PCA)、层次聚类和k均值[1]。定性分类后,研究者一般以预测模型的准确度或误判率[9]作为分类效果的评价指标。准确率的指标越接近于100%,误判率越接近于0,代表预测模型的分类效果越明显;若准确率低于70%则可判定识别效果不明显。
2 高光谱成像技术在农产品品质检测中的应用
常用的高光谱波长范围为可见–近红外(400~1 000 nm)、近红外(900~1 700 nm)和短波红外波段(1 000~2 500 nm)三种波段。高光谱成像技术凭借其高信噪比、高稳定性、高分辨率的特点在农产品品质检测中得到广泛应用。
2.1 品种分类
不同种类的农产品品种繁多,由于不同品种的农产品其生长环境、产量等存在差异,导致品种间营养成分、用途、价格差异较大。导致市场上以次充好现象频发,给农产品的国际贸易、地理标志产品保护以及消费者权益保护带来阻碍[2]。品种分类是农产品储藏、育种以及开发利用的重要依据[8],由于大部分农产品品种外观极其相似,很难通过肉眼观察进行品种分类。通过高光谱成像技术对不同种类的农产品品种进行无损分类,有助于商业分级,可以有效避免以次充好现象的发生。在品种分类的研究中,将扫描农产品得到的光谱信息和纹理特征、颜色特征和形态学特征等结合进行建模,所建模型性能优于单一使用光谱或图像信息。
由表2可知,不同种类农产品所用的光谱处理及建模算法有所不同,最常用的包括 MSC、SNV算法用于光谱散射校正,尽量消除样品状态、测量环境等因素带来的影响。因为高光谱成像技术结合了化学计量学、机器学习等方法,操作软件主要使用ENVI、Matlab、PyTorch和Python等。分别用于选取样本感兴趣区域从而提取光谱数据;对数据进行数据预处理、特征波长选择及常规方法建模;构造神经网络以及对数据进行可视化等。高光谱成像技术可运用于各个种类农产品的品种鉴别中,包括谷物、果蔬、肉制品等。由表2中统计的案例均表明了高光谱成像技术在谷物、果蔬、肉制品等农产品的品种鉴别方面的可行性,并结合了化学计量学和机器学习方法可以为农产品的品种鉴别提供更加无损、快速、低成本的方法。
表2 高光谱成像技术在农产品品种分类中的应用Table 2 Application of hyperspectral imaging technology in identification of agricultural products
2.2 理化性质检测
对于农产品内部理化性质的分析,可使用建模算法来建立回归模型从而对相关属性进行含量预测。由于农产品的营养价值直接体现在其内部的理化性质上,故对其进行分析有利于农产品的育种筛选、商业分级等。高光谱成像技术凭借“图谱合一”的自身优势已经被广泛运用于农产品的含水量、蛋白质等理化指标的检测中。
2.2.1 谷物含水量检测
廉孟茹等[26]采用高光谱技术对鲜食水果玉米进行光谱数据采集,选取 MSC对光谱进行预处理。基于 MSC预处理数据选用 SPA、CARS以及RF分别提取含水量的特征波长并建模分析。结果表明,MSC-CARS-PLS模型的含水率预测效果最好,预测集的决定系数达到0.825,预测均方根误差(RMSEP)为 0.006。该模型预测效果较好,但只使用了 PLS一种建模方法。除PLS外,建议使用多种建模方法,进行比较获得最佳建模方法。
2.2.2 果蔬含水量检测
李红等[27]利用高光谱成像技术,并结合颜色特征和光谱信息对生菜冠层含水量进行检测。在去除图像的背景噪声和光强校正后,利用SNV进行光谱预处理,采用蒙特卡罗无信息变量消除法(Monte Carlo Uninformative Variable Elimination,MCUVE)剔除无关变量,再结合SPA和基于最小绝对收缩和选择算法(Least Absolute Shrinkage and Selection Operator, LASSO)筛选特征波长。从而建立 MCUVE-LASSO-SPA-PLS模型,其预测集相关系数为0.901,均方根误差为0.929,效果较好。在特征波长筛选步骤中,组合使用三种算法达到更好的消除冗余信息、筛选波长的效果。故可使用 MCUVE-LASSO-SPA-PLS模型计算生菜冠层每个像素点的干基含水率,从而实现生菜冠层叶片干基含水率可视化检测。孙红等[28]为了快速检测马铃薯叶片的含水量,结合颜色特征和光谱信息,在862.9~1 704.2 nm波长范围内采集叶片光谱成像数据和图像信息,分别用相关性分析(Correlation Analysis, CA)和RF两种算法进行光谱特征分析各筛选得到15个特征波长。分别用两种算法筛选出的特征波长建立 CA-PLSR和RF-PLSR模型。结果显示,RF算法选取的特征波长分布范围较CA法范围更广,具有局部“峰谷”特性,且RF-PLSR建模后效果更佳,其预测集精度R2为0.947,RMSE为2.15%。然而,在他们的研究中,由于没有使用SNV算法等进行光谱预处理,直接在全波长的基础上筛选特征波长和建立预测模型,模型的运行效率可能较低。因此进一步的研究中可以使用光谱预处理来提高模型性能和运行效率。
2.2.3 肉品含水量检测
王迪等[29]利用高光谱成像技术对羊肉含水量进行无损检测。在1 000~2 500 nm范围内对羊肉样本进行光谱信息采集,分别使用SNV、MSC和去趋势校正法等6种算法进行处理,选出最佳预处理算法为去趋势校正法(Detrend Correction,DC)。原始数据经 DC处理后,采用相关系数法(Correlation Coefficient Method, CCM)筛选特征波长,建立特征波长下羊肉含水量的PLSR模型和逐步多元线性回归(Stepwise Multiple Linear Regression, SMLR)模型。如表3、表4所示,比较了两种模型的定量分析指标,SMLR模型对含水量预测效果最好,预测集的相关系数为0.865,标准误差为0.039,模型指标较好可以实现对羊肉含水量的无损检测。
表3 不同预处理方法下的PLSR模型结果[29]Table 3 The results of PLSR model under different preprocessing methods
表4 特征波段下的PLSR和SMLR模型结果[29]Table 4 Results of PLSR and SMLR models under characteristic bands
2.2.4 农产品中蛋白质含量检测
王朝辉等[30]结合颜色特征和光谱信息研究大米中蛋白质含量,提取了408.3~1 007.2 nm范围内的大米光谱信息并与化学方法测定的蛋白质含量相结合,比较SG、MC、MSC三种预处理方法的效果,得出MC算法效果最佳,再使用SPA法筛选特征波段。基于全波长分别建立 PLSR、主成分回归(Principal Component Regression,PCR)、BP神经网络预测模型,对比确定最优模型为PLSR。建立MC-SPA-PLSR模型,预测各像素点的蛋白质含量,训练集的相关系数为0.904。再结合其灰度图像可对大米中蛋白质含量分布进行可视化检测。胡鹏伟[31]提出一种基于CARS和SPA结合多层前馈神经网络的预测建模方法,实验以含有不同浓度蛋白质的牛奶为对象,利用高光谱成像系统共采集到5种牛奶的高光谱数据,进行实验对比选择采用标准化方法对获取到的吸收光谱预处理,然后采用CARS结合SPA筛选特征波长,建立 CARS-SPA-BP模型,其测试集决定系数达到 0.968,均方根误差(RMSEP)达到了0.034。该研究创新性的结合了CARS和 SPA算法既降低了模型运算量,还可以概括样品的光谱信息,具有实际意义,但在运用BP神经网络进行建模计算时要注意过拟合的问题。田容才等[32]分析早籼稻籽粒光谱反射率与籽粒粗蛋白含量的关系,在325~1 075 nm波长范围内,使用SG平滑进行光谱预处理,再进行反射率数据与粗蛋白含量的相关性分析,筛选敏感波长。最后,建立基于敏感单波长、波长组合和光谱参数的一元线性、多元线性、指数和多项式模型。研究发现,在基于敏感波长的估测模型中,四元线性模型估测效果最佳,其验证集的R2、RMSE和RE分别为0.518、0.154%和1.303%;在基于光谱参数构建的估测模型中,DSI为自变量构建的多项式模型估测效果较优,其预测集的R2为0.581;RMSE为0.230%;RE为2.307%。本研究基于敏感波长和光谱信息分别建模,R2值均较低,应考虑预测值与实测值含量间是否为线性关系。若在后续研究中将敏感波长与图像特征融合进行建模或许能提高模型精度并对R2值带来改善。
2.2.5 脂肪含量的无损检测
Liu等[33]提出了一种基于注意力机制的卷积神经网络回归模型ACNNR,结合高光谱成像来预测单个玉米籽粒中的含油量。在866.4~1 701.0 nm范围内采集单个玉米籽粒胚侧和非胚侧的高光谱图像,并比较了 CNNR、ACNNR和偏最小二乘回归(PLSR)的性能。对于PLSR,使用一系列光谱预处理和降维方法最终确定最优混合 PLSR模型。而对于CNNR和ACNNR,仅使用原始光谱作为其输入。结果表明,胚胎侧更适合建立回归模型;注意力机制有助于减少预测误差,使ACNNR表现最佳。ACNNR模型将光谱信息通过“端对端”的处理方式,节省了预处理、特征提取等步骤,并得到了比传统建模方法(PLSR)更好的性能参数。接下来可以引入不同品种玉米籽粒的含油量建立预测模型,增加模型的稳健性。
马文强等[34]对核桃仁脂肪含量进行预测。采集862.9~1 704.02 nm和382.19~1 026.66 nm波段的新疆“温 185”核桃仁的光谱信息。采用MSE和SNV法进行预处理后,通过CARS与CCM,对核桃仁样品的脂肪含量进行了特征波段筛选。通过PLSR算法建立了全光谱波段与特征光谱波段的预测模型,与全光谱波段相比蛋白质含量预测模型的验证集R2由0.66增长到0.91,RMSEP由1.37下降到0.78;脂肪含量预测模型的验证集R2由 0.83增长到 0.93,RMSEP由 0.98下降到0.47。该研究表明采用CARS与CCM算法结合,筛选出的特征波段可以有效降低全光谱信息的复杂度,提高建模质量。章海亮[35]利用高光谱技术采集900~1 700 nm范围三文鱼样本的光谱数据。对全谱利用SPA算法提取特征波长,然后基于特征波长建立 PLS模型,利用 PLS模型,对 100个样本的光谱数据进行三文鱼脂肪建模分析,模型预测集的R2为0.913,RMSE为0.920%。本研究模型精度较高,但缺少光谱预处理,直接对全波段进行特征波长筛选和建模可能导致模型运行效率较低。
2.3 农药残留检测
中国作为农业大国,每年都需要使用大量农药来减少昆虫和病害对农作物的干扰,从而保证农作物的正常生长。农药一方面可以用来防治农作物中的病虫害,但另一方面使用不当也会给人们的健康带来危害[36]。不同于传统检测方法,高光谱成像技术具有快速、无损的特点,满足现代农业需求。针对农药残留的问题,目前已有国内外团队进行相关研究。
REN等[37]以施加了不同乐果浓度的菠菜叶为研究对象,使用 MSC算法对光谱数据进行校正。此外,卡方检验特征选择算法分别与支持向量分类(Support Vector Classification,SVC)、KNN、RF和LDA等建模方法相结合。结果表明卡方检验与 LDA组合是最佳模型,该模型的预测准确度和标准偏差分别为99.7%、0.008,预测模型识别准确率较高,该方法可用于菠菜中乐果农药的无损检测。SUN等[38]以莴苣叶中的混合农药(氰戊菊酯和乐果)为研究对象,采用SNV算法对莴苣叶的高光谱数据进行预处理。然后分别使用CARS和随机森林递归特征消除(RF-RFE)选择特征波长,再利用SPA结合最小二乘支持向量回归(Least Squares Support Vector Regression,LSSVR)建立氰戊菊酯和乐果的预测模型。结果表明,预测氰戊菊酯的 CARS-SPA-LSSVR模型预测集R2为0.889,RMSEP为 0.018,预测乐果的 RF-RFE-SPA-LSSVR模型预测集R2为 0.939和RMSEP为 0.008。本研究创新性的结合了CARS-SPA和RF-RFE-SPA算法分别进行特征波长的筛选,简化了校准模型,提高了模型精度。
高光谱成像技术不仅可以对农产品进行单一种类的农药残留检测,还可以同时对不同种类的农药残留进行无损检测,赵昱萱等[39]结合高光谱技术和化学计量学方法,采集450~950 nm波长范围薄荷叶的光谱信息,对薄荷叶上的异丙甲草胺、烟嘧等4类除草剂残留进行种类判别。使用SG平滑和 MSC对光谱信息进行预处理。利用PCA算法对原始数据进行降维后,建立SVM模型。分别利用网格搜索(Grid Search, GS)、粒子群算法(Particle Swarm Optimization, PSO)及灰狼算法(Gray Wolf Optimizer, GWO)对SVM模型参数进行处理。经过对比不同模型,SG-PSOSVM、SG-PCA-GWO-SVM和MSC-GS-SVM对测试集的判别正确率达到了100%,其中 SG-PCAGWO-SVM 计算时间最短。MSC-GS-SVM 具有最优的泛化能力,该方法应用范围广泛,可以实现对薄荷叶片上常见除草剂的无损检测。潘明康[40]基于高光谱成像技术对柿子表面不同农药残留种类进行检测。在400~1 000 nm范围内采集柿子的高光谱数据再经过SNV进行光谱预处理,分别选用PCA和SPA算法进行全波段降维。基于PCA法和SPA提取的特征波长分别建立SVM、BP神经网络和 ELM 的农药残留种类检测模型。实验结果表明,SPA降维效果优于 PCA,基于 SPASVM模型分类效果最好,识别准确率为90%。本研究中三种模型中对农药残留检测精度有待提高,可尝试更多高光谱降维方法和其他预测模型,提高模型识别准确率。桂江生等[41]提出一种基于高光谱图像技术的西兰花农药残留定性检测新方法。首先在383.70~1 032.70 nm波段内分别采集喷砂了吡虫啉、阿维菌素、丙森锌3种农药的西兰花高光谱图像,并采用 MSC对原始光谱数据进行预处理,再分别使用PCA和SPA算法选择特征光谱。最后,使用 MD、LSSVM、ANN和ELM 4种分类算法建立基于全波段和特征波段信息的农药残留检测模型。结果表明:基于 SPAELM 模型的识别效果最好,预测集的正确率为96.7%。
姜荣昌等[42]提出了一种快速无损识别大白菜农药残留种类的方法。将含有均匀喷洒农药(毒死蜱、乐果、灭多威和氯氰菊酯)的大白菜样本为研究对象,分别获取其400~1 000 nm高光谱图像,并选取感兴趣区域后经 MSC预处理;分别采用CARS、PCA算法和离散小波变换(discrete wavelet transform, DWT)降维;最后,将降维后的高光谱数据分别输入 CNN、多层感知机(Multi-Layer Perceptron, MLP)、 KNN 和支持向量机SVM建立模型并比较。结果显示,DWT-CNN算法总体精度为 91.2%。本研究使用离散小波算法降维,能够有效过滤高频干扰信息;且与PCA和CARS降维算法相比较,基于离散小波变换降维数据的同时,不仅较好的保留原始光谱曲线形状,而且还能较好还原曲线相对空间位置,提高了高光谱数据分类识别准确度。
丛孙丽[43]利用高光谱图像技术对生菜叶片多种农药残留鉴别研究。采集 431~962 nm波段的生菜叶片光谱数据。采用SNV算法对原始光谱数据预处理,并使用SPA选出15个特征波长再建立 SVM 鉴别模型。接着,在特征光谱数据的基础上建立基于三种智能优化算法的 SVM模型(ABC-SVM、CS-SVM 及 GSA-SVM),综合考虑模型运行时间、训练集和测试集准确率及收敛迭代次数,GSA-SVM模型性能最优。确立 GSASVM模型中最佳粒子个数为40时GSA-SVM达到了最佳鉴别效果,测试集准确率为 96.1%。本研究对生菜叶片多种农药残留的定性研究聚焦于高光谱图像技术的光谱信息,没有研究生菜叶片农药残留与图像特征之间的关系,也没有对混合农药残留的含量实行可视化分析。因此,今后需要在这两方面进行深入研究,提高模型精度的同时使农残量可视化。
对农产品中农药残留的无损检测需求,使得高光谱成像技术在农残检测方面具有较高的应用潜力。上述研究多聚焦于使用光谱信息进行农药残留的鉴别与残留量的检测,未融合图像信息进行处理。若能结合农产品的纹理特征等,则能起到提高模型通用性和准确率的效果。也可以对残留农药在农产品中的分布进行可视化处理,进一步对残留农药含量进行检测。
2.4 病菌及毒素感染检测
农产品在采摘、运输和营销过程中若保存措施不当极易受到病菌感染,农产品表面及内部的病菌存在不仅会导致品质下降,还会对农产品的食用安全性带来不利影响。一些真菌还会产生高温条件下难以去除的真菌毒素,限制了农产品的产量同时也造成了污染,也对消费者健康造成危害。高光谱成像技术凭借其无损快速的特点可以对农产品的实时健康进行检测,满足现代农业发展的要求。并且能够在农作物的初步阶段预防植物病害,有助于农作物的健康控制和优化产量,而不只是单单依赖于农药的使用[44]。
在真菌感染检测方面。由于发霉的花生含有大量的黄曲霉毒素,能对绝大多数动物起急性毒害作用,而且具有明显的致癌作用。若能进行无损区分霉变花生,能对生产和售卖起到积极作用。Qi[45]利用高光谱识别发霉花生。将花生的光谱数据,进行了连续小波变换(Continuous Wavelet Transform, CWT)和可分性分析,再利用阈值法,分离出五个小波特征(WFs)来识别发霉花生。此外,将SPA得到的七个最佳波段与WFs进行了比较。采用PLS-DA和SVM作为分类器,对WFs和最优频带进行评价。根据PLS-DA和SVMs的总体分类结果,连续小波变换 CWT分类后与PLS-DA相结合分类效果更佳,测试数据的分类结果至少为96.2%。Feng等[46]采用874~1 734 nm光谱范围内的近红外高光谱成像系统检测蓝霉菌对栗子的霉变危害。从高光谱图像中提取光谱数据后使用SPA选出了12个特征波长。采用ANN,包括反向传播神经网络(Back Propagation Neural Network, BPNN)、进化神经网络、ELM等模型,利用全光谱和特征波长建立模型。使用全光谱和最佳波长的BPNN和ENN模型获得了令人满意的性能,分类精度均超过99%。两份研究中的模型精度较高,然而在他们的研究中,都缺少光谱预处理步骤;并且均只针对单一品种的农产品进行霉变检测,在接下来的研究中应该增加更多的品种,以增强所建立预测模型的鲁棒性。
Chu[47]利用高光谱成像评估三个杂交种的健康和真菌感染玉米籽粒之间的差异。分别采用PCA-SVM、SPA-SVM,研究了像素级(PW)和对象级(OW)两种采样策略。使用PC1和PC3到 PC6开发的对象级,OW-SPA-SVM模型对三个玉米杂交种的准确率均高于OW-PCA-SVM模型,分别为100%、98.9%和98.9%。在像素级分析中,PW-SPA-SVM模型的核级分类准确率更高分别为100%、100%和100%。本研究从图像的不同采样方法入手,对比了像素级和对象级检测方法对模型准确性的影响,可由实验结果看出搭配PW采样,模型分类更好。
刘琦等[48]为了区分感染小麦条锈菌的潜育期小麦,在325~1 075 nm范围内利用定性偏最小二乘(Discriminant Partial Least Squares,DPLS)、ANN和SVM这3种方法建立识别潜育期小麦条锈菌的模型,经过对比三种模型的准确度,以FD筛选特征光谱时三种模型中SVM识别效果最佳,FD-SVM识别准确率均可达到100.00%,能明显起到区分被感染小麦的作用。但该研究所选波段仍是全波段范围,含有较多无效信息,若能找到识别潜育期小麦条锈菌的敏感波段,使建立模型所选波段更加科学合理,将使识别模型更加高效、准确。
Siedliska[49]使用高光谱成像技术检测真菌感染导致的水果腐烂。将“Senga Sengana”和“Honeoye”两个品种的草莓分别接种灰霉病菌和急性衣原体的致病真菌,而将未接种的果实作为对照。在接种后的4天内获得了果实的反射光谱。基于原始光谱使用2ND筛选出19个特征波长,并用于构建监督分类模型。在所研究的分类模型中,使用BPNN模型的预测精度最高,接种和对照果实的鉴别准确率均在97%以上,可以有效对感染真菌的草莓果实进行无损区分。
除了对被污染农产品中的病原体进行检测,高光谱成像技术还可以对农产品中所含有的真菌毒素进行定性定量检测。
丁静等[50]为实现小麦呕吐毒素含量快速检测,在1 000~2 500 nm范围内采集小麦赤霉病籽粒样本的高光谱图像,组合使用SG-NL-MA对原始光谱进行预处理,再使用SPA和区间组合优化结合连续投影算法(ICO-SPA),结合PLSR、MLR和最小二乘支持向量机回归(LS-SVR)模型比较三种模型的预测效果。结果表明,ICO-SPA提取出的 22个特征波段能有效反映病粒样本中的大分子含量的差异,其中ICO-SPA-MLR模型效果最优,预测集相关系数、均方根误差和相对分析误差分别为0.921、0.375 mg/kg和2.79。该研究针对小麦单一品种进行 DON含量预测实验,ICO-SPA的特征波长选择算法获得了让人满意的结果,若换成其他小麦品种,ICO-SPA的效果如何有待进一步的研究和验证。
玉米作为食品和饲料生产中的重要作物之一,但玉米在运输和贮藏过程中极易发生霉变,霉变后会产生分布广泛、危害严重的黄曲霉毒素和玉米赤霉烯酮,若对两种毒素处理不当,极易引起人、畜、禽中毒。因此,及时检出霉变玉米尤为重要。殷勇等[51]为通过高光谱技术检测霉变玉米中黄曲霉毒素B1含量,选择5种不同霉变程度的玉米为试验材料,采集371.05~1 023.82 nm波段内样本的光谱信息,再进行 MSC预处理;运用PLSR来选择特征波长,然后利用Fisher判别分析(Fisher Discriminant Analysis, FDA)分别对全波长和特征波长下霉变玉米进行鉴别分析。结果表明,而在特征光谱下的FDA鉴别正确率均在98%以上。王光辉等[52]欲结合高光谱信息和纹理特征,检验霉变玉米中的玉米赤霉烯酮含量。在371.05~1 023.82 nm波段内采集原始数据后使用MSC进行预处理;根据CCM进行数据降维,再通过SPA结合信息熵选择出8个特征波长;建立特征波长下的赤霉烯酮含量的 BP神经网络预测模型。结果表明,特征波长的光谱信息所建立的预测模型最佳,赤霉烯酮含量预测正确率为100%,均方根误差为0.161。
通过表5对上述研究中所探究的农产品、病菌种类等进行了总结。在高光谱成像技术检测病菌和毒素感染的研究中,研究人员将获取的病菌毒素的光谱信息和图像信息融合检测,加强了高光谱成像技术对病菌毒素检测的灵敏度和普遍性。但上述研究成果多针对于单一或少数品种农产品进行图像提取,在此基础上进行建模操作,后期可以对多个品种混合的农产品进行检测,从而提高预测模型适用性。
表5 农产品检测的光谱范围以及算法Table 5 Spectral region and algorithms for agricultural products detection
3 结论与展望
高光谱成像技术作为农产品营养品质与质量安全无损检测的有利工具,融合了成像技术和光谱技术的优点,产生带有空间信息和光谱信息的三维数据立方体,弥补了传统成像技术和光谱技术的缺点[1]。近二十年来,该技术已经广泛应用于各种农产品的质量检测,如果蔬、谷物、肉制品和咖啡等副食产品。高光谱成像技术可检测到的目标质量属性也很全面,不仅包括品种分类、营养物质检测,还可以对被真菌感染和毒素污染的农产品进行检测。另外还有针对农产品的新鲜度评价以及缺陷评价等。这些大量的成功应用也表明HSI具有快速、准确的优点,可以作为一种无损、便捷、低成本的检测方法实现农产品的质量分析。
目前,高光谱成像技术大多数报道聚焦在以实验室规模内进行的可行性研究,缺乏相关研究证明模型在实际场景中应用的适用性[53]。其次,HSI生成的大量光谱数据,限制了其在农产品快速检测中的应用,从冗余的光谱信息中提取出有用的特征数据及建立合理的预测模型成为解决该问题的关键。另外,在实际应用中,使用高光谱相机捕捉样品图像及光谱信息的操作难度不大,但后续的数据处理及建模方法对于非专业人员来说难度较大,可能对高光谱成像技术投入生产线使用带来技术限制。
因此,未来可以开展针对化学计量学和机器学习算法的相关研究,开发更多针对高光谱成像技术在实际应用中使用的更加简单、快捷的技术和算法,可以实现对高精度的高光谱数据进行快速分析,从而提取特征波长并建立回归模型[54]。随着光谱技术和计算机技术的发展,将有更先进的光学设备和相关算法被研究人员开发出来,使高光谱成像技术作为一种快速高效的无损检测技术,在农产品品质和安全检测领域发挥更大的作用。