APP下载

光谱成像技术在玉米种子质量检测方面的研究进展

2023-12-29靖相柱郭业民赵文苹桑茂盛

北方农业学报 2023年5期
关键词:玉米种子光谱玉米

靖相柱,孙 霞,郭业民,赵文苹,郭 榛,桑茂盛

(山东理工大学农业工程与食品科学学院,山东淄博 255000)

种子是一切农业生产的基础,优质种子是提高作物产量的关键[1]。玉米属禾本科植物,原产中美洲和南美洲[2]。玉米对环境的适应能力较强,产量高,是世界各国的主要粮食作物。玉米种子中的维生素含量为水稻、小麦的5~10 倍,是保健食品行业的潜在资源[3]。由于玉米种子在种植、收获、干燥、运输、加工、贮藏等过程中,受外部环境和自身活动的影响,易使种子的质量发生改变,进而影响到产量的高低,为保障玉米种子质量,因此要对玉米种子质量进行检测。目前,对玉米种子质量检测的方法主要有形态鉴定法、人工感官鉴定法、化学分析法等[4-5]。

形态鉴定法和人工感官鉴定法易受个人经验等因素的干扰,且存在工作量大、作业周期长、检测效率低等缺点,难以保证结果的准确性;利用化学分析法检测玉米种子虽然准确性高、特异性强,但极易对玉米种子造成损伤,并且存在检测周期长、可重复性差等缺点,这几种方法均不适用于大规模检测。目前机器视觉技术、近红外光谱技术在玉米种子质量检测方面得到了较为广泛的研究和应用[6-8]。TU 等[9]基于RGB 图像结合微调后的VGG-16 网络,鉴别玉米目标品种的种子,准确率为98%。ALTUNTA等[10]基于机器视觉技术分类单倍体和二倍体玉米种子,VGG-19 模型取得了最优效果,准确率达到94.22%。冯晓等[11]基于轻量级卷积神经网络和迁移学习构建了玉米籽粒双面特征模型,准确率达99.83%,优于单面特征模型。FAN 等[12]使用近红外光谱技术检测单粒种子的活力,利用主成分分析法(principal component analysis,PCA)和连续投影法(successive projections algorithm,SPA)进行特征降维,结合4 种机器学习方法构建了8 种预测模型,结果表明8 种模型的准确率均达到84%以上。但以上机器视觉技术只能获取种子表面的物理特征信息,无法获取种子内部的成分含量信息;近红外光谱技术只能提供关于整个样品的平均光谱信息,不能直接获取像素级别的信息,这一技术缺陷也限制其在图像分析和图像处理中的应用。因此,寻求一种快速、有效、稳定的玉米种子质量检测方法具有现实性和迫切性。

光谱成像技术(spectral imaging techniques)融合了传统的光谱技术和图像技术,并且在光谱和图像信息与被测物质成分之间建立数学关联,由此获得被测样品的检测结果,具备无损、快速、高分辨的优点,已经应用在各类粮食作物、经济作物、蔬菜作物等农产品的无损检测中[13-15]。截至目前,光谱成像技术已在玉米种子活力、含水率、病害检测和品质与产地鉴别等方面进行了多项研究[16-19]。光谱成像技术应用于玉米种子质量检测主要是结合化学计量学方法,依托采集的光谱数据信息,利用多种数据预处理方法,实现对相关检测指标的定性判别和定量分析,最终建立有较强鲁棒性的模型,但在对同一种指标进行检测时,不同学者用到的预处理方法不同,提取的特征波长数也不同,导致检测指标与其特定吸收波长的联系存在争议,因此,将建立的模型应用到不同设备上指导农业生产仍是研究重点。本文阐述了光谱成像技术基本构成及原理、光谱数据预处理的方法、光谱特征波长提取方法、建模分析方法以及模型评价指标,综述了目前光谱成像技术在玉米种子质量检测中的应用成果,展望了光谱成像技术在玉米种子质量检测中的前景,以期促进光谱成像技术更广泛地应用于玉米种子的质量检测中,从而进一步保障玉米种子产业安全生产具有重要意义。

1 光谱成像技术原理

1.1 光谱分析技术

光谱分析技术是通过光谱系统采集在特定波长范围内的光谱信息,分析物质吸收、发射或散射光的波长从而确定样品成分和性质的一种技术。其基本原理是根据原子、分子和离子的内部结构等特点,通过光在不同物质中的传播以及相互作用不同,对物质进行分析和检测。常见的光谱分析技术主要包括:可见光谱分析、近红外光谱分析和中红外光谱分析,目前针对近红外光谱技术的研究最为常见[20]。光谱分析技术具备快速、无损、简便等优点,由于光谱分析技术采用单点扫描的方式,易受样本分布均匀性的影响,需在不同的位置多次测量样本信息;另外,该技术只能提供大规模样品的平均光谱信息,不能直接获取像素级别的信息,如何进行图像的分析和处理也是需要关注的问题。

1.2 光谱成像技术

光谱成像技术的概念是1985 年由GOETZ 等[21]提出的。早期光谱成像技术主要用于遥感领域的地物探测[22]。图1 所示光谱成像系统的构成主要是光源、光控装置、摄像机、载物台、计算机。光谱成像技术采集的光谱波长范围广泛,包括了200~2 560 nm的紫外线光谱区域、可见光谱区域、近红外光谱区域。按照光谱系统扫描方式的不同将其分为点扫描式、线扫描式及面扫描式。线扫描式可以沿一个方向连续扫描,适用于传送带系统,因此是食品工业中最常用的扫描方式[23]。光谱成像技术基本原理见图2[24],光谱图像是由许多矢量像素构成的三维光谱立方体[25]。

图1 光谱成像系统示意图Figure 1 Schematic diagram of the spectral imaging system

图2 技术原理图[24]Figure 2 Technical schematic chart[24]

这些矢量像素同时包含了波长(λ)下的光谱信息和二维空间信息(X,Y),通过指定特定波长λ 或者指定空间坐标(X,Y)可以分别提取波长λ 处的图像信息和特定像素点(X,Y)的光谱信息。光谱成像技术可以对多个目标同时进行检测,具有“图谱合一”的优点。受内外部环境的影响,光谱成像技术采集的光谱会带有冗余信息,这些冗余信息会对数据处理造成影响,使光谱数据处理效率降低,因此光谱成像技术通常应用在基础研究中。

2 光谱检测技术工艺

2.1 种子检测状态

由于玉米种子的表皮富有光泽,会产生全反射,形状呈卵形、U 形,影响光谱穿透效果,因此,玉米种子的检测状态影响光谱分析和光谱成像技术在检测玉米种子质量过程中采集的光谱数据。玉米种子检测状态主要包括玉米种子整体、玉米种子研磨成粉、单粒玉米种子。玉米种子整体检测是将相同重量的玉米种子均匀平铺在培养皿中使高度保持一致,由此获取平均光谱信息,但采集前需要大量样本;粉末状态检测是将种子研磨成粉后放在培养皿中采集光谱信息,但是这种方法会破坏样品内部结构,浪费种质资源;单粒玉米种子检测,国内研究相对较少,其原因主要是由于光谱采集系统中配件的缺失和实验操作复杂所致。

2.2 光谱成像数据预处理

光谱信息量庞大,目前应用到的处理软件主要有HSI Analyzer、Matlab、Envi 和Unscrambler X。光谱成像技术(spectral imaging techniques)流程图见图3。由于采集图像前,光谱数据易受到光源光照强度的影响出现噪声干扰,这些干扰会影响光谱数据准确性。因此,采集样品图像前需对光谱系统进行黑白板校正。采集信息完毕后首先对图像进行背景剔除,通过小波变换法(wavelet transform,WT)、主成分分析法(principal component analysis,PCA)来去除图像坏点、不完整的背景信息和图像的模糊边缘;其次,要对图像的感兴趣区域(ROI)进行提取,这就要求使用阈值分割算法(OTSU)等对图像进行分割处理,其目的是将有差异的区域分割出来,使它们互不相交;最后,对纹理、颜色和形态特征进行提取。纹理特征的提取方法有灰度共生矩阵(GLCM)[26-27],颜色特征的提取方法有颜色直方图等,形态特征的提取方法有几何参数法等[28-29]。

图3 光谱成像技术流程图Figure 3 Flow diagram of spectral imaging technology

利用光谱采集样本图像时,由于受到外界环境等因素的干扰,会使采集到的光谱图像中掺杂一些噪声,出现噪声会影响模型精度,因此需对采集到的原始光谱数据进行预处理。常用的光谱预处理的方法有平滑法(moving average,MA)、标准正态向量法(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)[30-32]。

2.3 光谱数据特征波长提取方法

由于利用光谱成像技术采集的图像数据量大,使波长之间有较大的冗余度,在数据处理时非常耗时,导致建立的模型不稳定、效率低,所以对光谱特征波长的提取是模型好坏的关键一步。常用的特征波长提取方法有竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、主成分分析法(principal component analysis,PCA)、连续投影算法(successive projections algorithm,SPA)、遗传算法(genetic algorithm,GA)和随机蛙跳(random frog,RF)算法等[33-34]。

2.4 模型的建立和评价方法

由于采集到的光谱数据冗余度较大,会导致建立模型的精度较差,因此需要对模型进行定性定量分类建模。在定性分类建模时应用支持向量机(support vector machine,SVM)、偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)、线性判别分析(linear discriminant analysis,LDA)等方法[35-36];定量分类建模的方法主要有主成分回归(principal component regression,PCR)、支持向量回归(support vector regression,SVR)、偏最小二乘回归(partial least squares regression,PLSR)、多元线性回归(multiple linear regression,MLR)等[24]。

通过上述方法进行定性、定量分类建模后,由于使用不同测试数据测试的模型精度出现误差,所以必须对建立的模型进行校准验证。目前采用交叉验证法(cross validation,CV)可以得到一个准确、稳定的数据[37],用来评估模型的交叉验证法主要有建模集决定系数(R2C)、预测集决定系数(R2P)以及建模集的均方根误差(root mean squared error of calibration,RMSEC)、预测集的均方根误差(root mean squared error of prediction,RMSEP)和相对预测偏差(residual predictive deviation,RPD)5 个参数指标,最后模型的相关系数越接近1,均方根误差越接近0,RPD 的值大于3.0 小于6.5 时意味着模型性能越好,精度越高。

3 光谱成像技术在玉米种子质量检测中的应用

3.1 玉米种子活力检测

种子活力影响种子发芽率、出苗率、幼苗生长势,通常作为评价玉米种子质量的重要指标。在收获后,由于处理不当导致热损伤或物理损伤,种子的活力可能会丧失。在贮藏过程中,种子呼吸会产生大量的水分和热量,这也会导致种子老化,影响种子活力。在大田播种低活力的种子后,会造成出苗缓慢、发芽率低等问题,导致减产。应用光谱成像技术及时测定种子活力,筛选出活力低的种子,对作物生产具有重大意义。

WAKHOLI 等[38]利用光谱成像技术对玉米种子的活力进行分类,通过对建立的不同模型进行对比,发现支持向量机模型的分类正确率最高。但是在利用不同分类模型建模时出现了错误分类,究其原因是收集到的数据中存在噪声,导致数据产生偏差,由此可见,在数据收集过程中,对环境控制是非常重要的。王亚丽等[39]设计了基于近红外光谱技术的玉米种子活力分级装置,建立PLS-DA 模型对种子活力进行定性判别,最终校正集相关系数为0.987,预测集相关系数为0.960,对玉米种子活力逐粒无损检测及分级具有良好的效果。此外,单粒化装置作为玉米种子活力分级装置的关键部位,将有活力和无活力的玉米种子分别吹送至相应的分种箱,其分离效率是完成种子检测及分级速率的关键,另外转盘倾斜角、转盘速度以及孔高度参数的设置会对单粒化装置产生影响。FENG 等[40]在874~1 734 nm 光谱范围内使用光谱成像技术鉴定了8 个不同人工老化时间处理下的玉米种子活力,采用PCA 对不同老化时间下的玉米籽粒进行定性分析,应用二阶导数选择特征波长,建立基于全光谱和最佳波长的SVM 分类模型,最终发现在0、12、24 h,分类精度范围在61%~100%,在其他时间下分类精度较低,说明使用光谱成像技术结合化学计量学方法可以评估种子的活力和种子的老化程度。

上述研究大多基于玉米种子活力的定性分析,如活力水平预测、种子老化评价。活力检测方法主要集中在具有一致性状的玉米种子上,并且建立的模型准确率较高,可以达到快速、准确地检测某一种玉米种子活力的要求。但是,在种子成分预测过程中与种子活力相关的定量分析的研究较少,且只关注了同一批次、同一品种的玉米种子,导致所建立的模型只能应用于当前任务,可移植能力不佳。

3.2 玉米种子含水率检测

种子含水率是评价种子质量的重要指标。在种子贮存过程中,过高的水分会导致种子的呼吸作用变强,产生大量的水分和热量,引起种子发霉,降低种子的活力特性,因此通过测定种子水分,防止种子变质,是保证种子质量的重要手段。目前传统测定种子含水率的方法有蒸馏法、烘干法、微波法、电导法等。但是这些方法存在检测过程耗时、破坏性强等缺点,不利于无损、高效检测。

ZHANG 等[41]通过光谱成像技术结合深度学习的方式对玉米种子含水率进行了预测,运用偏最小二乘法(partial least squares,PLS)、卷积网络(convolutional neural networks,CNN)、长短期记忆(long-short term memory,LSTM)和CNN-LSTM 分别建立了单粒水分模型,结果表明,胚侧CNN-LSTM模型预测集的综合指数为0.141,最适合水分测定,但CNN 模型需要训练的参数太多,必须保证有足够的训练样本。WANG 等[42]利用光谱成像技术结合变量选择法,分别建立了玉米种子前后两面不同放置位置的水分预测模型,有效地对水分进行了定量分析,得出前后两面验证集的相关系数分别为0.969和0.946,均方根误差分别为0.464%和0.616%。廉孟茹等[43]应用光谱成像技术对144 根人工剥开玉米苞叶的鲜食玉米水分含量进行了预测,采用卷积平滑法(savitzky-golay,SG)、SNV、MSC、MA 对光谱数据进行处理,用SPA、CARS、RF 分别提取含水率的特征波长并建模分析,得出预测集相关系数分别为0.825 和0.006,但是针对田间未去除苞叶的鲜食玉米含水率的无损检测模型还需进一步研究。

光谱成像技术在测定玉米种子水分方面取得了良好的效果,可满足玉米种子质量检验快速、高效的要求。但是光谱采集的数据信息量极大,具有高维数和冗余度,因此在建模之前要进行多个数据预处理和特征波长的提取,这不仅增加了光谱建模过程的复杂性,且过度使用预处理方法还可能导致光谱信号失真,从而降低模型泛化性能。

3.3 玉米种子病害检测

玉米种子在贮存过程中,由于温湿度不一,易受真菌侵染发生霉变,影响其营养品质。黄曲霉和镰孢菌产生的赭曲霉毒素、呕吐毒素及伏马菌素等真菌毒素,影响人们的食用和使用,给粮食行业带来严重损失。近年来,光谱成像技术已被应用于染病种子的检测。

KIMULI 等[44]采用短波红外高光谱成像系统(SWIR) 结合PCA、PLS-DA 和阶乘判别分析(flexible discriminant analysis,FDA)对4 个黄玉米品种感染黄曲霉毒素B1(AFB1)程度进行分类预测,准确率为96%。由于混合样品的化学成分变化有限,PLS-DA 和FDA 模型在分离混合样品时收到的AFB1 信息较少,导致两个模型合并样本的黄曲霉毒素分类结果较差。YANG 等[45]以实测真菌孢子数为依据,将霉变状态划分为4 个等级,通过高光谱技术结合深度堆叠稀疏自编码器算法(stacked autoencoder)有效识别了玉米籽粒发霉程度,模型准确率超过90%,但真菌孢子在培养过程中的0~10 d孢子生长速度较慢,原因可能是真菌还在适应环境,没有从玉米粒胚中吸收大量的营养。SHEN 等[46]通过可见光近红外光谱成像技术和机器视觉技术相结合,采集270 组玉米籽粒的光谱信息,利用PCA+LDA 建立光谱和图像特征融合模型,最终准确率为92.2%,该方法可以有效地检测贮藏玉米中的曲霉菌属和镰刀菌属污染情况,但光谱和图像响应特性曲线易受玉米品种、侵染真菌种类和贮藏条件的影响,且在该试验中仅对少数菌株进行了研究,以上原因均有可能导致建立的模型精度较差。DA CONCEISO 等[47]利用近红外高光谱成像技术结合图像的模式对感染黄萎镰刀菌和禾谷镰刀菌的玉米种子进行了判别,建立PLS-DA 预测模型,最终预测集相关系数为1。康孝存等[48]通过光谱成像技术结合麻雀搜索算法(sparrow search algorithm,SSA)对感染伏马菌素的种子进行了检测,建立PLS-DA、PLS和BP 神经网络(back propagation neural network)判别模型,最终SPA-SSA-BP 神经网络与PLS-DA 模型精度达95.56%。

以上研究表明,光谱成像技术可以用于检测种子是否受到真菌侵染及真菌毒素的危害。多数学者将光谱成像技术和机器视觉技术相结合进行检测,提高了样本特征的全面性,模型识别精度多数超过90%。但由于种子霉变时受环境温度、样品形态的影响,导致研究中的真菌浓度低于实际浓度,使所建立的定量模型产生误差,因此未来应加大不同霉菌对玉米种子光谱成像特征影响的研究力度。

3.4 玉米种子品质与产地鉴别

玉米种类众多,在大小和外观上具有很强的相似性,肉眼难以区分,不同产地的玉米种子受环境的影响其特性会出现差异。在贮存、加工、销售等环节,一些不法商家将不同品质的种子进行混合,影响种子质量。因此对玉米品质和产地的鉴别可以保障农民的权益,促进农业发展。近年来,光谱成像技术在鉴别品质和产地方面已经有了相关研究。

ZHANG 等[49]通过近红外光谱技术对3 个不同玉米品种的冻害进行了鉴别并采用MSC、SNV、SG进行了预处理,建立了PLS-DA、KNN 和SVM 3 种模型进行比较,最终分类准确率为90%,说明该方法可以鉴别不同程度冻害的玉米,但由于该试验样本种类数量较少,模型精度还需进一步验证。WANG等[50]采用近红外光谱成像技术对3 种甜玉米种子(无处理的、人工加速老化的、经过热损伤的)进行鉴别,建立的PLS-DA 模型准确率为95%,该模型对区分3 种不同处理的玉米的甜玉米种子具有良好的效果。ZHOU 等[51]通过光谱成像技术结合卷积神经网络(CNN)和分区投票方法对12 个不同玉米品种种子的胚状体和非胚体形态进行了识别。结果表明,6 个品种的普通玉米种子鉴定出胚状和非胚状的准确率分别为93.33%和95.56%;6 个品种甜玉米种子鉴定出胚状和非胚状的准确率分别为97.78%和98.15%。王庆国等[52]通过光谱成像技术对不同产地和不同年份的玉米种子进行了鉴别,得到了均值、标准差、熵和能量4 种特征,建立的PLS-DA 模型的预测集和验证集相关系数为0.991 和0.984,但是在该研究中检测的样本数量较少,模型的精度还需要进行多次验证。

以上研究表明,光谱成像技术可以对玉米种子的品质和产地进行鉴别。但近红外光谱成像技术建立的模型准确率在95%以下,其原因在于扫描方式为单点扫描,无法评估样本整体信息,易受样本分布均匀性影响,因此将近红外光谱成像技术与其他检测技术相结合是未来的研究重点。虽然基于光谱成像技术建立的模型准确率高,但还存在图像信息利用率不足和模型可移植性不强的问题,如何将光谱成像技术广泛应用在玉米种子产地鉴别的现实需求中也是未来研究应该突破的重点。

4 存在问题与展望

综上所述,国内外学者利用光谱成像技术在玉米种子质量检测中都取得了不同的成果,并且在光谱成像预处理方面采取了多种算法,使建立的模型精度和数据准确性更高,但是光谱成像技术仍存在一些不足,主要体现在以下几个方面。

(1)光谱成像中包含大量冗余信息,相关研究介绍了不同的预处理算法、特征波长选择算法、建模方法,但是相关研究所使用的方法各不相同,建立具有较强鲁棒性和较好泛化性能的模型仍是相关领域研究的重点,而建立更加标准化、普适化的建模方法是未来的发展要求。

(2)光谱成像包含图像信息和光谱信息,相关研究大多侧重于光谱信息的发掘而忽略与图像信息相结合。传统的图像处理技术主要是提取图片的纹理特征和颜色特征等,无法提取光谱图像的全部特征,而深度学习技术的不断发展,包括CNN、深度残差网络(deep residual network,ResNet)、LSTM 等能够提取图像更深层次的特征,深度学习方法与光谱成像技术的融合有助于推动相关技术进一步发展。

(3)相关光谱设备都是大型设备,小型化、国产化是设备发展的趋势。随着我国产业技术升级,研究转向高新技术突破,必然打破高端高光谱设备由国外垄断的现状。

(4)光谱成像技术的优势在于能够同时、快速、无损地检测样品的多项指标,且具有实时检测的潜力。相关研究大多处于基础研究阶段,仅为光谱成像技术的产业化应用提供了一些参考,只有较少的研究实现了实际应用,而这更多地依赖于建立具有良好鲁棒性和泛化性能的模型以及发展更加小型、便携式的光谱设备。

随着科技的不断发展,光谱成像技术在各类行业的应用范围越来越广,要求也更严格。针对存在的问题,首先,未来应建立一个玉米种子数据库,通过加大抽样力度,把玉米种子品种进行分类和分级,尝试多种预处理算法,设计对应的光谱成像系统,达到降低成本、节约时间的效果,进而提高模型精度;其次,建议研究人员基于机器视觉技术、近红外光谱技术和HIS 技术相结合的方法对玉米种子质量进行检测;最后,开发一种更智能的玉米种子加工自动化分拣仪器。以数字化、图像化和信息化为代表,建立一个通用的、稳健的模型是未来农产品无损检测发展的必然趋势。

猜你喜欢

玉米种子光谱玉米
不同条件下对济宁地区玉米种子萌发特性的研究
基于三维Saab变换的高光谱图像压缩方法
影响玉米种子发芽率的因素及对策
收玉米啦!
我的玉米送给你
玉米种子生产存在的问题及管理办法
星载近红外高光谱CO2遥感进展
苦味酸与牛血清蛋白相互作用的光谱研究
生物活性水对玉米种子萌发及幼苗生长的影响
铽(Ⅲ)与PvdA作用的光谱研究