水果成熟度近红外光谱及高光谱成像无损检测研究进展
2021-10-24胡逸磊姜洪喆周宏平
胡逸磊,姜洪喆,周宏平,王 影
(南京林业大学机械电子工程学院,江苏南京 210037)
成熟度这一指标在水果产业中扮演着重要角色,对水果的采收时间和采后加工处理方式起主导作用[1]。如果采收过早,水果产量低、品质差、风味不好;采收过晚,水果易脱落、硬度下降、货架期短[2]。因此,建立水果成熟度评价方法,不仅有助于水果的科学按需采摘及采后分选,也可提高水果的经济效益,满足水果产业的发展需求。
水果成熟度的常用评价方法是果农根据色泽、硬度、盛花期天数、果实脱落难易程度等指标进行主观上的判断,或者结合化学计量学检测水果内部成分含量并划分阈值进行成熟度分级[3−4]。但这些方法存在检测效率低、受气候影响大、受主观性制约、准确度不高等缺点,使得基于此类方法形成的果品采收供销产业链相对简单粗犷,对果农收益产生一定负面影响[5]。为了弥补上述评价方法的不足之处,无损检测技术越来越受到重视,如核磁共振、近红外光谱、高光谱成像、拉曼光谱及其成像技术等,其中近红外光谱和高光谱成像技术已被大量研究证实为适合应用于水果品质参数的无损检测[6−7]。
近年来,不少文章报道了水果外部品质、内部成分、病虫害、生长状态、质量安全等方面的无损检测研究进展[8−10]。但鲜有文章针对水果成熟度这一指标,从光谱仪器工作波段、光谱采集方式、光谱采样区域、成熟度表征因子、单一成熟度参数、多元成熟度指数等方面具体分析成熟度的光谱无损检测评价体系。因此,本文综述了国内外利用近红外光谱和高光谱成像技术检测水果成熟度的研究现状,分析目前成熟度检测手段的优势与不足,并讨论未来水果成熟度光谱检测的发展趋势。
1 近红外光谱和高光谱成像
近红外光谱是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的,反映了含氢基团(C-H、N-H、O-H)伸缩振动的倍频和合频吸收[11]。近红外光谱区是指波长介于780~2526 nm的区域。在进行光谱检测时,入射光经样品吸收、透射或反射后被定向探测器采集并携带大量的光谱信息,通过对吸收谱峰的解析可以得到样品的理化成分信息,从而完成对样品的无损检测[12]。近红外光谱设备成本低、检测速度快,可以实时获取样品的光谱信息,适合在线检测过程中使用,系统鲁棒性好。但该类设备只能进行单点检测,将其应用于水果成熟度检测,由于水果内部成分分布的不均匀性,以点概面会产生一定程度上的检测误差,且所测样品之间的差异性需要足够大才能获得准确的成熟度判别模型。
高光谱成像技术是一种集光谱和图像于一体的技术,高光谱图像由数百个相邻连续波段的单色图像组成,图像中的每个像素点都包含特定位置的光谱信息,可实现被测物各组分分布情况的可视化[13]。图谱结合的特点使得研究人员可以利用物理图像维度和化学光谱维度的理化有效信息多维度综合检测果品水果成熟度,但高光谱设备成本较高,数据处理和建模速度较慢,对系统的硬件和存储空间要求较高,是未来亟待解决的一个问题。
此外,拉曼光谱和核磁共振技术也常用于水果品质检测,但拉曼光谱系统灵敏度低,在进行微量和痕量物质分析时,需采用表面增强和共振增强方式增强光谱信号[14]。核磁共振技术能同时检测多种化合物,但该系统的灵敏度也不高[10]。因此,本文主要讨论近红外光谱和高光谱成像技术在水果成熟度检测中的应用。
2 水果成熟度检测
利用近红外光谱和高光谱成像技术检测水果成熟度可分为对水果成熟度的定性判别以及对水果成熟度参数的定量预测,本节将从这两个方面展开论述。
2.1 水果成熟度的定性判别
利用光谱技术将不同成熟度的水果准确地区分开来,有助于按需供销,提高果蔬的市场竞争力。为了验证各类光谱系统对不同水果的分类能力,实验室中将水果预先分为若干成熟度等级,如未熟、半熟、成熟和过熟。划分水果成熟度等级的依据一般包括以下3种:a.根据盛花期天数分批采样,每一批次样品的成熟度为一个等级[15];b.根据水果的着色程度,比如果皮绿色面积占其总面积的比例[16];c.对于同一批次采集的样品,依靠专业人士根据水果的色泽、风味、硬度等指标进行成熟度划分[17],或者利用水果的后熟特性,每间隔一段时间测量部分样本的光谱数据和理化指标[18]。然后根据水果的近红外光谱特征进行成熟度分类,其中影响分类准确率的因素有:光谱仪器的工作波段、光谱采集方式、光谱采样区域和成熟度表征因子。
2.1.1 光谱仪器的工作波段 光谱仪器的固有参数指标尤其是工作波段对水果成熟度分类精度存在一定影响。Pu等[16]比较了两台成像光谱仪(光谱集Ⅰ:600~1000 nm和光谱集Ⅱ:1000~2500 nm)检测荔枝成熟度的能力,建立的PLSDA(partial least squares discrimination analysis)模型在光谱集Ⅰ上对成熟和未熟荔枝的分类准确率比在光谱集Ⅱ上高6.25%。Zhang等[19]采集了成熟、半熟和未熟草莓在两组不同波段下的高光谱图像,融合草莓的光谱特征和纹理特征建立的SVM(support vector machine)模型发现:在441.1~1013.97 nm,SVM模型识别准确率为95%,在941.46~1578.13 nm,SVM模型识别准确率只有70.83%。Pu等[20]使用便携式分光光度计(360~740 nm)和高光谱仪(400~1000 nm)分别采集了三个成熟度等级的香蕉在400~740 nm范围内的光谱数据,发现基于高光谱数据提取的特征波长(650、705、740 nm)建立的PLSDA模型比使用分光光度计数据建立的判别模型精度更高。可以发现,使用短波近红外对荔枝、草莓、香蕉成熟度的检测精度通常比使用长波近红外高。
尽管如此,为了提高对不同成熟度水果的识别效果,关于光谱仪器类型和波段的选择,目前没有统一的定论,但一般与所测果品在成熟前后不同的理化特性(如敏感波段、颜色、纹理特征等)有关。
2.1.2 光谱采集方式 光谱采集方式主要有漫反射、透射和漫透射三种,其中漫反射只能定向获取果皮附近的果肉光谱信息,常用于薄皮水果的成熟度检测;透射和漫透射可通过调节光照角度获取果实的整体内部特征,适用于厚皮水果的品质检测[9]。
Rungpichayapichet等[21]采集了未熟、半熟、成熟、过熟芒果的漫反射光谱数据,建立的判别模型对未熟芒果的识别准确率最高,为87.5%。Qi等[22]在漫透射模式下采集了西瓜顶部的光谱数据,结合西瓜的可溶性固形物、番茄红素、水分等指标建立的回归模型的相关系数最高可达0.939。Xuan等[23]采集了柑橘的漫透射光谱信息,建立的kNN(k-nearestneighbor)模型能准确地将未熟、半熟、成熟的柑橘区分开来。
2.1.3 光谱采样区域 光谱采样区域主要由水果的物理特性(果皮厚度、果面着色程度、形状体积等)决定。Cédric等[24]为了使获得的光谱数据能较完整地反映杏果实的光谱特征,采集了杏果实着色和未着色两面赤道处的近红外光谱,建立的FDA(factorial discriminant analysis)模型能准确地判断两个品种杏果实的采摘时间。Rosli等[25]将每个柑橘样品划分成6个区域,分别测试每个区域的光谱反射率,发现对于无论是生长期还是成熟期果皮颜色相差不大的柑橘而言,利用PSO(particle swarm optimization)建立的模型能筛选出未成熟的柑橘。Khodabakhshian等[26]取石榴赤道处4个等距点光谱数据的平均值作为石榴最终的光谱数据,建立的PCA(principal component analysis)分类模型对四种成熟度石榴的识别率为93.25%。
表1 列举了不同水果的光谱采样区域及分类结果,可以发现由于近红外光谱仪只能进行单点检测,大多研究人员倾向于选择水果的赤道位置作为光谱采样区域,而为了获得水果各部位的完整光谱信息,也可以将水果进行采样区域的划分,进而分别采集每个区域的光谱信息进行后续的分析处理。相比之下,使用高光谱相机采集水果的光谱数据,可将相机视野内的整个果面作为高光谱图像的ROI(region of interest),以此获得的光谱数据更为准确。
表1 不同水果的光谱采样区域及分类结果Table 1 Spectral sampling regions and classification results of different fruits
此外,很多水果内部成分分布不均匀,应避免随机选择水果的某一部分作为光谱采样区域,要根据检测对象的物理特性灵活选取以获得尽量全面的水果光谱信息,才能准确的评估水果的成熟状态。如果以可见区域的整个水果表面作为高光谱图像的ROI,那么各像素点的光谱强度会因水果表面的曲率问题而产生差别,通过数学方法减小或消除这种差异对后续的模型性能会起到优化作用。Li等[27]将樱桃高光谱图像中ROI区域内所有像素点的光谱值偏差压缩到合理范围,然后建立的LDA模型对三种成熟度等级的樱桃的分类准确率达到96.4%。
2.1.4 成熟度表征因子 在构建水果成熟度分类模型之前,需要考虑模型的输入量,即成熟度表征因子。一些学者根据梨、李、哈密瓜等在不同成熟度下的光谱反射强度不同,使用水果的特征波长作为成熟度分类的依据,建立的判别模型性能通常与特征波长的提取算法有关,虽然使用全光谱建模的精度比使用特征波长要高,但使用特征波长建立的模型具有变量少、运算速度快的优势[28−30]。Xuan等[23]利用柑橘特征波长640、670、760 nm的线性组合建立的多光谱指数( T670+T760−T640)/(T670+T760+T640)作为模型输入变量,建立kNN模型对不同成熟度柑橘的识别准确率达96%。Lu等[31]发现番茄在可见光范围内光谱波长与其绿色通道图像的灰度值之间高度相关,而该灰度值在不同的取值范围对应着不同的成熟度等级。Rungpichayapichet等[21]认为要提高芒果成熟度指数RPI(ripening index)预测模型的鲁棒性,需要利用两年以上的组合数据来建立校准模型,使得数据范围更广,数据之间的差异性更大。
由上述可知,使用特征波长或者光谱指数构建分类模型的优势在于,如果模型的性能稳定,将有助于开发商用多光谱检测系统以实现在线快速识别分选。而研究水果光谱特征与图像特征之间的关系,有利于建立水果成熟度的多元评价体系,提高准确率和可信度。
2.2 果品成熟度参数的定量预测
成熟度参数是指在水果成熟过程中变化相对明显的理化指标,当这些理化指标的值在某一区间范围时,可以反映水果的成熟度等级和采摘时间[34]。利用近红外光谱和高光谱成像技术检测水果的成熟度参数,主要分为基于单一成熟度参数的定量预测和基于多元成熟度指数的综合评价。表2列举了不同水果的成熟度参数定量预测方法及结果。
表2 不同水果的成熟度参数定量预测方法及结果Table 2 Quantitative prediction methods and results of maturity parameters of different fruits
2.2.1 基于单一成熟度参数的定量预测 水果成熟过程大多伴随着水分、可溶性固形物和硬度的变化。Qi等[22]利用西瓜的近红外光谱数据建立了评价西瓜SSC、番茄红素、水分的PLSR模型,并且发现西瓜的成熟度参数之间存在较高的相关性,这对于提出不仅仅依赖单一成分评价西瓜成熟度的方法具有重要意义。Zhang等[35]使用均值归一化校正方法消除了梨果实曲率对高光谱图像中不同像素点光谱强度的影响,建立的PLSR模型能够准确地预测梨内部的糖含量。Itoh[18]使用SSC和硬度作为梨成熟度的评价指标并结合散射光谱数据建立的PLSR模型精度不高,认为是样本量不够多以及成分含量的变化范围太小所致。Bertone等[36]对不同日期采收的苹果的成熟度参数(SSC、硬度、淀粉、叶绿素)和近红外光谱数据进行跟踪监测,建立苹果收获天数的PLSR预测模型,其RMSEP为1.0 d(1天)。Phuangsombut等[37]提出了通过降低榴莲果皮吸光度的影响使所测近红外光谱数据趋近于果肉吸光度的方法,实现了无损检测榴莲果肉干物质含量的目的。Khodabakhshian等[15]发现石榴的光谱数据与硬度、TSS、pH三个参数之间相关性最高的四个波长是680、800、900和1000 nm,基于此开发的四波长多光谱成像系统结合PLSR方法可以较好地预测石榴的理化参数进而确定其成熟阶段。
除了水果曲率大、成分含量差异性小、采摘周期短等因素会影响成熟度参数的检测精度外,如果将水果样本来源扩展到不同年份、不同品种、不同果园,将会是对检测模型鲁棒性的重大考验。Bureau等[38]发现杏的成熟度参数PLSR检测模型对SSC和TA预测效果较好,但对其糖度、硬度、有机酸等成分预测偏差较大,原因是杏样本包含8个不同品种且来自两个果园。
2.2.2 基于多元成熟度指数的综合评价 水果的多元成熟度指数一般是指成熟度参数的线性组合、PCA的第一主成分等,利用多元成熟度指数进行建模分析,强调水果各指标之间的关联性,可以较全面地评估水果的成熟状态。Sánchez等[39]将SSC与TA的比值作为柑橘的成熟度指数建立MPLS模型,发现模型的误差偏大,究其原因是该模型对柑橘TA的预测能力较差。Wanitchang等[40]利用PCA将火龙果的DAES、TSS、TA、TSS/TA和WR转化成第一主成分用作成熟度指数,并结合log(R680/R550)建立的PLSR模型能以更高的精度预测火龙果的各成分含量。Jha等[41]提出了芒果的成熟度指数Im的计算公式如式(1),发现使用PLSR建立的近红外模型能较好地预测Im值。Wang等[17]定义了甜瓜的成熟度指数ER如式(2),ER值越高代表成熟度越高,发现利用甜瓜赤道部位的近红外光谱数据建立的PLSR模型预测ER值的能力较强。
成熟度指数的定义式中,只要存在某项理化指标的近红外光谱预测能力较弱,就会影响对成熟度指数的最终预测精度,因此在提出成熟度指数计算方法之前,尽量排除这些干扰项。
式中,η表示品种因子;TSS表示总可溶性固形物;DM表示干物质含量;TA表示可滴定酸度。
式中,Sintact表示甜瓜横截面面积;Sedible表示可食用部分的面积。
3 其他类果实成熟度检测
除水果外,也有部分学者尝试使用近红外光谱及其成像技术检测油料作物果实的成熟度。Bensaeed等[52]对400~1000 nm范围内的油棕果实高光谱数据分析后发现830和880 nm是划分不同成熟度油棕果实的最佳波长,Dharma等[53]等利用GANN(Genetic Algorithm Neural Network)建立了油棕果实成熟度的判别模型,分类准确率在80%以上。Cayuela等[54]对橄榄的近红外光谱特征进行跟踪观测,建立PLSR模型能较好地预测不同成熟度阶段橄榄的品质参数。Zou等[55]将带壳花生的高光谱图像解混,使用FCLS(Fully Constrained Least Squares)实现了不成熟与成熟花生的准确分类,与传统的剥壳观察花生仁颜色判断成熟度的做法相比,该方法有很大的优势。
油料作物成熟度不仅决定其收获时间,也影响其产量和油质。使用光谱技术长期监测油料作物的成熟状态,有助于油料作物的精准适时采收,实现产量、品质及经济效益的最大化。
4 展望
准确判断水果的成熟度,不仅可以确定采摘的最佳时间,而且有利于良种培育、贮藏、运输和深加工。传统的根据从业人员经验或者利用理化指标检测仪判断成熟度的方法存在明显的缺陷,使得近红外光谱和高光谱成像等无损检测技术在水果成熟度判别方面具有广泛的应用前景。
a.检测硬件方面:目前,高光谱成像设备成本高和图像处理速度慢仍然是高光谱成像技术在水果检测应用中的发展障碍[56]。开发低成本实时成像的高速多光谱检测系统,可大幅降低高光谱高维数据的处理时间。可以有针对性地选择信息最丰富的波段,以便使用价格低廉的激光二极管来代替连续激光光源和单色器,从而研发低成本高效益的多光谱传感器。
b.检测对象方面:水果拥有多样的物理形态和丰富的化学成分,这要求检测时除了采用合适的光谱采集方式外,也要选择合理的数据采集波段。近红外光谱中波长较短的部分(<1100 nm)可以更好地穿透生物材料,如果化学成分位于生物材料的深处,这个短波区域将提供更有效的光谱信息,而化学成分靠近表面,则长波区域(>1100 nm)会更有效[57]。对于光谱采集区域,通过分析光与水果内部组织交互作用机理,寻找并建立水果感兴趣区域的标准库将有助检测模型精度和研究效率的提升。
c.检测算法方面:样本的多样性(不同果园、不同年份、不同品种)、水果表面曲率导致的不同光谱强度、实验环境噪声、光谱信息冗余以及高光谱相机的条纹都会对检测模型的鲁棒性造成影响。开发性能稳定、运算高效的算法成为光谱分析中的核心问题。目前还没有适用于所有光谱分析问题的标准算法库,但存在通用性较强的算法框架和检测流程[8]。建立并完善光谱检测库是未来发展的重要趋势,这要求从业人员不但要精通光谱分析和图像处理的机制,还要从校正算法的原理上去改进和创新。