高光谱融合马氏距离的贮藏黄瓜腐败预警方法
2020-12-02于慧春袁云霞
张 棣 殷 勇 于慧春 袁云霞 李 欣
(河南科技大学食品与生物工程学院,河南 洛阳 471023)
高光谱成像技术作为一种新型检测技术[1-3],结合了计算机图像技术和光谱技术的优点,可以实现对检测对象的判别、分类与识别[4-6]。检索国内外文献发现,高光谱技术已经逐渐取代传统的果蔬检测方法[7-9],广泛应用于果蔬的品质检测[10-12]。黄瓜作为重要的蔬菜作物,因其在贮藏过程中易发生腐败变质,需要及早及时监测黄瓜在贮藏过程中的品质变化,以实现黄瓜腐败变质的早期预警。目前,黄瓜腐败主要是通过测定黄瓜的pH值[13]、失重率[14]、可溶性固形物含量[15]等传统的理化分析方法,或者通过观察黄瓜皮颜色[16]、纹理[17]等表观特征进行判别。但上述方法都存在费时费力的缺点,而且测定结果受人工操作影响较大,无法实现快速监测黄瓜品质的变化,更难以实现黄瓜腐败的前期快速预警。然而运用高光谱技术可以克服以上不足,及时地实现黄瓜腐败变质的早期预警。
马氏距离(Mahalanobis distance, MD)[18]于1936年由印度统计学家马哈拉诺比斯(Mahalanobis P C)提出。它是一种有效计算1个样本与样本集“重心”的最近距离,或者计算2个未知样本集相似度的方法。MD作为一种新型光谱多元分析模式识别方法[19],目前已广泛应用于天文[20]、生态系统识别[21]、塑料牌号识别[22]等领域,但有关应用MD法检测黄瓜贮藏过程中距离腐败远近的研究尚鲜见。本研究以常温贮藏过程中的黄瓜为试验材料,并以高光谱光谱信息为依据融合MD探究黄瓜贮藏过程中腐败变质的预警方法,以期为黄瓜在实际贮藏过程中腐败的早期预警提供一种新手段,为其他果蔬的腐败早期预警提供参考方法。
1 材料与方法
1.1 试验材料
新鲜黄瓜,品种为德瑞特D19,总质量为500 kg,于2018年10月16日购于当地温室大棚,常温存放于贮藏库中自然腐败。分别于黄瓜贮藏第1、第2、第3、第5、第7、第8、第9、第10天采集其高光谱数据及对应样本的pH值和失重率数据。
1.2 主要仪器与设备
高光谱图像采集系统包括高光谱成像仪(IST50-3810型,德国Inno-Spec公司),2个500 W光纤卤素灯(RK90000420108型,德国Esylux公司),驱动传送装置和计算机。高光谱成像仪通过USB2.0连接计算机[23]。该仪器光谱采集范围为371.05~1 023.82 nm,光谱分辨率为2.8 nm,在光谱范围内共采集1 288个波段。PHS-3E型pH计(上海雷磁)。
1.3 样本数据采集
1.3.1 样本高光谱数据采集 在正式试验之前,首先进行高光谱黄瓜采集预试验,调整高光谱采集系统的参数[24]。具体调整方法如下:首先,静态调整物镜高度,确保采集的黄瓜样本片高光谱图像清晰;然后,调整最佳曝光时间及平台移动速度,确保动态采集的黄瓜样品片高光谱图像不变形、不失真。经过多次调整及优化,最终确定物镜高度为350 mm,电荷耦合器件(charge coupled device camera,CCD)相机的曝光时间为90 ms,载物平台的移动速度为2 mm·s-1,采样波长间隔为0.51 nm。每次试验当天从贮藏库中随机选取10根黄瓜,统一从每根黄瓜头部切5片,共计50片样本进行高光谱数据采集。黄瓜样本片不仅包含黄瓜表皮信息还有黄瓜内部果肉信息。每次试验时将1个样本平铺在高光谱黑色输送带上进行高光谱数据采集。图1、2分别为贮藏第3天(腐败前)、贮藏第7天(腐败当天)采集黄瓜样本的高光谱图像示例。
图1 腐败前黄瓜样本高光谱图像Fig.1 Hyperspectral image of cucumber sample before spoilage
图2 腐败当天黄瓜样本高光谱图像Fig.2 Hyperspectral image of cucumber sample on the day of spoilage
由图1、图2可知,不同贮藏时间黄瓜样本的高光谱图像是不一样的。为了减弱或消除高光谱图像采集过程暗电流和噪音对试验结果的影响,需要对采集的高光谱图像用公式(1)进行黑白校正[25]。
(1)
式中,R为校正后的高光谱图像;I为高光谱原始图像;W为全白标定图像;B为全黑标定图像。
1.3.2 样本pH值和失重率数据采集 用于表征黄瓜腐败的理化指标较多,其中pH值和失重率的检测操作较为简便,变化趋势较明显,更能直观反映黄瓜腐败过程中理化性质的改变。由于高光谱图像采集和pH值测定部位均取自黄瓜头部,pH值测定后的黄瓜样本受损严重无法用于高光谱图像采集,而高光谱图像采集后的样本失水严重同样影响pH值的测定结果;此外,测定黄瓜失重率时需要固定样本。因此,为避免黄瓜样本个体差异对所建立预警模型的影响,提高模型泛化应用能力,采用不同的黄瓜样本用于高光谱图像采集和pH值及失重率的测定。
1)pH值测定:每次试验当天从贮藏库中随机选取3根黄瓜,每根黄瓜先去除头部不均匀部位,然后取10 g黄瓜头部切成小块放入匀浆机,再加入90 mL蒸馏水,匀浆80 s,最后将匀浆倒入锥形瓶中,编号备用。用pH计测量样品的pH值,每个样品测定3次,求平均值。
2)失重率测定:第一次试验当天从贮藏库中不同置物架随机选取6根黄瓜,用标签纸标明样品架号和层号,编号备用。用电子天平依次测量每个样品的质量W,之后每天的质量为w,根据公式(2)计算样品的失重率α,6个黄瓜样品的平均值作为该天黄瓜样本的失重率:
(2)。
此外,每次试验当天从贮藏库中挑选黄瓜样本进行pH值和失重率数据采集时,均对贮藏库中黄瓜进行整体感官评定,并对黄瓜形态、瓜皮颜色,萎蔫程度,是否霉变等品质特征变化进行记录,以便为之后判断黄瓜腐败发生日提供参数。
1.4 数据处理
1.4.1 感兴趣区域选取 黄瓜样本形状不规则,并且同一样本不同部位光谱值相差较大,需要用ENVI5.1软件根据样品与背景的光谱差异手动将样品从背景中分离。从ENVI5.1软件得到的一个样本图像中不同区域的光谱值如图3所示,图中绿线为背景光谱值曲线,蓝色曲线最高点处波长下样本与背景光谱差异最大,选择最高点处波长为703.69 nm,在此波长下选取样本片为感兴趣区域(region of interest,ROI)[26](图4);然后提取该ROI的光谱信息。平均光谱值是ROI图像所有像素点光谱反射值的算术平均数,可以反映某一特定波长下样本高光谱图像光谱反射值,能表述整幅图像。
图3 黄瓜样本图像中不同区域的光谱特征图Fig.3 Spectral feature map of different regions in cucumber sample image
图4 黄瓜样本图像感兴趣区域提取Fig.4 Extraction of region of interest from cucumber sample image
1.4.2 原始光谱预处理 为减少光谱噪声的影响,剔除信噪比较低的边缘波段(371.05~480.55 nm及876.97~1 023.82 nm),保留481.06~876.47 nm范围内的平均光谱。采用Savitzky-Golary卷积平滑法(SG平滑)[27]对保留的光谱数据进行预处理,以减少电流、噪声等外界因素对光谱信息的干扰。
1.4.3 特征波长提取方法 为了简化分析,降低预警模型构建的复杂性,用偏最小二乘回归系数法[28-29]进行特征波长提取,确定适合黄瓜腐败变质检测的特征波长。该方法是通过构建表征黄瓜腐败进程的pH值和失重率测量值对各波长光谱反射值的回归模型,回归表达式中每个波长的回归系数表征各波长的贡献比重,回归系数的绝对值越大,表明该波长越能表征黄瓜的品质特征。
1.4.4 预警模型构建方法 MD作为一种新型光谱多元分析模式识别方法,与其他距离相比,具有排除变量之间相关性的干扰和不受量纲影响的优点。通过计算腐败前不同贮藏天数(或不同测试日期)光谱特征值与腐败黄瓜基准光谱特征值间的MD来表征黄瓜在贮藏过程中距离腐败基准的接近度,MD值越大,说明该贮藏天数的黄瓜距离腐败越远;MD值越小,说明该贮藏天数的黄瓜距离腐败越近,由此实现黄瓜腐败的预警。MD的优势在于可以小样本建立预警模型。为了提高模型的可靠性,该模型通过计算每个贮藏天数50个黄瓜样本数据的均值特征值向量与腐败基准光谱特征值向量MD实现预警。按照公式计算MD:
dij(M)=(X(i)-X(j))′S-1(X(i)-X(j))
(3)
式中,dij(M)为样本i与样本j之间的MD值,S-1为样本j协方差阵的逆矩阵。X(i)为黄瓜每个贮藏天数50个样本的均值向量,X(j)为腐败基准贮藏天数50个样本的均值向量。
2 结果与分析
2.1 光谱预处理
对比图5和图6可知,经SG平滑处理后的光谱曲线平滑很多,说明已极大地减少了噪声和暗电流等环境因素对所采集光谱数据的影响,更有利于后面预警模型的构建。
图6 经SG平滑处理后黄瓜光谱图Fig.6 Spectrogram of cucumber after smoothing by SG
2.2 样本腐败基准确定
前人研究表明,黄瓜在贮藏期内其品质和形态颜色都在不断地发生着变化,其中pH值和失重率均呈上升趋势[30]。而本研究中,由表1可知,黄瓜pH值在贮藏期间呈波动变化,与期望中的上升趋势有差别,这可能是由于每次测试的样品是随机的;黄瓜的失重率呈上升趋势,与预期的趋势一致。感官评定发现,黄瓜从贮藏第7天开始出现不同程度的腐烂、头部肿大、尾部发霉、表皮发黄等症状。由图7可知,黄瓜样品不同贮藏天数的平均光谱反射值曲线趋势基本相似,而且在740.37~876.47 nm波长范围内不同曲线基本成平行状态。随机取此范围内的波长——802.3 nm,得到此波长下黄瓜样品不同贮藏天数的平均光谱反射值曲线,如图8所示。
表1 黄瓜样本的pH值和失重率Table 1 pH value and mass loss rate of cucumber
图7 黄瓜的平均光谱反射值曲线Fig.7 The average spectral reflectance curve of cucumber
图8 802.3 nm波长下黄瓜的平均光谱反射值曲线Fig.8 Average spectral reflectance curve of cucumber at 802.3 nm wavelength
由图8可知,贮藏第7天黄瓜的平均光谱反射值最低,这是因为随着贮藏过程中黄瓜新鲜度的降低,其平均光谱反射值逐渐降低,但黄瓜腐败之后随着腐败产物增多,其平均光谱反射值又升高,结合感官分析可以确定第7天为黄瓜的腐败发生日,故拟定此日光谱信息作为表征黄瓜腐败的基准光谱值。
2.3 特征波长选取
用偏最小二乘回归系数法提取表征黄瓜腐败的特征波长,得到黄瓜的权重系数图,如图9所示。
图9 黄瓜的权重系数图Fig.9 The weight coefficient diagram of cucumber
根据1.4.3的方法,每个波长下所对应的回归系数绝对值越大表明该波长对所建模型预测性能的影响也就越大。由图9可知,第1主成分和第2主成分下不同波长对应的回归系数波动较小,涵盖的信息较为全面和常见,不能较好地体现样本间的差异,第3主成分波动明显,可较好地体现样本间的差异,所以选取第3主成分回归系数波峰和波谷所对应的波长为特征波长,分别为554.34、589.69、599.93、627.57、646.50、683.28、716.95、742.40、777.97、823.55 nm。这样便可获得每个测试日期适合黄瓜腐败变质检测的特征光谱信息矩阵,大小均为50个样本×10个特征波长。腐败黄瓜基准光谱特征值即黄瓜贮藏第7天光谱值是通过使用与其他贮藏天数一样的偏最小二乘回归系数法提取特征波长后得到的特征光谱信息矩阵,大小也为50个样本×10个特征波长。
2.4 样本预警模型构建
根据1.4.4的方法,构建了基于腐败基准的黄瓜腐败马氏距离(MD)预警模型。为了预警黄瓜常温贮藏过程中发生腐败,所以本研究只计算分析了黄瓜腐败前不同贮藏日期(贮藏第1、第2、第3、第5、第7天)50个样本×10个特征波长特征光谱信息矩阵与腐败基准(贮藏第7天)50个样本×10个特征波长特征光谱信息矩阵的MD。由表2可知,随着贮藏天数增加,MD值的变化呈下降趋势,充分印证了贮藏日期越接近腐败基准日期黄瓜越接近腐败这一事实。因此,基于腐败基准的MD模型可有效实现黄瓜的腐败预警。
表2 黄瓜不同贮藏天数与腐败基准的MD值Table 2 MD value of cucumber during different storage days and spoilage benchmark
图10为黄瓜不同贮藏天数与腐败基准间的MD折线图,可进一步直观地揭示样本在贮藏过程中的变化情况。结果表明,随着贮藏天数的增加,与腐败基准黄瓜光谱值的MD值越来越小,说明黄瓜越来越接近腐败。黄瓜实际贮藏过程中也是越来越接近腐败,进一步验证了所建立MD预警模型的正确性。
3 讨论
黄瓜采后不仅易受机械损伤,而且易受到真菌或细菌侵染,发生腐败,造成极大的经济损失[31]。因此,及早地预警黄瓜腐败,可以为即时处理提供决策,具有重要的现实意义。本研究在试验数据处理中,借鉴了邹小波等[27]的SG平滑预处理方法,极大地减少了外界噪声、暗电流等因素对黄瓜高光谱数据的影响。特征波长的提取对减少计算量、提高检测精度至关重要。本研究运用偏最小二乘回归系数法提取的特征波长实现了预警,这与殷勇等[29]利用高光谱技术结合特征波长检测霉变玉米黄曲霉毒素B1的结论一致。但特征波长的选择方法可能并非最佳,所以针对高光谱特征波长的选择仍需进一步研究。在高光谱果蔬品质检测方面,对果蔬新鲜度和理化性质方面的检测报道较多,如刘晶晶等[32]利用高光谱图像技术检测了苹果外部损伤;孙静涛等[33]采用高光谱技术结合特征波长筛选的方法对哈密瓜的可溶性固形物含量、硬度及成熟度进行了检测研究;由于果蔬腐败基准难确定以及缺乏腐败预警模型和构建方法,在运用高光谱技术及早预警黄瓜腐败变质方面的研究尚鲜见。所以,本研究以高光谱的光谱信息为依据,融合MD探究了黄瓜贮藏过程中腐败变质的预警方法。预警结果表明,在选定黄瓜腐败基准光谱数据的前提下,通过计算不同贮藏天数黄瓜与腐败基准光谱数据的MD,判定黄瓜距离腐败的程度,从而实现预警。此外,本研究所建立的MD预警模型在实际应用中可用于少量样本的腐败预警,为其他果蔬贮藏过程中的腐败预警提供了参考方法。
高光谱成像技术在果蔬腐败预警中的应用仍然存在一定的局限性,还需进一步完善,另外本研究黄瓜样本的数量及种类较少,地域、品种覆盖范围不够广,构建的预警模型泛化能力有待进一步提高,后续工作仍有待深入研究。
4 结论
本研究采集了黄瓜不同贮藏天数高光谱数据,并在SG平滑处理原始数据的基础上,用偏最小二乘回归系数法提取了表征黄瓜腐败的特征波长,最后构建了基于特征光谱信息的MD预警模型。结果表明,偏最小二乘回归系数法提取的特征波长不仅是适合黄瓜腐败变质检测的特征波长,而且大大减少了全波长庞大的数据量,降低了计算量;建立的MD模型可以较好地度量贮藏黄瓜接近腐败的程度,以便为即时处理提供决策。本研究结果充分说明了所提出的黄瓜贮藏过程中用于腐败预警的方法是有效的。