APP下载

高光谱成像技术预测香葱贮藏品质

2021-06-18王成全BonahErnestJoshuaHarringtonAheto黄星奕

食品工业科技 2021年10期
关键词:香葱叶绿素预处理

任 怡,王成全,Bonah Ernest,3,Joshua Harrington Aheto,王 锋,黄星奕,

(1.江苏大学食品与生物工程学院,江苏镇江 212013;2.苏州农业职业技术学院,江苏苏州 215008;3.食品药品监督管理局检验部,加纳阿克拉 00233)

香葱是一种重要的调味食品,深受人们喜爱。但其保质期短,在货架期会出现变色、软化、失水等现象[1],影响其品质。水分及叶绿素含量是绿叶蔬菜的主要品质参数。目前香葱水分与叶绿素含量的测定主要采用干重法[2]和分光光度法[3]。这两种方法检测精度高,但速度慢,且对样品具有破坏性。叶绿素检测仪能对植物叶片叶绿素含量进行无损检测,但其检测范围仅为2 mm×2 mm,不适用于细长的香葱植株。因此,本文选用合适的无损检测技术替代传统检测方法,对不同存储条件下香葱的货架期水分及叶绿素含量进行检测。

高光谱成像技术可同时采集样品的空间及光谱信息,实现对样品的无损检测[4]。部分学者使用高光谱成像技术对植物叶片的叶绿素和水分含量进行了测定[5-8],但均没有实现水分及叶绿素分布可视化,而另有学者用高光谱检测了农产品中颜色和水分的空间分布[9-11]。据此,高光谱成像技术能实现农产品的水分及叶绿素含量分布可视化,但香葱货架期水分及叶绿素分布情况的高光谱检测研究仍较罕见。

综上所述,本文主要研究香葱采后0~3 d不同存储方式下的水分及叶绿素含量变化情况,并使用高光谱成像技术实现了香葱水分及叶绿素含量分布可视化,以期为其他农产品品质参数的高光谱检测及可视化分布提供借鉴意义。

1 材料与方法

1.1 材料与仪器

整株带根的新鲜四季小香葱 采自当地农场,挑选单株重约1.5 g、直径2~3 mm、植株高约20 cm的香葱300株,清洗后装入塑料袋密封,用冰盒(2~8 ℃)迅速运至实验室;丙酮、石英砂、碳酸钙 均为分析纯,镇江华东器化玻有限公司;低密度PVC薄膜(鲜元) 淘宝商城。

UV-2450紫外可见分光光度计 日本岛津;BS224S电子天平 北京赛多利斯仪器系统有限公司;UF750烘箱 德国美墨尔特有限公司;ImSpector V10E高光谱相机 芬兰奥卢光谱成像有限公司;12 V,50 W石英卤素灯 荷兰皇家飞利浦公司;移动平台TSA200-A 北京卓立汉光有限公司。

1.2 实验方法

1.2.1 样品准备 将样本分为3组,以不同的方式存储。样品组“R”90株,用低密度的PVC薄膜包裹,置于4 °C冰箱内,模拟传统的方法储存;样品组“W”90株,室温(20 ℃)下水培;余下120株作为对照组“A”,置于20 °C室内。

采集当天取对照组样本30株,采后1~3 d每天取对照组“A”、样品组“R”、样品组“W”样本每组30株,进行数据采集。即上述每组30株样品中取15株香葱平行样,对每株样品进行高光谱检测,再获取各单株香葱的水分含量实测值;另从每组样品中取15株香葱平行样,对每株样品进行高光谱检测,再获取各单株香葱的叶绿素含量实测值。

1.2.2 高光谱信息的采集 高光谱成像系统由江苏大学自主研制,硬件结构见图1。

图1 高光谱成像系统Fig.1 Hyperspectral imaging system

为避免环境中其他光源干扰,高光谱图像采集需在暗室内进行。实验过程如下:打开卤素灯光源,预热30 min。将整株样本置于镜头下450 mm处的移动平台上,使样本与光源距离约为700 mm,调整镜头焦距,将移动平台采集图像时的速度设置为0.9 mm/s,进行反射光谱数据采集。

由于相机中的暗电流会导致图像噪声,需对原始高光谱图像进行黑白平衡校正。黑白平衡校正方法如下:使用标准白色校准板获得一副全白色校准图像W,盖上镜头盖获得全黑校准图像D,扫描样本后获得原始高光谱图像I。通过公式(1)计算可得黑白平衡后的高光谱图像R。

式中:W—白色校准图像,D—全黑校准图像,I—原始高光谱图像,R—校准后的高光谱图像。

软件(HIS analyzer)可以辅助进行高光谱图像的黑白平衡校正。

1.2.3 水分含量的测定 每组取15株高光谱数据采集后的样本,去除样本根部,将每株样本切为30 mm的葱段,用于单株样本水分含量测定。水分含量测定采用干重法。称取单株样本重量wo,放入铝盒(底部圆形直径50 mm,高40 mm)中,铝盒置于80 ℃烘箱中烘干。并在干燥器中冷却至恒重,使用电子天平称得样本重量wd。采用公式(2)计算香葱样品的水分含量:

1.2.4 叶绿素含量的测定 每组取15株高光谱数据采集后的样本,去除样本根部,将每株样本切为2 mm的葱段,用于单株样本叶绿素含量测定。称取单株葱段样本质量m放入研钵,加少量石英砂、碳酸钙粉末及80%丙酮溶液3~5 mL,将样本研成匀浆,继续研磨至样本组织变白,静置3~5 min。经丙酮溶液湿润的圆形滤纸折叠呈漏斗状,置于25 mL的棕色样品瓶口。用少量80%丙酮溶液冲洗研钵、研棒数次,将研钵内容物经滤纸转移至样品瓶内。用滴管吸取少量80%丙酮溶液,将滤纸上的叶绿素洗入样品瓶内,最后以80%丙酮溶液定容至25 mL。将提取液摇匀后,倒入光径1 cm的石英比色皿内,以80%丙酮溶液为空白,在波长663、645 nm下测定提取液吸光度A663和A645[12]。叶绿素的提取全过程需在避光条件下完成。叶绿素[13]的计算方法基于朗伯-比尔定律,计算公式如下:

式中: Ca—叶绿素a含量, Cb—叶绿素b含量,Ct—总叶绿素含量,单位均为毫克每克(mg/g);v—试液体积,单位为毫升(mL);m—样品质量,单位为克(g)。

1.3 数据处理

1.3.1 光谱数据的提取与数据集的划分 高光谱数据分析的第一步是去除图像背景,提取感兴趣区域(ROI)。本实验将除根部外的整株样本所在区域作为ROI。使用高光谱数据分析软件ENVI 5.3.1中的ROI工具将背景区域的像素点光谱值设为零,导出每株样本的ROI高光谱图像数据,用于后续光谱和空间信息的提取。将每个样本ROI内所有像素的光谱值自动平均,生成每个样本的平均光谱。

按1.2.1所述,300个经过高光谱检测的样本被平均分为两组,一组用于水分检测,一组用于叶绿素检测。因此,最终形成两个150×618的平均光谱矩阵,其中150表示样本数,618表示波段数。两个高光谱数据级矩阵分别命名为HW和HC,其中HW用于定量预测香葱样本的水分含量,HC用于定量预测香葱样本的叶绿素含量,且高光谱数据集HW和HC分别以2:1的比例划分成训练集和预测集。

1.3.2 光谱预处理 获取平均光谱数据集后,需对光谱进行预处理,以降低由暗电流及散射光引起的光谱噪声。

标准正态变异(SNV)校正方法是一种高光谱数据归一化技术[14],该方法假设每个光谱的数据点遵循正态分布过程。在这种假设下,每个光谱都经过预处理,使其尽可能接近无散射误差的理想光谱。

多元散射校正(MSC)是一种常用的散射去除技术[15-16]。MSC首先计算所有样品光谱的平均光谱[17],然后将平均光谱作为标准光谱,每个样品的光谱与标准光谱进行一元线性回归运算,求得各光谱的线性偏移量和斜率,使用公式(6)计算校正谱。

式中Xcor—校正谱,Xraw—原始光谱,b—偏移量,p—斜率。

卷积平滑法(savitzky-golay,SG)由移动平滑算法演变而来,能提高光谱的平滑性并降低光谱噪声[18]。假设滤波窗口宽度为5,即各数据点为X∈(Xm-2, Xm-1,Xm,Xm+1,Xm+2),SG将利用窗口内各数据的多项式拟合值替代Xm,并依次遍历各光谱数据值。

本文借助数据分析软件(The Unscrambler X 10.4)使用上述校正方法对HW和HC光谱数据集预处理后,分别建立偏最小二乘回归(PLSR)与支持向量机回归(SVMR)模型,并根据模型预测精度挑选最适用的光谱降噪方法。

1.3.3 模型的建立与评估 高光谱数据量巨大,存在较多冗余,导致数据处理速度慢,精度低。这也是目前高光谱实验多在实验室中进行的原因之一,该缺陷已成为便携式快速光谱检测仪器开发的主要障碍。因此,有必要采用合适的方法挑选最佳波长,加强对样本水分和叶绿素的预测速度与准确性。本文借助软件MATLAB R2018a,采用竞争自适应加权采样(CARS)算法进行特征波长的选择。从618个波长中选出最优波长。随后使用PLSR和SVMR算法建立基于特征波长的香葱品质参数预测模型,基于校正决定系数(R2c)、交叉验证决定系数(R2cv)、预测决定系数(R2p)、校正均方根误差(RMSEC)、交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)作为模型评价标准,选出最优预测模型。

1.3.4 水分和叶绿素含量的可视化 为了更直观地分析香葱样品在不同存储条件下水分和叶绿素品质参数的变化情况。首先需借助MATLAB R2018a读入去除根部后的香葱图像样本区域的三维高光谱图像,并平铺成n×m的二维矩阵(n为像素点个数,m为CARS优选的特征波段数),然后利用预测模型根据各像素点的特征波段光谱值预测出该点的水分和叶绿素含量值,再将各像素点的预测结果还原成二维矩阵,最后使用伪彩色图像表征去除根部后的香葱样本的水分和叶绿素含量分布图及变化趋势。

2 结果与分析

2.1 水分和叶绿素含量变化

图2为不同存储条件下测得的10组香葱水分和叶绿素含量平均值的变化情况。根据图2a中显示结果可知,随着存储时间的延长,空气中存放的香葱样品水分含量从新鲜时的91.40%下降至第3 d的71.74%,失水量大,出现萎蔫现象,严重影响了香葱的品质。冰箱中存储的香葱样品亦逐步轻微失水,含水率下降至84.30%,保鲜膜内部有水滴凝集,这可能是由香葱叶片新陈代谢形成的水分[19]。水培的香葱样品水分含量在第2 d下降至83.96%,第3 d反而上升至85.90%。可能采摘时香葱根部受损使其失水,而第3 d部分根部吸水功能恢复,重新使香葱含水率略有上升。

图2 不同存储条件下香葱水分及叶绿素含量Fig.2 Moisture and chlorophyll content of green onions under different storage conditions

从图2b的统计结果可知,空气中存放的香葱样品与水培的香葱样品叶绿素含量皆随货架期的延长而下降。空气中及水培的香葱样品在存储第3 d的总叶绿素含量分别下降至0.41和0.62 mg/g,叶片脱绿黄化较严重,失去食用价值。而冰箱冷藏的香葱样品叶绿素含量变化并不显著,3 d存储期内总叶绿素含量在1.01 mg/g上下波动。据文献[20],光照可改变植物叶绿体膜脂肪酸比例并促使植物产生活性氧,脂肪酸比例的改变使活性氧中的小分子更易进入叶绿体,加速叶绿素的降解。该解释与本文叶绿素测定实验结果相符,即无光照的冰箱冷藏样品组“R”叶绿素衰减程度低于暴露在自然光照条件下的空气存储样品组“A”及水培样品组“W”的香葱样品。另外,保鲜膜具有半透性,能抑制果蔬呼吸代谢,而绿叶植物叶绿素含量与氧气释放率呈负相关[21]。该理论也能解释本文实验结果。

2.2 光谱降噪预处理

图3a展示了不同香葱样品在431~962 nm波段的原始反射光谱曲线。光谱曲线明显具有绿色植物的轮廓特征。光谱曲线550 nm处出现了明显的反射波峰,该波峰主要由叶绿素及其他色素引起[22]。675 nm处的波谷与叶绿素的存在有直接关系[23]。在680~730 nm的光谱区域是红边区域,该区域的光谱反射率迅速上升。红边的位置和斜率特征往往能反映植物活性及叶绿素含量[24]。水分子中的O-H键二级倍频在960 nm处有吸收峰[25],图3(a)中960 nm处的波谷可能由香葱叶片中的水分产生。

由于相机暗电流及环境光散射等外界因素的干扰,原始反射光谱数据往往包含噪声。本文分别采用SG、MSC及SNV三种不同的预处理方法对原始光谱进行了相应转换,预处理后的光谱曲线如图3(b)~图3(d)所示。经过预处理的光谱数据更平滑、紧密,消除噪声的同时最大限度地保留了原有的光谱特征,以利于后续的数据分析。通过得到的三种光谱数据(SG、MSC及SNV)及原始光谱数据(RAW)分别建立预测香葱样品水分及叶绿素含量的PLSR和SVMR模型。各模型的预测精度如表1所示。

由表1可知,MSC预处理后的水分含量PLSR模型预测效果最好,预测决定系数高达0.8876;而原始光谱的水分含量SVMR模型预测效果最差,预测决定系数仅为0.7806。MSC预处理后的叶绿素含量PLSR模型预测精度最高,预测决定系数达0.8812;原始光谱的叶绿素含量PLSR模型预测精度最低,预测决定系数为0.7918。综上,MSC能有效消除散射并强化与目标成分相关的光谱信息,从而提升香葱水分和叶绿素预测模型的精度,故本文将采用去噪效果最好的MSC作为光谱预处理方法。

2.3 基于最优波长的模型建立与评估

图3 经不同降噪方法预处理后的光谱Fig.3 Spectra pretreated by different noise reduction methods

表1 不同预处理方法下基于全波段光谱数据的香葱水分与叶绿素含量预测模型精度Table 1 Accuracy of green onion moisture and chlorophyll content prediction models based on full-band hyperspectral data under different pretreatment methods

结合传统化学计量学方法,依据MSC降噪后的光谱数据所建模型已能较好地预测香葱样品的水分及叶绿素含量,预测集决定系数分别达到了0.8876和0.8812。然而,由于高光谱数据量庞大,数据本身包含很多冗余信息,影响了模型运算速度及精度。基于该缺陷,目前高光谱检测仍处于实验室研发阶段,极少应用于实际生产。因此,需选用合适的降维手段,减少冗余数据,以提升检测精度及速度。当前广泛使用的降维算法有主成分分析法,即将全波段高光谱数据转换为能代表数据集主要信息的若干个主成分,选用转换后的前n个主成分代替全波段高光谱数据建立相应模型。但该方法仍需采集样品的所有波段信息,所使用的检测仪器价格昂贵。本文采用CARS算法,通过1000次重复抽样运算,分别为水分预测模型及叶绿素预测模型选出若干条最优波段,提高模型运算速度和精度。

图4 CARS优选波长过程Fig.4 Process of optimal wavelength selection by CARS

图4 展示了CARS算法的运行过程。图中交叉验证均方根误差值随着抽样次数的增加呈现出先下降后升高的趋势,均方根误差最低值为欠拟合与过拟合的交汇点,故选取该点处的最优波长。最终选取了460、537、598、750、755、756、757、812、828、941、959共11个特征波段用于水分含量的预测;550、612、614、623、630、631、690、691、692、710、712、714、715、790、892、911、913、933、945、947共20个特征波段用于香葱叶绿素含量的预测。所选取的特征波段数量分别仅占全波段的1.78%和3.24%。极大地降低了数据冗余度,提高了模型运行速度与精度。

表2展示了基于全波段的预测模型与采用CARS算法挑选最优特征波段后建立的模型精度对比。使用CARS算法优选特征波段后,通过PLSR和SVMR建立的水分含量与叶绿素含量预测模型的预测决定系数分别提高了0.0170、0.0035、0.0433和0.0567。其中,CARS-PLSR模型进行水分含量预测效果最好,预测决定系数为0.9046,CARSSVMR模型进行叶绿素含量预测效果最好,预测决定系数可达0.9143。

2.4 水分和叶绿素含量的可视化

上文对香葱在不同存储条件下的品质属性(叶绿素和水分含量)进行了评价,并基于高光谱数据建立模型得到了较好的预测结果。然而,除了使用经过验证的预测模型准确预测这些品质属性外,可视化分布图在帮助分析人员确定不同存储条件影响下品质属性的变化或空间位置方面也很重要。

图5显示了所选香葱样品在不同存储条件下的水分和叶绿素含量的伪彩色分布图。图5顶部从红色到蓝色渐变的颜色条所给出的不同颜色代表了不同的水分和叶绿素含量水平。冷色(蓝色和绿色)代表水分和叶绿素含量较低,而暖色(红色、橙色和黄色)则表示含量较高。以空气中存放的对照组样品为例,储藏3 d的过程中,样品A0~A3的水分含量分布图从浅蓝色逐步变为深蓝色,同时叶绿素含量分布图从暖色调变为了冷色调,这意味着在空气中存放的样品随着存储时间的延长,其水分和叶绿素含量均明显下降。由图可见,随着存储时间的增加,空气中放置0~3 d的香葱样品A0、A1、A2、A3的水分含量和叶绿素含量急剧下降;水培1、2、3 d的香葱样品W1、W2、W3叶绿素含量略有下降,水分含量呈先下降后上升的趋势;冰箱中存储1、2、3 d的香葱样品R1、R2、R3水分及叶绿素含量下降并不显著。图5中不同样品的水分和叶绿素水平变化趋势与其对应组别实际测得的水分和叶绿素含量平均值的变化趋势(图2)几乎是一致的。该现象进一步验证了利用所建模型进行水分和叶绿素含量可视化分布的准确性和可行性。

表2 香葱水分与叶绿素含量预测模型精度Table 2 Accuracy of green onion moisture and chlorophyll content prediction models

图5 不同存储条件下香葱水分和叶绿素分布情况Fig.5 Distribution of moisture and chlorophyll in green onions under different storage conditions

3 结论

高光谱成像技术对香葱样品进行快速无损检测,采用4种不同的光谱预处理方法后分别建立基于全波段PLSR和SVMR模型,经比较MSC对光谱信息进行预处理后所建模型效果最好。使用CARS筛选最优波长后,分别使用1.78%和3.24%的光谱数据获得了很好的建模效果,所建叶绿素和水分预测模型的预测集决定系数分别达到0.9143和0.9046。根据所建预测模型将原始高光谱三维数据转换成了二维的水分与叶绿素含量分布图。结果表明:采用合适的化学计量学算法后,利用高光谱成像技术检测香葱贮藏期的品质是可行的。本文所研究内容对便携式果蔬采后品质参数含量分布快速无损检测仪器的开发提供了理论依据。

猜你喜欢

香葱叶绿素预处理
求解奇异线性系统的右预处理MINRES 方法
濮阳县细香葱高产栽培技术
香 葱
高COD二噻烷生产废水预处理研究
提取叶绿素
锌对白菜和香葱叶绿素含量的影响研究
我与香葱宝宝共成长
桃树叶绿素含量与SPAD值呈极显著正相关
基于预处理MUSIC算法的分布式阵列DOA估计
基于膜过滤的反渗透海水淡化预处理