基于高光谱成像技术的鲜食核桃仁水分检测研究
2021-04-02牛瑞敏张淑娟陈彩虹孙海霞高庭耀
牛瑞敏,张淑娟,陈彩虹,孙海霞,高庭耀
(山西农业大学农业工程学院,山西 晋中 030800)
0 引言
我国是世界上最大的核桃生产国和消费国,鲜核桃仁具有丰富的营养价值,口感脆嫩香甜,近年来在市场上掀起了一股鲜食核桃的消费热潮[1-3]。货架期是影响水果品质的重要因素,目前,核桃在采后的贮运销环节,所处状态基本为室温下的货架期状态[4]。而货架期的核桃仍具有活性,青皮会发生失水皱缩,甚至产生褐变,使其售卖价值下降。同时,核桃仁的水分含量也会随贮藏时间的变化而变化,而鲜食核桃仁的含水量不得低于17%[5]。因此,探究青皮的光谱信息与核桃仁水分含量的关系成为很多学者关注的技术问题。
高光谱技术具有波段多、光谱分辨率高等特点,可以实现简便、快速、无损和准确检测[6-9]。目前,高光谱技术已经成功应用于果蔬等农副产品的货架期预测和判别。邵园园等[10]采用高光谱成像结合化学计量学方法对不同储存条件下的保鲜猕猴桃进行了货架期预测。李雄等[11]利用高光谱成像技术,结合偏最小二乘判别法和偏最小二乘支持向量机算法对酥梨货架期进行了判别。周莉萍等[12]利用高光谱技术对覆盖保鲜膜的新鲜菠菜叶片货架期进行预测,建立了偏最小二乘法判别分析模型。
现有的研究主要针对干食核桃,而利用高光谱成像技术预测货架期青皮核桃的核桃仁水分含量鲜见报道[13-15]。本试验利用高光谱成像技术结合化学计量学方法对货架期青皮核桃的核桃仁水分进行快速预测,为食品加工企业和消费者在购买青皮核桃时对其品质的判断提供参考依据。
1 试验部分
1.1 试验材料
本试验所用“礼品2号”核桃样本采摘自山西省汾阳市协和堡村。采摘时挑选大小相近、表面光滑、无缺陷损伤的青皮核桃,采后装于垫有泡沫的纸箱内,采摘当天运回实验室。将精选出的240个核桃样品分别编号和标记,并在常温条件下储藏。采后的第1、5、9、13、17天从常温储藏的样品中每次随机抽取48个样品,采用Kennard-Stone算法按3∶1划分样本,其中,校正集180个,预测集60个[15]。分别对其进行光谱采集,再进行青皮及核桃仁水分含量的测定。
1.2 仪器设备
本试验采用北京卓立公司开发的“盖亚”高光谱分选仪,仪器主要由Image-λ-N17E光谱相机、4个35 W溴钨灯、暗箱、电移动平台和计算机组成,波长范围900~1 700 nm。为防止采集信息过度饱和而出现失真现象,需要先调整仪器的曝光时间和平台移动速度,设置曝光时间20 ms,平台移动速度2 cm/s,样本与镜头距离22 cm。
1.3 采集高光谱数据
为了消除镜头暗电流、光照不均等对所采数据的影响,需要在对数据进行分析处理前进行黑白校正[16]。通过扫描标准白板及遮挡镜头分别获得全白图像W和全黑图像B。校正公式如式(1)所示。
(1)
式中R——校正后图像
I——原始图像
采集高光谱图像时,正反两面各采集1次。利用ENVI 5.1提取感兴趣区域(ROI)时,选择20×20像素的区域作为感兴趣区域,以正反感兴趣区域的平均反射值作为该样本的原始光谱信息。青皮核桃不同货架期的平均光谱如图1所示。
图1 青皮核桃货架期平均光谱曲线Fig.1 Average spectral curve of fresh walnut during shelf life
1.4 测定含水率
测定所有样本的青皮含水率。通过手工破壳取仁并保持核桃仁的完整性,测定对应的核桃仁含水率。按照国家标准GB/T 5009.3—2016中的“直接干燥法”测定水分含量,结果如表1所示。
表1 货架期青皮及核桃仁含水率统计Tab.1 Statistics of moisture content of green skin and walnut kernel during shelf life
1.5 模型评价
模型的好坏由校正集相关系数(RC)、校正集均方根误差(RRMSEC)、预测集相关系数(RP)和预测集均方根误差(RRMSEP)评价。以RC和RP越接近1,RRMSEC和RRMSEP越小为标准选择最优模型。
2 结果与讨论
2.1 相关性分析
核桃青皮与核桃仁的货架期平均含水率如图2所示。
图2 货架期平均含水率Fig.2 Average moisture content in shelf life
由图2可知,核桃青皮与核桃仁的含水率均随着货架期的增加而逐渐降低。为进一步确定两者的关系,采用SPSS statistics 26软件对青皮及核桃仁的含水率进行相关性分析。采用斯皮尔曼(spearman)相关性系数表示青皮及核桃仁含水率之间的相关关系。其计算公式如(2)所示。
(2)
式中ρ——相关性系数
xi——第i个样本青皮含水率
yi——第i个样本核桃仁含水率
青皮含水率与核桃仁含水率的相关性分析如表2所示。由表2可知,青皮含水率与核桃仁含水率相关性系数ρ=0.614,说明这两者的含水率在0.01水平相关性显著。
表2 含水率相关性分析Tab.2 Correlation analysis of water content
2.2 提取特征波长
连续投影法(SPA)算法是基于不同波长变量之间投影的大小来选择候选特征波长,不仅可以消除冗余信息的共线性,而且可以避免有效信息的重叠问题[13]。所选出的特征波长如图3所示。由图3可知,选出11个特征波长,分别为963、1 010、1 100、1 154、1 189、1 275、1 345、1 373、1 653、1 685和1 700 nm。
图3 特征波长分布Fig.3 Characteristic wavelength distribution
2.3 建立模型
建模方法主要采用偏最小二乘回归法(PLS)、多元线性回归(MLR)和最小二乘支持向量机(LS-SVM)。
PLS回归广泛应用于光谱分析,是一种线性回归模型,其核心思想是把观测到的数据分成多个部分,每部分数据进行不同权重的线性组合后可用来表示该区域的相应值。
MLR较PLS计算简单,模型易于理解,并且在实际生产要求不太高时,这种方式能够降低模型复杂程度,并最终提高模型的速率。
LS-SVM是非线性回归模型,是一种高效的算法,可减少训练时间,提升运行速度,简化计算复杂度,在模式识别、回归分析等方面应用广泛。
本研究用SPA法提取特征波长后的特征值作为输入量,分别建立PLS、MLR和LS-SVM模型,含水率预测结果如图4所示。其中,PLS、MLR和LS-SVM模型的RP分别为0.771 6、0.771 9和0.800 7,RRMSEP分别为2.302 9、2.300 7和2.189 7。PLS和MLR预测精度相差不多,LS-SVM预测效果最好。
图4 PLS、MLR、LS-SVM模型预测结果Fig.4 Prediction results of PLS,MLR and LS-SVM models
3 结论
本文以采后第1、5、9、13、17天的青皮核桃为研究对象,利用SPA提取特征波长,分别建立PLS、MLR、LS-SVM模型。PLS模型的RP=0.771 6,RRMSEP=2.302 9;MLR模型的RP=0.771 9,RRMSEP=2.300 7;LS-SVM模型的RP=0.800 7,RRMSEP=2.189 7。所建LS-SVM预测效果最好。因此,利用高光谱成像技术可以实现货架期青皮核桃的核桃仁水分快速预测。