APP下载

基于高光谱成像技术预测牡蛎干制加工过程中的水分含量

2020-08-03陈李品于繁千惠陈桂东李兆杰薛长湖

中国食品学报 2020年7期
关键词:牡蛎波长校正

陈李品 于繁千惠 陶 然 陈桂东 李兆杰 薛长湖

(中国海洋大学食品科学与工程学院 山东青岛266003)

牡蛎是世界上第一大养殖贝类,也是我国四大养殖贝类之一,资源丰富,是一种营养价值高的天然保健食品,也是一种具有药用价值的海洋生物[1]。牡蛎干制品具有风味独特,耐储藏,携带方便等特点,因而受到广大消费者的欢迎。在牡蛎干制品加工过程中,水分含量是一个重要的品质评价指标,与风味、质构及货架期息息相关[2]。目前,水分含量检测方法主要是干燥称重法[3]或水分含量测定仪法,虽然干燥称重法的操作简单,成本低,精度高,但耗时长,对样品有破坏性,不利于牡蛎干制过程中水分含量的在线实时检测。

高光谱成像技术(Hyperspectral imaging,HSI)作为一种非传统、非破坏性的技术,提供了研究对象的空间信息和光谱信息,达到“图谱合一”的效果[4],该技术既可以检测物体的外部品质,又可以像光谱技术一样检测物体的内部品质,用于定性、定量分析[5]。近年来,高光谱成像技术在食品检测[6-7]、分类[8-9]等方面的研究日益广泛,如西班牙的Talens 等[17]利用高光谱成像(900~1 700 nm)测定西班牙熟火腿的水分,采用偏最小二乘回归(PLSR)和偏最小二乘法判别进行多元分析,对熟火腿进行品质分级。目前,在水产方面,该技术被应用于脱水虾[10]、干贝[11]、三文鱼[12]等的水分含量可视化检测,以及检测肉的新鲜度[13-14]、持水力[15]分析等。目前鲜见采用高光谱成像技术预测牡蛎干制过程中水分含量的相关研究报道。

本研究采用高光谱成像技术检测牡蛎干制过程中水分含量的变化,并用化学计量学方法分析数据,以期建立一种预测牡蛎水分含量的实时在线检测技术,推进水产加工实现数字精细化。

1 材料与方法

1.1 材料与预处理

新鲜牡蛎,青岛水产市场。挑选大小均一的样品,用保鲜袋包装并编号,20 个牡蛎为1 组。沥干水分后开壳,分别称重(记为M0);将牡蛎置于37℃干燥箱中冷风干燥1 h,取出后置于干燥器中冷却,20 ℃时称重(记为M1),并将样品横放于传输平台上,然后采集每个样品的高光谱图像。循环烘干-称重-采集图像,共得到100 个高光谱图像(源于5 个干燥时期:1,2,3,4,5 h)。采用交叉验证的方法建立校正集和预测集。通过公式(1)计算水分含量。

1.2 高光谱成像系统

高光谱成像采集系统主要构成部分:线扫描成像光谱仪image-λ-V10E-LU (Spectral Imaing Ltd.,芬兰SPECIM)(帧频:15~60 fps,空间通道数:1 392;光谱通道数:1 040(953),传输方式:USB)、面阵CCD 相机(Hamastsu Ltd.,芬兰SPECIM)、镜头OLE-23(Spectral Imaing Ltd.,芬兰SPECIM)、电移台PSA200-11-X(四川双利合谱科技有限公司)、光源调节器(3900,Schott,芬兰SPECIM)、对称分布的4 个150 W 卤素灯线光源(HSIA-LS-T-200W,加拿大)和计算机。全套系统的外部被黑色密闭柜封闭,以避免外界光照对采集图像的影响。

为防止基线漂移造成数据不准,采集光谱前将仪器预热30 min。在采集牡蛎干样本高光谱图像前,对试验参数进行调整,最终参数设置:光谱范围400~1 100 nm,曝光时间6.6 s,物距348 mm,其中电控位移平台的移动速度设为0.9 cm/s。

为减弱成像光谱仪相机暗电流和室内光照度的影响,需要对原始高光谱图像I0进行黑白板校正。扫描标准白板得到白色标定图像W(反射率~100%),旋上相机镜头盖采集到黑色标定图像B(反射率~0%),校正后的高光谱图像I 通过式(2)校正。

式中,I0——样品的原始漫反射光谱图像;W——白板的漫反射图像;B——暗图像;I——校正后的漫反射光谱图像。

1.3 高光谱图像处理

校正后得到高光谱图像。通过ENVI4.7(Research system Inc,Co.,美国)选取整个牡蛎干的图像作为感兴趣区域(region of interest,ROI),并计算光谱的平均反射值,即可得到样本反射光谱曲线。依次提取所有样本的平均光谱,得到100×256(样本数× 变量数)光谱矩阵。

1.4 光谱预处理

为消除由散射和光学干扰引起的样品间潜在的变异性,如散射、噪声、漂移等,并提高模型的准确性和可靠性,需要对原始光谱数据进行预处理。

多元散射校正(MSC)主要是消除颗粒大小和颗粒分布不均匀产生的散射影响。MSC 算法是基于一组样品的光谱矩阵进行运算的。首先计算校正集样品的平均光谱;然后将理想光谱与原始光谱进行线性回归计算,可得出多元散射校正后的光谱[16]。

高光谱成像仪得到的光谱信号还会叠加随机误差,称之为噪声。卷积平滑法(S-G)被较多的应用在光谱去噪方面。通过在被平滑点的前、后随机选取若干点进行“平均”或“拟合”,以得到平滑点的最佳估计值,从而降低随机噪声。

1.5 特征波长的选择

试验中用来建模的样本数高达上百个,且每个高光谱数据有上百个波段,这就会导致整体的数据矩阵非常大。因此,为减少原始光谱的数据冗余,去除无关信息,建立一种低维的数据模型至关重要。

相关系数是光谱分析中常用的一种选择特征波长的方法,通过计算一组样本的某一波长吸光度与待测浓度之间的相关性,若相关性较高,就可以选择这一波长作为特征波长。两个变量之间的线性相关程度可以用相关系数R 或者决定系数R2来描述[17-18]。因此,本研究计划采用相关系数法提取出对水分敏感的特征波长。

1.6 建模

光谱的定量建模分析即为定量校正,也称多元校正,其原理是在物质浓度(即理化值)与仪器的响应值(即光谱) 之间建立一种定量的关联关系。

多元线性回归[19](Multiple linear regression,MLR)是早期光谱定量分析中常用的方法。多元线性回归模型也可以称为复线性回归分析,它研究的是一组自变量如何直接影响一个因变量[20]。利用误差最小的原理,求解一个或多个特征波长下的反射值与所研究的样品品质指标之间的关系。

BP 神经网络由输入层、隐含层和输出层构成,结合牡蛎干水分含量实测值与特征波段下感兴趣区域光谱平均反射值的回归分析。

采用相关系数R 和均方根误差RMSE 对模型的预测能力进行验证和精度评价。R 值越接近1,说明所建模型精度越高,RMSE 值越接近零,且RMSEC 和RMSEP 差异越小,所建模型越稳健。模型建立及评价都基于MATLAB(The Math Works,Natick,USA) 软件。

2 结果与分析

2.1 干制加工过程中水分含量与光谱曲线分析

从表1可见,由于牡蛎干制加工时间跨度较大,使得样品的水分含量相差较大,导致标准偏差大,说明样本具有较好的代表性,模型的广泛性也较好。

由图1可见,不同干制加工时间牡蛎干的平均光谱反射率曲线的趋势相似,随着水分含量的减少,光谱反射率呈下降趋势。牡蛎干光谱平均反射率曲线在波长970 nm 附近有一个波谷,可能是由于水分子中O-H 三级倍频吸收带造成的[21]。水是牡蛎的主要成分,因此水分含量的减少可以被认为与光谱曲线变化的相关性较大。光谱反射率曲线可以定性解释牡蛎干的光谱特征,而需要进一步采用化学计量学的方法建立模型对牡蛎干水分含量进行定量预测。

图1 不同干制加工时间牡蛎干的光谱平均反射率曲线Fig.1 The spectral average reflectance curves of oysters at different drying times

表1 牡蛎干的水分含量Table 1 Summary of moisture content in samples

2.2 光谱预处理

未经预处理的平均反射率光谱图和经过不同预处理后的光谱曲线如图2所示。经过平滑、多元散射校正、平滑与多元散射校正结合预处理后的光谱曲线虽基本保留了原始光谱的吸收特性,但有不同程度的强化。

2.3 特征波长的选择

本试验共有256 个波段,若直接用来建模,必然会因为输入数据量过大,而影响模型运行的速度和精度。因此,在建模之前将水分含量实测值与全波段下感兴趣区域光谱平均反射值进行相关系数分析,以选取特征波长。从图3可以看出,相关系数范围在-0.8~0.8 之间,说明水分含量和光谱平均反射值之间相关性较好[22]。选择8 个相关系数的极大值或极小值作为特征波长,分别为429,491,530,555,600,817,917,970 nm。

图2 原始数据与经过预处理后的光谱图Fig.2 Raw data and spectra after pretreatment

图3 基于相关系数的特征波长的选择Fig.3 Selection of characteristic wavelength based on correlation coefficient

2.4 基于特征波长的水分预测模型

2.4.1 MLR 模型 基于所选择的特征波长分别对未经过预处理、多元散射校正、卷积平滑校正、多元散射校正结合卷积平滑校正后的数据建立MLR 模型,分别为Y0、YMSC、YS-G、YMSC+S-G,如式(3)、(4)、(5)、(6)所示。其预测结果见表2。从表2中可以看出,4 种模型都取得了相对较好的效果,说明所提取的特征波长基本涵盖了牡蛎干水分的特征信息。特征波长模型均取得了良好的结果,4 个MLR 模型的Rp、Rc 和Rcv 都较高,Rp 分别为0.8916,0.8775,0.9007,0.8885,Rc 分别为0.8538,0.8946,0.8284,0.8831,Rcv 分别为0.8774,0.8858,0.8800,0.8846,且RMSEC、RMSEP 和RMSECV 都较低。从预测结果分析,R 值和RMSE 值增降幅度并不大,因此认为4 个MLR 模型的预测效果相当,都可预测牡蛎干的水分含量。

表2 高光谱成像技术预测牡蛎水分含量模型的性能Table 2 Performances of models for prediction of moisture content of oysters by hyperspectral imaging technique

YMSC+S-G=454.9940-1.3695X429+3.6667X491+2.4201X530-8.3629X555-4.3013X600+0.4326X817+0.1130X917-6.0722X970

由图4可见,样本均以比较近的距离均匀分布于回归直线周围,说明该模型比较准确地预测了牡蛎干的水分含量。

图4 MLR 模型的预测值和实际值的散点分布图Fig.4 Scatter plot of predicted and actual values for the sample

2.4.2 BP 神经网络模型 基于所选择的特征波长分别对未经过预处理、多元散射校正、卷积平滑校正、多元散射校正结合卷积平滑校正后的数据建立BP 神经网络模型,其预测结果见表3。

表3 高光谱成像技术预测牡蛎干水分含量模型的性能Table 3 Performances of models for prediction of moisture content of oysters by hyperspectral imaging technique

由表3可见,4 种模型都取得了相对较好的效果。说明所提取的特征波长基本涵盖了牡蛎水分的特征信息。4 个模型的Rp、Rc 和Rcv 都较高,Rp 分别为0.9996,0.9995,0.9995,0.9995,Rc 分别为0.9995,0.9807,0.9802,0.9817,Rcv 分别为0.9994,0.9918,0.9921,0.9904,且RMSEC、RMSEP和RMSECV 都较低。分析以上4 种模型,R 值和RMSE 值增降幅度并不大,认为BP 神经网络4 个模型的预测效果相当,都能达到很好的预测效果。

图5 BP 神经网络模型的预测值和实际值的散点分布图Fig.5 Scatter plots of predicted and actual values for the BP neural network model

从图5可以看出,样本均以较近的距离均匀分布于回归直线周围,说明相关系数法提取的特征波长基本涵盖了牡蛎干水分的特征信息,可以使用该模型对牡蛎干水分含量进行预测。

从表2,3,图4,5 可以看出,两种模型都取得了较好的预测效果。而MLR 模型的校正集、预测集和交叉验证集相关系数较BP 神经网络低,BP神经网络效果较好。然而,从RMSEC、RMSEP 和RMSECV 分析,MLR 效果较BP 神经网络好。结果表明,两种模型都显示高光谱成像技术结合化学计量学方法可用于检测牡蛎干制加工过程中水分含量。

3 结论

本研究验证了采用高光谱成像技术结合化学计量学的方法对牡蛎干水分含量预测的可行性。采用相关系数法提取特征波长,并对光谱数据进行多元散射校正、卷积平滑校正后分别建立MLR模型和BP 神经网络模型,对预测集样本的水分含量进行预测。结果表明,MLR 模型和BP 神经网络模型均取得了较好的结果。本研究为牡蛎干制加工过程中水分含量在线实时无损检测提供了参考。

猜你喜欢

牡蛎波长校正
杯中“日出”
劉光第《南旋記》校正
环境温度和驱动电流对LED的峰值波长的影响
LED峰值波长对多光谱组合白光色参数的影响
建立在校正系统上的强大实力Sonance所能士i12
法国培育出多口味牡蛎
在Lightroom中校正镜头与透视畸变
机内校正
昙石山文化的牡蛎器
《如何煮狼》:煮狼的女人爱牡蛎