皮蛋凝胶品质含水率和弹性的高光谱预测及其可视化
2022-02-16陈远哲王巧华
陈远哲,王巧华,2,*,高 升,梅 璐
(1.华中农业大学工学院,湖北 武汉 430070;2.农业农村部长江中下游农业装备重点实验室,湖北 武汉 430070)
皮蛋又称松花蛋、彩蛋,其风味独特,营养丰富,氨基酸比例均衡,易消化吸收,是我国特有的一种传统蛋制品[1]。皮蛋加工历史悠久,主要利用碱和盐腌制而成,其形成过程一般会从溶液状态转变为溶胶状态,进而转变为富有弹性的凝胶状态[2-4]。但腌制液中的碱浓度过高时,凝固的蛋清蛋白会水解液化,使已经吸附的结合水又以自由水的状态释放出来,此过程称为碱伤[5-7]。影响皮蛋凝胶品质主要有腌制液浓度、腌制温度、蛋壳气孔大小等因素[8-14]。出缸期皮蛋的凝胶强弱是工厂对皮蛋分级的一个重要衡量标准。而弹性与皮蛋凝胶品质相关,凝胶越好,皮蛋的弹性就越大[15];含水率作为食物中重要的衡量指标,对皮蛋的内部品质、质构特性及风味会产生较大影响[16];因此,弹性和含水率可以作为消费者进行购买时的重要参考指标,但是皮蛋弹性目前只能依靠手掂方式估算,含水率只能依据生化检测方法计算,繁琐低效。
高光谱成像技术是将光谱技术与图像技术相结合,探测待测物体的二维集合空间的图像信息和一维的光谱信息,具有简便、快速、无损、准确等优点,已成功应用于肉类、果蔬等品质的分析与检测[17-22]。近年来,国内已有对皮蛋品质的相关报道,分别从皮蛋破损、斑点、分级、微量元素等方面进行研究,刘龙等[23]根据皮蛋蛋壳的声学特性,采用小波变换和BP神经网络相结合的方法对皮蛋蛋壳破损进行检测;吴玲等[24]利用机器视觉技术分析不同腌制配方对皮蛋表面斑点形成的影响,最终确定最佳生产配方;王巧华等[25]利用机器视觉结合近红外光谱技术,对优质皮蛋、次品皮蛋和劣质皮蛋进行检测和分级,其中优质蛋的识别率为96.49%,次品蛋识别率为94.12%,劣质蛋的识别率为100%;黄郁杰等[26]采用络合滴定法与原子吸收光谱法测定了皮蛋中的铅含量,但这并不能满足快速、高效、检测的要求。目前关于皮蛋凝胶内部品质高光谱成像检测的研究鲜见报道。
本实验以皮蛋为研究对象,采集出缸期皮蛋的高光谱信息,建立光谱信息与皮蛋凝胶品质含水率和弹性的回归模型,进而实现出缸期皮蛋凝胶品质的可视化分析与不同品质皮蛋的预测。
1 材料与方法
1.1 材料
材料为市面上常见的青壳皮蛋,由湖北神丹健康食品有限公司提供,由经验丰富的工人挑选大小相近,颜色相似、蛋壳无破损的出缸期皮蛋作为实验样本,其中优质蛋105个,合格蛋75个,建模总样本数为180 颗。将选取的样本依次编号,优质蛋样本编号为1~105,合格蛋样本编号为106~180,按照编号依次对样本去除蛋壳进行光谱信息采集和理化指标的测定。
1.2 仪器与设备
Zolix Hyper SIS-VNIR-CL高光谱成像系统(美国海洋光学公司)如图1所示,该系统主要由高光谱成像光谱仪(芬兰Spectral Imaging公司)、CCD工业相机(日本Hamamatsu公司)、1 支Cob款帕灯(功率24 W,颜色为暖白;北京卓立汉光仪器有限公司)、1 台丝杆式位移步进电机控制平台(北京卓立汉光仪器有限公司)等部件组成。光谱的波段范围为450~1 000 nm(含有520 个波长),光谱的分辨率为2.8 nm,整个采集过程在暗箱中进行。通过提取450~1 000 nm的三维光谱图形信息,分析不同波段和图像像素的特征,进行皮蛋凝胶品质的内部指标可视化分析与检测。
图1 高光谱成像系统Fig. 1 Hyperspectral imaging system
TMS-PRO型质构仪 美国FTC公司;101电热鼓风干燥箱 上海捷呈实验仪器有限公司。
1.3 方法
1.3.1 图像的采集与校正
高光谱图像采集之前,需将仪器预热20 min后进行实验。实验时,在图像采集台上放置自制带孔灯箱,打开光源,将去壳皮蛋钝端朝下放置在透光孔处。高光谱成像系统参数设置:样本与镜头距离为300 nm,相机曝光时间0.15 s,步进电机移动速率为2 mm/s,移动范围为0~200 mm。为消除光照和相机暗电流工作不稳定性的影响,需对高光谱成像系统进行黑白校正[27-28]。全黑图像ID、全白图像IW分别通过遮盖镜头、扫描标准白板获得;将皮蛋放在载物平板上获取原始高光谱透射图像IR;校正图像IC按式(1)计算:
利用ENVI软件(美国Exelis VIS公司)选择整颗皮蛋的图像作为感兴趣区域(region of interst,ROI)高光谱数据,ROI大小在200×200像素左右,将提取ROI的平均光谱作为对应的透射原始光谱[27]。
1.3.2 弹性值测定
利用质构仪进行质地多面剖析(texture profile analysis,TPA)实验,测定皮蛋弹性值。首先在质构仪上装上P/5平底柱形探头,然后在弹性测定程序中设置参数:测试前速率30 mm/min,测试速率60 mm/min,测试后速率60 mm/min,压缩程度40%,测试时间间隔5 s。
1.3.3 含水率的测定
光谱采集和弹性值测定之后,将皮蛋去壳切碎放入食物搅拌器中搅拌,依次称取每颗皮蛋大约10 g作为样本。采用GB 5009.3—2016《食品中含水率的测定》。取洁净铝盒,加热、干燥后称量为m3,放入样本后的铝盒质量为m1,然后在105 ℃电热鼓风干燥箱内烘干后样本和铝盒的质量为m2,按式(2)计算样品中皮蛋含水率(X):
1.4 数据处理
1.4.1 光谱数据预处理
为解决光谱信息信噪比低、光谱变动及光谱重叠等问题,利用Matlab2016a软件对采集的光谱数据进行处理。保留450~1 000 nm波段的光谱数据,对原始光谱进行卷积平滑(Savitzky-Golay,S-G)处理可以有效消除基线漂移、倾斜等噪声;一阶导数(first derivation,FD)处理,可以消除与波长无关的变量,该方法可以提高模型准确性;并计算S-G后光谱数据的S-G-FD。
1.4.2 异常样本剔除
皮蛋高光谱数据采集和理化值测定时,由于仪器、人为操作不当等因素使数据中存在异常点,所得到的模型会偏离真实模型,此时不能代表数据的主体信息,均方根误差波动较大,甚至得到错误的结论[28-31]。利用蒙特卡罗偏最小二乘(Monte Carlo-partial least squares,MCPLS)法可以同时检测光谱信息和弹性、含水率的异常值,由交叉验证均方根误差达到最小值确定最佳主成分数,根据计算得到的样本误差均值和标准差为准,其值越大,则判定为异常样本。
1.4.3 特征波长的选择
全波长共含有520 个波长变量,为使光谱变量之间共线性达到最小以及降低光谱冗杂信息的变量组,本实验采用连续投影算法(successive projection algorithm,SPA)和无信息消除(uninformative elimination,UVE)法进行特征波长选取。
SPA是一种前向循环的特征变量筛选方法,可以过滤掉无用信息,大大降低数据间的共线性影响[32]。UVE法是淘汰一些与变量关联非常小的波长。具体实现为向原始光谱数据中随机添加同行列一定数量级(本实验采用大小0~10-6)的噪声,每剔除一个样本,将剩下的样本作为训练集建立最小二乘回归模型,每次得到回归模型的回归系数α通过可信度Y判断是否选取该波长点。模型系数按式(3)计算:
式中:Yi为第i个波长点处的模型系数;mean(αi)为模型平均回归系数;std(αi)为方差;当|Yk|>max|Ym|时,则选取该波长点,其中,k取1~520,m取450~1 000。
1.4.4 样本集的划分
采用光谱理化值共生距离(sample set partitioning based on joint X-Y distance,SPXY)法对剔除后样本的弹性和含水率按3∶1比例进行校正集和预测集划分,统计分析计算出校正集和预测集样本的最小值、最大值、平均值和标准差。
1.4.5 回归和分类模型的建立与评价
多元逐步回归(multiple stepwise regression,MSR)是在逐步回归基础上改进的一种建模方法,能够建立多个自变量与因变量之间的关系模型。而MSR模型适用于光谱变量数少于理化值数的情况,因此本实验采用由SPA和UVE算法提取的波长建立回归模型。
BP神经网络是人工神经网络的一种,目前被广泛适用。它是按照误差逆向传播算法训练的多层前馈神经网络,由大量的神经元联结构成,具有很强的非线性函数逼近能力,并拥有强大的容错率。本实验采用BP对竞争性自适应重加权算法(competitive adaptive reweighting sampling,CARS)提取的特征波长建立出缸期不同品质皮蛋的预测模型。
回归模型建立后,采用测试集的决定系数R2、均方根误差(root mean square error,RMSE)和相对分析误差(relative percent deviation,RPD)对皮蛋弹性和含水率的估算模型进行评价。当决定系数R2越接近1、RMSE越小,表明模型效果越好;其中,当RPD>2时,模型具有极好的预测能力,当RPD为1.4~2时,模型效果一般,可以进行粗略评估,当RPD<1.4时,该模型无法对样本进行预测[33];而分类模型的性能采用混淆矩阵对出缸期不同品质皮蛋进行评估预测。
1.4.6 伪彩色图像处理技术
伪彩色处理是根据特定的准则对灰度值赋予彩色的处理,可以将单色图像变换成给定彩色的分布图像。该技术可以提高对图像细节的辨别力,达到图像增强的效果。本研究利用最优回归模型分别估算出缸期不同品质皮蛋高光谱图像上每个像素点的弹性值和含水率,结合伪彩色图像处理技术生成弹性值和含水率的彩色分布图。
2 结果与分析
2.1 出缸期皮蛋光谱特征
对高光谱图像上ROI提取光谱,光谱波长范围为450~1 000 nm,共520 个波长,获得优质蛋与合格蛋的原始光谱和平均光谱曲线如图2所示。可以看出,不同品质皮蛋的光谱曲线变化趋势基本相同;在450~643 nm(可见光波段)光谱的透射率整体升高,由于皮蛋蛋壳气孔数量和内膜结构特性对凝胶品质的影响,造成对可见光吸收减弱,从而在波长570 nm附近出现第1次透射率波谷;由于C—H键二级倍频和一级倍频的吸收,在波长640 nm附近出现光谱上的最高峰;在波长657~910 nm(可见-近红外波段)光谱的透射率持续下降,这是因为在波长900 nm附近对皮蛋凝胶中水分子O—H键吸收减弱形成的第2次波谷。皮蛋腌制期腌制液浓度、腌制温度、蛋壳气孔大小等因素使出缸期皮蛋的光谱发生了明显变化[34-35],主要表现为优质蛋比合格蛋对光的吸收更强。因此,可以根据光谱间的差异进行皮蛋凝胶品质弹性和含水率的估算。
图2 出缸期皮蛋光谱曲线Fig. 2 Spectral curves of preserved eggs
2.2 皮蛋含水率、弹性与光谱数据的相关性分析
利用SPSS软件中的Pearson相关分析法对不同预处理的光谱数据和含水率、弹性进行相关性分析,其相关性曲线如图3所示。在图3a中,皮蛋含水率与原始光谱在可见光波长范围内呈负相关,且相关性不断增高,在波长667 nm处相关性最高,相关系数为-0.732,由于腌制期腌制液浓度、蛋壳气孔大小、内膜结构等因素对凝胶特性的影响,使穿过吸收区域水层的光能太少,造成在近红外波长范围相关系数基本趋近0,不相关;含水率与S-G光谱数据的相关性和原始光谱相似,但相关性有所提高,在波长672 nm处相关性最高,相关系数为-0.836;FD后的光谱与含水率相关性曲线呈正负起伏变化,波长在623 nm处相关性最大,相关系数为0.753;S-G-FD组合变换的相关性曲线与FD相关性曲线相似,在波长625 nm处相关性达到0.851。在图3b中,经S-G处理后光谱数据与原始光谱数据相似,两者分别在可见光波长671 nm和657 nm处相关性最高,相关系数为0.715、0.794;经FD处理后的光谱数据与S-G-FD处理后的相似,在可见光波长754 nm和757 nm处相关性最高,相关系数为0.704、0.786;由此可见,原始光谱与不同预处理方法的光谱在可见光波长520~760 nm范围内的相关性较高,表明可以通过预处理方法有效提高光谱数据与皮蛋含水率、弹性的相关性。
图3 皮蛋含水率、弹性与光谱数据的相关性Fig. 3 Correlation between water content and springiness of preserved eggs and spectral data
2.3 异常样本剔除
实验中仪器、人为操作不当等因素造成的异常数据由MCPLS分析法剔除,结果如图4a所示。弹性值异常样本检测以预测误差平均值3.24,预测误差标准差0.631为标准,共剔除异常样本8个,分别为13、24、47、63、85、117、146和161号样本。剔除后的样本决定系数R2由原来的0.726 5提升到了0.812 4。由图4b所示,光谱值和含水率的蒙特卡罗分析检测中未出现较大的平均值偏差和标准偏差,因此没有进行异常样本剔除。
图4 弹性值、含水率MCPLS法异常样本剔除Fig. 4 Elimination of abnormal samples by MCPLS method for springiness and water content
2.4 样本集的划分
如表1所示,实验中共180 个样本,利用SPXY法将剔除异常值的弹性和未剔除异常值的含水率样本结合光谱信息按照3∶1的分布范围为16.36%~39.64%,校正集和预测集的标准差分别为3.322 4%、3.284 5%;含水率的分布范围为46.15%~74.50%,校正集和预测集的标准差分别为6.342 7%、6.421 5%;通过SPXY法划分的弹性和含水率校正集的分布范围大于预测集,说明数据具有代表性。
表1 利用SPXY算法划分样本集的数据统计Table 1 Data statistics of sample sets divided by SPXY algorithm
2.5 特征波长的提取
为减少光谱数据的冗杂性,提高模型的运行速度,采用SPA和UVE算法提取不同预处理和原始光谱数据的特征波长并建立回归模型。以弹性指标和原始光谱为例介绍特征波长提取的过程。如图5所示,建立SPA弹性模型,初始设定提取波长变量范围为5~30,提取步长为1;由图5a可知,RMSE最小为0.394 7,对应模型中变量的个数为10 个,即经SPA提取的最优波长点有10 个,优选出波长点的位置如图5b的原始光谱索引显示,所选波长变量占总波长的1.923%。不同预处理的光谱由SPA提取的波长结果如表2所示。
图5 SPA提取波长过程Fig. 5 Extraction of characteristic wavelengths by SPA
表2 SPA提取波长结果Table 2 Results of extraction of characteristic wavelengths by SPA algorithm
利用UVE法提取特征波长,如图6所示,建立UVE的弹性模型,初始设置噪声矩阵最大稳定性绝对值的90%作为剔除阈值,图中黄色曲线为光谱变量的稳定性值,红色曲线为噪声变量信息的稳定值。以阈值±27.43为界,两条水平虚线之外是需要保留变量,虚线之外为剔除的变量,最终经UVE变量选取出12个波长变量,波长点的位置在图6b中显示,所选波长点占总波长的2.31%。由UVE选取的波长结果如表3所示。
图6 弹性的UVE提取特征波长Fig. 6 Extraction of characteristic wavelengths by UVE for springiness
表3 UVE算法提取波长结果Table 3 Results of extraction of characteristics wavelengths by UVE algorithm
2.6 MSR模型的建立与预测
分别以SPA和UVE算法提取的特征波长建立不同预处理后的光谱数据MSR模型,计算每种模型在预测集中弹性和含水率的估算值,回归模型效果如表4所示。可以看出,对皮蛋含水率来说,基于UVE算法经S-G-FD预处理后的模型性能最好,决定系数R2为0.882,RMSE为0.583,RPD为2.1;用于预测弹性指标经S-G-FD预处理后的SPA-MSR模型性能最好,决定系数R2为0.903,RMSE为0.348,RPD为2.2。建立的含水率和弹性的MSR模型如图7所示,可以看出,2 种特征提取方法结合MSR模型分别对含水率和弹性取得了不错的估算结果。
表4 皮蛋弹性和含水率模型预测结果Table 4 Parameters of prediction models for springiness and water content of preserved eggs
图7 含水率和弹性预测值和实测值散点图Fig. 7 Scatter plots for predicted values versus measured values of water content and springiness
以光谱透射率X为自变量,建立的最优预测含水率和弹性的MSR回归模型方程:
式中:YW为含水率预测值;YS为弹性预测值;Xi为特征波长处的透射率(下标表示波长/nm)。
2.7 含水率和弹性的可视化检测
利用UVE-MSR和SPA-MSR模型分别估算出缸期皮蛋高光谱图像的每个像素点的含水率和弹性,结合Matlab编程,采用伪彩色图像处理技术生成含水率和弹性的分布图[36],不同的颜色和深浅程度代表不同品质皮蛋的含水率和弹性,结果如图8所示。图8a、b中,不同品质皮蛋的蛋清凝胶部分主要呈浅蓝色和绿色,不同的是合格蛋的蛋黄部分主要呈黄色和浅红色,含水率主要集中为52%~65%,优质蛋的蛋黄部分主要呈黄色和深红色,含水率主要分布在57%~69%之间,优质蛋的含水率要高于合格蛋的含水率;图8c、d中,不同品质皮蛋的蛋清凝胶部分主要呈浅蓝色和绿色,不同的是优质蛋蛋黄部分要比合格蛋的蛋黄部分颜色浅,合格蛋的弹性主要分布在26%~38%之间,优质蛋的弹性主要分布在29%~42%之间,优质蛋的弹性值要高于合格蛋。通过可视化不同品质皮蛋的分布图,可以直观看出皮蛋的不同部位的含水率和弹性值,从理论上有助于分析皮蛋内部品质变化规律,从应用上有助于后续在线检测皮蛋凝胶品质。
图8 不同品质皮蛋含水率和弹性分布图Fig. 8 Water content and springiness distribution maps of preserved eggs of different quality grades
2.8 出缸期皮蛋品质的预测
为快速准确地预测出缸期不同品质皮蛋,采用CARS算法进行特征波长的提取。采样过程中,CARS算法以弹性的标准值筛选出10 个特征波长473、504、541、583、619、654、699、748、827 nm和937 nm,如图9所示。再以特征波长作为输入值,建立BP预测模型。对优质蛋与合格蛋样本按照2∶1划分训练集和预测集,模型参数:最大训练次数为200、学习率为0.1、误差为0.1。如图10所示,由混淆矩阵可以看出,出缸期不同品质皮蛋的预测总准确率为98.3%,预测结果较为理想。
图9 CARS特征波长选择Fig. 9 Selection of characteristic wavelengths by CARS
图10 混淆矩阵Fig. 10 Confusion matrix
3 结 论
出缸期不同品质的皮蛋光谱变化趋势基本相同,不同的是,优质蛋比合格蛋对光的吸收更强。对出缸期皮蛋的原始光谱进行不同的预处理可以提高与含水率、弹性的相关性,在可见光波长520~760 nm范围内不同预处理的光谱数据与含水率、弹性的相关系数较高,经S-GFD处理后的光谱在625 nm处与皮蛋含水率相关性最高,为0.851;经S-G处理后的光谱在657 nm处与皮蛋弹性相关性最高,为0.794。
基于SPA和UVE算法提取特征波长建立的MSR预测模型。预测含水率的最优模型为UVE-MSR,R2和RMSE分别为0.882、0.583,RPD为2.1;预测弹性的最优模型为SPA-MSR,R2和RMSE分别为0.903、0.348,RPD为2.2。
分别利用UVE-MSR、SPA-MSR预测模型计算出缸期不同品质皮蛋每个像素点的含水率和弹性值,结合伪彩色图像处理技术生成可视化分布图,实现出缸期不同品质皮蛋的含水率、弹性值的评价。
基于CARS提取的特征波长建立的BP模型对出缸期不同品质皮蛋进行预测,总准确率为98.3%,表明高光谱技术可以实现对不同品质的皮蛋进行预测。