APP下载

高光谱技术结合特征波长筛选的牛肉品种多波段识别

2019-05-13王彩霞何智武吴龙国买玉花张智峰贺晓光

发光学报 2019年4期
关键词:安格斯波段牛肉

王彩霞, 何智武, 吴龙国, 买玉花, 张智峰, 贺晓光*

(1. 宁夏大学 农学院, 宁夏 银川 750021; 2. 宁夏尚农生物科技产业发展有限公司, 宁夏 固原 756000)

1 引 言

牛肉是我国消费最为普遍的肉制品之一,其味道鲜美,营养丰富,深受国内外市场的青睐。近年来,牛肉消费量逐年增加[1]。目前国内市场的牛肉品种繁多,不同品种的牛肉在口感和品质上存在很大差异,但肉品性状和颜色极为相似,肉眼无法区分。为保护一些优良的牛肉品种及消费者权益,对牛肉品种进行快速鉴别具有很重要的现实意义。

传统的肉类鉴别方法有酶联免疫吸附[2]、蛋白质谱技术[3-5]、PCR[6]等,鉴定成本高,操作复杂,耗时耗力。因此,寻求一种快速高效的牛肉品种鉴别方法有很重要的现实意义。高光谱成像技术是一种集图像和光谱于一体的无损检测新技术,具有高效快速、操作简单等优点[7],在肉品分析领域得到了广泛的应用。王松磊等[8]在400~1 000 nm波段对滩羊肉嫩度进行检测,结果表明基于图谱特征变量融合所建立的偏最小二乘回归(Partial least square regression,PLSR)模型决定系数为0.88;Jiang等[9]利用Vis/NIR高光谱对鸡胸肉的嫩度进行分类,结果表明基于全光谱波段所建立的偏最小二乘判别(Partial least squares discrimination analysis,PLS-DA)模型的校正集与预测集准确率分别为0.92和0.94;Xiong等[10]利用可见近红外高光谱对散养鸡和普通饲养方式下的鸡进行识别分析,并结合多元散射校正(Multiplicative scatter correction,MSC)进行预处理,建立基于连续投影算法(Successive projections algorithm,SPA)和径向基函数-支持向量机(RBF-SVM)的鸡肉判别模型,模型准确率高达93.33%;Balage等[11]应用近红外高光谱成像技术对猪肉的pH值、颜色、脂肪和剪切力值进行预测,并取得了较好的预测结果;王靖等[12]使用900~1 700 nm高光谱成像系统对宁夏不同产地的羊肉进行品种识别,结果表明CARS-PLS-DA为最优模型, 校正集正确率90.48%,预测集正确率84.21%。

由上述研究可知,利用高光谱成像技术在肉品定量分析及定性鉴别领域已得到国内外许多学者的研究并都取得了较好的结果。本文利用高光谱成像技术对安格斯牛、力木赞牛、西门塔尔牛3个品种的牛肉进行鉴别研究,比较不同预处理方法和特征波长筛选方法对模型精度及稳定性的影响,并对400~1 000 nm及900~1 700 nm波段的鉴别结果进行比较分析,进而为不同牛肉品种的鉴别提供技术参考。

2 材料与方法

2.1 材料与仪器

分别采集3岁左右的安格斯牛、力木赞牛、西门塔尔牛各3~5头,肉样均采自宁夏固原市宁夏尚农生物科技发展产业有限公司。各品种牛经屠宰后在0 ℃下冷藏,排酸48 h。取出牛肉样品进行分割,取4个部位肉(脖肉、眼肉、里脊肉、瓜条肉),每个部位取0.5 g,放入保温箱运至实验室,贮藏在4 ℃冷柜备用。光谱扫描前将肉样整形切块(大小约为40 mm×30 mm×10 mm),室温下放置2 h,待肉样中心温度达到室温水平后,用滤纸吸干样品表面的水分,进行光谱扫描。

TA-XT plus质构仪(HDP-BSW刀具,厚度3 mm,英国Stable Micro Systems有限公司);WSC-S色差计(北京精密科学仪器有限公司);pHS-25数显pH计(上海仪电科学仪器股份有限公司);SMART Turbo微波水分测定仪(美国培安有限公司);Hyper Spec-VNIR高光谱成像系统(光谱范围400~1 000 nm,美国Headwall公司);Hyper SIS-NIR型近红外光谱成像仪(光谱范围900~1 700 nm,芬兰Specimen公司)

2.2 实验方法

2.2.1 色泽测定

应用色差仪对牛肉样品进行色泽测定。在每个样品表面取3个不同的位置,测定3组L*、a*、b*值,取其平均值。

2.2.2 嫩度值测定

牛肉嫩度的测定依据NY/T 1180-2006标准进行。将牛肉块顺着肌纤维方向切成1 cm×1 cm×2 cm的小块,置于质构仪上,垂直于肌肉纤维方向剪切,取3个肉块剪切力的平均值作为该样本的最终嫩度值。测试参数设定:测试模式为压缩测试,探头下降速度为6.0 mm/s,探头回程速度为6.0 mm/s,测试距离为20 mm。

2.2.3 pH值测定

将pH计的探针插入肉样中,使pH计的电极与肌肉组织充分接触,待读数稳定后记录数据,每个肉样重复测定3次,取其平均值。

2.2.4 水分、蛋白质及脂肪含量的测定

采用SMART Turbo微波水分测定仪进行水分、蛋白质及脂肪含量的测定。

2.3 光谱数据处理方法

在样本采集前,需打开高光谱仪器预热30 min。由于牛肉样本形状、表面纹理、色泽等会造成光源漫反射,同时,光源强度分布不均以及相机中暗电流的存在,使光强在分布较弱波段下的图像噪声较大,影响光谱信息采集,因此,需要对仪器进行黑白校正及扫描参数设定。经过预试验最终确定VIS/NIR高光谱系统的采集参数为:相机曝光时间为15 ms,物距为380 mm,位移平台移动速度为15 mm/s;近红外高光谱采集系统的参数为:输送速度14 mm/s,物距为370 mm,曝光时间20 ms,扫描长度160 mm。试验过程中,每组取5块肉样依次置于电控位移平台上,进行光谱扫描,获取所有样本的高光谱图像数据。图像数据处理之前,利用ENVI 4.8软件选取整块肉表面作为感兴趣区域(Region of interest,ROI),计算ROI内的平均反射光谱,作为样本的反射光谱。利用SPXY[13]法对采集到的光谱数据进行样本划分,并对划分后的数据进行预处理,本文选取SG卷积平滑(Savitzky-Golay smoothing,SG)、归一化(Normalize)、基线校准(Baseline)、标准正态变量变换(Standard normal variate,SNV)和MSC预处理方法处理。

由于牛肉样本的全波段光谱数据量大、信息混杂,因此,需选用适当的特征波长提取方法剔除不相关或者非线性变量,降低模型运算量、提高模型稳健性[14]。本文选用SPA、间隔随机蛙跳(Interval random frog,IRF)法提取特征波长。SPA法提取的特征波长具有共线性小、冗余度低的性能[15],IRF法是将整个光谱按照特定宽度划分成区间,通过每个区间光谱点的绝对回归系数总和来评估区间,找到最佳区间组合的一种方法[16]。

2.4 数据统计分析

应用SAS 9.2对牛肉样品的色泽、嫩度、pH值及水分含量测定值进行均值差异显著性分析;光谱数据预处理在The Unscrambler X 10.4中进行,其余算法在Matlab R2016a中实现。

3 结果与讨论

3.1 三个品种牛肉理化指标测定结果

不同品种的牛肉在内外品质上有很大的差异。牛肉的品质主要包括食用质量(色泽、风味、嫩度)、营养质量(蛋白质含量、脂肪含量)、技术质量(系水力、pH值水平)等[17]。本试验对3个品种牛肉的理化指标进行测定,结果如表1所示。

表1 3种类型牛肉的理化指标统计情况

注:同行平均值标注不同字母为差异显著(P<0.05);标注相同字母为差异不显著(P>0.05)。

由表1可知:安格斯牛与力木赞牛的L*值差异不显著,且均低于西门塔尔牛;安格斯牛与西门塔尔牛的a*、b*、pH值差异不显著,但a*值、pH值与力木赞牛差异显著;安格斯牛与力木赞牛的水分含量差异不显著,蛋白质含量差异显著;3个品种牛肉的嫩度与脂肪含量差异显著,力木赞牛的嫩度最高,西门塔尔牛的嫩度最小;安格斯牛的脂肪含量高于力木赞牛与西门塔尔牛。

3.2 样本划分

样本集的划分方法在一定程度上决定了所建模型的优劣性,本研究采用SPXY法对样品进行划分。结果如表2所示。

表2 利用SPXY法划分样本结果

3.3 原始光谱及预处理

为消除原始光谱曲线的噪音及无关信息,提高所建模型的准确性,需要对原始光谱进行预处理。在建立PLS-DA模型时,需确定模型的最佳主成分数。试验中将最大主成分数设定为20,进行数据归一化处理,并采用百叶窗交互验证[18],设置交互验证组数为10,原始光谱的交互验证错误率随主成分数的变化如图1所示。

从图1可以看出,在主成分数为18时,错误率达到最低。之后随主成分数的上升错误率缓慢增大,因此将18确定为最优主成分数。依此类推,可确定其他预处理数据的最佳主成分数,结果如表3所示。

图1 交互验证中不同主成分下的错误率

Fig.1 Error rate of different principal components in cross validation

由表3可知,400~1 000 nm波段内校正集准确率效果较好,均高于95%,其中,校正集准确率最高的是SNV与MSC,预测集中经SNV方法预处理后的模型准确率略高于MSC方法,说明SNV法可有效消除由于肉品表面不均及操作环境造成的光谱差异,因此,在400~1 000 nm波段范围选择SNV法为建立牛肉样品分类PLS-DA模型的最优光谱预处理方法。在900~1 700 nm波段范围,准确率最高的为SG预处理,校正集与预测集准确率分别为100%和96.04%,故选用其为900~1 700 nm波段的最佳预处理方法。

表3 不同预处理方法后的PLS-DA模型结果

Tab.3 Results of PLS-DA models by different pretreatment methods

预处理方法400~1 000 nm900~1 700 nm校正集正确率/%预测集正确率/%校正集正确率/%预测集正确率/%原始光谱98.5697.1198.5295.05SG平滑98.5696.1510096.04Normalize99.0495.1998.5291.09Baseline96.1794.2396.5597.03SNV10097.1298.0393.07MSC10095.1994.5893.07SG-MSC99.0495.1910095.05SNV-MSC99.5297.1294.5893.07

3.4 特征波长提取

3.4.1 SPA法提取特征波长

在采用SPA法进行特征波长筛选时,首先需要计算SPA在不同的有效波长数下的均方根误差(Root mean square error of calibration set,RMSEC),通常将最小的RMSEC值确定为最佳的有效波长数。

由图2(a)可知,特征波长数为15之前时,RMSEC处于显著下降状态,之后随着波长数的增加,RMSEC处于较平稳的变化状态。当波长数为15时,RMSEC为0.546 01,表明特征波长所含牛肉品种差异信息与真实值之间具有较高的一致性。图2(b)为400~1 000 nm波段范围共125个波段下挑选出的特征波长,分别为425,430,459,473,531,550,579,589,598,670,723,761,776,958,987 nm。利用SPA法优选出的特征波长占全部波长的12%。由图3(a)可得,特征波长数为12之前时,RMSEC处于显著下降状态,12之后随着波长数的增加,RMSEC处于较平稳的变化状态。当波长数为12时,RMSEC为0.316 84。图3b为900~1 700 nm波段范围共256个波段下挑选出的特征波长,分别为954,981,993,1 005,1 023,1 151,1 202,1 229,1 607,1 649,1 664,1 673 nm,提取的特征波长主要位于光谱吸收曲线的波峰波谷位置。

图2 400~1 000 nm波段利用SPA方法提取特征波长

图3 900~1 700 nm波段利用SPA方法提取特征波长

3.4.2 IRF法提取特征波长

在利用IRF提取特征波长时,设置迭代次数N为1 000,间隔宽度W为10,子间隔初始值Q为50,主成分数为20。在400~1 000 nm波段运行IRF,得到116个间隔中排名前10的间隔如表4所示;同时计算每个间隔的RMSECV,如图4所示。同理可得,900~1 700 nm波段中排名前10的间隔如表5所示,247个间隔的RMSECV如图5所示。

由表4可知,挑选出的排名前10的区间波点为36号到125号。而图4(a)显示,前18名间隔波长的RMSECV值最小,因此,选择排名前18的间隔波长[19],最终优选出的波点为8~19,35~52,79~99,113~125号,具体波长是435~488 nm、565~646 nm、776~819 nm、939~997 nm,共58个波长。

由表5可知,挑选出的排名前10的区间波点为31号到104号。而图4(b)显示,前18名间隔波长的RMSECV值最小,因此,选择排名前32的间隔波长[19],最终优选出的波点为7~16,24~45,87~121,168~177,186~203号,具体波长是936~963 nm、987~1 050 nm、1 175~1 276 nm、1 416~1 443 nm、1 470~1 521 nm,共95个波长。

表4 400~1 000 nm波段牛肉光谱数据排名前10的波长间隔

Tab.4 Top ranked 10 wavelength intervals of beef spectral data from 400-1 000 nm

排名间隔排名间隔138~476115~1242116~125735~44341~50839~48436~45942~51537~4610114~123

图4 波段排名从第一到最后一个波长间隔的RMSECV值

Fig.4 RMSECV of the union of the intervals from 1st to last

表5 900~1 700 nm波段牛肉光谱数据排名前10的波长间隔

Tab.5 Top ranked 10 wavelength intervals of beef spectral data from 900-1 700 nm

排名间隔排名间隔132~41633~42231~40735~44388~97893~102490~99992~101591~1001089~98

3.4.3 IRF-SPA特征波长筛选

通过IRF筛选出的特征波长变量依然较多,波长变量之间仍存在共线性,为更加有效地筛选出最少的特征变量,经IRF筛选特征波长后再利用SPA进行二次特征波长筛选。在400~1 000 nm波段,从58个特征波长变量中筛选出19个变量,分别为411,425,435,445,459,488,497,526,541,545,555,589,593,608,617,637,641,646,651 nm;在900~1 700 nm波段,从95个特征波长变量中筛选出16个变量,分别为401,406,440,445,449,454,488,512,550,603,641,723,757,795,819,848 nm。

3.5 全波段及特征波长下牛肉品种PLS-DA鉴别模型

利用PLS-DA鉴别模型对不同波段下的牛肉品种进行鉴别,并对全波段及3种特征波长提取波段下建立的牛肉品种鉴别模型进行对比分析,结果见表6。

由表6可知,在400~1 000 nm波段,经SNV法预处理的全波段PLD-DA鉴别模型中校正集与预测集准确率分别为100%和97.12%。基于不同特征波长提取方法建立的鉴别模型中,SPA法建立的模型准确率较低,校正集与预测集准确率均低于90%;IRF法提取58个特征波长下建立的PLS-DA模型中,校正集准确率为99.04%,略低于全波段模型,预测集准确率为98.08%,高于全波段模型准确率。IRF-SPA法共提取了19个特征波长,校正集与预测集准确率分别为98.56%和97.12%,所建模型的校正集准确率接近IRF法建立的模型,预测集准确率与全波段模型相同。IRF-SPA法提取的19个波长与全波段及IRF法相比,大大降低了运算量,并且建模准确率高于SPA法。因此,在400~1 000 nm波段内IRF-SPA方法提取出的19个特征波长可以代替全波长进行3种牛肉的光谱鉴别。

表6 3个品种牛肉的鉴别准确率

在900~1 700 nm波段,经SG卷积平滑预处理后的全波段PLD-DA鉴别模型中校正集与预测集准确率分别为100%和96.04%。利用SPA法提取的12个特征波长建立的模型的校正集准确率为94.09%,低于全波段建模的准确率;预测集准确率与全波段相同,均为96.04%。IRF法提取95个特征波长下建立的PLS-DA模型中,校正集准确率为100%,但预测集准确率仅为83.17%。IRF-SPA法共提取了16个特征波长,校正集与预测集准确率分别为94.09%和90.10%,均低于SPA法。SPA法提取的12个波长与全波段及IRF法相比,波长数大大减少,模型稳定性也较高。因此,在900~1 700 nm波段,SPA方法提取出的12个特征波长可以代替全波长进行3种牛肉的光谱鉴别。

根据以上分析可知,在特征波长提取方法中,SPA法优选出的变量数明显少于IRF提取方法,但IRF法所建模型的准确率均高于SPA法。400~1 000 nm波段的鉴别准确率高于900~1 700 nm波段,说明3种牛肉在外部色泽纹理上的识别效果比内部成分的识别更加准确,这与王松磊等[20]对羊肉品种的多波段识别结果一致。

4 结 论

安格斯牛、力木赞牛、西门塔尔牛3个品种的牛在内外品质上有很大的差异。通过实验研究发现,在外部色泽方面,安格斯牛与力木赞牛的L*值差异不显著,安格斯牛与西门塔尔牛的a*、b*值不显著,因此,仅用色泽差异无法对3个品种的牛肉进行区分。通过对牛肉内部品质进行检测发现,安格斯牛与西门塔尔牛的pH值差异不显著;安格斯牛与力木赞牛的水分含量差异不显著;3个品种牛肉的嫩度与脂肪含量差异显著,安格斯牛的脂肪含量高于力木赞牛与西门塔尔牛。这是由于牛肉的嫩度不仅与牛肉大理石结构有很大关系,还受肌肉中各种蛋白质结构特性、结缔组织含量及分布的影响。

对400~1 000 nm及900~1 700 nm波段的牛肉原始光谱进行不同预处理后分别建立牛肉品种的PLS-DA全光谱鉴别模型,对比得出在400~1 000 nm波段,SNV法为最优预处理方法;在900~1 700 nm波段,SG平滑法为最优预处理方法。

采用SPA、IRF及IRF-SPA方法对经预处理后的光谱进行特征波长筛选并建立PLS-DA鉴别模型。经比较分析,在400~1 000 nm波段,利用IRF-SPA方法提取出的19个特征波长下建立的PLS-DA模型的校正集与预测集准确率分别为98.56%和97.12%,接近全波段识别率,因此可代替全波长进行3种牛肉的光谱鉴别。在900~1 700 nm波段,利用SPA方法提取出的12个特征波长下建立的PLS-DA模型的校正集与预测集准确率分别为94.09%和96.04%,校正集准确率略低于全波段准确率,预测集准确率与全波段相同,该方法在很大程度上简化了模型复杂程度,提高了运算效率。

猜你喜欢

安格斯波段牛肉
酋长的答谢礼
酸汤牛肉里的爱
寻味牛肉
牛肉怎么做,好吃又嫩?
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
安格斯和鸭子
M87的多波段辐射过程及其能谱拟合
吃不上牛肉了
回眸