基于近红外光谱法对羊肉嫩度测定
2020-10-29陈杰张晓姚娜王亚明
陈杰 张晓 姚娜 王亚明
(塔里木大学信息工程学院,新疆 阿拉尔 843300)
与猪肉、牛肉相比,羊肉肉质较细腻,蛋白质和维生素的含量都很高,并且它的脂肪和胆固醇等物质含量较低。常吃羊肉对增强人体免疫能力和能提高整体的身体素质都有很好的帮助。在新疆南部地区,由于维吾尔族同胞比例相对较大,对羊肉的需求量更是大于其他地区。南疆塔里木河流域出产的羊肉品质最优,它不仅肉质细腻,而且膻味和腥味较小,受到各族人们的喜爱[1]。随着民众生活消费水准的提升,人们对肉的品质要求越来越高。在羊肉的品质特性中,嫩度是评判羊肉质量的重要指标之一,也是消费者最重视的感官指标,其高低直接影响着肉的食用价值和经济价值。肉的嫩度是指肉在食用时对肌纤维碎裂的抵抗力,反映了肉的质地,是肌肉中各种蛋白质结构特性的总体概括。嫩度的客观评价是对定型肉块进行剪切力测定,剪切力值越低肉嫩度越好[2]。
近几年,近红外光谱技术的发展较快,它具有快速高效检测的优点,已经在肉制品品质检测中广泛的应用[3-4],这种无损快速检测技术也较多的用于肉品的嫩度检测研究[5]。关于肉类嫩度研究大多是针对牛肉和猪肉嫩度检测和嫩度分级[6],羊肉的嫩度研究较少。Park等[7]使用波长为1 100~2 498 nm内获得的近红外光谱,来分析测定牛肉背长肌的嫩度,得到的嫩度值相关系数为0.692,并且建立了预测牛肉嫩度的模型;赵杰文等[8]采用多元线性回归方法对新鲜牛肉所吸收的近红外光谱曲线和剪切力的值建立了牛肉嫩度预测模型;张德权等[9]曾使用偏最小二乘法分析研究了羊肉的近红外光谱和嫩度的关系,所建立的模型相关性达到0.862,但是,文中仅使用相关性对建立的模型进行了研究,没有涉及到交叉验证均方差、预测均方差、预测精度。本文使用连续投影算法结合最小二乘法建立羊肉嫩度和近红外光谱的模型,评价指标使用交叉验证均方差、预测均方差、预测精度和相关系数来衡量。连续投影算法(SPA)[10-11]的优点是可以提取全波段的几个特征波长,这种算法能够消除原始光谱数据中冗余的信息,预测速度相对较快[12],近年来,国内外学者在利用光谱分析技术检测作物和食品中某些重要成分的含量时利用了连续投影算法做有效波长的选取[13-14]。
常见的数据建模方法有多元线性回归法、主成分分析法、主成分回归法、偏最小二乘法、人工神经网络方法和支持向量机等方法[15]。最小二乘法集成了典型相关分析、主成分分析以及线性回归分析的优点,它能解决的最典型的问题就是自变量之间的多重相关性。很多时候,样例很少,甚至比变量的维度还少,变量之间又存在多重相关性的问题,这时最小二乘法就开始发挥它的作用[16]。
一个建模算法预测评价指标的衡量参数有:交叉验证均方差、预测均方差、预测精度和相关系数。交叉验证均方差、预测均方差可以用来定量分析模型的性能以及评价指标,而最小二乘法就是为了寻求一条直线来拟合所有的点,使得这条直线到所有的点之间的均方根误差最小;相关系数的绝对值是在区间[0,1]分布的数值,越接近1,说明数据相关性越强,预测精度就越高。
本研究在前人对鲜肉研究的基础上以南疆小尾寒羊后腿肉的嫩度为研究对象,使用近红外光谱仪进行采集光谱数据,使用C-LM4型数显式肌肉嫩度仪进行肌肉嫩度测量,根据光谱数据和肌肉嫩度数据,采用连续投影法选取特征波长分布对原始光谱数据和经过多元散射校正预处理后的光谱数据进行提取特征波长,根据提取出来的特征波长采用偏最小二乘法针对训练集建立嫩度和近红外光谱的嫩度模型,并对预测集进行嫩度预测,采用评价指标的衡量参数来检验模型是否合格。
1 材料和方法
1.1 主要仪器
近红外光谱仪(JDSU-MicroNIR 1700),北京凯元盛世,扫描波长900~1 800 nm;剪切仪(C-LM4),沃-布;手术刀;无菌刀;保鲜袋;电热恒温水浴锅(HH-M4,四孔),上海赫田;冰箱(BCD-329),海尔;温度计和干燥切板。
1.2 试验样品光谱数据采集
试验样品使用宰后24 h排酸后的小尾寒羊的新鲜羊后腿肉,切成6 cm×6 cm×4 cm的块状,共180块肉样,保存在4℃的冰箱中,逐一取出,擦干表面水分进行采集光谱数据和嫩度数据。
(1)近红外光谱仪打开预热30 min后将白板放在光谱仪器下2 mm处进行校光;
(2)取下白板,放鲜羊肉样品,肉表面要平整,与镜头仍保持2 mm的距离;测量在900~1 700 nm之间的光谱数据;(测量三次,测量间隔是5 s,取平均值)
(3)采集完光谱信息的羊肉装入保鲜袋包好,肉样中心插入温度计,放进恒温水浴锅中加热(水浴锅温度设定为80℃恒温状态);
(4)当温度计读数达到70℃(此温度和恒温锅的温度根据NY/T 1180—2006农业行业标准选取)时,取出肉样放到冰箱冷却到4℃,放置时间为24 h。取出后顺着肌肉纤维取样,样本大小3 cm×3 cm×4 cm,样本数为3;
(5)使用剪切仪垂直肌肉纤维方向剪切肉条,记录数据,数据单位为kgf,剪切三次取平均值。
2 数据预处理方法
近红外光谱主要是由于分子振动的非谐振性使得分子从基态向高能级跃迁产生的,主要是对含氢基团振动的倍频和合频的吸收,由于不同基团产生的光谱在吸收强度上是不同的,因此随着样品组成的变化及其光谱特性也发生变化,从而为近红外光谱分析样品的物理性质提供了基础[17]。近红外光谱分析不同于化学分析方法,它是一种间接分析技术,需要用统计方法在样品的嫩度属性与近红外光谱数据建立一个训练模型,这就需要采集一些样本的光谱和嫩度数据建立训练集,一般采集的近红外光谱会包含一些与待测样本性质无关的因素带来的干扰,导致基线漂移、高频随机噪声和光散射[18],此外在采集的过程中没有经过化学处理,所以直接采集的近红外光谱数据可能会出现背景复杂化的情况,因此对原始近红外光谱数据进行预处理是非常有必要的。采用上述实验方法获得180组羊肉的近红外光谱数据,得到有效数据174组,采用matlab2016软件进行分析处理,原始光谱曲线如图1所示。原始嫩度数据的直方图如图2所示,它显示了整体嫩度数据的分布情况,可以看出数据的产生过程比较稳定。数据预处理方法有很多种,如一阶导数法、二阶导数法、S-G平滑法、小波变换法、多元散射校正等,本文在对比了多种预处理方法之后决定使用多元散射校正法进行数据预处理,这种方法能有效地去除外在因素对光谱造成的影响,可以从图3看出这种预处理方法消除了很多冗余信息,对整个数据的影响较大。
图2 羊肉嫩度直方图图
图3 多元散射校正预处理之后的光谱
3 数据处理和建模
根据交叉验证法中的留一法的算法[19],即把整个数据分成N组,每组选一个数据作为测试集,最终通过比较,174组数据中分成7组,选24个样本作为测试集时最合适的。
文中采用SPA算法对原始数据和多元散射校正预处理后的数据分别进行数据处理。对原始数据的处理中,在RMSE=0.573 26的情况下选取了五个特征波长,如图4和图5所示,波长分别是907 nm、967 nm、1 264 nm、939 nm和1 511 nm。对从原始数据获取的特征波长使用最小二乘法进行建模,从174组实验样品数据中选取150组进行建模,其他24组样品用来验证模型。图8为使用特征波长对原始数据的最小二乘法建模预测效果图,交叉验证均方差为0.121 62,预测均方差为0.573 26,预测精度为0.958 47,相关系数的数值是0.859 41,满足了建模和预测的基本需求。
图4 SPA对原始数据选取的特征变量数目
图5 SPA对原始数据选取的特征变量
结合最小二乘法使用特征波长对多元散射校正(MSC)预处理后的数据进行处理,在RMSE=0.508 73的情况下选取了五个特征波长,如图6和图7所示,波长分别是 907 nm、989 nm、1 117 nm、939 nm和1 735 nm。对上述特征波长使用最小二乘法进行建模,从174组实验样品数据中选取150组进行建模,其他24组样品用来验证模型。图9为使用特征波长对多元散射校正预处理后的数据的最小二乘法建模预测效果图,交叉验证均方差为0.181 25,预测均方差为0.508 73,预测精度为0.963 29,预测精度明显提高,相关系数的数值提升到0.877 5,可见,多元散射校正在去噪声、去散射等方面有很好的作用。表1给出了两种数据进行建模的预测情况,可以更直观的看出对多元散射校正预处理后建立的模型的预测效果明显好于对原始信号进行建模。
图6 SPA对MSC预处理后的数据特征变量选取的数目
图7 SPA对MSC预处理后的数据选取的特征变量情况
图8 特征波长对原始数据建立模型图
图9 特征波长对MSC预处理过的数据建立模型
表1 羊肉训练集和预测集嫩度信息表
4 结论
文中使用SPA对原始数据和经过多元散射校正预处理之后的数据进行筛选特征波长,选中的特征波长个数均为5,筛选出的特征波长有两对是相同的,可见多元散射校正预处理方法在去掉冗余信息的同时能保存数据的原始状态。针对筛选的特征波长使用最小二乘法进行建模,174组数据随机选出150组用作训练集,24组用作测试集。从建模后的嫩度预测的参数可以看出使用多元散射校正预处理数据建立的模型预测能力明显优于原始数据。这一结论对相关方面的研究有很好的指导作用。