APP下载

牛肉品质高光谱检测技术研究

2017-05-11汪明辉

沈阳理工大学学报 2017年2期
关键词:新鲜度牛肉校正

宋 凯,汪明辉

(沈阳理工大学 信息科学与工程学院,沈阳 110159)

牛肉品质高光谱检测技术研究

宋 凯,汪明辉

(沈阳理工大学 信息科学与工程学院,沈阳 110159)

为及时了解肉品品质,需要一种快速准确检测肉品品质的方法。针对此问题,提出利用高光谱检测技术检测肉品品质的方法。高光谱检测技术,需对光谱进行预处理。主要分析在400~1100nm波长内获取牛肉表面的高光谱图像,经过多种预处理方法进行预处理后,再通过连续投影算法进行特征波长优选后,分别利用多元线性回归对新鲜度和水分含量进行校正集和预测集建模,通过模型评价指标来判断各预处理方法的优劣性。实验结果表明,2阶9点S.Golay卷积平滑对牛肉新鲜度指标和水分含量的预测均是最佳预处理方法。

牛肉新鲜度;水分含量;高光谱图像;预处理;多元线性回归;连续投影算法;校正集;预测集

随着目前我国人民的生活水平的逐渐提高,人们的饮食结构也慢慢朝着优质而合理的方向发展,牛肉是中国需求量排行第二的肉食品类,仅仅低于猪肉。牛肉的脂肪含量很低,但是却有着丰富的蛋白质,所以牛肉拥有娇嫩的口感和鲜美的味道,人们爱吃牛肉,所以牛肉享有“肉中骄子”的美名。因此,人们对牛肉的需求越来越大,同样,也对牛肉的肉品品质提出了更高、更严苛的要求。传统的较为常见的检测肉品品质的方法主要为以下几种:感官评价、微生物菌落检测以及理化指标检测等等[1]。但是这些传统的检测方法都存在着或多或少的弊端,无法达到真正的使用目的。因此,世界各国亟需一种方便、快捷且准确性高的肉品品质检测手段,因此光谱分析技术应运而生。

光谱的范围在400~1100nm之间的光谱称为可见-近红外光谱,可见-近红外光谱技术是一种相对来说非常成熟的光谱检测技术。通过被测样品自身所携带的各种各样的信息从而得到样品全波长范围内的原始光谱数据,再结合样品的多种组成成分,找出样品全波长范围内的原始光谱数据与各种理化指标的实际测量值之间的关联,并通过分析来得出被测样品所包含的主要的成分信息。通过可见-近红外光谱来获得的待测样品的反射光谱信息,原始光谱中不仅含有物质本身的化学成分信息,也极其容易被诸如外界因素、背景信息以及电噪声等多种干扰所影响[2],导致光谱数据中不仅包含着研究所需信息,但同时存在着不相关的无用信息,使得光谱数据出现基线漂移或者光谱不重叠等后果[3],使得待测样本的光谱数据中存在一定量的误差,从而影响预测模型精度。所以,在对数据进行研究之前需要对原始的光谱数据进行预处理,光谱预处理的主要作用是可以在一定的程度上消弭部分噪声或者减少噪声对有用光谱信息的影响,使得原本所隐藏的信号差别得以放大,提高待测光谱的分辨率[4],使得所得有效信息具有高信噪比、低干扰性的特点,最后建立的预测模型具有较高的预测精度。

本文主要针对不同预处理算法对后续建模结果的影响进行分析,介绍了多种不同的预处理算法以及比较经过预处理之后所建模型的差异性,用实验数据阐明了预处理在预测建模中的差异性以及重要性。

1 光谱预处理算法

为了区别多种预处理方法效果之间的差异,本文主要分析针对103个牛肉样本(含67个校正集和36个预测集)建立牛肉新鲜度指标和水分含量的预测模型,分析原始光谱数据经过不同种的预处理方法预处理之后,所建预测模型之间的差异性,选择最优的预处理方法。

本实验采用Matlab R2010a对数据进行预处理。首先对所有数据用mapminmax函数进行处理,对结果分别采用均值中心化、标准化、归一化、标准正态变量变换、多元散射校正、3点平滑、5点平滑、7点平滑、3阶5点、1阶7点、2阶7点、1阶9点和2阶9点S.Golay平滑等方法对103个牛肉样本(含67个校正集和36个预测集)的光谱数据进行多种方式预处理。对于处理后的数据用连续投影算法进行特征波长优选,在对其进行多元线性回归建模,比较所建模型的优劣性,从而选择最佳预处理算法。图1为原始光谱。

图1 原始光谱

1.1 均值中心化

均值中心化变换是通过用原始光谱减掉校正集的平均光谱[5]。在建模时,均值中心化是将光谱的变动与待测部分的构成或性质的变动关联在一起,而非将光谱的绝对量与待测部分的构成或性质相关联。因此,建立光谱定性模型或者定量模型之前,往往需要通过采用均值中心化来凸显各个样品光谱之间的差异,从而使得预测模型有着稳定、预测准确性高的特点。

在使用这种预处理方法对原始光谱数据进行处理的时候,往往也需要对待测部分的构成或性质进行预处理[6]。

1.2 标准化

标准化又称作均值方差化,光谱标准化变换的原理是将均值中心化处理后得到的光谱数据再除以校正集光谱阵所得的标准偏差光谱。

1.3 归一化

归一化的方法相对而言较多,包括最大归一化法、面积归一化法以及平均归一化法等。在光谱分析当中,使用最多的方法是矢量归一化。矢量归一化通常是被用来校正因为微小的光程差异所引起的光谱变化带来的问题。

1.4 标准正态变量变换SNV

标准正态变量变换的目的主要是为了消除固体颗粒的大小、样本的表面散射和光程变化对NIR漫反射光谱产生的影响。SNV的主要原理是通过改变光谱信号的尺度范围和强度大小的方法来消除样本背景噪声。

1.5 多元散射校正MSC

多元散射校正和标准正态变量变化都是将吸收信息与散射光信号相分离。在一般的情况下,散射所导致的光谱的变化一般要比样品成分所导致的光谱变化要大一些,MSC的主要目的是校正每一条光谱的散射,获得其中与成分有关的相对来说理想的信息。MSC的处理结果类似于SNV方法的结果。

1.6 平滑去噪算法

通过光谱仪获得的光谱信号中既有有用信息,也有随机误差,即噪声。信号平滑是最为常见的消弭噪声的一种方式,它的原理是假设光谱所包含的噪声为零的随机白噪声,若多次测定求均值,能达到降低噪声和提高信噪比的效果。使用较多的一些信号平滑的方式有移动平均平滑法和Savitzky-Golay卷积平滑法[7]。

移动平均平滑算法是通过一个特定窗口宽度的平滑窗口(2ω+1),单个窗口内的波长点都为奇数个,用窗口中的中心波长点k以及前后ω点处的测量值的平均值来代替波长点的测量值,自左至右移动k,使得所有的点都得到平滑。

采取该预处理方法的时候,窗口宽度的大小非常的重要,若宽度过小,将不能充分去噪;若宽度过大,用简单的求均值运算,不仅会平滑处理掉所不需要的噪声,也会过滤掉所需的有用信息,使得光谱信号失真。

实验中采用3点平滑、5点平滑和7点平滑对原始光谱数据进行预处理,判断各自优劣性。

1.7 Savitzky-Golay卷积平滑

Savitzky-Golay卷积平滑的基本思想与移动平均平滑大致相似。只是通过多项式的方式来对移动窗口中的数据进行最小二乘拟合,而并非是用简单的平均方法,它的本质是一种加权平均算法,它突出了中心点的作用。S.Golay卷积平滑法是目前使用较多、较为普及的一种去噪的方式,因为相对于移动平均平滑来说,移动窗口的宽度对最终结果的影响要小得多。

同时S.Golay卷积平滑也能用来求导数光谱,可以通过最小二乘法求得导数系数。目的是能够有效消除基线漂移和背景噪声对光谱的干扰,同时能够精确分辨出重叠峰,在提高灵敏度的同时也增强分辨率。但同时也会引入噪声,降低信噪比。在进行光谱处理的时候,导数点数是较为重要的参数,假如过小,就会导致噪声较大,影响所建模型的预测能力;反之假如过大,会导致处理过度,使得光谱失去所需的细节。

经验证,本实验采取一阶差分宽度时效果最佳,分别采用3阶5点、1阶7点、2阶7点、1阶9点和2阶9点S.Golay平滑来对原始光谱数据进行预处理,判断各自优劣性。

2 建模方法及模型评价指标

2.1 连续投影算法

连续投影算法属于前向循环的选择方法,它的原理是从一个波长开始,每次循环都是在计算它在未选入波长上的投影,将投影向量最大的波长引入到波长组合。每一个新选入的波长,都有与前一个线性关系最小的特点[8]。

2.2 多元线性回归

线性回归总共有两大类,分别是一元线性回归和多元线性回归[9]。在实际使用中,很多情况下需要用到多元线性回归来更好地描述不同的变量与变量之间的关系。从而导致多元线性回归的计算量往往要比一元线性回归大许多,一般用计算机处理。

设因变量Y与自变量X1,X2,…,Xm之间有关系式:Y=b0+b1X1+…+bmXm+ε对于n组量测数据:

(Y1;X11,X12,…,X1m)

(Y2;X21,X22,…,X2m)

(Yn;Xn1,Xn2,…,Xnm)

Xij是自变量Xj的第i个值,Yi是因变量Y的第i个值,m为自变量的个数。模型的数据结构式为

Y1=b0+b1X11+b2X12+…+bmX1m+ε1

Y2=b0+b1X21+b2X22+…+bmX2m+ε2

⋮ ⋮ ⋮

Yn=b0+b1Xn1+b2Xn2+…+bmXnm+εn

多元线性回归常用于评价多组样品的光谱预测结果与参考方法测定结果之间的相关性。

2.3 模型评价指标

(1)校正标准偏差(RMSEC)

(2)预测标准偏差(RMSEP)

(3)相关系数(R)

对于光谱数据来说,无论是校正集还是预测集所建的预测模型,相关系数R越接近于1,预测结果越好;RMSEC和RMSEP越小,表明所建的预测模型具有更强的预测能力。

3 实验结果

本实验利用103个牛肉样本(含67个校正集和36个预测集)的实验理化值及全光谱数据分别建立牛肉新鲜度指标和水分含量的MLR多元线性回归模型。结果显示,不同种预处理算法对原始光谱的处理得到的结果存在着差异,如图2~图14所示。

(1) 均值中心化

图2为均值中心化处理后的光谱。

图2 均值中心化处理后的光谱

(2) 标准化

图3为标准化处理后的光谱。

图3 标准化处理后的光谱

(3) 归一化

图4为归一化处理后的光谱。

图4 归一化处理后的光谱

(4) SNV

图5为SNV处理后的光谱。

图5 SNV处理后的光谱

(5) MSC

图6为MSC处理后的光谱。

图6 MSC处理后的光谱

(6)3点平滑

图7为3点移动平均平滑法处理后的光谱。

图7 3点移动平均平滑法处理后的光谱

(7)5点平滑

图8为5点移动平均平滑法处理后的光谱。

图8 5点移动平均平滑法处理后的光谱

(8)7点平滑

图9为7点移动平均平滑法处理后的光谱。

图9 7点移动平均平滑法处理后的光谱

(9)3阶5点S.Golay平滑

图10为3阶5点S.Golay平滑处理后的光谱。

图10 3阶5点S.Golay平滑处理后的光谱

(10)1阶7点S.Golay平滑

图11为1阶7点S.Golay平滑处理后的光谱。

图11 1阶7点S.Golay平滑处理后的光谱

(11)2阶7点S.Golay平滑

图12为2阶7点S.Golay平滑处理后的光谱。

图12 2阶7点S.Golay平滑处理后的光谱

(12)1阶9点S.Golay平滑

图13为1阶9点S.Golay平滑处理后的光谱。

图13 1阶9点S.Golay平滑处理后的光谱

(13)2阶9点S.Golay平滑

图14为2阶9点S.Golay平滑处理后的光谱。

图14 2阶9点S.Golay平滑处理后的光谱

同时,釆用不同种类的光谱预处理方法对牛肉的新鲜度指标和水分含量建立预测模型的模型参数有所不同,具体如表1、表2所示。

综上所述,2阶9点S.Golay卷积平滑后对牛肉的新鲜度和水分含量进行建模,无论是校正集建模还是预测集建模,其建模效果都要好于其他预处理算法。在对牛肉新鲜度指标的校正集预测中,测得R为0.9737,RMSEC为0.1686;在对预测集的预测中,测得R为0.9689,RMSEP为0.1364;在对水分含量的校正集预测中,测得R为0.9685,RMSEC为0.1784;在对预测集的预测中,测得R为0.9560,RMSEP为0.1682。

表1 不同预处理方法建立牛肉新鲜度指标的预測模型

表2 不同预处理方法建立牛肉水分含量的预測模型

4 结论

探讨了利用高光谱检测技术对牛肉的新鲜度和水分含量进行检测,通过对原始光谱进行预处理,波长优选后进行MLR建模。通过对预处理的结果分析以及对所得模型评价指标的比较,可知2阶9点S.Golay卷积平滑对牛肉新鲜度指标和水分含量的预测均是最佳的预处理方法。

[1]刘娟.肉品新鲜度检测方法研究进展[J].农家科技(下旬刊),2012 (5):134-135.

[2]许倩,朱秋劲,叶春,等.近红外光谱分析技术快速检测冰温贮藏牛肉品质[J].肉类研究,2015 (3):23-26.

[3]程长阔,杨鹏程,李燕,等.光谱预处理方法对硝酸盐测量模型影响实验研究及软件设计[J].海洋技术学报,2015 (2):69-73.

[4]金灵.基于高光谱技术的宁夏滩羊肉内部品质检测方法研究[D].宁夏:宁夏大学 2014:42-44.

[5]马世榜,汤修映,徐杨,等.可见/近红外光谱结合遗传算法无损检测牛肉pH 值[J].农业工程学报, 2012,28(18):263-268.

[6]张洋.吸附材料的改性及其在微量成分近红外光谱分析中的应用研究[D].天津:南开大学,2013:23-24.

[7]王璇.基于多元线性回归的昆虫图像分割技术研究[D].南昌:江西理工大学,2014:34-35.

[8]王欣.近红外分析中光谱预处理方法的研究与应用进展[J].科技资讯,2013 (15):23-24.

[9]刘善梅.基于高光谱成像技术的冷鲜猪肉品质无损检测方法研究[D].武汉:华中农业大学,2015:45-47.

(责任编辑:马金发)

Hyperspectral Detection Technology of Beef Quality

SONG Kai,WANG Minghui

(Shenyang Ligong University,Shenyang 110159,China)

In order to understand the quality of meat,we need a rapid and accurate method for the detection of meat quality.To solve this problem,the method of meat quality detection is preposed using hyperspectral detection technology.For hyperspectral detection technology,pretreatment on the spectrum is needed.The main analysis of this paper is to obtain high spectral image at 400~1100nm wavelength in the surface of the beef,after pretreated by many methods and selected feature wavelength for spectral data by successive projection algorithm,by using multiple regression model respectively for freshness and moisture content of the calibration and prediction modeling,through the model evaluation index to judge the pros and cons of each pretreatment method.Experimental results show that the 2 order 9 point S.Golay convolution smoothing method is the best pretreatment method for the prediction of the fresh degree and the moisture content of beef.

freshness of beef;moisture content;high spectral image;pretreatment;multiple linear regression;continuous projection algorithm;calibration set;prediction set

2016-10-08

辽宁省教育厅科学研究项目资助(LG201610)

宋凯(1964—),男,教授/博导,博士,研究方向:计算机视觉、智能检测与控制等。

1003-1251(2017)02-0005-07

O657.33

A

猜你喜欢

新鲜度牛肉校正
稻谷新鲜度测定影响因素分析及优化
酸汤牛肉里的爱
劉光第《南旋記》校正
寻味牛肉
牛肉怎么做,好吃又嫩?
在Lightroom中校正镜头与透视畸变
机内校正
吃不上牛肉了
你在异性眼中的“新鲜度”
基于TTI的冷鲜羊肉新鲜度研究