干扰校正组合法在近红外检测牛奶中的应用
2014-03-27聂庆琛侯欢欢杨国龙孙尚德
彭 丹,聂庆琛,侯欢欢,杨国龙,孙尚德
(河南工业大学 粮油食品学院,河南 郑州 450001)
0 引言
随着人们生活水平的提高,乳制品的需求量逐年增加.近来年,尽管各部门不断加大对乳品安全监管的力度,但仍有劣质乳品的频繁出现,如无抗奶事件、三聚氰胺事件、皮革奶事件、激素门事件等,无不引发社会的广泛关注.在事故处理过程中,暴露出奶源质量检测技术的不足.因此,简便、快捷、准确的检测技术是现代乳品企业及有关监管部门的迫切需求.
在奶源质量检测领域,有多种检测方法如化学法、中红外光谱法、高效液相色谱法、质谱法等,但无法满足原料乳实时、在线、连续监测的要求.近红外光谱技术作为一种快速、简便、无损的定性和定量分析方法,已成为乳品质量安全检测的最佳方式.近红外光谱技术是利用分析物对光的特异性吸收光谱数据来进行定性分析或定量检测技术.然而,光谱数据中不仅含有分析物的有用信息,还包含噪声、背景、杂散光等无关信息,结果导致校正模型不稳定、适应性不好、分析精度难以提高等问题[1].因此,有效消除无关信息的干扰对建立预测精度高、稳定性好的校正模型至关重要.目前,消除无关信息干扰的方法主要有3 种:(1)采用预处理方法剔除光谱中的无关信息,如多元散射校正[2]、标准正交变换法[3-4]和正交信号校正法[5]等;(2)通过抵偿法扣除光谱中的无关信息,如扣标准液校正法[6]等;(3)利用频谱特性消除光谱中的无关信息,如小波变换[7-8]等.笔者以牛奶中脂肪和蛋白质含量的检测为例,尝试采用干扰校正组合方法对无关信息进行消除,提高牛奶成分的测量精度,同时探讨不同校正方法的优劣.
1 方法原理
1.1 预处理方法
1.1.1 扩展多元散射校正
扩展多元散射校正(extended multiplicative signal correction,EMSC)是多元散射校正的推广,与MSC 法只考虑信号的处理不同,EMSC 对光谱中的信号和噪声同时进行处理.这里把物质成分的吸收信息作为信号,而由粒子大小等物理信息引起的无关信息作为噪声,通过对信号与噪声分离,即分别用不同的参数来表示吸收和散射影响的方式,达到提取有用信息的目的.
1.1.2 标准正交变换
标准正交变换(standard normal variate,SNV)是一种用来消除样品尺寸、颗粒大小与均匀性、表面散射以及光程长变化对光谱影响的方法,它是基于光谱阵列对一组光谱进行标准化处理,处理后的光谱xSMV可表示为:
1.1.3 正交信号校正
正交信号校正(orthogonal signal correction,OSC)的基本原理是将光谱阵X 与浓度阵Y 正交,滤除光谱中与浓度阵无关的信号,然后进行多元校正,达到提高模型预测能力的目的.其具体算法如下:
(1)将原始校正集光谱矩阵X 和浓度矩阵Y进行均值化、中心化或标准化处理;
(2)计算M=1-XTY(YTXXTY)-1YTX;
(3)得到权重向量W=λ-0.5MXTp,其中p 为XM(XM)T的第一主成分,λ 为特征值;
(4)求出载荷向量p*=XTt*/((t*)Tt*),其中t*=t-Y(YTY)-1YTt;
(5)在X 中将正交信号减去XOSC=X-t*(p*)T.当计算第二主成分时,XOSC代替X,重复步骤(2)~(5),直至所需的OSC 因子被移除.对于预测向量Xnew,由权重和载荷求出校正后的光谱.
1.2 扣标准液校正法
扣标准液校正是用一种与样品基体相似、浓度恒定的标准液为背景,在每次测量分析样品之前测定该背景标准液,然后从分析样品的近红外光谱中扣除此背景标准液的近红外光谱.该法通过对原始光谱数据的校正,消除待测样品中其他成分相互作用带来的干扰,提高光谱测量的精度,从而提高模型的预测精度及适用性.
1.3 小波变换
小波变换(wavelet transform,WT)是把信号分解为不同尺度和频率的小波子空间,具体理论参见文献[8].目前多采用Mallat 算法的小波变换对信号进行处理,得到的小波系数中逼近系数反映了原始信号的“骨架”信息,在信号轮廓上更逼近原始信号;细节系数则反映了信号的局部细微信息.本研究通过阈值法去除小波系数中被认为是噪声的元素,经处理后的小波系数再进行反变换即可得到滤噪后的光谱信号.
2 材料与方法
2.1 仪器及数据采集
采用瑞士Buchi 公司NIRFlex N-500 傅立叶变换红外光谱仪,InGaAs 检测器,光谱采集范围1 000~2 500 nm,扫描分辨率8 cm-1,波长精度±0.2 cm-1,扫描次数为8.
2.2 样品制备
样品由河南奶牛中心提供,共100 个样品,其中80 个样品作为校正集,20 个作为验证集样品.牛奶中脂肪、蛋白质和乳糖的参考值由丹麦FOSS公司生产的乳品综合成分指标分析仪测定,测量结果见表1.
表1 校正和验证集中牛奶样品的信息
2.3 数据处理与定量校正
扩展多元散射校正、小波变换、标准正交变换、正交信号校正的数据处理程序均由Matlab7 编写.利用CAMO 公司的Unscrambler 7.8 软件建立PLS 校正模型.模型性能通过相关系数(Corr.)、校正集标准偏差(root mean squared error of calibration,RMSEC)和验证集标准偏差(root mean standard error of prediction,RMSEP)来评价.
3 结果与分析
3.1 光谱分析及预处理
图1 为牛奶的近红外透射光谱图,在1 000~2 500 nm 谱区内包含有脂肪、蛋白质中含氢基团(包括C—H、O—H、N—H 等)一级、二级倍频及合频吸收信息.由于牛奶中脂肪存在颗粒的不均匀性,使其对光具有很强的散射作用[9],本试验分别采用EMSC、SNV 和OSC 处理光谱数据,其结果如图2、图3 和图4 所示.
图1 牛奶近红外透射光谱图
经EMSC、SNV 和OSC 处理后,光谱形状总体上与处理前的光谱没有差别,EMSC、SNV 处理后的光谱离散程度均明显降低,使光谱中富含有用信息的部分凸显出来,而OSC 法去除了与浓度阵Y正交的无用信息,这说明EMSC、SNV 和OSC 法均能滤除牛奶光谱中的干扰信息(如噪声、背景、散射干扰等),保留光谱中主要信息,以简化模型,提高模型的预测精度.
图2 经EMSC 处理后的牛奶近红外透射光谱图
图3 经SNV 处理后的牛奶近红外透射光谱图
图4 经OSC 处理后的牛奶近红外透射光谱图
3.2 背景标准液的选择
背景标准液的确定没有规律可循,只能根据分析结果进行筛选.对于牛奶这样的复杂样品,通常选择与样品基体相似、浓度恒定的溶液作为背景标准液.本试验分别采用同一品牌的全脂牛奶、低脂牛奶、脱脂牛奶以及水作为背景,结合PLS 分析脂肪和蛋白质含量,其结果见表2.
表2 不同背景标准液脂肪和蛋白质分析结果
从表2 可以看出,水作为背景标准液时,脂肪和蛋白质的分析精度最佳,与无背景标准液模型相比,脂肪和蛋白质的预测精度分别提高了13.3%和19.7%;而采用脱脂、低脂和全脂牛奶作为背景标准液时,分析精度较差,经处理后的牛奶样品中脂肪球虽然变小,但对入射光仍有一定的散射.因此,本研究选用水作为背景标准液.
3.3 WT 参数的确定
对光谱进行WT 时,需要人为选择一些合适的参数,其中母小波和分解水平是小波变换的主要参数.本研究考察Haar 小波、Daubechies 小波系列(阶数分别为2、4、6、8)、Coiflets 小波系列(阶数分别为1、2、3、4)以及Symlets 小波系列(阶数分别为2、4、6、8)对脂肪和蛋白质含量分析结果的影响.结果表明:4 阶的Daubechies 小波(db4)作为母小波,其分析精度最佳.分解水平的确定应考虑到光谱数据的维数,本研究选8 作为小波分解水平.
3.4 校正方法的比较
分别采用预处理(EMSC、SNV 和OSC)方法、扣标准液校正法以及WT 法对光谱进行处理,结合PLS 分析脂肪和蛋白质含量,结果见表3.结果表明,EMSC 和SNV 可强化有用信息,减弱无用信息的干扰(见图2 和图3),使模型的预测精度有了较大幅度提高,脂肪和蛋白质的最佳预测精度分别为0.205 7%和0.202 3%;而OSC 法忽略不完全正交的无用信息,模型不但没有得到改善,反而使模型的预测精度下降.WT 法将光谱分解为不同时频的信号,根据不同时频的信号的属性来消除无关信息的影响,与校正前相比脂肪和蛋白质模型的预测精度分别提高了35.3%和32.6%.牛奶是一种复杂的多分散系统,它既含有乳糖、盐类等溶解态物质,又含有蛋白质等胶体态物质,还含有脂肪这样的悬浮态物质,因此对于如此复杂的分析体系,仅用一种校正方法往往不能得到最佳的结果,这时可将不同校正方法结合使用,以获得预期的结果[10].
表3 不同干扰校正方法模型预测结果的比较
3.5 不同校正方法组合研究
作者尝试用预处理方法(EMSC、SNV)、扣标准液法和WT 法组合方法进行校正,其结果见表4.
表4 不同校正组合方法预测结果的分析
从表4 可以看出,采用EMSC 和WT 组合校正方法,模型具有最佳的预测精度.与最佳单一方法(表3)相比,脂肪的预测精度提高了31.6%,蛋白质的预测精度提高了30.0%,但不同组合方式的预测结果相差较大.因此,该方法还需进一步完善才能在光谱预处理中得到更好的应用.
4 结论
近红外光谱法作为一种依靠模型对物化性质进行分析的技术,光谱数据的准确性是得到可靠分析结果的前提.但是光谱中无关信息的存在会直接影响校正模型的准确性,从而影响模型的预测效果.作者利用预处理法、扣标准液法和WT法,对测得的近红外牛奶光谱进行了无关信息的剔除.试验结果表明,干扰校正组合方法能有效消除无关信息的干扰,其效果远优于单一干扰校正方法,并且该方法具有数值稳定性好、校正效率高等特点,非常适用于在线分析和其他复杂物质检测中无关信息的消除.
[1]Seasholtz M B,Kowalski B R.The parsimony principle applied to multivariate calibration[J].Anal Chim Acta,1993,277:165-177.
[2]Woo Y A,Terazawa Y,Chen J Y,et al.Development of a new measurement unit(milkspec-1)for rapid determination of fat,lactose,and protein in raw milk using near-infrared transmittance spectroscopy[J].Applied Spect-roscopy,2002,56(5):599-604.
[3]马广,傅霞萍,周莹,等.大白桃糖度的近红外漫反射光谱无损检测试验研究[J].光谱学与光谱分析,2007,27(5):907-910.
[4]陈华才,吕进,俸春红,等.近红外光谱法测定茶多酚中总儿茶素含量[J].中国计量学院学报,2005,16(1):17-20.
[5]Blanco M,Coello J,Montoliu I,et al.Orthogonal signal correction on near infrared calibration[J].Anal Chim Acta,2001,434:125-132.
[6]刘蓉,谷筱玉,徐可欣.近红外光谱无创血糖测量中背景扣除方法的研究[J].光谱学与光谱分析,2008,28(8):1772-1775.
[7]Barclay V J,Bonner R F.Application of wavelet transforms to experimental spectra:smoothing,denoising,and data Set compression[J].Anal Chem,1997,69(1):78-90.
[8]田高友,袁洪福,刘慧颖.近红外光谱的小波特性研究[J].光谱学与光谱分析,2006,26(8):1441-1444.
[9]彭丹,徐可欣.响应量转化近红外检测技术在强散射介质中的应用研究[J].光谱学与光谱分析,2010,30(2):318-322.
[10]褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004,16(4):528-542.