基于高光谱的牛奶脂肪质量浓度预测模型建立与评价
2018-03-26赵紫竹卫勇张乃迁常若葵吴海云刘华单慧勇杨仁杰郭小英
赵紫竹,卫勇 ,张乃迁,常若葵,吴海云,刘华,单慧勇,杨仁杰,郭小英
(1.天津农学院工程技术学院,天津300384;2.Biological and Agricultural Engineering Department,Kansas State University,M anhattan KS 66502,USA)
0 引 言
牛奶中营养元素丰富,被誉为“白色血液”,其脂肪、蛋白质含量是评价牛奶品质的重要指标[1-2]。目前,常用牛奶检测方法分析过程繁琐,无法提供在线测试[1]。近年来,应用近红外光谱技术快速在线测量牛奶品质是一个研究热点[3-6]。据报道采用近红外光谱技术可检测牛奶中干物质含量及品质[7-8]。Fu等(2014)采用高光谱成像技术有效检测了掺假牛奶中低含量(≤1.0%)的三聚氰胺。在国内应用高光谱定量检测牛奶中成分含量报道较少。仅有张倩倩等建立模型对牛奶中蛋白质成分含量进行预测。本文利用高光谱成像技术,分别采用PLS法、二维相关技术结合N-PLS法,建立了牛奶中的脂肪含量预测模型,并分析了两种预测模型在测量牛奶脂肪含量上的适用性。
1 实 验
1.1 样品采集
实验中所用牛奶为市面购买Vitamin D Milk(总脂肪质量浓度8 g/240 mL),Hiland牌2%R educed Fat M ilk(总脂肪质量浓度5 g/240 mL),1%Low Fat Milk(总脂肪质量浓度2.5 g/240 mL),Fat Free Skim Milk(总脂肪质量浓度0 g/240 mL)。实验中所用脂肪含量梯度牛奶样品均为上述牛奶混合配制,配制后每240 mL中总脂肪量分别为0,0.5,1,…,7.5,8 g共17个梯度。样品配制后使用搅拌器搅拌20 min使牛奶中脂肪充分均匀,然后取样,放置于直径为70 mm的培养皿中,液面高度为8 mm,用于高光谱测试。表1为样品质量浓度。
表1 牛奶脂肪质量浓度
1.2 仪器设备
实验室采用美国堪萨斯州立大学高光谱仪,采集过程如图1,成像系统的光谱范围为400~1000 nm,光谱分辨率<4 nm,共有141个波段,空间分辨率CCD像元为8微米,图像分辨率为1024像素×400像素。
采集数据前首先对高光谱成像系统进行黑白校正,为了使实验结果更加精确,同一脂肪质量浓度测量3次。
图1 数据采集过程
1.3 高光谱图像校正
在高光谱图像数据采集过程中,由于光源在不同波段下的光强不同以及相机中暗电流的作用对图像带来较大的噪音干扰,这些噪音信息会影响高光谱图像数据的质量,因此在高光谱图像数据采集之前必须要对系统进行黑白校正,以消除噪音信息的干扰[11-12]。首先,将相机镜头盖上,得到全黑参考高光谱图像,再将白板放置在电移动平台,采集到全白参考高光谱图像,根据公式(1)进行黑白校正。
式中,Ic为校正后高光谱图像;Iraw为原始高光谱图像;Idark为全黑参考高光谱图像;Iwhite为全白参考高光谱图像。
1.4 样品平均光谱计算
首先根据高光谱图像选取感兴趣区域,再提取感兴趣区域的光谱值作为数据分析对象。图2为牛奶样品的单波长图像,选取培养皿中心部分为分析区域,分析区域大小为60像素×60像素。提取分析区域内所有高光谱反射值,取每一个波段下3 600个像素点的平均值作为该波段的光谱值。即
并根据式(2)对光谱数据采用归一化处理方法[13],
式中:IN为光谱归一化值;Ii为各个波长下光谱反射值;m ax(I)为光谱反射最大值;min(I)为光谱反射最小值。
图2 牛奶样品高光谱图像
图3为牛奶样品在401.95~965.54 nm内的光谱归一化反射平均值光谱图。图3中,横坐标为波长,纵坐标为光谱归一化反射值。由图3可以看出,牛奶样品在652 nm、607 nm下产生较大的吸收峰,但不同脂肪含量的牛奶样品的光谱图仅有细微的差别,由于平均光谱图中包含信息较少,区别小,样品数量多,光谱数据量大,为了更好的探索牛奶中脂肪含量对光谱反射值的影响,还需要对光谱数据中所包含的有用信息进一步的探索。
图3 牛奶样品的平均光谱图
2 结果与讨论
2.1 牛奶脂肪质量浓度偏最小二乘预测模型
实验共有51个样品,按照60%,40%的比例分为校正集和测试集,既校正集由34个样品组成,测试集由17个样品组成。将所有牛奶样品的光谱值的二维矩阵作为输入变量,建立PLS模型对牛奶中的脂肪质量浓度进行定量分析。
主成分数量的选择对建立具有较高精度的模型十分关键,如果选择主成分数过大,则容易将噪音信号也拟合进去,对模型过度拟合,反之,如果主成分数选择过小,则对模型拟合不够,主成分数过大或过小都会影响模型的拟合精度,削弱模型预测能力[14-15]。为了选择最优主成分个数,首先对校正集采用交叉验证方法,计算在不同主成分数下的校正均方根误差REMSEC值(如图4)。由图4可知,当主成分数为3时RMSEC趋于平缓,因此选择3个主成分建立PLS模型。
图4 PLS模型中主成分数对RMSECV的影响
利用光谱归一化反射平均值建立PLS模型,对校正集中的34个样品进行预测,并将校正集中牛奶脂肪含量的实际值与预测值进行一元线性回归,结果如图5,回归方程为y=0.9879x+0.4242,其相关系数R2为0.9851,RMSEC为0.3066。
图5 PLS模型校正集样品预测结果
为了对所牛奶脂肪含量预测模型精度进行评价,并检验预测模型是否具有通用性,将未参与校正集建模的17个测试集样品带入校正模型进行验证计算,预测结果见表2,并对预测集中牛奶脂肪含量的预测值与实际值进行一元线性回归,结果如图6,回归方程为y=1.022x-0.08541,相关系数R2为0.9913,预测均方根误差RMSEP为0.2409。由图可见,PLS模型建立的预测模型对牛奶中脂肪含量的预测具有较高的精度,能够精确地预测牛奶中的脂肪含量。
图6 PLS模型预测样品预测结果
2.2 牛奶脂肪含量多维偏最小二乘预测模型
将牛奶脂肪含量为0的样品分别与其余脂肪含量的牛奶样品进行二维相关计算,将所有牛奶样品二维相关计算后得到的三维矩阵作为输入变量,建立N-PLS模型对牛奶中的脂肪含量进行定量预测,
经二维相关计算后共有48个牛奶样品参与模型建立及测试,按照60%,40%的比例分为校正集和测试集,既校正集中有32个牛奶样品,测试集中有16个牛奶样品。N-PLS模型主成分数的选择也同样重要,主成分数对模型精度有较大的影响。首先对校正集采用交叉验证法,计算在不同主成分数下的R EMSEC值(如图7)。由图7可以看出,当主成分数为8时RMSEC值趋于平缓,因此选择8个主成分建立N-PLS模型。
图7 PLS模型中主成分数对RMSECV的影响
利用光谱归一化反射平均值建立N-PLS模型,对校正集的32个牛奶样品中脂肪含量进行预测,并将牛奶脂肪含量的实际值与预测值进行一元线性回归,结果如图8所示,回归方程为y=1.0031x-0.017,相关系数R2为0.9999。RMSEC为0.0255。
图8 N-PLS模型校正集样品预测结果
对所建立的牛奶脂肪含量预测模型进行评价,检验模型是否具有通用性,将没有参与建模的16个测试集牛奶样品带入N-PLS预测模型进行验证计算,预测结果见表2,对牛奶脂肪含量的预测值与实际值进行一元线性回归,结果如图9,回归方程为y=1.026x-0.1199,相关系数 R2为 0.9976,RMSEP为0.1247。
表2为PLS模型与N-PLS模型对预测集中17个牛奶样品中脂肪质量浓度的预测结果。在PLS模型当中,绝对误差绝对值最大为0.39,绝对误差最小为0.03。在N-PLS模型当中,绝对误差绝对值最大为0.303,最小为0.01。通过表3-2能直观的看到,N-PLS模型的预测能力略高于PLS模型,尤其是在对脂肪低含量值的预测,N-PLS模型高于PLS模型。
表2 PLS、N-PLS模型预测结果
图9 N-PLS模型对预测集预测结果
3 结 论
本文在高光谱反射成像系统下,采集不同脂肪质量浓度牛奶样品的高光谱图像数据,根据高光谱图像选取适当的分析区域,并提取分析区域内所有光谱数据取每个波段下的平均值,将光谱数据进行归一化处理,并进行二维相关计算,建立PLS模型与N-PLS模型进行比较,其中PLS模型校正集R2为0.9851,RMSEC为 0.3066,预测集 R2为 0.9913,RMSEP为0.2409。N-PLS模型校正集R2为0.9999,RMSEC为0.0255,预测集R2为0.9976,RMSEP为0.1247。结果表明,高光谱成像技术可以应用于对牛奶中脂肪质量浓度的检测,而且具有很高的预测精度,并且采用适当的模型可以进一步提高预测精度。二维相关计算与N-PLS方法相结合的模型预测精度优于传统的PLS方法建立的模型,尤其是对脂肪质量浓度较低的牛奶样品。
参考文献:
[1]阳丽芝,陈志伟.牛奶中脂肪检测技术研究进展[J].食品科学,2011(1):270-273.
[2]张华秀.近红外光谱法快速检测牛奶中蛋白质与脂肪含量[D].中南大学,2010.
[3]赵明富,施玉佳,罗彬彬,王念,曹李华,罗松.基于近红外透射光谱的牛奶中脂肪和蛋白质含量检测[J].激光杂志,2014(1):44-45,50.
[4]阳丽芝,陈志伟.牛奶中脂肪检测技术研究进展[J].食品科学,2011,32(1):270-273.
[5]王晶,王加启,卜登攀,等.近红外光谱技术在牛奶及其制品品质检测中的应用[J].光谱学与光谱分析,2009,29(5):1281-1285.
[6]韩东海,鲁超,刘毅.纯牛奶、还原奶、掺假奶、牛奶新鲜度的近红外检测[C]//中国乳制品工业协会第十一次年会,2005.
[7]李晓云,王加华,黄亚伟,等.便携式近红外仪检测牛奶中脂肪、蛋白质及干物质含量.光谱学与光谱分析,2011,31(3):665-668.
[8]杨仁杰,刘蓉,杨延荣,等.用二维相关近红外谱和多维主成分分析判别掺杂牛奶.光学精密工程,2014,22(9):2352-2358.
[9]FU X,KIM MS,CHAO K,et al.Detection of melamine in m ilk pow ders based on N IR hyperspectral imaging and spectral sim ilarity analyses[J].Journalof Food Engineering,2014,124(1):97-104.
[10]张倩倩,谭琨.2015.基于高光谱的牛奶中真蛋白质含量反演.光谱学与光谱分析,35(12):3436~3439.