APP下载

基于近红外光谱技术对市售羊奶粉品质指标独立模型与通用模型探究

2021-11-14乔春艳张雪茹郑卫民刘永峰

食品工业科技 2021年22期
关键词:羊奶粉定标酸度

乔春艳,张雪茹,郑卫民,李 玲,刘永峰,

(1.陕西师范大学食品工程与营养科学学院,陕西西安 710119;2.西安市奶牛育种中心,陕西西安 710075)

陕西羊奶粉产量和产品市场占有量均稳居全国第一,其品质监测十分重要[1]。作为羊奶的主要产品,羊奶粉是直接由鲜羊奶加工制作而成的。其中纯羊奶粉不添加任何其它辅料,基本保留了羊奶本身的营养成分,有较长的贮藏期,日益庞大的消费人群与地区[2]。由于产地、季节、饲料、环境等因素的影响,羊奶品质会有差异,经过杀菌、浓缩、干燥等处理后,羊奶粉中各营养成分也会不同,尽可能多保留羊奶营养成分和提高奶粉质量仍是乳品企业正在攻克完善的问题。羊奶粉作为多组分物质,成分复杂,蛋白质、脂肪、乳糖、水分、灰分等品质指标常被用于评价奶粉质量[3-6]。此外,酸度常被用于评价奶粉新鲜程度[7]。各品质指标检测主要依赖于国家标准的要求检测,若要实现大批量样品检测及生产实时监控,则会耗时费力,成本高昂,且不适于监测部门的快速便捷检测。

近红外光谱分析技术作为一项绿色技术,操作方便、原理简单、无损快速,可实现同时对大批量样本多个指标的检测[8]。近红外光谱技术已经广泛应用于乳及乳制品品质[9-12]及掺假[13-14]等监测研究,可以为乳及乳制品质量监控提供有效技术支持。其中,何佳艳等[15]结合近红外光谱和偏最小二乘法建立了奶粉中脂肪含量预测模型,杨福臣等[16]探究了影响近红外光谱建立乳粉中蛋白质和脂肪模型的因素,邹婷婷等[17]建立了奶粉蛋白质的近红外定量模型,吴静珠等[18]首次建立配制奶粉的品质指标的近红外模型。以上研究主要是针对同一种类或某一指标奶制品预测模型的建立,而对市售羊奶粉多个品质指标的研究较少,尤其对酸度的研究更是少见。因此,建立一个适用于分析多种奶粉产品品质指标的通用模型尤为紧迫。

综上,本研究以陕西羊奶粉、纯羊奶粉为样本集,采用近红外光谱技术对羊奶粉中蛋白质、脂肪、乳糖、水分、酸度和总灰分6个品质指标建立独立模型,并优化和验证最终获得以135个羊奶粉为样本集建立的通用模型,以期对市售羊奶粉质量的快速准确评估,为奶粉的规范化生产应用提供依据。

1 材料及方法

1.1 材料与仪器

从超市购买羊奶粉共135个,按产地分为:陕西地区(93个)、非陕西地区(42个),按种类分为:纯羊奶粉(108个)、配方奶粉(27个);硫酸铜、石油醚、亚铁氰化钾、乙酸镁、氢氧化钠 西安晶博生物科技有限公司。

Infraxact型多功能近红外光谱仪(波长范围为570~1850 nm,检测器为硅铟镓砷)、Kjeltec 2300全自动凯氏定氮仪 瑞典福斯公司;ST310脂肪提取仪 FOSS分析仪器公司;U-3000高效液相色谱仪美国热电公司;WGLL-125BE电热鼓风干燥箱 上海福玛实验设备有限公司;SX2-2.5-10NP马弗炉上海一恒仪器有限公司。

1.2 实验方法

1.2.1 奶粉样品光谱的采集 将奶粉样品均匀铺满于2/3的样品杯中,采用近红外光谱仪对其进行扫描。扫描前,对仪器预热1 h并进行自检。扫描过程中保持室温25 ℃左右,并严格控制室内湿度,保证环境的一致性。通过仪器自带的ISI scan软件,获取奶粉样品的近红外光谱数据,每个样本重复扫描3次,取平均值作为原始近红外光谱数据。

1.2.2 羊奶粉成分含量的测定 蛋白质含量测定采用全自动凯氏定氮仪基于GB 5009.5-2016中的凯氏定氮法测定;脂肪含量采用脂肪提取仪用GB 5009.6-2016中的索氏提取法测定;乳糖含量采用高效液相色谱仪基于GB 5009.8-2016中的蒽酮比色法测定;水分含量采用电热鼓风干燥箱基于GB 5009.3-2016测定;总灰分含量采用马弗炉基于GB 5009.4-2016测定;酸度用GB 5009.239-2016中的酚酞滴定法测定。每个样品设置3个重复。

1.2.3 羊奶粉定标模型的建立和验证 利用WinISI III软件对羊奶粉6个品质指标的化学测定值结合近红外光谱数据建立定标模型,采用改进最小二乘法回归法(modified partial least squares, MPLS)建模时,对原始近红外光谱数据分别以无散射处理(None)、去散射校正(Detrend only)、标准正态变量变换(standard normal variate, SNV Only)、标准正态变量变换结合去趋势算法(SNV and Detrend)、多元离散校正(Standard multiplicative scatter correction,Standard MSC)、加权多元散射校正(Weighted MSC)、反向多元离散校正(Inverse MSC)等7种平滑处理与4种导数处理相结合共计28种方式进行预处理。其中,3种导数处理(1、4、4、1;2、8、8、4;1、4、8、4;1、8、8、1)中的数值依次代表导数处理的阶数、导数的数据间隔、一次平滑点数和二次平滑点数[19-20]。利用WinISI III软件通过得分矩阵计算样品的马氏距离(GH)和邻域距离(NH),GH≥3.0和NH≥0.6的视为异常样品。将剩下的样品按照3:1比例随机分成定标集和验证集[21]。

定标模型建立后,通过交叉验证标准误差(standard error of cross validation, SECV)和交叉验证相关系数(1 minus the variance ration, 1-VR)来判定定标模型的预测性能。SECV表示定标建模过程中进行交叉验证时所获得的预测值与化学分析值标准偏差;1-VR是定标建模过程中,进行交叉验证时所得到的相关系数,即模型对样品集浓度变化所能描述出的百分率。SECV值越小,1-VR值越大,则说明建立的定标模型预测性能越好。通过验证集偏差(Bias)、预测标准误差(standard error of prediction, SEP)、预测决定系数(coefficient of determination for validation,RSQ)、相对分析误差(relative percent deviation,RPD)来判定该模型预测准确性。Bias、SEP分别表示定标模型参考值与预测值的偏差和相对偏差,预测决定系数(RSQ)表示模型拟合效果,相对分析误差(the ration of performance to deviation, RPD)表示模型预测能力。Bias值和SEP值越小,RSQ值越接近于1,RPD值大于3.0,则说明建立的模型预测精度越高[22-23]。

1.2.4 通用模型预测评价 以全部羊奶粉样品作为研究对象,建立蛋白质、脂肪、乳糖、水分、酸度和总灰分6个品质指标的通用模型;再分别以陕西羊奶粉样品、纯羊奶粉样品作为研究对象,建立6个品质指标的2组独立模型。用陕西羊奶粉、纯羊奶粉的验证集去检验通用模型的预测性,用Bias值、SEP值、RSQ值进行综合评价。

2 结果与分析

2.1 样本集的划分与分析

2.1.1 羊奶粉总样本集划分 全部羊奶粉样品各品质指标的原始集(N=135)、定标集(N=95~97)和验证集(N=34)见表1。可以发现,蛋白质、脂肪、乳糖、水分、酸度和总灰分6个指标异常样品数略有差异,各指标分别剔除了5、6、6、5、5、4个异常样品。验证集的6个品质指标数值范围基本涵盖于定标集对应品质指标数值范围内,说明可以用于全部羊奶粉样本的外标建模与验证分析。

表1 全部羊奶粉样品各品质指标的分集Table 1 Diversity of each quality index of all goat milk powder samples

2.1.2 陕西羊奶粉样本集划分 陕西羊奶粉样品各品质指标的原始集(N=93)、定标集(N=65~68)和验证集(N=23)见表2。蛋白质、脂肪、乳糖、水分、酸度和总灰分6个指标分别剔除了5、5、4、5、5、2个异常样品。验证集的6个品质指标数值范围基本涵盖于定标集对应品质指标数值范围内,说明可以用于陕西羊奶粉样本的外标建模与验证分析。

表2 陕西羊奶粉各品质指标的分集Table 2 Diversity of Shaanxi province goat milk powder quality indexes

2.1.3 纯羊奶粉样本集划分 纯羊奶粉样品各品质指标的原始集(N=108)、定标集(N=77~80)和验证集(N=27)见表3。蛋白质、脂肪、乳糖、水分、酸度和总灰分6个指标分别剔除了1、4、4、2、6、3个异常样品。验证集的6个品质指标数值范围基本涵盖于定标集对应品质指标数值范围内,说明可以用于纯羊奶粉样本的外标建模与验证分析。

表3 纯羊奶粉各品质指标的分集Table 3 Diversity of each quality index of pure goat milk powder

2.2 羊奶粉2个独立模型及通用模型的建立

从羊奶粉样品的近红外反射原始光谱结果(图1)可知,135个羊奶粉的特征吸收波段光谱曲线趋势相似。由于奶粉中成分复杂,不同成分对应的不同基团(如甲基、亚甲基等)或同一基团在不同化学环境中近红外吸收波长与强度都有明显差别,所以成分的光谱吸收强度不同,波段也不同,本实验选择全谱波段进行分析。

图1 羊奶粉样品的近红外反射原始光谱图Fig.1 Near infrared reflectance spectra of the raw goat milk samples

为避免在光谱采集过程中由于仪器噪音、暗电流等及奶粉样品等产生的光谱曲线不重复、基线漂移,光谱信息重叠、散射等干扰现象影响到建模的精度。本研究利用WinISI III软件以平滑处理与导数算法相结合的28种处理算法对上述6个品质指标采集到的近红外光谱数据分别进行预处理建立了MPLS定标模型。通过交叉验证误差(SECV)和交叉验证相关系数(1-VR)来判定各品质指标建立的定标模型,最终筛选出6个品质指标的最优MPLS定标模型结果见表4。本文测定的6个品质指标中同一指标在不同模型里最优预处理方法有差异,同一模型里不同指标的最优预处理方法也有不同,这除了和模型样本集有关外,与各指标对应吸收的近红外波谱段也有关。从表4可知,对比未经处理定标模型的SECV和1-VR值可以发现,经过预处理定标模型的SECV值下降了38.2%~78.4%,1-VR值提升了0.2%~13.0%,SECV值越小,1-VR值越大,建立的模型越好[22]。综上,本研究选取的近红外光谱数据预处理方法可以有效提高模型的稳健性和预测性。

对于全部羊奶粉样品6个品质指标的通用模型最优预处理组合:蛋白质为Inverse MSC和2、8、8、4,脂肪为Weighted MSC和2、8、8、4,乳糖为SNVDetrend和1、4、4、1,水分为SNV-Detrend和1、1、8、8,总灰分为Standard MSC和1、4、8、4,酸度为SNV-only和2、8、8、4。其中蛋白质、脂肪、乳糖、水分、总灰分、酸度最优模型所对应的SECV值分别为:0.091、0.064、0.297、0.025、0.060和0.176,1-VR值分别为:0.999、0.999、0.998、0.998、0.999和0.974。

对于陕西羊奶粉样品6个品质指标的独立模型最优预处理组合:蛋白质为Weighted MSC和2、8、8、4,脂肪为Weighted MSC和2、8、8、4,乳糖为Inverse MSC和1、4、4、1,水分为Standard MSC和1、1、8、8,总灰分为None和2、8、8、4,酸度为Standard MSC和1、4、4、1。其中蛋白质、脂肪、乳糖、水分、总灰分、酸度最优模型所对应的SECV值分别为:0.094、0.063、0.327、0.026、0.065和0.242,1-VR值分别为:0.999、0.999、0.998、0.998、0.999和0.954。

对于纯羊奶粉样品6个品质指标的独立模型最优预处理组合:蛋白质为None和2、8、8、4,脂肪为Inverse MSC和2、8、8、4,乳糖为Inverse MSC和1、4、4、1,水分为SNV-Detrend和1、4、8、4,总灰分为None和1、4、4、1,酸度为Standard MSC和2、8、8、4。其中蛋白质、脂肪、乳糖、水分、总灰分、酸度最优模型所对应的SECV值分别为:0.081、0.057、0.206、0.021、0.063和0.173,1-VR值分别为:0.993、0.999、0.994、0.998、0.983和0.970。

通过比较全部羊奶粉样品建立的通用模型和仅以陕西羊奶粉样品建立的独立模型6个品质指标的SECV值和1-VR值(表4)来评估模型的预测性能发现,酸度预测模型性能提高,酸度的通用模型相比独立模型的SECV值降低了3.2%,1-VR值提升了0.2%,其余5个品质指标的模型预测性能均一致,因为SECV值越小,1-VR值越大,模型效果越好,所以本研究建立的定标模型中通用模型优于陕西羊奶粉独立模型。同样,对比全部羊奶粉样品建立的通用模型和仅以纯羊奶粉样品建立的独立模型6个品质指标的SECV值和1-VR值(表4)来评估模型的预测性能发现,除脂肪、水分得到的模型预测性能一致外,蛋白质、乳糖、灰分和酸度的预测模型性能均有提高,这4个品质指标的通用模型相比独立模型SECV值降低了1.7%~44.2%,1-VR值提升了0.4%~1.6%,所以本研究建立的定标模型中通用模型优于纯羊奶粉独立模型。

表4 羊奶粉各品质指标的最优MPLS定标模型Table 4 Optimal MPLS calibration model for each quality index of goat milk powder samples

2.3 羊奶粉两组定标模型及通用模型的验证

2.3.1 陕西地区独立模型的外部预测验证 通过陕西羊奶粉验证集对6个品质指标建立的独立模型进行检验(表5),发现蛋白质、脂肪、乳糖、水分、总灰分和酸度模型的Bias值均接近于0;SEP值分别为0.168、0.317、0.412、0.043、0.191和0.407;RSQ值分别为0.998、0.997、0.996、0.993、0.989和0.889,除酸度外,其余指标模型RSQ值均大于0.98且接近于1,RPD值除酸度外其余指标均大于3。一般Bias值和SEP值越小,RSQ值越接近于1,RPD值大于3,表明建立的模型预测能力越好[22-23]。酸度模型的RSQ值为0.889,小于0.9,一般大于0.9模型预测效果更好[22],RPD值为2.713,小于3,综合说明酸度模型预测能力一般。因此验证了陕西羊奶粉除酸度外其余5个品质指标的独立模型均具有很好的预测能力。

表5 羊奶粉各品质指标定标模型的验证结果Table 5 Validation results of calibration model for each quality index of goat milk powder samples

对得到的陕西羊奶粉集蛋白质、脂肪、乳糖、水分、总灰分和酸度的实测值与预测值进行配对t检验,计算得出t值依次为-1.745、-0.896、0.120、0.270、1.351、-1.398,P值 依 次 为0.095、0.380、0.905、0.790、0.190、0.176,P值均>0.05,说明实测值与预测值之间无显著差异。

2.3.2 纯羊奶粉独立模型的外部预测验证 通过纯羊奶粉验证集对6个品质指标建立的独立模型进行检验(表5),发现蛋白质、脂肪、乳糖、水分、总灰分和酸度模型的Bias均接近于0;SEP值分别为0.103、0.100、0.304、0.027、0.084和0.301,RSQ值分别为0.990、0.998、0.990、0.995、0.977和0.933,通过RPD值进行再次检验,各指标模型RSQ值均大于3。因此验证了纯羊奶粉6个品质指标的独立模型均具有很好的预测能力。

对得到的纯羊奶粉蛋白质、脂肪、乳糖、水分、总灰分和酸度的实测值与预测值进行配对t检验,计算得出t值依次为-0.320、-1.581、0.329、-0.325、1.531、-0.199,P值依次为0.752、0.126、0.745、0.748、0.138、0.844,P值均>0.05,说明实测值与预测值之间无显著差异。

2.3.3 通用模型的外部预测验证 通过全部羊奶粉验证集对6个品质指标建立的通用模型进行检验(表5),发现蛋白质、脂肪、乳糖、水分、总灰分和酸度模型的Bias均接近于0;SEP值分别为0.114、0.227、0.732、0.034、0.157和0.206,RSQ值分别为0.999、0.998、0.990、0.995、0.993和0.970,通 过RPD值进行再次检验,各指标模型RSQ值均大于3。因此验证了全部羊奶粉6个品质指标通用模型均具有很好的预测能力。

对得到的全部羊奶粉集蛋白质、脂肪和酸度的实测值与预测值进行配对t检验,计算得出t值依次为-0.555、-1.193、0.539、0.966、1.270、-0.023,P值依次为0.583、0.241、0.594、0.341、0.213、0.982,P值均>0.05,说明实测值与预测值之间无显著差异。

2.3.4 通用模型的适用性验证 用陕西羊奶粉、纯羊奶粉的验证集分别检验以全部羊奶粉建立的通用模型的适用性。利用WinISI III软件中的结果监控操作,并用验证集样品对通用模型预测结果进行监控,观察这6个品质指标的样品散点图(图2)可看出,陕西羊奶粉、纯羊奶粉和全部羊奶粉的各预测集样品点均分布在回归曲线两侧。表明通用模型对预测陕西羊奶粉集和纯羊奶粉集的这6个品质指标是适用的。

图2 羊奶粉样品各品质指标测定值和预测值的相关性Fig.2 Correlation between measured and predicted values of each quality index of goat milk powder samples

通过比较陕西羊奶粉预测集验证独立模型与通用模型的预测相对误差(表6),发现蛋白质、脂肪、水分和酸度4个品质指标的通用模型中预测相对误差均小于独立模型的值,乳糖和总灰分的独立模型中预测相对误差和通用模型一致,说明通用模型对陕西羊奶粉集这6个品质指标可达到更好的预测能力。因为独立模型和通用模型样本集都包含纯羊奶粉和其他配方奶粉,而通用模型的样本量及地域包括更广泛,说明样本的差异性及样本量对模型建立的稳健性与适用性有一定影响。

表6 独立模型和通用模型预测适用性比较Table 6 Comparison of applicability between independent model and general model

通过比较纯羊奶粉预测集验证独立模型与通用模型的预测相对误差(表6),发现蛋白质、脂肪、乳糖、水分和总灰分的通用模型预测相对误差均大于或等于独立模型的值,酸度的通用模型预测相对误差小于独立模型的值,说明通用模型对纯羊奶粉酸度指标可达到更好的预测能力,而独立模型对蛋白质、脂肪、水分和总灰分的预测能力更好。因为通用模型样本集包含了纯羊奶粉之外的其他类型配方羊奶粉,由于不同类型羊奶粉的蛋白质、脂肪、水分和总灰分的含量差异较大,参数范围较广,所以相比纯羊奶粉建立的独立模型,通用模型对纯羊奶粉这4个指标的预测误差相对就会变大。但是两种模型的预测相对误差的差值只在-0.001%~-0.105%之间,差值较小。还可以发现酸度的通用模型预测相对误差小于独立模型的值,说明通用模型对纯羊奶粉酸度的预测能力更好。通过比较两者的样本集发现,其样本集均包含了不同类型的羊奶粉,因为酸度在不同类型羊奶粉中差异较小,而且通用模型的样本量更大,所以通用模型可实现对纯羊奶粉酸度更好的预测性。

综上所述,通用模型对陕西地区羊奶粉的6个品质指标预测均是可行的,对于纯羊奶粉的乳糖、酸度指标预测也是可行的,但是对于纯羊奶粉的蛋白质、脂肪、水分和总灰分的预测能力不如独立模型。

3 讨论

奶粉的蛋白质、脂肪、乳糖、水分和总灰分是主要的营养指标,酸度是鉴定奶粉质量参数之一,故选择这6项品质指标对奶粉进行评价是非常有参考意义的[24]。对于这6项指标的测定方法一般采用化学分析法,需要对样品进行前处理,如果样本量较大的话,该方法还非常耗时耗样,成本高昂,结果易受干扰[24]。而近红外光谱分析技术作为一项绿色无损检测手段,操作简单,检测快速,可以完成大批量的数据分析,还可达到对样品多个指标的同时检测,无需样品处理,减少了样品需求量且耗时很短,节约成本且结果稳定[8,25]。所以,本研究选择近红外技术对羊奶粉的这6项指标进行检测。

由于奶粉组成复杂,在光谱预处理中,导数处理可提高重叠峰的分辨率和灵敏度,减少背景干扰,消除基线漂移[20,26],随着导数阶数增加,一些高频噪音及组分干扰会被消除,多元散射校正和标准正态变量校正方法可以消除由于奶粉样品颗粒形状、粒径大小、分布均匀程度等物理因素差异引起的光谱散射现象。故本研究选用了一阶导数和二阶导数两种算法与平滑处理结合的光谱预处理方法,更好提升了光谱数据的有效性。MPLS相比传统的PLS可以提升模型的预测精度及适用性。吕建波[27]建立了PLS和MPLS的液态纯牛奶品牌鉴别模型,结果表明MPLS模型的鉴别精度更高。因此,本研究直接采用MPLS建立羊奶粉中蛋白质、乳脂肪、乳糖、水分、总灰分和酸度6项指标的定标模型,为羊奶粉的实时监测提供了有效的技术支持。

本研究建立的通用模型中样品选择了来自于国内外多个市区45个品牌不同规格的纯羊奶粉和配方羊奶粉,样品具有较广泛的适应性。利用近红外光谱分析技术建立的6个指标的独立模型和通用模型中预测参数均有差异。在陕西独立模型和纯羊奶粉独立模型中酸度的RSQ值相比其余5个指标均为最低,表明预测性能相比其他5个指标均较弱。可能原因是:近红外光谱的原理是反映含氢基团有机物的倍频合频信息[28],而酸度指标是对物质中游离羧酸基团数量的计量标准,一般采用酸碱滴定法测定物质酸度值。本文酸度指标的化学检测法其结果优于近红外光谱技术对羊奶粉酸度的检测,说明酸度指标的模型稳健性还有待提高。但是两者酸度RSQ值均在0.8以上[29],表明近红外光谱技术可以用于实际生产中大量羊奶粉样品的酸度检测。

4 结论

本研究基于近红外光谱技术对羊奶粉蛋白质、脂肪、乳糖、水分、总灰分和酸度品质指标分析,分别以陕西羊奶粉和纯羊奶粉为研究对象建立了6项指标的独立模型,并以全部羊奶粉集为研究对象建立了6项指标的通用模型。通用模型对预测陕西地区羊奶粉的蛋白质、脂肪、水分和酸度4个品质指标,纯羊奶粉的酸度指标预测均优于独立模型。但是纯羊奶粉的独立模型对蛋白质、脂肪、水分和总灰分4项指标预测能力更好,后期可进行更大样本的投入与模型方法优化,从而进一步探讨、验证通用模型对这4项指标的预测性能。综上,本研究所建通用模型、独立模型均可实现对多种市售羊奶粉主要品质指标的快速定量无损检测,为市售羊奶粉产品尤其是陕西地区羊奶粉、纯羊奶粉的实时监测提供有效的技术支持。

猜你喜欢

羊奶粉定标酸度
近红外定标法分析黏/锦/氨三组分纤维含量
尽快制定羊奶粉国家标准
我国为世界大豆精准选种“定标”
浅谈电位滴定方法在柴油酸度分析中的应用
基于恒星的电离层成像仪在轨几何定标
一种固态发酵窖池酸度在线监测系统的设计与实现
基于子空间正交的阵列干涉SAR系统相位中心位置定标方法
羊奶粉产业规模快速扩大
低糖褐色乳酸菌饮品的研制
羊奶粉“掺牛” 不“纯粹”