掺杂婴幼儿奶粉的中红外光谱检测
2023-01-16黄明月赵晨吴海云靳皓杨仁杰
黄明月,赵晨,吴海云,靳皓,杨仁杰
(天津农学院 工程技术学院,天津 300392)
婴幼儿生长发育极为迅速,对各营养素的需求也很高[1],尤其是蛋白质、脂肪和碳水化合物等营养元素。一些不法商人为了追求奶粉市场中更大的利润,在婴幼儿奶粉中掺杂大量的淀粉与面粉,这种掺杂奶粉被婴幼儿长期食用会营养不良,发育缓慢。因此,研究一种快捷方便检测奶粉质量的方法对于消费者、奶粉企业和乳制品市场稳定都具有重要的意义。
光谱检测方法具有快速、无污染等优点[2],已被广泛应用于食品品质检测方面[3-4]。BARABASSY[5]采用近红外光谱技术对奶粉中蛋白质、脂肪和乳糖等理化性质进行分析。唐玉莲等[6]将近红外光谱与支持向量机相结合实现三种不同年龄阶段奶粉的判别。丁丽等[7]将近红外光谱技术与偏最小二乘法结合对奶粉中三聚氰胺进行定量分析,指出近红外光谱技术可用于奶粉中三聚氰胺的定量分析;刘景旺等[8]研究了奶粉中掺入三聚氰胺和葡萄糖的近红外光谱特性。MAUER等[9]采用近红外和中红外光谱法定量分析婴儿配方奶粉中三聚氰胺,指出其能够快速检测婴儿配方奶粉中的三聚氰胺,检测限为1 mg/kg。彭攀等[10]将近红外光谱与马氏距离结合对纯奶粉和掺杂植脂末、天然大豆分离出的蛋白质、麦芽糊精的奶粉进行判别,指出近红外光谱技术可以实现掺杂奶粉的快速判别。LU等[11]基于最小二乘支持向量机(LS-SVM)建立了检测奶粉中三聚氰胺的近红外光谱判别模型,指出该方法可快速准确检测奶粉中三聚氰胺。本文探讨了应用中红外光谱技术与化学计量学结合的方法对掺杂婴幼儿奶粉进行定性与定量分析,该研究对于维护婴幼儿奶粉市场稳定和消费者权益都有重要的意义。
1 材料与方法
1.1 试验材料、试剂与仪器
试验采用美国Perkim Elmer公司的傅里叶变换中红外分光光度计,样品池为仪器自带的衰减全反射附件,光谱采集的波数范围为800~4 000 cm-1,分辨率:8 cm-1, 扫描次数为32次。分别准备纯金领冠婴幼儿奶粉样品40个和同时掺有淀粉(质量百分比浓度:0.1%~30%)和面粉(质量分数为:0.1%~40%)的婴幼儿奶粉样品40个。
1.2 方法
1.2.1 蒙特卡洛(MCCV)剔除异常样品方法
蒙特卡洛是一种根据正常样品与异常样品的差异性建立大量的定性和定量模型,再通过计算统计参数把异常样品进行剔除[12]。基于蒙特卡洛计算各样品的预测残差均值与方差并作图,选择出光谱数据异常与化学值异常的样品并剔除。图1a为定性判别蒙特卡洛剔除异常样品图,剔除标准差大于0.3的4个样品。因此,采用剩余76个样品建立定性判别模型。使用同样的方法对淀粉定量分析模型和面粉定量分析模型分别进行异常样品的剔除(见图1b和图1c)。对于淀粉和面粉异常样本分别剔除了3个和4个,分别采用剩余37个和36个样品建立定量分析模型。
图1 定性分析(a),定量分析淀粉(b)和面粉(c)蒙特卡洛剔除异常样品
1.2.2 偏最小二乘判别(PLS-DA)分析方法
PLS-DA是基于偏最小二乘回归的一种判别算法[13]。在判别模型的类别变量矩阵中,纯奶粉用0表示,掺杂奶粉用1表示,用类别变量矩阵与光谱矩阵进行PLS分析,建立类别变量矩阵与光谱矩阵间的判别模型。
1.2.3 间隔偏最小二乘(IPLS)选择波段方法
建模时对光谱波段范围的选择可以是全谱也可以选取部分,对样品光谱信息筛选后的光谱范围可有效提高所建立模型的稳定性和准确性[14]。本论文采用IPLS方法对模型进行优化,对于淀粉定量分析得到最有效的样品波段区间为:962~1 122 cm-1(图2a);对于面粉定量分析得到最有效的样品波段区间为:3 522~3 362 cm-1和1 282~800 cm-1(图 2b)。
图2 定量分析奶粉中淀粉(a)和面粉(b)的波段选择
2 结果与分析
2.1 纯奶粉和掺杂奶粉的中红外光谱特性
图3a和3b分别为纯奶粉和掺假奶粉在800~4 000 cm-1一维中红外光谱图,可以看到在998、1 150 cm-1附近均出现特征峰,其均来自碳水化合物所对应的C—O伸缩振动峰;位于1 650 cm-1附近的吸收峰来自于奶粉中蛋白质的酰胺Ⅰ带的吸收峰,位于2 918 cm-1附近的吸收峰来自于脂肪中甲基的伸缩振动峰[15-17]。对比发现,纯奶粉和掺假奶粉仅在细微处存在差别,无法对其进行有效区分。
图3 纯奶粉(a)和掺杂奶粉(b)中红外光谱图
2.2 掺杂奶粉的定性判别模型
蒙特卡洛剔除异常样品后,采用浓度梯度法从掺杂奶粉样品中选出23个作为校正集,剩余13个作为预测集,并选取纯奶粉中的27个作为校正集,余下13个作为预测集。采用交叉验证法,选择3个主成分,基于PLS在全波段(800~4 000 cm-1)建立掺杂奶粉的判别模型。利用所建模型对校正集内50个样品进行预测,预测结果如图4a,所有纯奶粉都被正确判别,3个掺杂奶粉被误判,判别正确率为94%。同时采用模型对26个未知样品进行外部预测,预测结果如图4b,所有纯奶粉都被正确判别,2个掺杂奶粉被误判,判别正确率为92%。
图4 模型对校正集(a)和预测集(b)样品的判别结果
2.3 掺杂奶粉中淀粉定量分析
采用蒙特卡洛剔除异常样品后,基于一维中红外光谱(1 122~962 cm-1),在剩余37个掺杂奶粉中,选取24个作为校正集,余下13个作为预测集,在6个主成分下,基于偏最小二乘(PLS)建立对淀粉的定量分析模型。如图5a,采用内部交叉验证的方法来评价所建立模型的稳定性,其校正系数R为0.992,交叉验证均方根误差(RMSECV)为0.023,模型具有良好的稳定性和拟合效果;如图5b,采用外部预测方法来评价模型的预测效果,其相关系数R为0.98,预测均方根误差(RMSEP)为0.062,表明模型具有良好的预测能力和拟合效果。
图5 定量分析淀粉模型预测值与实际值线性拟合
2.4 掺杂奶粉中面粉定量分析
同样,采用蒙特卡洛剔除异常样品后,从剩余36个样品中,采用浓度梯度法选取24个作为校正集,余下12个作为预测集,基于一维中红外光谱(3 522~3 362 cm-1,1 282~800 cm-1),选择8个最佳主成分建立定量分析奶粉中面粉的 PLS模型。为了评价模型的可靠性,采用内部交叉验证的方法,如图 6a,其校正系数R为 0.996,RMSECV为0.021。为了评价模型的预测能力,采用外部验证的方法,如图6b,预测相关系数R为0.99,RMSEP为0.032,表明模型具有良好的预测能力和拟合效果。
图6 定量分析面粉模型预测值与实际值线性拟合
3 结论
本文在研究掺杂婴幼儿奶粉一维中红外光谱特性的基础上结合偏最小二乘建立了定性定量分析奶粉中淀粉和面粉的数学模型。经过对最佳的主成分数和最有效波数范围的选择得到最优模型,所建定性模型对未知样品的识别正确率为 92%,对淀粉定量分析的相关系数R为0.98,RMSEP为0.062;对面粉定量分析模型的预测相关系数R为0.99,RMSEP为0.032,表明所建立的模型具有良好的稳定性和预测能力。本研究为婴幼儿奶粉质量控制提供一种快速便捷的检测方法,对于维护婴幼儿奶粉市场稳定和消费者权益都有重要的意义。