基于低场核磁共振技术的奶粉品牌快速判别
2021-09-22夏阿林
杨 莉 夏阿林 张 榆
(邵阳学院食品与化学工程学院,湖南 邵阳 422000)
牛奶中除含有常见营养成分蛋白质、脂肪、乳糖、无机元素外,还含有能够增强机体免疫系统、内分泌系统的生物活性物质,可以保护机体内酶、活性肽、抑制剂及抗菌剂的良好运行[1]。对于企业来说品牌是核心竞争力,品牌是立于不败之地的利器[2];对于消费者来说能够购买到货真价实的品牌奶粉,若因质量问题可以找到厂家,以维护自身的合法权利。因此建立和完善奶粉品牌监督管理体系,让消费者购买到货真价实的品牌奶粉,追溯各品牌奶粉,需建立一种能快速准确地判别奶粉品牌的方法。
低场核磁共振技术可直接对样品进行测定分析,无需任何化学试剂提取,对环境友好且不损坏样品内部结构。检测时,低场核磁共振会发射射频脉冲使得被测样品中的氢质子吸收脉冲产生共振,食品中的氢质子相对较多,测定时产生的信号强度较大;而弛豫时间的变化与被测样品中氢质子的存在状态息息相关,不同样品的氢质子存在状态不同,可根据这一规律获取样品内部信息进行定性分析[3-5]。目前对品牌的判别有稳定碳同位素判别浓香型白酒品牌[6]、近红外光谱结合线性判别分析方法鉴别食醋品牌[7]、低场核磁共振结合化学模式识别方法判别休闲豆干品牌[8]、基于多源光谱分析技术判别鱼油品牌方法[9],而有关奶粉品牌的判别研究尚未见报道。化学模式识别是通过现代先进的分析仪器得到的化学数据经过数学计算,结合统计学知识获取有潜在价值的信息和物质基本特性,已被应用于样品分类、真假识别以及质量控制等领域[8,10-11]。
使用多元校正方法[12-13]对不同品牌奶粉的低场核磁共振谱中的有效数据进行提取分析,通过计算机辅助技术结合低场核磁共振技术达到化学模式识别的目的,为不同品牌奶粉判别分析提供一种快速、准确的方法。
1 材料与方法
1.1 材料与仪器设备
1.1.1 材料
6种常见的不同品牌全脂奶粉:分别为品牌1、品牌2、品牌3、品牌4、品牌5、品牌6,每个品牌奶粉各9个不同批号(生产日期不同),每个批号各5包,共270包。
1.1.2 仪器与设备
核磁共振仪:MQC-23型,自带Win DXP数据分析软件、26 mm专用样品管,英国牛津公司;
电子天平:ME104型,梅特勒—托利多仪器(上海)有限公司。
1.2 试验方法
1.2.1 样品处理 称取样品8 g,转移至26 mm专用的干净样品管中,按规定转入测量池中,于32 ℃放置15 min后进行测样,用Carr-Purcell-meiboom-gill(CPMG)测横向弛豫时间T2,每组样品重复测定5次取平均值,实测波形经曲线反演得到横向弛豫时间反演谱(T2谱),总计270个T2谱。
1.2.2 仪器参数 半回波时间3 000 μs;重复采样时间2 000 ms;180°硬脉冲宽度10.0 μs;回波数4 096;累加次数为8;采样频率1 000 kHz;90°硬脉冲宽度为P90。
1.2.3 主成分分析(PCA) 样品经低场核磁共振仪检测后,可得到被测样品的数据信息,采用算法PCA对数据进行处理,PCA对样品的大部分信息进行分析后筛选出部分不相关的综合变量。依据方差贡献率的累计数,值越大表示包含的信息越多[14]。
1.2.4 偏最小二乘判别(PLS-DA) 将样品经低场核磁共振仪检测后仪器得到的大量数据采用算法偏最小二乘判别处理,基于偏最小二乘回归的方法正交分解量测矩阵和响应矩阵[15],不同的主成分数对应不同的偏最小二乘模型。采用留一交互验证确定样品的最优主成分数,再建立偏最小二乘模型[16]。试验的y值设定为-5,-3,-1,1,3,5,分别对应奶粉品牌1、2、3、4、5、6,评价标准按式(1)进行计算。
(1)
式中:
RMSECV——RMSECV值;
Kp—— 交互验证集样本数;
Ci——第i个样本的期望值。
偏最小二乘方法建立的模型对检测的样品进行判别预测时会输出预测值yi,根据输出值对样品类别区间进行判断,yi<-4判定为品牌1; -4≤yi<-2判定为品牌2;-2≤yi<0判定为品牌3;0≤yi<2判定为品牌4;2≤yi<4判定为品牌5;yi≥4判定为品牌6。
1.2.5 误差反传人工神经网络(BP-ANN) BP-ANN由输入层、隐含层和输出层3部分构成。Levenberg Marquardt算法用于改进非线性最小方差优化问题[17-18]。因人工神经网络对选择隐含层的要求较高,若选择的隐含层不恰当就会出现过拟合现象。试验采用误差反传人工神经网络优化算法作为训练函数,按式(2)计算隐含层节点数。
(2)
式中:
n1——隐含层节点数;
n——输入节点数,取128;
m——输出节点数,取1;
a——调节常数,取1~10。
根据计算结果,a=3时输出结果最好,故隐含层节点数为14。
采用与偏最小二乘相同的判别期望值和输出区间,隐含层与输出层按式(3)进行转换,人工神经网络在训练时需按式(4)作为收敛判别依据。
(3)
(4)
式中:
SSE——SSE值;
m——样本数;
n——输出节点数;
Eij——期望值;
Oij——实际输出值。
1.3 数据处理
采用Matlab 软件进行主成分、偏最小二乘判别和误差反传人工神经网络数据分析,采用Origin 2018软件制图。
2 结果与分析
2.1 样品与低场核磁共振测量
用低场核磁共振在同一条件下将270个奶粉样品分为两部分:随机取出若干组成共180个样品的校正集,剩余90个组成预测集。由图1可知,不同品牌的弛豫时间有所不同,但只能粗略区分为4种不同的样品,无法正确区分6种不同品牌奶粉。因此,单独采用低场核磁共振的弛豫时间很难区分不同品牌奶粉。
图1 所有奶粉样品的横向弛豫时间(T2)反演曲线
2.2 主成分分析判别
由图2可知,主成分1、2、3的贡献率分别为75.29%,8.75%,5.31%,前3个主成分累计贡献率达89.35%,包含样品的大部分信息,但每个品牌的样本显得有些离散,聚集性也不强,很难区分6种不同的奶粉品牌。
图2 所有奶粉样品的三维主成分得分图
2.3 偏最小二乘判别和误差反传人工神经网络判别
采用留一交互验证确定样品的最优主成分数[16],当主成分数为7时交互验证均方根误差最小,由图3可知,因此选择7为此模型的最优主成分数,再建立偏最小二乘模型。
图3 交互验证均方根误差与主成分数的关系
PLS-DA方法的训练集和预测集的正确识别率如图4和表1所示。结果表明,PLS-DA方法对样本训练集和预测的识别率均不高,训练集中识别率最高为100.0%对应品牌3,最低识别率为3.3%对应品牌6,综合识别率为66.1%;预测集中识别率最高为94.4%对应品牌2,最低识别率为6.7%对应品牌6,综合识别率为52.2%;说明该方法无法用于实际判别,需建立一种更加可靠的方法。
图4 训练集及预测集奶粉样品PLS-DA方法预测结果
表1 PLS-DA与BP-ANN模型的判别结果
由图5和表1可知,BP-ANN方法可将6种不同品牌奶粉进行准确判别,训练集中除品牌5的正确识别率为96.6%外,其他品牌正确识别率均为100.0%;预测集中正确识别率均为100.0%,结果满意。
图5 训练集及预测集奶粉样品BP-ANN方法预测结果
3 结论
采用低场核磁共振信号结合化学计量学的方法对6种不同品牌奶粉的内部信息进行了分析和判别。结果表明,不同品牌的奶粉由于加工工艺有所差异,可用低场核磁共振结合误差反传人工神经网络进行有效识别,该方法的训练集和预测集的正确识别率分别为99.4%,100.0%。但在实际应用中存在着奶粉品牌的代表性不足,所处的环境不同等,这些因素都会影响结果的准确性,需扩大样品的类型以及多种不同环境来提高低场核磁共振技术在奶粉品牌判别中的适用性。