基于低场核磁共振的白酒品牌判别分析
2021-11-10夏阿林
张 榆,夏阿林
(邵阳学院 食品与化学工程学院,湖南 邵阳 422000)
白酒产业作为承载中国传统文化的特殊饮品产业,要以不断满足市场对白酒消费者在物质层面、精神层面的新需求为发展准则,且必须建立一套完整的中国白酒品牌评定技术指标体系。构建和完善中国白酒品牌评定技术指标体系是以白酒品牌特征识别技术为基础的[1-2],浓香型白酒是我国产量和销量最高的白酒(约占白酒市场份额70%以上),对白酒品牌特征识别技术的研究选择浓香型白酒为研究对象具有一定的代表性。目前,国内浓香型白酒的品牌特征识别与评定主要依靠人工感官识别和常规理化检测分析来完成,特别是近年来,浓香型白酒品牌特征识别技术精进并不明显。原因在于人工感官识别主要是依靠人的感官来进行判断,不仅对检验员要求很高,而且容易受外界环境因素的干扰,可靠性、稳定性不佳;常规的理化检测分析大多检测繁琐、过程繁杂、周期性长,客观上影响产业经济效益的提升。为了提高识别效率,降低评定成本,增强客观可信度。低场核磁共振检测(low field-nuclear magnetic resonance,LF-NMR)得益于无损、快速、易操作的检测特点,在检测不同物质时,驰豫时间差异变化大,且对于同一物质在于不同相态时,驰豫时间也不同[3-6]。本实验基于LF-NMR技术,综合运用主成分分析[7](principal component analysis,PCA)、偏最小二乘法-判别分析[8-11](partial least squares-discriminant analysis,PLS-DA)、反向传播人工神经网络[12-16](back-propagationartificialneuralnetwork,BP-ANN)方法对不同品牌的多个浓香型白酒样本进行模式识别分析,解析了对不同品牌浓香型白酒进行判别的可行性,因此成为较理想的浓香型白酒品牌特征识别技术之一[17-24]。
1 材料与方法
1.1 材料与试剂
6个品牌的52度浓香型白酒(分别命名为A品牌、B品牌、C品牌、D品牌、E品牌和F品牌):市售,5个月内每个品牌分25批次购买,每个批次购买2瓶酒,每瓶酒作为1个样品,共收集300个样品。
1.2 仪器与设备
MQC-23台式核磁共振仪(氢共振频率23 MHz,支持数据分析软件Windxp和26mm核磁共振专用采样管):英国牛津仪器公司;101-1AB型恒温鼓风干燥箱:天津泰斯特仪器有限公司。
1.3 方法
1.3.1 低场核磁共振检测
参数设置:将待测的300个浓香型白酒样品依次装入直径26 mm的核磁共振专用的样品管中,按顺序放置于MQC-23台式核磁共振仪测量池中,并需要在测量池中对浓香型白酒样品预热10 min之后再开始检测,其中仪器磁体温度为恒定温度32 ℃。在CPMG(Carr-Purcell-Meiboom-Gill)脉冲序列参数列表中依次调整参数设置并进行重复采样,获得横向弛豫时间(T2)的CPMG信号衰减曲线。仪器主要参数设置如下:90°硬脉冲宽度为0.95 μs;180°硬脉冲宽度为1.9 μs;脉冲间歇为9 950 μs。
光谱采集:在上述实验得到的低场核磁共振检测最佳参数条件下。通过CPMG脉冲序列测量取得白酒样品的T2反演曲线,每个样品都采集3次,用样品的平均光谱作为样品建模所用的T2谱。
1.3.2 样本T2谱分析
结合蒙特卡罗交叉验证方法[25],从各品牌样本集(T2谱)中随机选择210个样本作为训练集参与建模;以没有参与建模的90个样本作为验证集,考察检验模型的准确性。综合运用PCA、PLS-DA、BP-ANN方法对6个品牌的300个浓香型白酒样本进行模式识别分析。
1.3.3 数据处理
LF-NMR通过CPMG脉冲序列获取浓香型白酒样品的CPMG回波曲线。用配套数据分析软件WinDXP获取浓香型白酒的反演曲线T2谱,用矩阵实验室(MATLAB)软件平台编写或调用MATLAB工具箱进行PLS和BP-ANN模型建立,用Origin 8.5软件对模型计算结果进行作图。
2 结果与分析
2.1 低场核磁共振检测
在相同条件下,对六个不同品牌不同批次的300个浓香型白酒样本进行低场核磁共振检测,浓香型白酒样品的横向弛豫时间(T2)反演曲线见图1。由图1可知,每个白酒样品测量3次分别得到其CPMG回波信号,将CPMG回波信号反演后得到反演曲线T2谱3次取平均作为建模所用T2谱数据,白酒样品共获得300个T2反演曲线,回波曲线之间差异很小,这些白酒样品谱图之间的微弱差异很难直接用肉眼通过谱图来对白酒的品牌类别进行判别。因此需要借助其他方法来对这些谱图进行解析,通过提取有用的、能反映各品牌特征的信息来辨别品牌类别。
图1 横向弛豫时间(T2)反演曲线Fig.1 Inversion curve of transverse relaxation time (T2)
由图2可知,主成分1的方差贡献率为75.66%,主成分2的贡献率为11.90%,主成分3的方差贡献率为4.67%,即前3个主成分的累计方差贡献率为92.23%,说明前3个主成分对原变量变异性的解释能力较好。白酒样品的聚类结果表明,6个品牌的白酒样品聚集较为明显,不能将这几个品牌的样品进行区分。因此,基于主成分分析方法很难对不同白酒品牌进行识别。
图2 白酒样品主成分分析的二维主成分得分图Fig.2 Score diagram of two-dimensional principal components of the Baijiu samples
2.2 偏最小二乘法-判别分析与反向传播人工神经网络判别
将反演得到的210组数据作为210个训练集,通过留一交互验证法得到最佳主成分数为18。训练完成后,建立PLS-DA模型,运用此模型对训练集的210个样本和90个预测集样本进行预测;将反演所得到的210个样本数据编成210个训练集通过BP-ANN方法进行训练,经过训练优化,用剩下的90个预测集验证。PLS-DA 和BP-ANN方法判别结果见表1。
表1 偏最小二乘法-判别分析和反向传播人工神经网络方法判别结果Table 1 Discriminant results of partial least squares-discriminant analysis and back-propagation artificial neural network methods
由表1可知,运用PLS-DA方法进行判别时,各训练集、预测集识别率为88.9%~100%,总计的训练集识别率为99.5%,总计的预测集识别率为96.7%。运用BP-ANN方法进行判别时,各训练集、预测集识别率为93.8%~100%,总计的训练集识别率为99.5%,总计的预测集识别率为98.9%。两种方法较好地对不同品牌的浓香型白酒进行判别,一定程度上验证了将低场核磁共振技术应用到浓香型白酒的品牌判别具备可行性。
3 结论
结合主成分分析方法对六种不同品牌不同批次的浓香型白酒的300个样本的T2谱反演数据进行降维处理,用主成分的得分矢量做三维散点图进行聚类分析,结果表明,样品聚集较明显,品牌无法被区分,所以PCA方法无法确证低场核磁共振技术对浓香型白酒进行品牌判别具备可行性。结合PLS-DA方法对判别模型的浓香型白酒样本进行训练可知,对训练集的识别率为99.5%,对预测集的识别率为96.7%。结合BP-ANN方法对判别模型中浓香型白酒样本进行训练,对训练集的识别率为99.5%,对预测集的识别率为98.9%。说明这两种方法较好地对不同品牌的浓香型白酒进行判别,在一定程度上确证了低场核磁共振技术对浓香型白酒进行品牌判别具备可行性。