基于3维荧光光谱技术的含乳饮料分类研究
2021-05-13刘沐涵陈国庆肖榕阳徐煜杰陈哲涵蔡纪元
刘沐涵,陈国庆,2*,肖榕阳,徐煜杰,陈哲涵,蔡纪元
(1.江南大学 理学院,无锡 214122;2.江苏省轻工光电工程技术研究中心,无锡 214122;3.江南大学 物联网工程学院,无锡 214122)
引 言
近年来,含乳饮料在国内的市场逐渐扩大,其食品安全问题也引起了广泛关注[1-4]。由于含乳饮料成分复杂,其质量检测和产品种类划分往往费时费力。市场上销售的含乳饮料种类繁多、质量参差不齐,消费者很难通过直观的感觉来判断含乳饮料的营养成分。因此,需要建立一种快速、方便、可靠的含乳饮料分类技术。
3维荧光光谱技术具有准确、快速、无损等优势[5-15]。国内外学者主要关注食品成分的定量检测,近年来食品分类方面的研究也逐渐开始完善。WANG等人对电子鼻应用于酒类和液体食品的分类进行了研究[16]。TANG等人利用传感器电子舌检测技术实现了茶饮料的分类[17]。LIU等人通过建立口味传感器阵列对玉米汁饮料进行分类鉴定[18]。目前,暂时没有基于3维荧光光谱结合因子分析和聚类分析的方法对含乳饮料进行分类的相关报道。
本文中对市售含乳饮料进行研究,参照含乳饮料的国家标准GB/T 21732-2008中的产品分类标准,利用3维荧光光谱技术获取样本数据,结合主成分分析、因子分析的方法降低变量的维数,再通过聚类分析,实现了对含乳饮料的分类[19]。
1 实 验
1.1 仪器和样品
实验中所用设备包括: FLS920P荧光光谱仪、微量移液枪以及TGL-16M台式离心机。
样品配置方法:选取了市场上常见的12种不同品牌的含乳饮品,用去离子水稀释至体积分数为0.40,依次标记为样品1~12。
1.2 含乳饮料的荧光光谱测定
将配置好的样品放入3维荧光光谱仪中进行检测,参量设置为:激发波长为50nm~700nm,发射波长为265nm~800nm,检测完成后对测量结果进行了发射光谱矫正[20]。
经观察比较,所测得的12种市售含乳饮料的3维荧光光谱依据形态可以明显分为两种,一种有两个荧光峰,另一种只有一个荧光峰,如图1所示。12种含乳饮料的荧光发射光谱如图2所示。其中发射波长为350nm左右的荧光峰是由含乳饮料中的蛋白质类物质受到荧光激发所产生的,而550nm处的荧光峰是由含乳饮料中的有机食品添加剂(如山梨酸钾、卡拉胶等)产生的。部分含乳饮品缺少由食品添加剂产生的荧光峰,其主要原因是添加剂浓度较低,稀释后的样品中添加剂含量较少,产生的荧光十分微弱。
Fig.1 3-D fluorescence spectra of two brands of milk beverages (volume fraction of milk beverages: 0.40)
Fig.2 Emission spectra of 12 brands of milk beverages (volume fraction of milk beverages: 0.40)
可以看出,不同种类含乳饮料虽然荧光发射峰的峰值位置基本一致,但是荧光峰的形状各异。为了更好地研究含乳饮料的荧光特性,作者利用多元统计方法对3维光谱数据进行详细分析。
2 数据分析
2.1 主成分分析
首先对数据进行预处理,将得到的12组3维荧光光谱数据按发射谱依次展开,形成12组1维数据向量,共得到4709个变量和12组样本数据。为便于比较各含乳饮料3维光谱的特性,本文中截取含乳饮料的3维光谱中能够体现出荧光特性的一部分数据来进行分析,即发射波长为300nm~650nm所对应的波段,预处理后得到由12组样品和956个变量组成的数据。
将预处理后的数据导入SPSS软件,进行主成分分析,前3个主成分的方差贡献率分别为81.87%,13.28%和3.07%。前两个主成分的累计方差贡献率可以达到95.15%(大于85%),因此可以只保留前两个主成分,降维效果较好。将第一主成分(P1)和第二主成分(P2)绘制散点图,如图3所示。图中,三角形对应配制型含乳饮料,圆点对应乳酸菌饮料,方块对应发酵型含乳饮料。通过主成分分析的方法进行降维,将变量降到2维,再绘制样品的散点图。在图3的坐标系中,将各点投影到45°线上,可以将各个类别分隔开,但是分类的阈值间隔并不明确。因此考虑采用因子分析的方法重新对数据进行降维。
Fig.3 Principal component analysis scatter plots of 3-D fluorescence spectra data of 12 brands of milk beverages
2.2 因子分析
主成分分析是利用线性变换的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标,每个主成分都是原始变量的线性组合,使得主成分比原始变量具有某些更优越的性能。而因子分析由研究原始变量相关矩阵内部的依赖关系出发,把错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。
对预处理后的数据运用SPSS软件进行因子分析,并选取适当个数的公共因子组成初始因子载荷矩阵,最终保留8个公共因子。采用正交旋转中的最大方差旋转法,对初始因子载荷矩阵做因子旋转,从而得到最终的因子载荷矩阵,再运用回归分析法,计算各因子的得分系数及对应于12种含乳饮料的公共因子得分。
选用平方欧氏距离对以上因子得分矩阵进行聚类分析,聚类方法采用瓦尔德法,最终获得的聚类谱系图如图4所示。
Fig.4 Results of 3-D fluorescence spectrum analysis of 12 brands of milk beverages by using Ward linkage
聚类分析谱系图中给出了不同阈值距离下样品的分类结果,可根据分类需求对阈值进行选择。随着阈值距离从0增加到25,12个样品可以被依次分为12类(距离为0)、4类(距离为2)、3类(距离为2.5)、2类(距离为5)、1类(距离为25)。因此,如果以距离为2.5作为阈值,12个样品可以分为3类。第1类包括1号、4号、5号、7号、10号样品,除1号样品外,其余样品为发酵型含乳饮料;第2类包括2号、8号、9号样品,除8号样品外,其余样品均为乳酸菌饮料;第3类包括3号、6号、11号、12号样品,全部为配制型含乳饮料。因此,将因子分析结合聚类分析对含乳饮品的光谱进行处理,可以初步实现将市售含乳饮料划分为3种类别:发酵型含乳饮料、乳酸菌饮料以及配制型含乳饮料,分类正确率达到83%以上。
3 结 论
含乳饮料的发射光谱有两类明显的荧光峰,分别由蛋白质和食品添加剂产生,不同品牌的含乳饮料的荧光峰形状存在差异。主成分分析结果显示,前两个个主成分的累积贡献率为95.15%(大于85%),因此保留前两个主成分。将第一主成分和第二主成分对应的样本点绘制成散点图,能够大致划分为3类,但是类与类之间的距离阈值难以确定。通过因子分析对3维荧光光谱预处理后的数据进行降维,再利用聚类分析对降维后的数据进行处理,能够将市售含乳饮料分为配制型含乳饮料、发酵型含乳饮料和乳酸菌饮料,分类的正确率可以达到83%以上,为开发含乳饮料分类系统提供了基础。