基于红外光谱特征和傅里叶变换的牛奶成分检测方法
2024-03-21傅正立
傅正立
(闽江师范高等专科学校,福建福州 350108)
随着当前经济社会的不断发展,人们对物质生活水平的要求也越来越高,更加重视身体健康与生活质量。 牛奶作为一种生活常见的营养品,绝大多数家庭会选择牛奶制品补充蛋白质等营养元素。乳制品厂家也更加重视牛奶营养元素的平衡,研制出高蛋白、低脂、低糖等多种特色产品。 因此,牛奶中成分含量与浓度的监测技术成为当前牛奶制品厂商重点关注的关键技术。同时食品安全部门进行产品安全质量检测也需要配套的检测技术进行成分检测。当前主要运用光谱检测仪识别牛奶中成分含量,分辨牛奶成分是否掺假,不同功能性奶制品之间成分含量差异。
光谱研究者通过文献[1]提出一种利用液体阴极辉光放电原子发射光谱技术,对吸收后的牛奶进行成分含量分析检测,并建立稀酸稀释进样测定方法,对钙元素具有灵敏的识别性能,但该方法主要对牛奶中的含钙成分具有较高的检测准确性,对于乳糖、脂肪等成分感应不灵敏。国内学者曾经[2]运用微型NIR 光谱仪对乳制品样本进行漫透射光谱探索,并利用傅里叶变换转换光谱图像数据,经最小二乘法拟合校正乳制品成分化学值,测定不同营养成分含量标准。 此测量方法相对稳健,但光谱测量成分含量的精度不高,均方误差偏高。
针对以上技术存在的测量弊端,基于红外光谱特征和傅里叶变换研究了一种新型牛奶成分检测方法,探寻红外光谱回归系数最优解,优化光谱成分检测精度与效率。
1 基于红外光谱特征牛奶成分的数据处理
1.1 数据预处理
首先需要对牛奶样本现存状态进行辨认,区分样本当前的类别属性, 再进行聚类描述和解释。目前的光谱分析识别模式主要有监督类和无监督类,对液态牛奶进行红外光谱识别分析主要采用有监督类的软独立模式分类法,对分析训练集中的每个样本进行主成分分析,并建立光谱数学模型, 通过将待测样品参数与数学模型拟合,来判别确定目标样本属性类别[3-4]。
利用红外光谱仪, 设置固定的样品扫描频率,根据样本体积调整适当的光谱分辨率,在相同的光照温度环境下,对全部样品进行红外光谱扫描采样,采集去离子液体牛奶成分的红外光谱图像。由于样本数据需要根据各种液态牛奶在常态空间中的存在状态,以空气为采集背景,监测获取各类牛奶和参照物水的红外光谱图像。牛奶中含有脂肪、蛋白质、乳糖和酰胺等物质,成分相对复杂,因此采集到的红外光谱数据会存在一些杂糅成分,需要对原始样本数据进行光谱分析预处理[5-6]。
通过高频噪声仪对液态牛奶进行白噪声滤波处理, 采用基线校正与矢量平滑相结合方法,去除监测采集过程中的基线漂移等外部环境干扰噪音。 分析采集红外光谱的基线频谱分布图像,通过机械划分等形式,划分频谱时间段,计算得出基础数据阈值和参数均方误差,对时间段内超出基线阈值的频谱,通过线性平移对每段波形进行校正,从而调整频段中超出基线常态的噪声数据。 再将矢量数据按照基线标准归一化,使多项同质数据平滑化,完成牛奶成分红外光谱数据预处理。
1.2 特征波长检测
在红外光谱图像分析过程中,由于光谱数据类型多样,内容包含信息量要素过多,会产生部分光谱图像信息与实际牛奶样本成分相关性弱的问题,因此需要在数据预处理的基础上,对红外光谱带特征波长进行识别选取,能够使模型训练时的信息更具有效性[7]。
液体中的水含量越多会导致光谱图像越失真,因为水的成分在红外探测区域会产生强烈的光谱吸收带, 水分子含量大的区域摇摆振动,产生吸收性强且宽度超大的伸缩振动, 会干扰其他成分的光谱吸收。特征波长分布情况如图1 所示。
图1 特征波长分布情况
所以可以在实验样本中设置全谱观测和自选区域光谱观测。 根据液体牛奶种类的成分含量,选取适当的自选观测区域,对含量不同的乳糖、 脂肪与蛋白牛奶进行成分自选区域光谱识别, 建立PCA 模型提取光谱中关键成分特征波长,纵向比较主成分特征波长光谱与其他成分红外光谱图像差异,通过多项平滑提高特征波长的识别效果[8-9]。
2 红外光谱特征牛奶成分分析
2.1 参数估计
基于红外光谱特征分析牛奶成分需要考虑牛奶成分浓度与估计变量分布概率。在不知道测量误差统计信息条件下,选取足够的牛奶分析样本,利用最小二乘法对牛奶成分特征进行估计标定,通过化学方法检测出所有牛奶样本在不同环境与温度条件下的电导率、声传导速度与衰减系数变化规律[10]。 最小二乘法估计预测模型回归系数,牛奶各成分回归系数求解矩阵公式为:
式中:H 表示牛奶样本各成分回归系数求解矩阵,R、D、Z 分别表示牛奶中的乳糖、蛋白质、脂肪等成分浓度分布[11-12]。
用最小二乘法进行估计,寻找各成分参数求解的最优回归系数,其中回归系数与预测模型数据集满足以下条件:
式中,Y 表示成分参数的预测估计值,A 为牛奶各成分参数的回归系数,T 表示成分特征参数随着温度变化的时间节点。寻找最优回归解公式为:
式中,J(A)表示各回归系数的最小二乘估计求解结果,min J 表示最小二乘估计最优解。 同时,寻求最优参数估计还需满足以下条件:
式中,为最小二乘估计固定因数,根据以上公式可以计算样本牛奶各成分浓度估计值, 并基于最小二乘原理参数估计构建多元线性回归预测模型,对不同成分浓度进行预测,计算成分浓度与温度时间变化的线性回归关系f(A)表示如下:
代入检测牛奶样本成分谱带参数,按照以上步骤重复进行计算测量,使线性相关系数达到最优, 可以得到变异系数均小于0.01 的成分浓度与时间变化的测量结果[13-14]。
2.2 特征变量提取
红外光谱特征图像中,含蛋白质、脂肪乳、糖等成分浓度较高的液体牛奶在光谱吸收度方面存在一定差异, 同时也受牛奶品质等级影响,光谱吸收频带峰值不同。基于全光谱和自选区域光谱处理后的样本参数, 与预测估计进行参照对比, 利用二阶差分法进一步提取成分特征变量。首先根据成分浓度在牛奶中的含量占比,调整特征提取参数阈值,根据成分特征光谱回归系数矩阵,添加变量总数相同的随机噪声矩阵,构建矩阵变量波动变化图像。
利用UVE 消除算法筛选出牛奶关键成分中特征变量的波长信号,UVE 消除算法下的能级跃动如图2 所示。
图2 UVE 消除算法下的能级跃动
设置重复采样率为0.5, 在成分参数中进行多次迭代,观测特征变量呈现衰减趋势时的基线数值,当特征变量波长变化减弱,波动趋于平缓时,剔除随机噪声矩阵制造的无用变量,此时基线外的特征变量数据就是牛奶测量各成分关键特征变量数据。
通过特征变量均方误差计算,建立红外光谱成分参数模型,校正训练集参数的应用系数,从而提高模型测量精度,使各成分变量预测与计算分析均方误差皆低于0.05, 即为最佳测量模型,可以使检测模型具有较好的稳定性和测量性能[15]。
3 傅里叶变换下的成分检测
利用傅里叶变换对牛奶成分测量结果进行离散分析,当测量样本牛奶中防腐剂的含量少于0.5%时,不会对牛奶主要成分浓度与性质造成明显影响,但当防腐剂含量超出测量标准,或遇到光程变化、谱峰重叠、大分子散射等情况时,可以利用傅里叶变换对牛奶成分光谱参数进行归一化和平滑处理,使成分光谱参数更具收敛性。 傅里叶变换下的成分检测如图3 所示。
图3 傅里叶变换下的成分检测
牛奶中乳糖、蛋白质等非脂固型物质和乳脂肪成分之间存在明显的线性回归关系,但在红外光谱中,可能会由于检测样本粒径差异形成不规则散射,导致线性回归关系不清晰。因此,需要对红外图谱中近红外短波与中长波做透射分析。中长波反射能力较强,可以对牛奶成分中的乳脂肪和蛋白质进行漫反射光谱检验,建立良好的脂肪和蛋白质成分特征变量模型。短波具有较强的透射能力,可以对牛奶中的乳糖和乳蛋白进行近红外可见光透射,其中蛋白肽对光谱具有一定的吸收度, 利用短波透射构建伸缩振动吸收光谱,对红外光谱图像进行离散分析,可以提高牛奶成分测定模型收敛度。
经傅里叶变换后,牛奶成分检测模型预测与红外光谱分析的稳定性均可得到有效提升,模型的验证系数与回归系数误差可进一步缩减,有利于提高红外光谱图像对牛奶中不同固形物成分的光谱检测准确率, 具有较好的检测稳定性,对牛奶主成分含量有良好的检测效果。
4 实验研究
为了验证本文提出的基于红外光谱特征和傅里叶变换的牛奶成分检测方法的实际应用效果,设定实验,分别对四种样品的牛奶成分进行检测,分别是纯牛奶、低乳糖奶、低脂奶。分别检测牛奶中的乳中蛋白质、脂肪以及乳糖的回归系数。
得到的纯牛奶样品扫描光谱如图4 所示。
图4 纯牛奶样品扫描光谱
得到的回归系数如图5 所示。
图5 纯牛奶回归系数
根据图5 可知,在波长为2200 左右,纯牛奶样品扫描光谱吸光度达到峰值,乳中蛋白质出现了三次峰值,脂肪和乳糖出现了多次峰值。
低乳糖奶样品扫描光谱如图6 所示。
图6 低乳糖奶样品扫描光谱
回归系数如图7 所示。
图7 低乳糖奶样品回归系数
根据图7 可知,在波长为1300 左右,低乳糖奶样品扫描光谱达到峰值,乳中蛋白质、脂肪以及乳糖出现多次峰值。
低脂奶样品扫描光谱如图8 所示。
图8 低脂奶样品扫描光谱
回归系数如图9 所示。
图9 低脂奶样品回归系数
观察图9 可知,在波长为1600 左右,低脂奶样品扫描光谱达到峰值,乳中蛋白质、脂肪以及乳糖回归系数出现多次峰。
对三种样品进行整合,得到的红外光谱如图10 所示。
图10 红外光谱实验结果
根据图10 可知,乳中蛋白质、脂肪以及乳糖的跃进几率较高,因此红外吸收峰的强度相对较大。 对上述样本检测结果的相对误差进行检测,得到的实验结果如表1 所示。
表1 样本检测相对误差实验结果
根据表1 可知,本文提出的基于红外光谱特征和傅里叶变换的牛奶成分检测方法检测相对误差低于0.2%,具有极强的检测能力,更适用于实际的检测工作中。
针对牛奶成分含量监测中存在的感应不灵敏、精准度不高等问题,提出了一种基于红外光谱特征和傅里叶变换的牛奶成分检测方法,并得出以下结论:
(1)利用基线校正与矢量平滑对牛奶成分红外光谱进行降噪,进行归一化处理,降低红外光谱检测数据均方误差。
(2)建立自选光谱区,提取牛奶关键成分红外光谱特征波长,利用最小二乘法进行特征参数估计预测,能够求解最优参数估计值。
(3)利用傅里叶变换对牛奶成分光谱进行离散分析, 优化不同波形对成分检验的测定收敛度,进一步提高光谱检测精度与稳定性。
(4)通过实验证明该方法具有良好的应用效果,可以为乳制品含量检测技术发展更新提供一定的价值参考。