基于BP 神经网络的UHT 纯牛奶包装货架期预测
2024-02-23习鸿杰宋利君邓玉明李泽鹏卢立新
习鸿杰,宋利君,邓玉明,李泽鹏,卢立新,*,曾 科
(1.江南大学机械工程学院,江苏无锡 214122;2.江苏省食品先进制造装备技术重点实验室,江苏无锡 214122;3.内蒙古乳业技术研究院有限责任公司,内蒙古呼和浩特 010100)
超高温灭菌(Ultra-high Temperature,UHT)纯牛奶味道醇厚,口感细致柔密且营养丰富,深受消费者喜爱。但这些营养物质在贮藏过程中易受到光、热、氧气、微生物等影响,发生物理和化学变化,产生各种风味物质,导致UHT 纯牛奶腐败变质,影响营养安全、口感及味道[1]。
UHT 纯牛奶包装货架期预测是产品保质、销售的基础。长期以来UHT 纯牛奶货架期预测方法常用于酒精稳定性、TBA、黏度等单一独立指标预测的动力学模型,能较快速地将温度与反应速率构建起数学关系[2]。然而随着销售产品种类越来越多,各产品间的配方、营养物质含量越发多样,传统动力学模型已不能满足多因素货架期预测模型的建立。近年来,新兴的机器学习模型在食品货架期评估中逐步得到应用,如人工神经网络算法、偏最小二乘回归算法和支持向量回归算法等,它们可通过综合多个指标共同作用以提高货架期预测的准确性[3]。刘雪等[4]结合哈夫单位、气室高度、蛋黄指数、蛋清pH 和失重率等指标,构建基于BP 神经网络的鸡蛋货架期和贮藏时间预测模型。易甜等[5]利用BP 神经网络对酸奶理化指标、微生物指标、感官评价等指标建立预测模型,对比传统动力学模型其拟合度显著提高。由于UHT 纯牛奶成分多样,变化机制复杂,影响其包装货架期的因素较多,截止目前关于UHT 纯牛奶包装货架期的机器学习研究未见报道。因此,构建基于多影响因素的机器学习模型,实现对UHT 纯牛奶货架期更为精准全面预测是必要的。
本文针对不同配方UHT 纯牛奶,开展不同贮藏温度条件下的货架期研究,将褐变指数和蛋白水解度作为新鲜度指标,并将其设置为输入参数构建基于BP 神经网络的UHT 纯牛奶贮藏时间和新鲜度指标预测模型。根据模型在预测集上的表现以确定最优输入参数,并对隐含层神经元个数进行优化,最后将最优模型与传统的动力学模型进行对比。
1 材料与方法
1.1 材料与仪器
纯牛奶 为某品牌公司最新生产的不同初始蛋白质含量的盒装UHT 纯牛奶,样品编号与主要成分见表1;无水乙醇、邻苯二胺、三氯乙酸、四硼酸钠、十二烷基硫酸钠SDS、邻苯二甲醛OPA、1,4-二巯基苏糖醇DTT、甘氨酸标准品 国药集团化学试剂有限公司。
表1 试验产品基本信息Table 1 Basic information of test products table
RQH-350 人工气候箱 上海右一仪器有限公司;XW-80A 微型旋涡混合仪 上海沪西分析仪器厂有限公司;UV-1800 紫外分光光度计 日本岛津国际贸易公司;RJ-TDL-50A 低速台式大容量离心机无锡市瑞江分析仪器有限公司;CR-400 色差仪日本柯尼卡美能达公司。
1.2 实验方法
1.2.1 取样贮藏 参考国内外研究及牛奶日常使用、贮存条件及企业需求等将3 种UHT 纯牛奶放入23、30、37 ℃条件[6]下恒温无光照贮藏,3 个月内每10 d 对其进行色差和蛋白水解度测试[7],每个指标共计81 组训练数据。
1.2.2 指标的测定
1.2.2.1 色差(褐变指数)选择100 mL 的烧杯作为样品的盛放容器,将样品倒入烧杯中。在避光环境下将色差仪仪器探头伸入杯内样品中进行测量,读数L*、a*、b*值,样品的褐变指数[8](Browning index,BI)为:
1.2.2.2 蛋白水解度 参考孙琦等[9]的方法,对试样进行离心提取蛋白后,与配制的OPA 溶液混合,运用甘氨酸制作标准曲线进行读数。
OPA 试剂配制:将3.81 g 四硼酸钠和100 mg十二烷基硫酸钠溶解于70 mL 去离子水中,溶解完全;将80 mg 邻苯二甲醛OPA 溶解在2 mL 无水乙醇中,溶解完全后加入之前溶液中,并用去离子水转移;将88 mg 1,4-二巯基苏糖醇DTT 加入到上述溶液中,去离子水冲洗转移;将上述溶液用去离子水定容到100 mL,避光保存,现配现用。
牛奶样品处理与测定[10]:取10 mL 样品在5000 r/min 离心20 min 除去脂肪,取2 mL 上清液加入离心管中,加入2 mL 12% TCA,12000 r/min 离心20 min,取上清液400 µL,加3 mL OPA 试剂使混合物反应2 min 后在340 nm 处测吸光度值。
甘氨酸标准曲线的测定[11]:配制一系列浓度梯度的甘氨酸标准品溶液,除不需要离心外操作与上述相同,340 nm 处测吸光度值,并绘制标准曲线,拟合公式y=0.4041x+0.0289,(R2=0.9996),可用于样品浓度测定。
1.3 数据处理
1.3.1 BP 神经网络建模方法 BP 神经网络是一个多层感知系统,一般分为三部分:a.一个输入节点代表输入变量;b.一个输出节点代表输出变量,也就是预测输出的目标变量;c.包括一个或多个节点的隐藏层,能够捕捉非线性数据[12]。BP 神经网络基于训练过程来校正误差的方法向后传播,即误差计算是在输出层,向后传播至隐藏层,最后传播至输入层[13]。隐藏层通常包含充足、连续的预测问题[14]。试验将设计一个含有三个层面的BP 神经网络模型,针对UHT 纯牛奶贮藏过程中褐变指数与蛋白水解度的变化,预测其变化规律,从而对UHT 纯牛奶包装货架期进行预测,设计模型如图1 所示。将整体的81 组数据导入数据集中,随机选取70%的数据作为训练集,15%的数据作为验证集,15%的数据作为测试集[15]。模型中的输入变量包括UHT 纯牛奶的初始蛋白质含量、初始脂肪含量、环境温度、贮藏天数;输出变量是贮藏过程中试样的褐变指数和蛋白水解度。
图1 BP-ANN 结构图Fig.1 Structure diagram of BP-ANN
1.3.2 分析与评价方法 采用Origin 2022b 学习版软件绘制实验数据图像。通过数据拟合处理,建立牛奶风味预测模型,并使用决定系数R2对所建模型进行准确性分析。
2 结果与分析
2.1 样品贮藏期间褐变指数变化
美拉德反应是UHT 纯牛奶贮藏过程中发生的非酶棕色化反应,是羰基化合物(还原糖类)和氨基化合物(氨基酸和蛋白质)间的反应,经过复杂的历程最终生成棕色甚至是黑色的大分子物质类黑精或称拟黑素[16],严重影响UHT 纯牛奶的感官品质,其程度通常由色差(褐变指数)来反映[6]。贮藏温度对不同配方UHT 纯牛奶褐变指数的影响如图2 所示。各样品褐变指数初始值与初始脂肪含量呈相反变化规律,贮藏期间,褐变指数随时间呈上升变化规律,同时,贮藏温度越高,其上升速率越快,尤其30、37 ℃变化较为明显;蛋白质含量最高的CM 牛奶褐变指数随时间增长速率更快,这与Sunds 等[17]研究中相同温度下牛奶蛋白质含量越高褐变越明显的规律相似。
图2 温度对贮藏期间牛奶褐变指数的影响Fig.2 Effect of temperature on Browning index of milk during storage period
2.2 样品贮藏期间蛋白水解度变化
蛋白质在牛奶中不稳定,随着贮藏时间的延长,牛奶中蛋白酶、纤溶酶等会降解牛奶中的蛋白质,使牛奶中产生游离氨基酸[18],游离氨基酸互相再结合形成苦肽,这会导致牛奶中产生苦味并伴随絮状物析出,通过测量游离氨基酸的含量可以反应牛奶蛋白水解的程度[19]。不同配方样品于不同温度贮藏下的蛋白水解度变化如图3 所示。各样品在贮藏期间蛋白水解度总体呈上升趋势,且贮藏温度越高,变化速率越快,同时,蛋白质含量越高,贮藏期间蛋白水解度的增幅越大,与López-Fandiño 等[20]的研究结果类似。
图3 温度对贮藏期间牛奶蛋白水解度变化的影响Fig.3 Effect of temperature on proteolysis degree of milk during storage
2.3 基于UHT 纯牛奶关键指标的BP 神经网络模型建立
2.3.1 BP 神经网络参数的确定 隐藏层的激活函数(或称为传递函数)有着严密的逻辑关系,而输出层是典型的线性函数[21]。不同函数的差异,由相对误差和绝对误差来体现[22]。设置初始值为学习效率η=0.4,训练过程中动量常数 m=0.9,迭代次数代表训练的最大步数n=1000[23]。根据经验,隐藏层个数N 的测试范围为1~10 个,目标误差为0.5[24],具体网络信息见表2。
表2 BP 神经网络基本参数信息Table 2 Basic parameter information of BP neural network
2.3.2 模型的拟合 经过训练和校验迭代,最终拟合模型参数见表3。结果发现,所得模型训练标准相对误差较小,检验时的标度校对误差在10%左右。同时,经过自变量正态化重要性分析(图4)可知,初始的蛋白质含量对于样品褐变指数、蛋白水解度变化影响较高,而初始脂肪含量影响则较低,其原因是蛋白质参与了贮藏过程中的美拉德反应和氨基酸水解反应[25-26],反应过程中也产生了黑色素和絮状物的析出,故褐变指数和蛋白水解度随之升高。
图4 自变量正态化重要性分析Fig.4 Normalization importance analysis of independent variables
表3 模型基本参数信息Table 3 Basic parameter information of model
2.3.3 BP 神经网络模型验证 进一步对所建BP 神经网络模型进行验证,评价预测准确性的方法是对照传统多元线性回归模型[27]的预测效果。根据t检验,将预测数据和实际数据画成45°夹角的线性拟合,用R2表示拟合系数[28]。根据前期建立的UHT纯牛奶多因素动力学货架期预测模型[29]对原样本库样品进行预测,其如图5 所示,基于BP 神经网络的褐变指数、蛋白水解度模型拟合系数分别为0.9412、0.9527,而传统线性回归模型对应的拟合系数分别为0.8799、0.9211,表明BP 神经网络模型较传统线性回归模型能更加准确地拟合UHT 纯牛奶的特征指标变化,同时由于BP 神经网络是一个动态数据库模型[30],随着未来更多样品实验数据的录入,网络不断迭代,模型将涵盖更大范围,拥有更高的自适应精度。
图5 神经网络与线性回归预测结果对比Fig.5 Comparison of neural network and linear regression prediction results
3 结论
将初始脂肪含量、初始蛋白质含量和贮藏温度、褐变指数、蛋白水解度归一化后整理成训练集,利用BP 神经网络对其进行迭代训练得到不同配方牛奶贮藏时间与褐变指数、蛋白水解度的关系,将其与基于传统动力学的多元线性回归模型进行对比。结果表明,经优化隐含层神经元数的BP 神经网络模型对UHT 纯牛奶贮藏期间的特征指标变化预测精度更高,可用于该类产品包装货架期的预测。本研究为UHT 牛奶多因素货架期预测模型提供了一种新的建模思路,今后随着理化指标的不断扩充,神经网络算法性能的不断优化,构建的模型可涵盖更多变量,实现对UHT 纯牛奶货架期更为精准的预测。