APP下载

小麦加工链中重金属镉含量的深度网络预测模型

2022-09-30金学波张佳帅郭天洋王小艺苏婷立赖燕群孔建磊白玉廷

食品科学 2022年17期
关键词:矩阵小麦加工

金学波,张佳帅,郭天洋,王小艺,苏婷立,赖燕群,孔建磊,白玉廷

(1.北京工商大学人工智能学院,北京 100048;2.北京工商大学 中国轻工业工业互联网与大数据重点实验室,北京 100048;3.北京工商大学食品与健康学院,北京 100048;4.北京服装学院,北京 100105;5.中粮粮油工业(荆州)有限公司,湖北 荆州 434300)

小麦是一种在世界各地广泛种植的谷类作物,在我国小麦的生长范围广泛,是人们喜爱的主食之一,也是牲畜的主要饲料用料之一。据《国家统计局关于2021年粮食产量数据的公告》,2021年全国小麦播种面积23 568.4千 hm,总产量为12 226万 t。

在小麦的生产中,重金属污染问题引起了人们的广泛关注。若食用被重金属污染的小麦,当污染物生物累积性达到一定浓度后会引起慢性中毒甚至癌症、生理畸形等病症。如重金属镉在摄入后可在人体的肝、肾等器官组织中蓄积,造成各器官组织的损伤,当达到一定浓度后会破坏骨骼中钙的正常补给,严重者会造成骨软化症等恶性疾病。因此,通过预测方法掌握食品加工链重金属污染发展规律并及时加以预防控制具有极大的实际应用意义。

目前用于预测建模的方法主要是多元线性回归方法。例如,牛耀星等采用一级动力学模型结合Arrhenius方程建立了基于金针菇子实体品质指标的货架期预测模型,并对模型的预测精确度进行了验证及评价。李婕使用Huang模型、Baranyi模型、修正的Gompertz模型对双孢蘑菇表面背景菌群和假单胞菌的生长情况进行建模,模型适合描述温度对双孢蘑菇样品表面假单胞菌生长速率的影响。宋波等采用逐步多元回归分析建立不同镉浓度等级下水稻籽粒重金属镉含量预测模型,模型能够预测稻米中镉的累积量,为广西镉异常区内其他水稻产地的安全生产提供了参考。王烨锋采用多元逐步线性回归分析方法对土壤-水稻体系中镉的积累情况建立预测模型,决定系数()均达0.7以上。通过实测值反推模型,3 组模型拟合散点值均匀分布在=线两侧,并通过采集田间样品对模型进行了验证。也有一些学者进行了神经网络建模的尝试,取得了良好的效果。例如,于灏等针对小麦中镉的含量分别建立了多元回归模型与浅层神经网络模型,结果表明基于神经网络的小麦镉含量预测模型的精度总体优于多元线性回归模型。

综上可知,目前对于原粮产地小麦中镉含量分析的研究较多,却鲜有研究涉及小麦加工过程中镉含量的变化。而在加工过程中,镉含量的变化与小麦粉的品质直接相关。本研究基于小麦原粮(即原麦)的镉含量数据预测小麦加工成品——小麦粉中的镉含量,以此为依据指导加工环节中的重金属危害管控,从而避免小麦粉的重金属含量超标,保证食品安全。

另一方面,加工过程中的危害物含量具有强非线性、强随机性的特征,因此线性回归、浅层神经网络等模型建模精度不高,预测性能有待提升。将深度学习网络应用于强非线性、强随机性数据预测领域的研究有很多。Haider等建立了一种基于长短期记忆(long and short term memory,LSTM)网络的小麦产量预测模型。牛哲文等建立了基于门控循环单元(gated recurrent unit,GRU)的预测模型,使用具有波动性和不确定性的风速、风向等历史天气数据对风力发电的功率进行了预测。但是,由于这些深度网络模型对噪声非常敏感,并不适用于小麦加工过程中镉含量预测模型的建立。

为了提升小麦加工过程中镉含量预测的准确度,本研究基于小麦加工链镉含量数据进行深度学习网络建模,并使用正则化方法优化其损失函数,通过加入噪声惩罚项防止训练时模型对噪声的过度拟合,并使用贝叶斯超参数优化方法对模型超参数进行优化。

1 材料与方法

1.1 材料

小麦为某企业收购原粮。

1.2 设备

Y7000P便携式电脑(配备16 GB运行内存和RTX3050Ti显卡) 联想控股股份有限公司。

1.3 方法

1.3.1 小麦加工链及关键节点

小麦加工链是指从原麦到小麦粉的所有生产环节,简化示意图如图1所示。该加工链共有清理、润麦、皮磨等10 个加工环节。原粮委托某公司按图1进行加工,并对各加工环节进行抽检。抽检方法为:每隔2 h对全加工链抽检1 次,共抽取16 次,每次在各环节分别抽取3~4 份(每份1 kg)平行样品。为便于表示各环节的样本,设定原粮、清理、润麦、皮磨一(1M芯)、皮磨二(2M芯)、皮磨三(3M芯)、皮磨四(4M芯)、皮磨五(5M芯)、皮磨六(6M芯)、包装、存放环节分别为~。

图1 小麦加工链简化示意图Fig. 1 Flow chart of wheat processing chain

1.3.2 镉含量的测定

取1.3.1节样品,委托某公司参照GB/T 20380.4—2006《淀粉及其制品 重金属含量 第4部分:电热原子吸收光谱法测定镉含量》测定镉含量(以镉元素计),单位为mg/kg。

1.4 数据处理与分析

1.4.1 镉含量数据集构建

取样时设置3~4 个平行,各环节每次取样的镉含量结果以平行样品镉含量的平均值表示,共获得16 条全加工链的镉含量数据。由于这些数据数量不足以训练神经网络,利用等差插值的方法对数据进行增广处理。

1.4.2 基于正则化损失函数的GRU深度网络模型分析

首先用门控循环单元建立深度学习模型,其次,设计基于正则化方法优化的损失函数,该损失函数在模型原损失函数的基础上添加训练数据中噪声的惩罚项,达到在训练过程中减小对噪声拟合程度的目的。因此训练过程中损失函数会在一个稳定值附近波动,该稳定值用来量化数据中的噪声。

GRU在时序预测任务中有很好的效果,此前已经有大量的研究中都使用GRU作为预测模型并且证明了其性能。GRU模型中只有两个门,分别是更新门和重置门。更新门控制前一时刻的状态信息带入到当前状态的程度,该门的数值越大就说明前一时刻的信息带入越多。重置门用于控制前一时刻状态的遗忘程度,数据越大说明忽略越少。

GRU模型结构如图2所示,根据该结构进行前向传播时每个单元中参数计算,如式(1)~(4)所示。

式中:x为时刻的输入;z为更新门衰减系数;r为重置门衰减系数;h是-1时刻的状态向量;h为时刻状态向量;WU为更新门权重;WU为重置门权重;WU为待选a的权重;bbb为偏置向量;为Sigmoid激活函数;*表示逐元素乘法;tanh为tanh激活函数。

图2 GRU模型结构图Fig. 2 Structure diagram of GRU model

但GRU模型在训练时易对镉含量数据中含有的非线性噪声过度拟合,降低模型的泛化能力,从而影响模型的预测性能,因此需要采取措施防止模型过度拟合。正则化的作用在于限制模型中的参数,让模型的参数不会过大,从而减少模型过度拟合的可能。在此步骤中,为减少模型因过度学习加工链数据中的随机噪声而导致模型过度拟合,设计噪声平滑损失函数,如式(5)所示。

噪声平滑损失函数的计算公式中包括两个部分,第一部分衡量数据拟合程度,表示将实际序列与拟合序列之间的残差平方和最小化的目标;第二部分衡量数据平滑程度,表示训练过程中对序列平滑度的需求。其中,拟合程度用平均绝对误差表示,平滑程度通过计算P的范数来实现。是正则化项,将其视为在拟合与平滑两个目标之间的权衡取舍。

P的计算是实现噪声平滑损失函数的关键,计算时首先需要定义矩阵,该矩阵对数据进行平滑度惩罚。矩阵如式(6)所示。

矩阵的维度由输入数据决定,假设输入数据长度为,则的维度为(,),然后通过与输入数据组成矩阵的乘法计算得到矩阵P,最后通过矩阵范数的计算得到可以表示数据每3 个点间平滑程度的范数。

在训练过程中,本实验所设计的损失函数可以有效地考虑噪声对模型的影响从而达到减少过度拟合的作用。当公式(5)中为0时,网络学习原始数据,随着不断增大,拟合线趋向平滑。所以,本实验所设计的损失函数可以使模型对噪声具有更强的鲁棒性,有效减小噪声在训练过程中的影响,从而提高模型的预测准确度。

1.4.3 应用网络的贝叶斯优化方法分析

深度学习模型的超参数选择直接决定了模型的性能。本研究基于序列模型的优化(sequence model based optimization,SMBO)方法进行模型超参数优化,优化的超参数主要包括GRU中的神经元数、Dropout率、训练次数、批处理大小、优化器。

贝叶斯优化方法在确定模型参数时,使用代理模型来拟合真实的目标函数,并根据拟合结果主动选择最“潜在”的评估点。所以需要定义一个目标函数()和优化的超参数空间。目标函数(式(7))表示通过贝叶斯优化需要达到的最小化的目标,通过设定模型的目标函数,找到此度量上产生最佳得分的模型超参数。

贝叶斯优化的代理函数如式(8)所示。

式中:*为贝叶斯优化确定的最优参数;为输入的一组超参数;为多维超参数的参数空间;()为目标函数。

贝叶斯优化主要由两个步骤组成:首先通过第+1步估计和更新高斯过程,然后通过最大化代理函数来指导超参数的采样。在高斯过程中,设置目标函数()服从高斯分布(式(9))。

式中:()为目标函数;()为目标函数()的均值;(,’)为目标函数()的协方差矩阵;表示高斯分布。初始的(,’)如式(10)所示。

式中:为超参数的数量;表示协方差矩阵;(,)、(,w)、(w,)、(ww)为矩阵内的不同超参数的组合。

在进行贝叶斯优化时,高斯过程的协方差矩阵会随着迭代过程改变,假设在第+1步输入的一组参数为w,则此时协方差矩阵如式(11)所示。

式中:’为+1时刻的协方差矩阵;为初始的协方差矩阵;w为+1时刻的超参数值;为超参数的组合矩阵,为的转置,的组合公式为=[(w,),(w,),…,(ww)],此时可以得到目标函数的后验概率(式(12))。

得到后验概率后,通过超参数搜索方法来寻找最优超参数,本实验使用上置信界(upper confidence bound,UCB)采集函数(式(13))来完成超参数搜索。

1.4.4 预测效果评价标准与模型对比验证

以80%的镉含量数据用作训练集,对模型的性能进行训练优化;以20%的镉含量数据数据作为验证集,验证模型的性能。采用均方根误差(root mean square error,RMSE)、平均绝对误差(mean absolute error,MAE)、皮尔逊相关系数评估预测的性能,计算分别如式(14)~(16)所示。三者均反映模型预测值与真实值之间的关系。RMSE、MAE越小,说明模型预测结果与真实情况越接近。越大,说明模型预测结果与真实情况越接近。

采用线性回归、循环神经网络(recurrent neural network,RNN)、LSTM和GRU模型与本研究所得模型进行对比。通过比较各模型基于小麦加工链镉含量数据的预测效果评价指标(RMSE、MAE、)验证模型的预测性能,验证本研究所得模型在实际小麦加工链镉含量预测中的可靠性。

2 结果与分析

2.1 小麦加工链中小麦的镉含量数据集构建

小麦加工链各环节样品的镉含量数据经增广处理后最终获得2 057 条全加工链的镉含量数据。以其中3 条全加工链的镉含量变化为例,如图3所示,在清理环节、润麦环节中镉含量略有增加,之后各环节镉含量的变化相对平稳。

图3 各加工环节不同样本中镉含量Fig. 3 Cadmium contents in different samples measured during processing

2.2 不同模型预测的性能对比

基于2.1节小麦加工链10 个环节中2 057 条全加工链的镉含量数据进行实验。将本研究所得模型与线性回归、RNN、LSTM、GRU模型进行对比,采用RMSE、MAE、评估模型的性能,结果如表1所示。本研究所得模型的RMSE(0.259 5)最小、MAE(0.161 6)最小且最大,比GRU模型的预测性能更好(RMSE降低了46.37%)。

表1 不同预测方法基于镉数据的性能对比Table 1 Performance comparison of different prediction methods based on cadmium data

通过验证集的验证与对比分析可知,本研究所得模型在预测任务中表现更为出色,拥有更强的含噪时序数据分析能力。由此可见,本研究所得模型可以有效地分析含噪时间序列数据,对于小麦加工链危害物等含噪数据有良好的预测性能。

2.3 模型预测结果

基于2.1节中20%的原粮镉含量数据,对后续清理、润麦、皮磨等10 个环节镉含量进行预测,其中6 个样本预测结果如图4所示。其中,清理环节和润麦环节样品的镉含量略有上升,尤其是清理环节,由于镉元素在小麦表皮的富集,这两个环节的浸润对镉元素有一定的析出作用。皮磨一及皮磨二环节后镉含量持续下降,说明皮磨对危害物镉有较好的去除作用。预测结果还表明,~环节镉含量基本趋于平稳。

GB 2762—2017《食品安全国家标准 食品中污染物限量》规定小麦原粮及成品粮的镉含量不得高于0.1 mg/kg。由本研究所得模型可知,当小麦原粮中镉含量低于GB 2762—2017规定的0.1 mg/kg时,加工链中清理环节和润麦环节的镉含量可能会使其暂时超标,但最终成品小麦粉符合GB 2762—2017要求;而当原麦中镉含量高于0.1 mg/kg时,成品小麦粉中镉含量将高于0.1 mg/kg。因此考虑检测数据偏差的情况下,为确保小麦粉的食用安全,原粮中危害物镉含量高于0.1 mg/kg时不能进行后续加工流程。

图4 模型预测小麦加工链中样品镉含量的变化规律Fig. 4 Trend of cadmium content in wheat processing chain predicted by the model

3 结 论

本实验基于小麦加工链各个环节小麦中的镉含量。采用深度学习的建模方法对加工链各环节样品中的镉含量进行建模预测。所建模型首先使用正则化方法修改深度学习模型的损失函数,通过加入噪声惩罚项来减小噪声项对模型预测性能的影响。同时使用贝叶斯优化算法优化模型超参数。经过对比验证,本研究所建模型对于实际的小麦加工链镉含量数据预测准确度较高。

应用该预测模型可以准确地预测出加工链中从原麦到小麦粉的各个关键环节镉含量的变化,能够对小麦加工链的镉危害物防控实践进行指导。预测结果表明,通过加工,原麦中的镉含量呈整体下降趋势。但是,在清理和润麦的环节,镉含量会略有上升。由预测模型可知,如果原麦的镉含量满足GB 2762—2017要求,即小麦中的镉含量不高于0.1 mg/kg,则经过加工的成品小麦粉基本满足GB 2762—2017的要求。

猜你喜欢

矩阵小麦加工
浅析小麦的收获与贮藏技术
可加工陶瓷精密铣磨加工技术研究
自由曲面加工中数控加工技术的应用
山西省2019年对口升学考试 加工制造类
小麦,你好
多项式理论在矩阵求逆中的应用
防止小麦倒伏和增加穗数及穗重的措施
矩阵
矩阵
矩阵