基于神经网络算法的龙山小米γ-氨基丁酸富集工艺优化
2022-06-01张一鸣和法涛葛邦国
张一鸣,和法涛,葛邦国,高 玲
(中华全国供销合作总社 济南果品研究院,山东 济南 250014)
龙山小米特产于山东省济南市章丘区,是全国农产品地理标志,也是历史上全国四大贡米之一。龙山小米香味浓郁且营养丰富,富含多种微量元素和生物活性成分[1-4]。目前龙山小米主要以鲜销为主,通过精深加工制备的高附加值产品较少,产业产值较低,亟需转型升级。γ-氨基丁酸广泛存在于谷物作物中,具有降血压、改善脑机能、防止动脉硬化等功能,植物性来源的γ-氨基丁酸产品因其安全性、天然性的特点备受研究者关注[5-7]。已有研究表明,通过谷物发芽的方式,可有效提高谷物中γ-氨基丁酸含量,并进行高附加值产品开发[8-10]。
神经网络(Artificial neural networks,ANN)是一种数据分析方法,通过模仿大脑的神经网络行为特点对数据进行处理,具有极强的非线性映射能力,广泛应用于生物、农业、机械等领域的模型建立[11-12]。遗传算法((Genetic algorithm,GA)是一种基于人工智能的随机非线性优化方式,可实现随机、自适应、并行性全局搜索寻优[11-12]。通过遗传算法结合神经网络进行工艺优化,可有效避免传统优化方法易产生局部最优解的情况,更适合进行全局最优组合设计[11-15]。将神经网络算法应用于龙山小米 γ-氨基丁酸富集工艺的研究尚未见报道。
本研究将神经网络应用于龙山小米 γ-氨基丁酸富集工艺优化,以期为龙山小米产品开发提供新思路,延伸龙山小米加工产业链,推动地方特色农产品经济发展,促进我国新旧动能转换。
1 材料与方法
1.1 材料与试剂
小米,章丘龙山小米(糙米):购于山东省济南市章丘区;
γ-氨基丁酸标准品,色谱纯级:美国 Sigma公司;乙腈,色谱纯级:美国TEDIA公司;磷酸,分析纯级:北京化工厂;硼酸、邻苯二甲醛、巯基乙醇、氢氧化钠、醋酸、三乙胺、四氢呋喃、2-辛醇、甲醇,分析纯级:国药集团化学试剂有限公司;三水乙酸钠,分析纯级:源叶生物有限公司。
1.2 仪器与设备
XS 365M电子天平:瑞士普里赛斯仪器有限公司;DS-56III双螺杆挤压膨化机:济南赛信机械有限公司;500Y型高速多功能粉碎机:浙江锐腾食品机器有限公司;UV1000分光光度计:上海天美科学仪器有限公司。
MA160-1CN型水分分析测定仪:赛多利斯科学仪器(北京)有限公司;SPX-150B-Z型生化培养箱:上海博远实业有限公司;KQ-600E超声波振荡器:昆山舒美有限公司;2695型液相色谱仪:沃特世科技(上海)有限公司;500Y型紫外检测器:Empower工作站。
1.3 实验方法
1.3.1 工艺流程
龙山小米→清洗→浸泡→发芽(富集 γ-氨基丁酸)→干燥
1.3.2 单因素实验
取一定量龙山小米不发芽作为空白组,另取一定量龙山小米作为实验组置于烧杯中,室温浸泡一段时间后,置于培养箱中一定温度下发芽。以 γ-氨基丁酸含量为指标,单因素实验条件分别为浸泡时间4、8、12、16、20 h;发芽温度25、30、35、40、45 ℃;发芽时间 12、24、36、48、60 h。考察单因素实验条件时,设置固定条件为浸泡时间12 h;发芽温度40 ℃;发芽时间48 h。分别测定空白组和实验组γ-氨基丁酸含量。
1.3.3 响应面优化实验
以浸泡时间(X1)、发芽温度(X2)和发芽时间(X3)作为自变量,样品γ-氨基丁酸含量作为因变量(y),进行N=17的响应面(Box-Behnken)优化实验,结合单因素实验最优结果,在满足最优工艺范围的情况下,设置因素水平编码表见表1。
表1 因素水平编码表Table 1 Factor level coding table
1.3.4 BP神经网络
设置该神经网络模型拓扑结构为 3-10-1,其中神经网络设置输入层为3个神经元,即浸泡时间(X1)、发芽温度(X2)和发芽时间(X3);设置1个隐含层,包含10个神经元,以满足输入层数据计算;将γ-氨基丁酸含量(Y)设为输出层;通过模拟龙山小米发芽过程中的 γ-氨基丁酸含量变化,确定相关因素对龙山小米 γ-氨基丁酸含量的影响。拓扑结构图见图1。
图1 神经网络拓扑结构Fig.1 The architecture of artificial neural network
本次优化以建立的神经网络模型为遗传算法的适应度函数,利用适应度函数对个体进行选择,进而对龙山小米γ-氨基丁酸富集工艺进行寻优。
1.3.5 γ-氨基丁酸测定
采用高效液相色谱法测定γ-氨基丁酸的含量,测定方法结合NY/T 2890—2016《稻米中γ-氨基丁酸的测定 高效液相色谱法》和 QB/T 4587—2013《γ-氨基丁酸》。
称取一定量样品,研磨后过60目筛,加入一定量乙醇水溶液,超声提取后静置离心,取上清液,样品残渣进行2次提取,合并上清液。加入一定量邻苯二甲醛-乙腈衍生剂,反应后进样。
色谱分析条件:流动相分为A相和B相。A相:称一定量的结晶乙酸钠,定容至1 000 mL,加一定量三乙胺,调整pH至7.20后加四氢呋喃,混合过滤备用。B相:按A相的方法配置,调好pH后按照体积比为甲醇∶乙酸钠∶乙腈=2∶1∶2混合过滤备用。柱温40 ℃、流速1.0 mL/min、检测波长:338 nm。
1.4 数据分析
数据差异显著性通过软件 SPSS 22.0进行分析,响应面优化实验通过软件Design Expert 8.0进行分析,神经网络建模和遗传网络寻优通过软件Matlab 2018b进行。
2 结果与分析
2.1 工艺优化结果
2.1.1 单因素实验
浸泡时间对样品γ-氨基丁酸含量的影响见图2。
图2 浸泡时间对γ-氨基丁酸含量的影响Fig.2 Effect of soaking time on γ-aminobutyric acid content
由图 2可知,随着浸泡时间的上升,γ-氨基丁酸含量先显著上升,当达到12 h后呈下降趋势。分析原因为在小米浸泡过程中,小米吸水提高自身生物酶活性,促进胚乳中的干物质转化为供给胚乳、发芽所需的营养成分,有利于 γ-氨基丁酸生成,故浸泡时间小于12 h时γ-氨基丁酸含量显著上升。当浸泡时间过长时,细胞结构损伤导致水溶性物质溶出,γ-氨基丁酸含量降低。故选择12 h为单因素最适浸泡时间。
发芽温度对样品γ-氨基丁酸含量的影响见图3。随着发芽温度的上升,γ-氨基丁酸含量呈现先显著上升,当达到 35 ℃后呈下降趋势。分析原因为发芽温度过高或者过低,都将抑制小米中谷氨酸脱羧酶的活力,进而抑制γ-氨基丁酸的生成[6]。故选择35 ℃为单因素最适发芽温度。
图3 发芽温度对γ-氨基丁酸含量的影响Fig.3 Effect of germination temperature on γ-amino butyric acid content
发芽时间对γ-氨基丁酸含量的影响见图4。
图4 发芽时间对γ-氨基丁酸含量的影响Fig.4 Effect of germination time on γ-amino butyric acid content
由图 4可知,随着发芽时间的上升,γ-氨基丁酸含量呈先显著上升,当48 h后下降的趋势。分析原因为,小米蛋白在蛋白酶作用下生成谷氨酸,谷氨酸脱羧酶将谷氨酸转化为γ-氨基丁酸,但较高的γ-氨基丁酸生成量,将激发γ-氨基丁酸转氨酶的活性,使γ-氨基丁酸转化为琥珀酸半醛,故过长的发芽时间,γ-氨基丁酸含量下降[8]。选择48 h为单因素最适发芽时间。
2.1.2 响应面实验优化
响应面优化实验结果见表2。
表2 响应面优化实验结果Table 2 Test results of response surface optimization
使用 Design Expert 8.0.6中的 Box-Behnken模块进行响应面优化,得到Y二次多项方程
该二次项模型R2=0.98,说明该模型仅有2%的总量变异不能由模型因素解释,同时模型信噪比=71.01>4,说明该模型拟合程度较好,优化结果较为可信。模型方差分析结果如表3所示。
由表3可知,该预测模型项P<0.000 1,呈极显著水平,模型失拟项P=0.245 2,呈不显著水平,同时模型 X1、X2、X3、X1X2、X12、X22、X32项呈极显著水平,模型X2X3项呈显著水平,说明该预测模型拟合程度良好。
各因素对响应值的影响见图 5。由图 5结合表3可知,浸泡时间和发芽温度交互作用对γ-氨基丁酸含量影响极显著(P<0.01),发芽时间和发芽温度交互作用对 γ-氨基丁酸含量影响显著(P<0.05),浸泡时间和发芽时间交互作用对 γ-氨基丁酸含量影响不显著(P>0.05)。
图5 各因素交互作用对γ-氨基丁酸含量影响的响应面和等高线图Fig.5 Contours and response surface diagrams of the effects of various factors on the γ-amino butyric acid content
表3 方差分析Table 3 Analysis of variance
2.1.3 BP神经网络的建立与训练
神经网络误差下降曲线图如图6所示。随着训练次数的增加,模型的均方误差逐渐逼近最优误差值。当神经网络训练迭代到157次时,训练误差达到最优值0.000 2,表明该神经网络模型可信性较高。
图6 BP神经网络均方误差图Fig.6 MSE curve of BP neural network
BP神经网络模型训练的相关系数见图7。当训练误差为0.000 2时,BP神经网络模型训练的相关系数为 0.999(R>0.95),结果表明本次训练的BP网络模型对于训练样本逼近能力较高,能较好的描述浸泡时间、发芽温度、发芽时间和样品 γ-氨基丁酸含量间的关系,可以用于本工艺优化。
图7 BP神经网络训练相关系数图Fig.7 Correlation coefficient diagram of BP neural network training
模型随机验证结果见图8。在17组实验数据中随机选择 3组数据,对 BP神经网络模型进行验证,结果表面3组数据实际值与模型预测值误差分别为4.75%、0.25%、0.5%,误差均小于10%,说明该模型预测性较好。
图8 模型随机验证结果Fig.8 Model random verification results
利用人工神经网络(ANN)预测各因素对γ-氨基丁酸含量的影响见图9。
图9 利用ANN预测各因素交互作用对γ-氨基丁酸含量的影响Fig.9 Using ANN to predict the impact of various factors on γ-amino butyric acid
由图9可知,浸泡时间、发芽温度和发芽时间对 γ-氨基丁酸含量都有较大影响且相互间存在交互作用,γ-氨基丁酸在该模型中存在全局最优。说明本次建立的BP神经网络具有较好的预测性,可以明确输入数据和输出数据之间的关系,作为模拟小米发芽富集γ-氨基丁酸过程的预测工具。
2.1.4 遗传算法寻优
图10为遗传算法寻优的适应度曲线。
图10 适应度曲线Fig.10 The fitness curve
由图10可知,遗传算法(GA)能够进一步完善实验的优化工艺并在模型中寻找最优值。随着遗传进化迭代次数的增加,适应度值首先呈断崖式下降,随后又进行了3次选择处理,被选择个体的适应度值产生小范围的改变,并逐步向最优适应度值逼近,适应度曲线在进行51次迭代时收敛于最优适应度。通过循环迭代处理,当进化代数增大至60代时,GA 停止选择并得出适应度值最高的个体。运行出的优化结果:最优工艺参数为浸泡时间11.7 h,发芽温度38.5 ℃,发芽时间49.4 h,最优γ-氨基丁酸含量为445.75 mg/kg。根据模型优化方案结合实验设备可设置参数实际情况进行验证实验,相关结果如表4所示。
表4 模型优化结果及验证比较Table 4 The optimization results and comparative validation
由表4可知,验证实验的γ-氨基丁酸含量为444.03 mg/kg,比模型优化值 445.75 mg/kg低0.39%,实验相对误差维持在±5%的范围内,达到了该模型对实验精确度的要求。GA-BP 神经网络优化的最佳条件为:浸泡时间 11.5 h,发芽温度38.5 ℃,发芽时间49.5 h。未处理的龙山小米γ-氨基丁酸含量为66.46 mg/kg,通过最优富集工艺处理后的龙山小米γ-氨基丁酸含量提高5.68倍。
3 结论
通过对龙山小米进行发芽富集 γ-氨基丁酸,研究浸泡时间、发芽温度和发芽时间对龙山小米γ-氨基丁酸含量的影响。在单因素实验的基础上,运用Design Expert 8.0中Box-Behnken模块进行3因素3水平的响应面实验设计,通过matlab2018b建立 BP神经网络模型,结合遗传算法最终确定最优工艺参数。龙山小米 γ-氨基丁酸富集最优工艺为:浸泡时间11.5 h,发芽温度38.5 ℃,发芽时间49.5 h。在此工艺下龙山小米γ-氨基丁酸含量为444.03 mg/kg,相比未处理样品含量提高5.68倍。通过 BP神经网络的模型优化,对龙山小米富集 γ-氨基丁酸的工艺提供数据参考,可推动龙山小米产业提质增效,带动地方特色农产品经济发展。但本研究的γ-氨基丁酸富集工艺为传统发芽法,尚需结合生物酶法、改性等技术手段进行深入研究,进一步提高γ-氨基丁酸富集效果。