神经网络与遗传算法及其在食品工艺优化中的应用
2012-09-05代志凯
代志凯
(浙江医药股份有限公司新昌制药厂,浙江新昌 312500)
食品工业是人类赖以生存与发展的基础,是关系国计民生的主要产业。而食品加工工艺及配方优化是食品开发与研制中不可缺少的环节,选择合适的优化工艺及配方对缩短试验时间、减低生产成本、保证食品的质量具有重要的作用。
国内外用得比较成熟的工艺及配方优化方法有正交试验、均匀设计和响应面设计等。虽然上述方法在试验处理时可以取得较佳点,基本可以满足一般试验的要求,但它们还存在一些问题,如试验的精度不够,选择的试验取值仅仅是接近最佳取值,无法精确找到最佳点,难以描述优化指标与各因素之间的非线性关系,误差较大[1]。随着人工神经网络技术的成熟和完善以及优化设计理论与算法的进步和发展,为食品加工工艺及配方的优化开辟了新的途径[2-3]。但是利用神经网络与遗传算法优化需要较高的理论知识和较强的计算机编程能力,限制了其在食品工业中的应用。
本文从神经网络和遗传算法的原理、实验设计的选择、数据处理和分析入手对其进行系统的介绍,重点介绍如何使神经网络的非线性映射和遗传算法的全局搜索的能力有机结合在一起应用于食品工艺及配方优化中,以期有更多的研究工作者采用神经网络和遗传算法技术方便有效地优化生产过程提高工作效率。
1 神经网络与遗传算法的原理简介
人工神经网络(Artificial neural network,ANN)简称神经网络,是20世纪80年代重新兴起的一种模拟人脑及其活动的理论化的数学模型,由多个非常简单的处理单元按某种分时相互联接而形成的计算系统,具有自组织、自适应、自学习等特点,对解决非线性问题特别有效,还有很强的输入输出非线性映射能力,易于学习和训练等优点。它基本上类似黑箱理论,只根据输入数据和输出数据来建立模型,网络的统计信息储存在数量巨大的加权矩阵内,可以反映十分复杂的关系。目前对于不同目的的神经网络有60多种,其中在食品工艺优化中应用最多的是误差反传网络即BP(Back-propagation)神经网络。典型的BP神经网络如图1所示。
遗传算法(Genetic algorithm,GA)是一种借鉴生物界自然选择和进化机制发展起来的高度并行、随机、自适应搜索算法。它将问题域中的可能解看作是群体的一个个体或染色体,并将变量进行二进制或十进制编码,确定个体性能的评价依据,即适应度函数,然后模拟生物进化过程,对群体反复进行类似于遗传的操作(选择、交叉和变异),根据预定的目标适应度函数对每个个体进行评价,依据适者生存,优胜劣汰的进化规则,不断得到更优的群体,同时以全局并行方式来搜索群体中的最优个体,最终获得适应度最好的个体。由于其思想简单、易于实现、遗传算法已广泛应用于智能控制、问题优化及求解、模式识别和人工生命等领域,并取得了许多令人鼓舞的成就。
2ANN-GA耦合的设计步骤
ANN有很强的输入输出非线性映射能力,特别适用于非线性、非结构化的复杂模型中。而GA又是一种有导向的全局随机搜索方法,对于目标函数和搜索空间没有任何限制,因此非常适合ANN模型等无明确分析函数形式的优化问题。将神经网络与遗传算法有机的融合,充分利用ANN的非线性拟合能力与GA的全局搜索能力,从而增强了ANN的智能搜索和泛化能力。目前在工艺优化领域中BP神经网络应用的最为广泛,也相对简单,因此本文将主要介绍BP神经网络和遗传算法耦合过程。
2.1 ANN输入工艺参数选取
由于食品加工过程涉及的工艺参数种类很多,不同工艺参数对产品质量的影响程度也各不相同,因此为提高模型工作效率,降低网络模型的复杂度,必须对模型要考察的输入工艺参数项目进行选取。ANN建模过程中参数项的选择将遵循以下原则:
1)所选输入参数必须是易于控制和测量的变量。
2)所选输入参数应尽可能是相互独立的变量。
3
)所选输入参数对输出目标有显著影响。
2.2 网络数据样本的选取及预处理
由于BP神经网络是一种有到导师的学习过程,因此选择合适的样本来训练网络就显得很关键。随机进行实验的数据来训练神经网络,需要较多样本,且分布不合理,效率不高。按照一定优化设计进行实验,得到的实验数据来训练ANN建模,优于一般的随机实验数据所建的模型。因为这些设计的取点在空间分布均匀,更有代表性,能减少训练样本数,所建的ANN模型的效果也更佳[4]。目前常用正交、均匀设计和响应面设计(response surface optimization,RSM)所得到的试验样本一般均能满足要求。
当样本选取好后,以避免由于变量取值范围的差异造成的网络不稳定性,所有的变量(包括输入、输出变量)一般均做标准化处理。
2.3 ANN模型训练和验证
利用ANN技术构建模型时,由于受各种因素的制约,所采集到的工艺参数值与实际值总有一定的差异,因此要求所建立的神经网络模型除具有良好的非线性映射能力之外,还必须具有较强的去除噪能力和泛化能力。因此常常将收集到的实验数据随机的分成两组,即训练组和预测组。训练组用来训练神经网络,预测组检验网络的泛化能力。
ANN的拓扑结构确定以后,可以通过不断调试网络的参数来训练ANN。当网络训练好之后还要检验其预测能力(即网络的泛化能力)。为了更准确的测试网络的性能,必须从训练集之外的数据样本中选取测试样本,这是因为如果测试样本本身来自训练集之中,由于ANN训练精度非常高,网络模型对每组数据都高精度地拟合了,但是拟合的好并不一定网络的泛化能力强,有时可能会陷入过度拟合,所以必须选用训练集以外的样本检验网络的预测能力[5]。故应该将数据样本分成两部分,一部分用来训练神经网络,另外一部分用来检验网络的预测能力。当网络的拟合和泛化能力都满足要求后,我们就可以利用GA来寻优了。
2.4 GA优化
将上述完成训练的ANN输出,作为求解目标函数值。由于GA不需要明确的数学导数表达式,故可利用它计算寻优。ANN与GA相结合的优化方法,整个流程见图2。
图2ANN与GA结合的框图Fig.2 Schema of the working principle for ANN coupling GA
在图2中,实验数据被分成训练组和预测组,训练组用来训练BP神经网络,然后预测组用来对训练好的网络进行测试,由此构建ANN模型,并以该模型的输出为GA的目标函数,通过GA的全局寻优,找到最优工艺或配方组合[6]。
3ANN-GA在食品工艺优化中的应用及实现
3.1 ANN-GA在食品工艺优化中的应用
由于ANN强大的非线性拟合能力和GA优良的全局收索能力,ANN-GA耦合已广泛应用于食品工业工艺优化的各个方面。具体见表1。
例如周先汉等[16]首先在单因素试验基础上,确定合理的因素水平范围,设计均匀试验,使试验点尽可能多的分布在可行的试验。然后再将单因素和均匀设计的41组实验数据分为训练(30组)和预测(11组)两部分,建立拓扑结果为(5-16-1)的ANN模型,训练组用来训练ANN,预测组则用来检验网络的泛化能力。最后以训练好的ANN作为适应度函数,利用GA全局寻优求取最优工艺参数。
ANN-GA的特点在于:对于ANN模型而言,通过结合GA的优化作用,使网络的性能在合理范围内得到提高;对于GA而言,ANN起的是一种约束作用,通过ANN的模拟使GA的优化范围大致限定在的实际合理的范围内。目前限制ANN-GA在食品工艺优化中应用的主要原因还是由于其需要一定的算法方面的论理知识和较强的计算机编程能力。因此下面将就一个具体实例为例详细讲解ANN-GA耦合在工艺优化中的应用,旨在更加形象直观展示其实现过程。
3.2 ANN-GA在工艺优化中的实现
3.2.1 ANN模型的建立
本文以文献[10]为例,具体说明ANN-GA的优化过程。考察pH值、交联剂浓度和时间3个因素对固定纤维素酶活的影响,首先建立3因素5水平的中心组合设计,利用中心组合设计的20组数据建立ANN模型,然后利用另外3组合数据检验模型的泛化能力。
表1ANN-GA在食品工艺优化中的应用Table 1 The application of ANN-GA in optimization of food technology
由于文献[10]中提供的细节有限,因此本文只能简单模拟其实现过程。
ANN的建立与检验程序如下:
注:本文的所建立的神经网络只是对简单的还原,并非与文中的模型完全一致,旨在帮助读者形象的了解神经网络的建立过程。
文献[10]还分别比较了ANN模型和响应面(RSM)模型的拟合与预测能力。本文利用上述程序建立的神经网络模型也能实现文献中的效果,结果分别见图3和4,可见,图3和4表明所建的ANN模型的拟合与预测能力均优于RSM模型。
3.2.2 GA优化
当所建的ANN模型符合要求后,就可以利用GA来优化求取最优解,一般ANN的拟合能力非常强,关键是看其泛化能力,即对训练集之外样本的预测能力,由图3可知上述所建的ANN的拟合和泛化能力基本达到要求,因此下面就利用gaot遗传算法工具箱求解其最佳工艺。
GA的性能追踪如图5所示。
当经过约25次遗传操作后最优解和总群平均解均收敛于66%左右,即当pH=4.34,交联剂浓度为0.085%,时间4.59 h,纤维素酶的最高固定化率为65.97%,最优值与原文的66.75%相差不大,最佳工艺参数有少许差别,有待实验检验。不过这并不是本文的重点,本文旨在还原ANN-GA在工艺优化中实现的具体步骤和过程,为其实际应用提供一个参考。上述就是ANN-GA优化的整个源程序,读者只需掌握一定Mablab语言便可根据需要将程序稍许改动就能灵活运用,希望通过本文能给广大科技工作者在利用ANN-GA优化工艺及配方时提供便利。
4 结论
在生产工艺及配方优化过程中,影响因素很难用精确模型描述,传统的正交及响应面方法存在模型粗糙,精度低等缺陷[19-20]。而利用ANN高度非线性拟合和GA的全局寻优的能力能在很大的程度上克服传统方法的缺陷,为生产工艺的决策和控制提供可靠的依据。
ANN-GA优化工艺参数的过程中,关键步骤在于训练ANN,理论上训练ANN数据点越多越好,但是在实际的试验中往往不能达到,通常是利用尽可能少的试验次数得到尽量多的试验信息。因此在训练网络时,在有限信息中,合理的数据点分布对ANN训练的好坏起着重要的作用。理论上来说ANN训练所需的试验点应该在空间分布均匀,且有足够的代表性。利用正交设计、均匀设计和中心组合设计等得到的数据点一般都能符合上述条件,其中尤其是均匀设计得到的数据点最佳,因为在相同的实验次数下,均匀设计能考虑更多的因素和水平,而且均匀设计试验点的分布和代表性均优于中心组合设计。因此,利用均匀设计的试验点来训练ANN,能得到更好,泛化能力更强的网络模型[21-22]。
利用ANN-GA优化食品工艺时,可以直接利用正交、均匀设计或者响应面设计的实验数据建立ANN,然后利用GA直接寻优,并不需要额外单独的设计试验。因此将传统的实验设计方法与ANN-GA相结合,提出了一种新的数据分析和处理方法。该方法能充分挖掘和利用试验设计数据的信息,得出的结论可以和常规的实验设计分析方法互相验证,可预见在以后的研究中,ANN-GA在食品工艺及配方优化中将越来越发挥重要的作用。
:
[1]Ba■D,Boyacl I H.Modeling and optimization I:Usability of response surface methodology[J].Journal of Food Engineering,2007,78:836-845
[2]李琳,赵谋明,张黎.人工神经网络在食品工业中的应用[J].食品研究与开发,2005,26(1):13-16
[3]Huang H.Applications of Artificial Neural Networks(ANNs)in Food Science[J].Critical Reviews in Food Science and Nutrition,2007,47:113-126
[4]Cheng J,Li Q S,Xiao RC.A new artificial neural network-based response surface method for structural reliability analysis[J].Probabilistic Engineering Mechanics,2008,23:51-63
[5]He L,Xu Y Q,Zhang X H.Medium factors optimization and fermentation kinetics for phenazine-1-carboxylic acid production by Pseudomonas sp.M18G[J].Biotechnol Bioeng,2008,100(2):250-259
[6]代志凯,张翠,阮征.试验设计与统计优化及其在培养基优化中的应用[J].微生物学通报,2010,37(6):894-903
[7]Bao Y,Mou M Z,Yue M J.Optimization of tyrosinase inhibition activity of ultrasonic-extracted polysaccharides from longan fruit pericarp[J].Food Chemistry,2008,110:294-300
[8]Koc1 A B,Heinemann P H,Ziegler GR.optimization of whole milk powder processing variables with neural networks and genetic algorithms[J].Food and Bioproducts Processing,2007,85(C4):336-343
[9]Izadifar M,Zolghadri M.Application of genetic algorithm for optimization of vegetable oil hydrogenation process[J].Journal of Food Engineering,2007,78:1-8
[10]Zhang Y,Xu J L,Yuan Z H,et al.Artificial neural network-genetic algorithm based optimization for the immobilization of cellulase on the smart polymer Eudragit L-100[J].Bioresource Technology,2010,101:3153-3158
[11]Tushar G,Mainak C,Anshu S.Comparative Study of Response Surface Methodology,Artificial Neural Network and Genetic Algorithms for Optimization of Soybean Hydration[J].Food Technol.Biotechnol,2010,48(1):11-18
[12]Zhu Y B,Zhang J H,SHI Z P.Optimization of Operating Conditions in Rice Heat Blast Process for Chinese Rice Wine Production by Combinational Utilization of Neural Network and Genetic Algorithms[J].journal of the institute of brewing,2004,110(2):117-123
[13]唐明,藏占锋,邵伟.酵母抽提物干燥工艺节能优化研究[J].现代食品科技,2010,26(2):167-169
[14]赵武奇,仇农学,王宏.苹果渣多酚提取工艺的神经网络建模与遗传算法优化[J].食品科学,2007,28(12):138-142
[15]曹晞,吴毅强,李积华.人工神经网络-遗传算法优化酶法提取绿豆渣水溶性纤维素工艺研究[J].食品科技,2006,10:296-299
[16]周先汉,阮少钧,成刚.基于遗传算法与神经网络的微波浸提过程优化[J].食品科学,2007,28(10):180-183
[17]肖连冬,许彬,臧晋,等.基于BP神经网络和遗传算法研究啤酒糟不溶性膳食纤维的酶法脱脂工艺[J].食品科学,2010,31(14):18-21
[18]赵武奇,殷涌光,仇农学.基于神经网络和遗传算法的红景天苷缓释微囊制备过程建模与优化[J].西北农林科技大学学报(自然科学版),2006,34(11):106-110
[19]Nagata Y,Chu K H.Optimization of a fermentation medium using neural networks and genetic algorithms[J].Biotechnol Lett,2003,25(1):1837-1842
[20]Wang J L,Wan W.Optimization of fermentative hydrogen production process using genetic algorithm based on neural network and response surface methodology[J].Int J Hydrogen Energy,2009,34:255-261
[21]Lin Z,Yi Z L,Jian H J,et al.Uniform design applied to nonlinear multivariate calibration by ANN[J].Analytica Chimica Acta,1998,370:65-77
[22]Cheng J,Li Q S.Reliability analysis of structures using artificial neural network based genetic algorithms[J].Comput Methods Appl Mech Engrg,2008,197:3742-3750