基于BFA-ELMAN神经网络的微生物生长预测系统
2018-08-24侯奇
侯奇
(上海海事大学信息工程学院,上海 201306)
0 引言
预测微生物学本质上是基于微生物群体对环境因素的反应可重现,利用过去观察到的试验数据通过数学模型预测食物环境中的微生物行为,并用实验结果证明模型所得到的误差不大于微生物实验所带来的误差[1]。微生物预测的核心是建立有效的模型,近些年,研究者在建模方式上大多都是参数化的模型,其模型中的参数没有实际的意义,仅仅是为了结果在形式上接近实际数据,而目前,得益于神经网络的研究发展,越来越多的研究者用神经网络去建模,并且神经网络在处理图片[2]、视频[3]、音频[4]等多维度问题上面有着强大的应用,使得神经网络在解决多维和建模问题上被研究者广泛采用,本研究就是采用一种改进的ELMAN神经网络来进行多维建模问题,来解决预测微生物学在建模上一直采用拟s形态函数的诟病,并通过细菌觅食算法(Bacterial Foraging Algorithm,BFA)对ELMAN神经网络进一步的优化,并将优化后的ELMAN网络应用到微生物生长预测模型中去,提高了其预测的精度。
1 ELMAN神经网络
人工神经网络是模拟动物神经网络的功能、特征、结构而建立的一种数学架构,实际就是一个强大的数学函数。ELMAN也是人工神经网络的一种,包括输入层、隐含层、承接层和输出层,其连接权可以进行学习修正,关联层的作用是通过联接记忆将上一个时刻的隐层状态连同当前时刻的网络输入一起作为隐层的输入,相当于状态反馈,反馈连接由一组“结构”单元构成,用来记忆前一时刻的输出值,局部反馈连接的递归神经网络,具有动态映射功能,并使系统具有适应时变特性的能力[5],其隐藏层使用一个具有与典型微生物生长曲线相似形状的Sigmoid函数,这让神经网络不需要使用大量节点就可以获得相应微生物生长曲线[6],关联层通过联接记忆上一个时刻的隐层状态连同当前时刻的网络输入一起作为隐层的输入,相当于状态反馈,便于做时间相关类型的预测。
由于微生物生长预测是关于时间动态化的过程,ELMAN神经网络对历史状态数据具有敏感性,增加了网络处理动态信息的能力,达到动态建模的目的,能使预测值均匀地分布在实际值的两侧,适合实时系统辨识的动态递归,对序列问题及时间问题有着很好的预测效果,因为有着较强的适应时变特性的能力,所以采用此网络对微生物生长预测建模,ELMAN网络结构设计的好坏对网络的性能和预测结果起着重要的影响作用,在网络隐含层的节点选取,以及权值阈值的取值上,没有有效地方法,很容易使得网络在建模中,网络训练收敛过慢,导致预测效果不佳的表现,因此有必要对ELMAN网络,特别是针对实际问题,对其网络结构要特别对待,本研究对ELMAN神经网络的拓扑结构进行了改进,提出一种双伴承接层的ELMAN神经网络结构,然后通过BFA对其权值、阈值进行优化。
2 改进ELMAN神经网络拓扑结构
由Whiting等[7]提出的基于变量类型的分类方法将预测微生物数学模型分为一级模型、二级模型和三级模型,其中二级模型描述微生物在食品中的生长情况与环境条件之间的关系,也是目前研究的热点,为了使得ELMAN神经网络来拟合微生物的生长状况,更改了其拓扑结构,在原有的ELMAN网络基础上加入另一个承接层,它的输入变量为细菌在当时的环境状态,输出为细菌的瞬时速率,微生物的初始浓度与生长速率为ELMAN的输入,输出为目标浓度,其网络结构如图1所示,传值函数见式(1),隐含层阈值函数见式(2),承接层阈值函数见式(3):
其中与 y(k)为第 k次输出集,u为输入矩阵,g(x)为传递函数,w为权值,x(k)为第k迭代矩阵,f(x)为阈值函数,e(x)为环境影响函数。
图1 改进的ELMAN网络结构
3 BFA优化的ELMAN神经网络
3.1 BFA优化算法简介
近年来,越来越多的仿生优化算法出现,这些算法是依据物种在自然进化过程中的存活状态,这取决于它们的健身状况和依赖于他们的觅食或运动行为,因此,对任何进化物种的觅食行为可适用于任何非线性系统优化和建模,细菌觅食算法就是这类,它是仿照我们的肠道中的大肠杆菌有一个觅食策略,由三个过程控制,即趋向、繁殖和驱散[8],优化问题的解对应搜索空间中细菌的状态,即优化函数适应值。在趋化过程中,细菌运动模式包括翻转和前进。细菌向任意方向移动单位步长定义为翻转。当细菌完成一次翻转后,若适应值得到改善,将沿同一方向继续移动若干步,直至适应值不再改善,或达到预定的移动步数临界值。此过程定义为前进。以趋化过程中各细菌适应值累加和为标准,较差的半数细菌死亡,较好的半数细菌分裂成两个子细菌。子细菌将继承母细菌生物特性,具有与母细菌相同的位置及步长。趋化过程可确保细菌的局部搜索能力,复制过程能加快细菌的搜索速度,但对于复杂的优化问题,趋化和复制无法避免细菌陷人局部极小现象发生,BFA引人驱散过程以加强算法全局寻优能力[9]。细菌在完成一定次数的复制后,将以一定概率被驱散到搜索空间中任意位置,避免解陷入局部最优的情况发生。
3.2 BFA优化神经网络
本研究在优化ELMAN权值问题上时候,有着较多的输入和隐含层,有125个参数ELMAN神经网络的节点数、层数、权重、激活函数参数等都是待定或者可调参数,可通过一定的算法学习得到。通常优化的是权重和激活函数参数,随着神经网络应用的越来越广泛,在对自适应的得到的权值与阈值,并不能过很好地得到预期的效果。例如GA对BP网络优化容易使得,BP网络的权值,阈值容易陷入局部最优,并不能够很好适应全局。PSO在优化问题上也被许多研究者所采用,它能做到快速收敛,但是,处理高维度问题,容易早熟收敛。正是神经网络本身的拓扑结构的多样性和权值阈值的的不确定性,使得没有很好地利用在微生物生长建模上,而BFA在处理高维度的问题上具有很好的效率[10],本研究通过BFA通过实际数据来优化ELMAN神经网络的权值,其模型如图2所示。
图2 基于BFA优化的ELMAN神经网络结构
4 基于BFA优化的ELMAN神经网络的微生物预测模型
4.1 样本数据
本研究通过沙氏门菌的生长数据实例为研究对象,数据来源于与ComBase数据库,ComBase数据库是2003年由英美两国将PMP、FM和Growth Predictor进行整合而成的数据库模型,拥有40489个关于微生物生长和存活的数据。并且也是世界上最大的预测微生物学信息数据库。实验数据对象在温度20-39℃、pH值在4.4-7.5、AW在0.934-1之间的环境所得。实验数据共98组,其中测试数据90组,测试数据为8组。
4.2 基于ELMAN网络的预测结果
图3 ELMAN神经网络预测结果与实际结果的对比
本次实验通过MATLAB进行建模,通过90组测试数据对ELMAN网络进行训练,在通过8组测试组数据对网络进行仿真测试,其经过多次的实验,得到的结果十分接近于实际值,并通过残差分析显示异常点仅仅接近2%,统计实验结果可以看出本模型对微生物生长的各个时期具有良好的预测效果,其中某次实验预测结果与实际值对比图如图3所示,对应的残差分析结果如所图4所示。
4.3 预测结果讨论
利用其数据中的温度、pH值、AW为伴生承接层输入层,由模型与实际值对比可知,本模型在生长期到稳定期的过渡期的预测有着更高的准确性,能够很好根据实际情况去预测。对于像是食品检测这样的机构会有很大程度上的帮助,而且能够更加有效的使用。其次对于微生物生长对数期及平稳期预测比较好,对于延滞期,如果想预测的更加的精确,需要考虑微生物其内部的状态,这使得预测更加的复杂,通常在处理与微生物行为相关的高水平的变异性和不确定性时候需要更高的检测仪器,由于过程的复杂,使得这一数据不易检测和获得,使得延滞期的研究进展缓慢,有待我们进一步去研究。
5 结语
本研究改进了ELMAN网络结构,并用BFA算法优化ELMAN神经网络中的权值、阈值,提高了其预测精度,利用沙氏门菌的数据为作为网络的训练集,试验结果显示,该模型可以对微生物生长的各个时期进行有效预测,并解决经验型模型参数化过多,以及没有生物意义的问题。此外本模型能够预测微生物在更多的环境条件下的生长和灭活,由不限制影响微生物生长因子的个数可提高本模型的通用性,可使得微生物预测模型能有较好的应用空间,可以帮助研究人员对微生物生长的动态分析,以及在复杂环境下对微生物生长失活的预测。
图4 ELMAN神经网络预测结果与实际结果的对比的残差分析