APP下载

花生四烯酸发酵过程的建模方法研究

2011-02-03李丽娟

自动化仪表 2011年11期
关键词:烯酸性能指标花生

焦 敏 张 湜 李丽娟 李 霜 黄 和

(南京工业大学自动化与电气工程学院1,江苏 南京 211816;南京工业大学生物与制药工程学院2,江苏 南京 211816)

花生四烯酸发酵过程的建模方法研究

焦 敏1张 湜1李丽娟1李 霜2黄 和2

(南京工业大学自动化与电气工程学院1,江苏 南京 211816;南京工业大学生物与制药工程学院2,江苏 南京 211816)

对发酵法生产花生四烯酸的建模方法进行了初步研究,并基于四种温度下的试验数据,建立了发酵过程模型。比较分析了最小二乘支持向量机(LS-SVM)和广义回归神经网络(GRNN)这两种方法的特点。结果表明,这两种方法均能较好地建立该发酵过程的模型,LS-SVM建模的预测能力稍优于GRNN,为后续花生四烯酸发酵过程的优化及控制的研究奠定了基础。

发酵过程 最小二乘支持向量机 广义回归神经网络 建模 Matlab

0 引言

花生四烯酸(arachidonic acid,AA或ARA)是一种重要的人体多不饱和高级脂肪酸,它对人体的免疫系统及心血管系统具有十分重要的作用[1]。迄今为止,花生四烯酸已经在医药、化工、保健食品、化妆品等领域得到广泛应用[2]。使用传统方法制备ARA不仅价格昂贵,而且不能满足大量的市场需求[3]。本文利用微生物发酵的方法。与传统方制备法相比,采用该方法不仅ARA产量大,而且绿色环保[4-5],这也和国家现在大力提倡的低碳经济不谋而合。

本研究以实验室中高山被孢霉发酵生产ARA为研究背景,针对实验数据样本小的特点,选择最小二乘支持向量机(LS-SVM)与广义回归神经网络(generalized regression neural network,GRNN)的方法建立ARA产量的模型,并通过均方差(MSE)和平均绝对误差(MAE)两个性能指标来评判模型的优劣性,最后对结果进行了分析与比较。

1 最小二乘支持向量机的原理

最小二乘支持向量机由Suyken等人提出,它的训练过程用等式约束替代了传统的不等式约束,并且用误差平方和损失函数作为训练集的经验损失,将解二次规划问题转化为求解线性方程组问题,大大提高了求解问题的计算速度。

首先假设训练样本集为(x1,y1),…,(xi,yi)(i为样本的数量),用一个非线性映射ψ(·)将原样本空间Rn映射到特征空间φ(xi),在高维特征空间中建立最优决策函数:

式中:ω∈Rn(原样本空间),为权重向量;b为偏置。

利用结构风险最小化原则,最小二乘支持向量机可转化为在一定约束条件下求解最小化泛函的问题:

约束条件为:

式中:ωT、ω为控制模型的复杂度;c为正规化参数;ξi为松弛因子,i=1,2,...,l。

用拉格朗日法求解这个优化问题,即:

式中:ω为权重向量;b为偏置;ξi为松弛因子;αi为拉格朗日算子。

由Karush-Kuhn-Tucker(KKT)最优条件,通过对ω、b、ξi和α求偏微导并令各式等于0,联立可得:

求解上式可得LS-SVM非线性回归函数为:

式中:K(xi,xj)=φT(xi)φ(xj)为核函数。

常用的核函数主要分为以下几种[6]。

①多项式核函数

式中:q∈N;c>0。

②径向基核函数(RBF)

式中:σ为核函数的参数,它定义了从原始空间到高维特征空间的非线性映射。

③Sigmoid核函数

式中:b、c为常数。

由此可见,LS-SVM模型主要是对式(5)进行求解。核函数的引入避免了高维空间容易造成的“维数灾难”,并解决了大量的计算问题[7]。研究表明,径向基核函数RBF的效果较好,故本文采用RBF核函数的LS-SVM。

2 发酵过程模型

2.1 建模数据的预处理

由于生物发酵过程是一个缓慢的过程,相邻采样点的数据一般不会发生突变,因此,本文采用三次平滑样条插值的拟合方法。具体实现方法是通过调用Matlab中的spline函数实现。

本文以高山被孢霉发酵生产花生四烯酸ARA为研究对象,选择15℃、20℃和25℃时的三组温度下的试验数据作为建模使用,28℃时数据作外推使用。具体实现方法是将每组数据中的时间、温度、pH作为输入变量,将花生四烯酸的产量作为输出变量,采用LSSVM以及广义回归神经网络GRNN来建立模型[8]。

2.2 LS-SVM建模

首先将LS-SVM lab1.5工具箱添加到Matlab中的toolbox,其使用方法可参见相关的资料,主要程序代码如下。

其中,LS-SVM中gam和sig2为两个可调整的参数,前者是正则化参数,决定了适应误差的最小化和平滑程度;后者是RBF核函数的参数。其中classification用于分类,function estimation用作函数回归使用。P、T分别为训练网络的输入和输出。

通过仿真,LS-SVM拟合及外推效果如图1所示。其中:“﹡”线表示产物花生四烯酸(ARA)产量的试验测量值;实线表示LS-SVM模型的计算值;纵坐标X为细胞干重。

图1 LS-SVM拟合及外推效果Fig.1 The results of LS-SVM fitting and extrapolation

为了评判LS-SVM建模效果的优劣[9],在此引入均方差性能指标(MSE)和平均绝对误差性能指标(MAE),LS-SVM的性能指标如表1所示。

表1 LS-SVM的性能指标Tab.1 The performance indexes of LS-SVM

3 GRNN建模

广义回归神经网络(GRNN)是径向基网络的一种变化形式,它的特点是训练速度快、非线性映射能力强,适合于进行曲线逼近拟合。为了与上述LS-SVM的建模方法进行比较,现拟用广义回归神经网络GRNN进行建模。

GRNN建模的具体方法如下:针对同一批数据使用GRNN神经网络进行建模,同样计算所建立模型的拟合误差和外推误差,并与LS-SVM进行比较。GRNN神经网络的创建是调用Matlab函数库中的newgrnn函数,具体调用格式为:net=newgrnn(P,T,spread)。其中:P为R×Q维的输入向量;T为S×Q维的输出向量;spread为散步常数,它的选取是关键,数值越大,代表需要的神经元就越少,但同时精度会下降,本网络中选取的散步常数为0.1。

通过仿真,得到GRNN模拟拟合及外推效果曲线如图2所示。其中:“﹡”线表示产物花生四烯酸(ARA)产量的试验测量值;实线表示GRNN模型的计算值。

图2 GRNN拟合及外推效果曲线Fig.2 The results curves of GRNN fitting and extrapolation

GRNN的性能指标如表2所示。

表2 GRNN的性能指标Tab.2 The performance indexes of GRNN

为了便于分析与比较上述两种建模方法的优劣性,将表1和表2联立,得到LS-SVM与GRNN的性能比较,具体如表3所示。

表3LS-SVM与GRNN性能比较Tab.3 Performance comparison of LS-SVM and GRNN

由表3可以看出,GRNN神经网络的训练集性能指标(即拟合精度)较LS-SVM要好,但LS-SVM的测试集性能(即预测精度)却略优于GRNN神经网络。究其原因,主要是由于ARA发酵过程中的数据量较小,对于小样本数据,神经网络容易出现“过拟合”现象,外推能力得不到最优化;而LS-SVM模型则可以防止此类现象的出现,预测能力较神经网络GRNN好。

4 结束语

本文使用了最小二乘支持向量机和广义回归神经网络两种方法建立了花生四烯酸发酵过程的模型。通过仿真结果表明:这两种方法相差不大,均能较好地建立该发酵过程的模型,但LS-SVM建模的预测能力稍优于GRNN。这为后续花生四烯酸发酵过程的优化及调控奠定了基础。

本文所使用的两种建模方法的预测精度均受到模型参数(如GRNN中的散步常数spread,LS-SVM中的gam和sig2)的影响,未来研究的主要方向可集中在对模型参数的优化以及算法的改进等方面。

[1]姚昕,秦文,齐春梅,等.花生四烯酸的生理活性及其应用[J].粮油加工与食品机械,2004,10(5):57-59.

[2]杨朝霞,张丽,李朝阳.花生四烯酸的营养保健功能[J].食品与药品,2005,7(1A):69-71.

[3] Singh A,Word O P.Production of high yield of arachidonic acid in a fed batch system by mortieralla alpina ATCC 32222 [J].Appl Microbiol Biotechnol,1997,48(7):1-5.

[4]周蓬蓬,余龙江,吴元喜,等.高山被孢霉产花生四烯酸发酵条件的研究[J].工业微生物,2003(2):414-415.

[5]欧阳平凯,韦萍,姚忠.生物化工研究现状与发展趋势[J].化工进展,2003,22(1):1-7.

[6]阎威武,朱宏栋,邵惠鹤.基于最小二乘支持向量机的软测量建模[J].系统仿真学报,2003,15(10):1494-1496.

[7]阎威武,邵惠鹤.支持向量机和最小二乘支持向量机的比较及应用研究[J].控制与决策,2003,18(3):358-360.

[8]陈文略,王子羊.三次样条插值在工程拟合中的应用[J].华中师范大学学报:自然科学版,2004,38(4):418-422.

[9]袁安平,张湜,姜珉,等.丁二酸发酵过程软测量模型的参数优化研究[J].化工自动化及仪表,2009,36(5):13-17.

Study on the Modeling Methods for Fermentation Process of Arachidonic Acid

The modeling method for fermentation process of arachidonic acid is studied preliminary,and on the basis of the test data under four of the temperatures,the model of fermentation process is setup.The features of two methods,i.e.least square support vector machine(LS-SVM)and generalized regression neural network(GRNN)are compared and analyzed.The result indicates that both these two methods are good to establish the model,while LS-SVM is better than GRNN on prediction capability.This builds foundation for researching the optimization and control of the fermentation process of arachidonic acid.

Fermentation process Least square support vector machine Generalized regression neural network Modeling Matlab

TP183

A

南京工业大学基金资助项目(编号:39710005)。

修改稿收到日期:2011-04-11。

焦敏,男,1985年生,现为南京工业大学控制理论与控制工程专业在读硕士研究生;主要从事生化工程建模、优化、控制方面的研究。

猜你喜欢

烯酸性能指标花生
掏花生
沥青胶结料基本高温性能指标相关性研究
北斗卫星空间信号故障与监测性能指标定义
高度不饱和脂肪酸对水生动物生长、发育和繁殖的影响与机理
脂质对中华花龟不同组织脂肪酸组成的影响
自动控制系统的优劣评价分析
到底埋在哪棵树下
储热水箱分层性能指标的研究进展
花生去哪儿了
模拟移动床色谱分离纯化花生四烯酸甲酯