应用遗传算法和神经网络优化多杀菌素发酵培养基
2017-11-28张峰吴柳娟李躺王灿胡益波丁学知夏立秋
张峰+吴柳娟+李躺+王灿+胡益波+丁学知+夏立秋
摘 要 通过优化刺糖多孢菌发酵合成多杀菌素培养基成分,改善培养条件,从而提高多杀菌素产量.在单因素以及Plackett-Burman试验设计的基础上,采用Box-Behnken试验设计方法对发酵培养基组分中的玉米浆、可溶性淀粉、丙酸钠进行研究,运用遗传算法优化的BP神经网络建立多杀菌素产量与培养基组分浓度之间的预测模型,采用循环算法对此模型进行寻优,得到三种组分的最佳配比为:玉米浆7 g/L、可溶性淀粉16 g/L、丙酸钠2 g/L,多杀菌素产量达到(550.22±3.84)mg/L,采用上述方法优化后的培养基使得多杀菌素产量比原始培养基产量(225 mg/L)提高145%.本研究结果可为培养基优化提供一种有效的建模方法.
关键词 刺糖多孢菌;多杀菌素;发酵培养基优化;神经网络;遗传算法
中图分类号 S4823;TQ927 文献标识码 A 文章编号 1000-2537(2017)05-0036-08
Optimization of the Spinosad Fermentation Medium by Applying Genetic Algorithm and Neural Network
ZHANG Feng, WU Liu-juan, LI Tang, WANG Can, HU Yi-bo, DING Xue-zhi, XIA Li-qiu*
(State Key Laboratory Breeding Base of Microbial Molecular Biology, Key Laboratory of Developmental Biology of
Freshwater Fishes, College of Life Science, Hunan Normal University, Changsha 410081, China)
Abstract In this work, we report an approach to improve spinosad production by optimizing the fermentation medium components. Corn steep liquor, soluble starch and sodium propionate in the fermentation medium were investigated by Box-Behnken design (BBD), which was based on single factor and the Plackett-Burman design. Moreover, a prediction model of the spinosad yield as a function of the medium component concentration has been established by using the artificial neural network (ANN) optimized by genetic algorithm (GA). Using ANN optimized by GA as the objective function, we employed the circulatory algorithm to optimize the medium components and the optimal ratio of the three components as follows: with corn steep liquor 7 g / L, soluble starch 16 g/L, and sodium propionate 2 g/L, the final yield of spinosad reached (550.22±3.84) mg/L, which was 145% higher than the original fermentatiom medium(225 mg/L)obtained when cultured on the optimized medium. Our results from this study can provide an effective modeling method for medium optimization.
Key words saccharopolyspora spinosa; spinosad; optimization of fermentation medium; neural network; genetic algorithm
多殺菌素又名刺糖菌素,是由土壤放线菌刺糖多孢菌 (Saccharopolyspora spinosa)经有氧发酵产生的具有大环内酯结构的次级代谢产物[1].因其具有广谱杀灭害虫作用,对人、非靶标动物和环境安全,可生物降解等优点[2],被国际上认为是一种具有发展前景的绿色杀虫防护剂.
自2005年,美国环保局( United States Environmental Protection Agency)批准将多杀菌素作为储粮防护剂以来,已在有机作物上应用[3-4],但多杀菌素工业发酵产量很低[5],如何提高发酵产量受到国内外研究者的高度重视.已有研究者通过遗传改造的方法,使多杀菌素产量得到不同幅度的提高[6-9].刺糖多孢菌发酵多杀菌素,不仅与其遗传基础有关,而且与其培养条件也密切相关[10].优化发酵培养基成分,是提高多杀菌素产量的一个有效技术途径.但多杀菌素发酵培养基组分复杂,组分间往往存在较强的交互作用,培养基组分和发酵目的产物间是一种非线性关系;由于神经网络能以任意精度逼近非线性函数,而遗传算法既可以避免陷入局部最小,又可以加快收敛速度,所以将神经网络和遗传算法结合,非常适合非线性模型的建立.研究表明,利用BP神经网络结合遗传算法进行微生物发酵条件优化,能促进发酵目的产物的产量得到不同程度的提高[11-14].endprint
本文通过单因素实验结果及文献研究结果[15-17],筛选出几种促进作用的因子,进行Plackett-Burman试验设计,筛选出对发酵多杀菌素具有显著影响的因子进行下一步的Box-Behnken响应面优化.基于Box-Behnken试验设计的结果构建利用遗传算法优化的BP神经网络模型,进一步寻找多杀菌素发酵最优培养基配方.
1 材料与方法
1.1 材料
1.1.1 菌株 刺糖多孢菌(Saccharopolyspora spinosa)菌株,本实验室选育保藏.初始发酵培养基培养10 d,多杀菌素产量为225 mg/L.
1.1.2 试剂 TSB(Tryptic Soy Broth)(海博生物技术有限公司,AR);葡萄糖(上海山浦化工有限公司,AR);酵母粉(安琪酵母股份有限公司,BR);七水合硫酸镁(天津化学试剂三厂,AR);棉籽粉(北京中棉紫光生物科技公司,工业级);豆饼粉(济宁双华工贸有限公司,工业级);可溶性淀粉(国药集团化学试剂有限公司,AR);碳酸钙(国药集团化学试剂有限公司,AR);油酸甲酯(上海阿拉丁试剂有限公司,CP);油酸丁酯(上海阿拉丁试剂有限公司,CP);丙酸钠(国药集团化学试剂有限公司,CP);氯化钡(国药集团化学试剂有限公司,AR);玉米浆(上海源叶生物科技有限公司,AR 45%).
1.1.3 培养基及溶液 种子培养基(g/L):TSB(Tryptic Soy Broth) 45.0;葡萄糖10.0;酵母粉9.0;七水合硫酸镁2.2;115 ℃灭菌30 min.初始发酵培养基(g/L):葡萄糖60.0,棉籽粉22.5,豆饼粉5.0,可溶性淀粉100,碳酸钙5.0,油酸甲酯42.0 mL/L.用2 mol/L的氢氧化钠溶液调整pH至7.2,115 ℃灭菌30 min.
1.2 方法
1.2.1 培养方法 将刺糖多孢菌菌株从-80 ℃超低温冰箱中取出,以1%(体积比,下同)接种到装有50 mL种子活化培养基中,280 r/min,30 ℃振荡培养48 h,作为种子液.种子液以10%接种于装有20 mL发酵培养基中,280 r/min,30 ℃振荡培养,无特殊说明则培养240 h.
1.2.2 发酵样品分析与检测方法 发酵液的多杀菌素含量通过高效液相色谱分析检测[18].
1.3 实验设计
1.3.1 Plackett-Burman试验设计 试验设计因子及水平见表1和表2.选择N=12的试验设计,见表3,误差列是“虚拟变量”,用于估计误差.在Design-Expert 8.06中进行Plackett-Burman试验设计与结果分析.
1.3.2 Box-Behnken试验设计 本实验通过Plackett-Burman试验设计确定了玉米浆、可溶性淀粉和丙酸钠的质量浓度是对刺糖多孢菌发酵多杀菌素有重要影响的因子.进行Box-Behnken试验时,每个因子取3个水平对应编码值为(-1,0,1),见表2.试验点共17个,包括12析因点和用于估计实验误差的5个重复的零点实验.Box-Behnken试验因素水平如表2.
1.4 优化方法
1.4.1 响应面模型 基于Box-Behnken试验数据进行响应面建模(Response Surface Model, RSM):
y是方程预测值(多杀菌素产量,mg/L),β0是常数;βi,βii,βij分别为一次项系数,二次项系数和交互项系数;xi和xj为自变量(培养基组分浓度,g/L).Box-Behnken試验结果的方差分析以及回归分析在Design-Expert 8.06软件中进行.
.4.2 神经网络模型 本研究创建了一个3-10-1型的前馈反向传播(BP)网络(图1),以Box-Behnken试验结果作为训练和验证数据,BP神经网络的误差函数作为遗传算法的适应度函数,对BP神经网络的权值和阈值进行优化.再以优化的BP网络模型,作为循环算法的函数进行循环寻优,考察自变量X1(玉米浆浓度),X2(可溶性淀粉浓度)和X3(丙酸钠浓度)对多杀菌素的影响.遗传算法初始设置:迭代次数为10,种群规模为50,交叉概率为03,变异概率为0.1.建模过程在Matlab 2015b中进行.
2 结果与分析
2.1 单因素试验结果
经前期实验发现,玉米浆、可溶性淀粉、氯化钡、油酸丁酯对多杀菌素合成有促进作用.本研究中,通过单因子实验初步分析了玉米浆、可溶性淀粉、氯化钡、油酸丁酯对多杀菌素发酵产量的影响.由图2可知,玉米浆为7 g/L时,多杀菌素产量达到215.9 mg/L(图2A);可溶性淀粉15 g/L时,多杀菌素产量达到282.4 mg/L(图2B);油酸丁酯30 mL/L时,多杀菌素产量达到244.3 mg/L(图2C);氯化钡浓度为3 mmol/L时,多杀菌素产量达到304.1 mg/L(图2D).
2.2 Plackett-Burman试验设计及结果
Plackett-Burman试验设计结果见表3,方差分析结果见表4.由表4可知,模型P=0.009 2,该模型是极显著的,同时决定系数R2为0.987 3,说明该模型回归有效,试验设计可靠.方差分析中各组分所对应P值越小,说明此组分对刺糖多孢菌合成多杀菌素影响越大.因此各组分重要性顺序为:ρ(可溶性淀粉)(P=0.002 5),ρ(玉米浆)(P=0.007 4),ρ(丙酸钠)(P=0.007 7),ρ(酵母粉)(P=0.015 1),ρ(豆饼粉)(P=0028 9),φ(油酸丁酯)(P=0.039 7),c(氯化钡)(P=0.091 0),ρ(棉籽粉)(P=0.598 6).因为超过3个因子的Box-Behnken试验设计实验组数将大大增加,所以选择前三个影响达到极显著的培养基组分进行后续的研究.endprint
2.3 响应面分析
Box-Behnken试验设计及结果见表5,方差分析结果见表6.由表6可见,模型失拟项(P=0.451 5>005)差异不显著,说明回归方程的失拟平方和基本是由实验误差等偶然因素引起的,需要进一步检验方程回归结果是否显著.回归模型P<0.000 1,说明回归方程描述各因子与响应值之间关系时,其因变量与全体自变量之间的线性关系是极其显著的,即该实验方法可靠;分析得到一个多杀菌素产量对玉米浆、可溶性淀粉和丙酸钠的二次多项式回归模型为:
回归方程的复相关系数R2=0.990 6,说明响应值的变化有99.06%来源于所选因素,该模型能较好地描述试验结果;预测相关系数R2(0.924 6)与调整相关系数R2(0.978 5)一致,这说明观测值与预测值高度相关,此模型可用来分析和预测玉米浆、可溶性淀粉和丙酸钠浓度对刺糖多孢菌发酵多杀菌素产量的影响.由该方程预测的最优培养基各组份浓度见表7,经验证多杀菌素产量达到(538.60±8.60)mg/L.
2.4 遗传算法优化BP神经网络
BP神经网络的误差函数作为遗传算法的适应度函数,对BP神经网络的权值和阈值进行优化,发现群体进化到第6代时其平均适应度不再改变,至第10代时进化终止(图3),此时BP神经网络的训练样本和验证样本的拟合系数分别达到0.992 6和0.996 5,均方误差均小于0.023(图4),说明该模型能够很好地描述實验因素(玉米浆、可溶性淀粉、丙酸钠质量浓度)与多杀菌素产量间的相互关系.
2.5 基于优化后的BP网络的寻优分析
采用循环计算的方法,以训练好的BP神经网络作为目的函数,将所有能够操作的变量组合输入到训练好的BP神经网络中,计算所得培养基组分为:玉米浆7 g/L,丙酸钠2 g/L,可溶性淀粉16 g/L时有最高多杀菌素产量,经发酵验证,此时多杀菌素产量为550.22±3.84 mg/L,将响应面法优化配方下刺糖多孢菌发酵多杀菌素产量与此配方下产量进行独立样本t检验,结果表明差异显著(P=0.047<0.05).
3 结论与讨论
放线菌次生代谢产物的生物合成是一个复杂的过程,它取决于前体物质、能量供应、酶活性、细胞状态和培养条件等因素,且这种影响往往是非线性的.在多杀菌素工业化发酵过程中,通过优化培养条件,有利于节省成本,提高经济效益.RSM和Artificial Neural Network(ANN)是常用的非线性数据建模和过程优化的分析工具.相比RSM,ANN具有明显的优势:不必知道分析函数的确切形式.Box-Behnken设计是响应面设计中最常使用的一种.在本研究中,基于Box-Behnken设计结果建立RSM和ANN模型,实现了对刺糖多孢菌多杀菌素发酵培养基成分的优化.在优化过程中,模型能否高精度预测真实响应至关重要.相比RSM,ANN模型对实验数据的预测值更接近实验观测值(图5,表7),说明ANN模型比RSM模型拟合效果更好.基于遗传算法优化的ANN模型寻优,验证最高多杀菌素产量为550.22 mg/L,高于由RSM模型所确定的多项式方程预测结果(表7),说明ANN模型有更好的泛化能力.类似的结果表明[13,20-21],神经网络模型在组分复杂的培养基优化过程中,相比响应面分析法更有优势.优化培养基通常被称为提高发酵目的产物产量的初始步骤,然而,利用遗传算法优化BP神经网络的建模方法,在多杀菌素的发酵过程优化中鲜有报道.本研究通过此方法成功优化了刺糖多孢菌发酵多杀菌素的培养基,在培养基优化方法的选择上具有一定的参考意义.
参考文献:
[1] SPARKS T C, CROUSE G D, DURST G. Natural products as insecticides: the biology, biochemistry and quantitative structure-activity relationships of spinosyns and spinosoids[J]. Pest Manag Sci, 2001,57(10):896-905.
[2] 张 苑. 多杀菌素高产菌种的推理选育和发酵工艺的优化[D]. 杭州: 浙江大学, 2004.
[3] 张国樑. 储粮害虫防护剂应用展望[J]. 粮食储藏, 2006,35(1):10-12.
[4] 武丽辉. 欧盟批准了多杀菌素在有机作物上使用[J]. 农药科学与管理, 2008,29(9):30-30.
[5] 邹球龙, 郭伟群, 王 超, 等. 多杀菌素补料发酵工艺的研究[J]. 粮油食品科技, 2014,22(3):86-88.
[6] BALTZ R H, BROUGHTON C M, CRAWFORD K P, et al. Biosynthetic genes for spinosyn insecticide production: US, US6143526[P]. 2000.
[7] LIANG Y, LU W, WEN J. Improvement of saccharopolyspora spinosa, and the kinetic analysis for spinosad production[J]. Appl Biochem Biotech, 2009,152(3):440-448.
[8] 代 鹏, 徐雪莲, 贺玉平, 等. 多杀菌素生产菌株的选育[J]. 热带作物学报, 2005,26(4):67-70.
[9] 陈继红, 张利平, 郭立格, 等. 多杀菌素产生菌株航天育种效果研究[J]. 安徽农业科学, 2008,36(12):4951-4952.endprint