APP下载

基于遗传算法-神经网络及响应面法优化龙牙百合总黄酮提取工艺

2021-04-16尹乐斌邓鹏何平刘桠丽李乐乐

食品研究与开发 2021年7期
关键词:液固比百合黄酮

尹乐斌,邓鹏,何平,刘桠丽,李乐乐

(1.邵阳学院食品与化学工程学院,湖南邵阳422000;2.豆制品加工与安全控制湖南省重点实验室,湖南邵阳422000)

龙牙百合(Lilium brownii)是一种属于百合科(Liliaceae)百合属(Lilium)的植物,为我国食药用百合之一[1],其鳞茎含有淀粉、维生素、皂苷、秋水仙碱和黄酮等成分,具有养阴润肺、清心安神、美颜、抗疲劳与抗肿瘤等功效[2-6]。龙牙百合种植地主要分布在中国湖北、湖南等省份,其中仅湖南邵阳隆回县龙牙百合的种植规模已达到2×107m2,产值达4 亿元,已成为当地的特色产业[7]。龙牙百合亦药亦食,极具开发利用价值,其鳞茎所含的黄酮类化合物是一类还原性物质,含量约为38.15 mg/g[8]。

黄酮类化合物在人体内可以发挥抗氧化的效果,进而达到延缓衰老和抑癌的作用,在注重健康生活的如今备受关注,因此提取龙牙百合黄酮成为目前的研究热点之一。目前,关于优化龙牙百合提取黄酮的报道虽然较多[8-10],但未见讨论不同优化方法对提取结果的影响。常用的优化方法有正交设计、响应面设计与人工神经网络(artificial neural network,ANN)等,几种优化方式各有千秋,难分优劣。基于此,本文以龙牙百合粉为原料,乙醇为溶剂,在单因素试验基础上,探讨Box-Behnken 设计响应面试验(response surface methodology,RSM)和遗传算法结合人工神经网络(genetic algorithm-neural network,GA-NN)对龙牙百合总黄酮最佳提取工艺条件进行优化,研究结果为提高龙牙百合总黄酮利用提供基础。

1 材料与方法

1.1 材料、试剂与仪器

龙牙百合粉:市售;芦丁标准品(色谱纯):万物标准(北京)科技有限公司;硝酸铝(分析纯):成都金山化学试剂有限公司;氢氧化钠、亚硝酸钠(分析纯):天津永大化学试剂有限公司;无水乙醇(分析纯):沧州沧龙化工产品有限公司。

DJ-A1000-电子天平:广州市深华生物技术有限公司;SY-1210-恒温水浴槽:武汉市梅宇仪器有限公司;VELOCITY-14R-离心机:Dynamica 公司;722-分光光度计:上海舜宁恒平科学仪器有限公司。

1.2 方法

1.2.1 芦丁标准曲线的绘制

采用NaNO2-Al(NO3)3比色法进行芦丁标准曲线的绘制与龙牙百合总黄酮的测定[7]。配制0.1 mg/mL 的芦丁标准液:准确称取10 mg 芦丁,溶解于95%乙醇,并定容至100 mL。分别量取0、0.1、0.2、0.4、0.6、0.8、1.0 mL 的0.1 mg/mL 芦丁溶液放置于10 mL 的容量瓶中,然后依次加入质量分数5%的亚硝酸钠溶液0.5 mL,摇匀之后静置6 min,再依次加入质量分数10%的硝酸铝溶液0.5 mL,摇匀,静置6 min,最后分别加入40 g/mL 的氢氧化钠溶液2.0 mL,摇匀,用60%乙醇定容至刻度线,摇匀,静置15 min,于510 nm 波长下测定其吸光度值,以芦丁质量浓度为横坐标(X)、吸光度(Y)为纵坐标绘制标准曲线。

1.2.2 龙牙百合总黄酮含量的计算

精确量取0.25 mL 样品溶液于10 mL 容量瓶中,按1.2.1 方法测定吸光度,并按公式(1)计算总黄酮含量。

式中:X 为龙牙百合粉样品总黄酮含量,mg/g;C为按芦丁标准曲线方程计算出的黄酮浓度,mg/mL;V为龙牙百合粉黄酮提取液的体积,mL;N 为稀释倍数;M 为称取龙牙百合粉的质量,g。

1.2.3 单因素试验

称取1.25 g 干燥至恒重的龙牙百合粉末,分别考察提取时间、乙醇体积分数、液固比和提取温度对总黄酮含量的影响。参数考察范围分别为:提取时间15、30、45、60、75 min;乙醇体积分数40%、50%、60%、70%、80%;液固比20∶1、30∶1、40∶1、50∶1、60∶1(mL/g);提取温度30、40、50、60、70、80 ℃,离心(6 000 r/min,20 min)后收集上清液测定总黄酮。每组平行提取3 次。

1.2.4 RSM 试验设计

基于单因素,采用Box-Behnken 设计原理进行的RSM 试验,以提取时间、乙醇体积分数、液固比和提取温度为条件,以总黄酮含量为响应值,进一步优化提取龙牙百合粉总黄酮的最佳条件。

1.2.5 ANN 模型构建

本研究将采用3 层的ANN 创建试验因素的优化模型。选取提取时间、乙醇体积分数、液固比和提取温度作为网络4 个输入层神经元,总黄酮含量作为输出层节点见图1。用“traingdm”作为训练函数,以测试集均方误差(mean square error,MSE)作为模型是否准确的指标,其主要是由学习效率、动量常数和隐含层神经元数决定。参考Winiczenko 等对ANN 参数优化方法,以学习效率、动量常数和隐含层神经元数为变量,MSE 为响应值,建立基于Box-Behnken 设计原理进行的RSM 试验进行参数优化[11]。其中学习效率取值范围为0.01~0.4,动量常数取值范围为0.1~0.9。隐含层神经元,其数目通常使用经验公式(2)计算得到,即所得的网络结构为4-m-1 其中m 为隐含层节点数。

式中:m 为隐含层节点数;n 为输入层节点数;l 为输出层节点数;a 为[1,10]的常数。

图1 醇提龙牙百合总黄酮的人工神经网络模型Fig.1 Artificial neural networks of alcohol extraction of total flavonoids from Lilium brownii

1.2.6 虚拟样本建立

虚拟样本是基于试验误差所设置的样本,在试验过程中,往往会因为客观因素导致自变量在设定水平上下浮动[12]。ANN 需要大量样本进行训练,故而引入虚拟样本,且虚拟样本可以加大训练样本密度,强化机器学习效果,致使在实际样本的附近区域不会产生大的波动[13]。张纪兴等、钟旭美等在使用ANN 优化中使用虚拟样本,所得测试结果相对误差较小[12,14]。相反,王薇等与薛宏坤等未使用虚拟样本,ANN 因样本过少,测试结果相对误差偏大[15-16]。因此本研究引入虚拟样本,虚拟样本的生成方法是在每个实际样本的各变量增加一个±Δi 值,设定误差范围Δi=0.2%,根据L8(27)正交设计表,使每个实际样本产生8 个虚拟样本[17]。由此得到232 个虚拟样本,加上29 个原样本共261 个样本参加训练。第一个虚拟样本设置见表1。

表1 虚拟样本Table 1 Virtual samples

1.2.7 遗传算法进行目标寻优

基于1.2.5 所构建的ANN 模型与遗传优化算法(genetic algorithm,GA)结合对目标寻优,对RSM 结果及虚拟样本进行全面仿真试验,拟合得到总黄酮含量最大的值,并反馈出其对应的条件,即优化后的工艺参数。设定种群大小为50,最大进化代数为150,交叉概率0.2,变异概率为0.05,代沟0.9,运行Matlab 软件程序,得到每代种群平均适应度变化结果。

1.2.8 RSM 与GA-NN 预测结果对比

参考文献[15]与[18],以均方根误差(root mean square error,RMSE)、平均绝对百分比误差(mean abso lute percent error,MAPE)和决定系数(R2)大小作为评价预测提取总黄酮含量模型的指标,其中RMSE 和MAPE越低,R2越高,则表示构建的模型越稳定越优秀。

1.3 数据处理

采用SPSS 软件分析每组试验数据方差;Design-Expert ver8.0.6 软件设计并分析RSM;Matlab R2016a构建GA-NN 模型;Excel 分析结果误差;Origin 7.5 制作数据图形。

2 结果与分析

2.1 标准曲线的建立

以芦丁质量浓度(X)为横坐标,吸光度(Y)为纵坐标绘制标准曲线,线性拟合方程为Y=7.822 6X+0.020 8(R2=0.995 9)。结果显示芦丁标准溶液0~0.07 mg/mL内与吸光度的线性关系良好。

2.2 单因素试验结果分析

单因素试验中,乙醇体积分数、提取温度、液固比和提取时间对总黄酮含量的影响见图2。

由图2A 可知,在提取时间15 min~75 min 范围内,总黄酮含量先快速上升,达到极值后缓慢下降,当提取时间为45 min 时,百合总黄酮含量最大。在提取时间为15 min~45 min 时,溶液中总黄酮含量变化上升明显,因为在这段时间内胞内外总黄酮浓度差极大,溶液中总黄酮溶出远大于分解速率。在45 min~60 min 之间,溶液中总黄酮含量呈现不明显的下降,这是因为随着总黄酮不断溶出,胞内外总黄酮浓度趋于平衡,溶出速率降低,并且由于溶液中总黄酮含量的上升,被分解的总黄酮也在增多,导致总黄酮溶出速率开始小于分解速率,但总体仍趋于平衡[19-20]。60 min 后,溶液中总黄酮含量呈现出显著下降,这是因为随着胞内总黄酮不断减少,溶出速率明显低于分解速率。故提取时间最佳点为45 min。

图2 单因素试验结果Fig.2 Results of single factor experiments

总黄酮含量在乙醇体积分数40%~80%范围的变化如图2B 所示,总黄酮含量先上升后下降,乙醇体积分数为50%时,百合总黄酮含量最大,继而随着浓度增大总黄酮含量呈现下降。这是因为NaNO2-Al(NO3)3比色法显色原理是发生在黄酮醇类成分邻位无取代的邻二酚羟基部位[21]。而黄酮醇类是平面结构,水溶性较差,在水-乙醇混合体系中溶解效果较好,与溶剂的极性有一定的关联。龙牙百合粉胞内黄酮极性与乙醇体积分数为50%时的水溶液极性较为相似,乙醇体积分数由40%上升至50%时,溶液中总黄酮含量上升明显,50%到60%时,则呈现出不显著的下降,这与李化强等结果较为相似[10]。并且在乙醇体积分数为50%时,该体系下的水与乙醇混合液会使得百合细胞溶胀性变大,溶剂能更好的向百合细胞内部渗透,总黄酮溶出量也会因此增加[22]。当乙醇体积分数由60%上升至80%时,溶液中总黄酮呈现显著下降,这是因为溶液极性与黄酮醇极性差距变大,因此导致其溶解性逐渐降低,并且伴随着其余醇溶性物质的溶出与黄酮醇形成竞争关系,使总黄酮得率下降[23]。因此,最佳乙醇体积分数为50%。

由图2C 可知,总黄酮含量呈现先上升后下降趋势。在液固比由20∶1(mL/g)上升至40∶1(mL/g)时,总黄酮含量呈现出显著上升,这是因为在较低液固比的情况下,溶剂的体积过少,百合粉未能与溶剂充分混和,较多细胞未分散于溶剂中,接触面积较低,胞内黄酮未能完全提取出来。随着液固比增大,粉末逐渐与溶剂混合充分,细胞充分分散于溶剂中,接触面积因此上升,有利于黄酮溶出,其含量亦逐渐增加。当液固比处于40∶1(mL/g)~60∶1(mL/g)时,溶液中总黄酮含量由缓慢下降变为明显下降,因为溶剂体积增加导致总黄酮分散,而分散的黄酮容易发生变性分解,另一方面溶出的总黄酮总量增率不及溶剂体积增率大,因此总黄酮含量被稀释,造成提取总量虽然增加,但浓度却是下降[24-25]。为了减少溶剂不必要的浪费,所以将最佳液固比控制为40∶1(mL/g)。

如图2D 所示,当提取温度在40 ℃升至70 ℃的过程中,总黄酮含量呈现出明显的上升趋势,这是因为随着温度上升,溶液中分子运动速率也得以上升,溶剂在粉末表面流速与压强都得到明显提升,胞内外物质交换更加频繁,总黄酮溶出速率因此得到增加。当温度升高到80 ℃时,总黄酮含量则呈现缓慢下降,这可能是较高温度下,乙醇开始挥发,溶剂极性开始变化,黄酮溶出速率发生改变。同时,在较高温度的情况下,物质溶出速率虽然会增加,但是不稳定物质的分解速率亦加快[26]。Chaaban 等在考察6 种不同黄酮类化合物的热稳定性,得出黄酮和黄酮醇在70 ℃~80 ℃降解速率明显加快[27],因此在提取温度为80℃的情况下,黄酮分解速率在提取结束前就已占主导[28-29],因此,本研究的后续试验提取温度设为70 ℃。

2.3 RSM 优化提取龙牙百合总黄酮工艺

2.3.1 建立模型与分析

在单因素试验基础上,以提取时间(A)、乙醇体积分数(B)、液固比(C)和提取时间(D)为考察因素,以总黄酮含量为响应值,设计四因素三水平RSM 试验,对工艺条件进行进一步优化,因素水平、设计结果、方差分析见表2~表4。

表2 响应面试验因素水平Table 2 Level of experimental factors

表3 Box-Behnken 试验设计和结果Table 3 Box-Behnken designs and results

Design-Expert 8.0.6 软件对表3 的试验数据进行分析,得到百合总黄酮含量的编码值回归模型方程,Y=44.95+0.85A+2.05B+0.48C+1.09D-0.02AB+0.96AC-0.81AD +0.43BC -0.16BD -0.47CD -1.49A2-1.54B2-1.03C2-1.53D2。从表4 中各一次项的F 值可以判断出,各因素对总黄酮含量的影响排序为乙醇体积分数>提取温度>提取时间>液固比。模型的F 值为21.54,P<0.000 1,极显著,说明该模型有统计学意义。失拟项F值为3.01,P=0.149 9>0.05,表现为不显著,即方程的拟合度较好。表明可以使用该方程确定龙牙百合总黄酮最佳提取工艺。

表4 响应面多项式模型的方差分析Table 4 ANOVA for response surface polynomial model

2.3.2 各因素间的交互作用分析

RSM 的3D 图和等高线能够较为直观的体现出各个因素的交互作用对响应值的影响[30]。其中曲面图开口向下表示响应值有极大值。等高线形状则反映了交互作用显著程度的强弱,显著程度与椭圆的离心率呈正相关。不同因素对龙牙百合总黄酮含量的响应面见图3。

由图3 可知,不同交互因素之间均存在稳定的极值,交互因素AC、AD 的等高线呈现椭圆,且响应曲面图坡度较陡,表明所对应的因素之间的交互作用较为明显。

2.3.3 优化结果与验证试验

百合总黄酮的提取最佳工艺经Design-Expert 8.0.6 软件分析得出:提取时间51.44 min、乙醇体积分数57.35%、液固比45.60 ∶1(mL/g)和 提取温度71.19 ℃,在此条件下提取的龙牙百合总黄酮预测含量为46.08 mg/g。对RSM 优化结果进行验证试验。根据生产实际最佳工艺参数进行调整,提取时间51 min、乙醇体积分数57%、液固比46∶1(mL/g)、提取温度71 ℃,在此条件下进行龙牙百合醇提总黄酮的验证试验(n=3),得到的百合总黄酮实际含量为46.63 mg/g,试验值比理论值大1.19%<0.05,与理论预测值差异不显著,即RSM 优化预测的最佳工艺条件准确可靠,可以用于预测龙牙百合总黄酮提取含量。

2.4 ANN 模型构建结果

决定ANN 模型的稳健性的参数分别为:学习效率、动量参数与隐含层神经元数。其中隐含层神经元数m 由公式与其实际意义,得取值范围为[3,13],设定ANN 训练循环次数为10 000,训练误差目标为0.000 01,使用Box-Behnken 设计原理进行的RSM 试验,对测试集MSE 寻找最小值,得学习效率、动量参数与隐含层神经元数分别为10、0.31 和0.48。确定网络拓扑结构为4-10-1,根据上述结果,并对试验数据与虚拟样本进行训练,对应的网络训练模型适配,训练集、验证集、测试集和全部数据集见图4,拟合结果相关系数均达到0.99,表明建立的ANN 模型性能极好,准确性高。

图4 训练模型适配Fig.4 Training model adaptation

2.5 利用GA 优化及验证总黄酮提取工艺结果

将表3 中RSM 结果及其虚拟数组作为初始群体,通过ANN 模型调试函数的适应度,以龙牙百合总黄酮含量作为其函数的输出值,将ANN 和GA 结合对提取工艺进行全局寻优,获得最佳的龙牙百合提取总黄酮的工艺。运行相关程序后,得GA 寻优结果如图5所示。

图5 适应度曲线Fig.5 Fitness curve

由图5 可得,经过36 代后达到最佳适应度,此后适应度曲线平稳,表明提取的总黄酮含量已达到最大值,之后基本保持不变,经GA-NN 对提取工艺进行全局寻优,获得提取龙牙百合总黄酮含量最大预测值为46.83mg/g,对应的工艺条件分别为:提取时间50.04 min、乙醇体积分数53.37%、液固比43.37∶1(mL/g)、提取温度73.39 ℃。在修正后:提取时间50 min、乙醇体积分数53%、液固比43∶1(mL/g)、提取温度73 ℃条件下进行验证试验(n=3),得总黄酮提取含量为47.17mg/g,试验值比理论值大0.72%<0.05,与理论预测值差异不显著,且高于RSM 的优化值。

2.6 RSM 与GA-NN 预测结果对比

结合表3 RSM 和GA-NN 模型所提供的总黄酮含量预测值。使用Excel 分别计算出RSM 和GA-NN的RMSE、MAPE、R2值,分别为0.435 5、0.858%、0.955 4和0.149 7、0.103 7%、0.994 7。其中RSM 和GA-NN 模型的预测值统计评估结果如图6 所示。从RMSE、MAPE、R2值的对比中,可以得出结论,GA-NN 模型比RSM 模型具有更加精准的拟合度和估计预测能力。

2.7 RSM 与GA-NN 优化结果对比

RSM 与GA-NN 优化各项参数、预测值、实际值以及相对误差的对比见表5。

图6 模型预测值与实际值的对比Fig.6 Comparison of model predicted value and actual value

表5 优化结果比较Table 5 Comparison of optimization results

由表5 可知,GA-NN 优化的相对误差明显低于RSM 优化的相对误差,且GA-NN 优化结果高于RSM优化方法,表明GA-NN 优化结果更加可信,证明用该方法进行优化醇提龙牙百合中的总黄酮是可行的。

3 结论与讨论

探讨醇提龙牙百合黄酮的文献较多[8-10],但多为正交试验优化。正交试验仅从所进行的试验点中寻找最优值,因此,所得的结果可能与实际上的最优值相差甚远,与正交试验相比,基于Box-Behnken 原理建立的RSM 试验是采用多元二次回归方程来拟合因素与响应值的函数关系,其建模与寻优能力在正交设计之上,但极度依赖于所得的方程,且忽略了多项式阶数的影响,因此在高阶多项式影响情况较大的时候,就会导致相对偏差过大的现象,难以找出准确的区域面[31-32]。ANN 是通过构建数据正向传播和误差的负向反馈的循环,将输出值与期望输出值之间的误差平方和降到最低的方法,GA 则是一种通过模拟自然界生物自适应过程的算法,采用物竞天择的规则,通过适应度来评估个体的生存能力,使得其中优秀个体得以保留,遗传至下一代,直到迭代结束[33]。ANN 结合GA 是将均方误差函数作为适应度函数,将两者的评估标准融为一体,可以提高网络优化性能。该法优化不依赖于一个明确的函数表达式,ANN 通过局部寻优可以减少GA 的搜索空间、提高搜索效率;GA 则反复优化网络的权值,直到平均值不再显著增加为止。此时解码得到的参数组合已经充分接近最佳,再用ANN 寻优,搜索出最优解。该法具有优秀的非线性模拟能力和非鲁棒性,并且建模与寻优过程可以利用数据可视化技术以直观的图表展现出来[34-35]。

中药的化学成分具有多样性、复杂性,提取亦是非线性的拟合过程,基于二次回归方程的预测显示了模拟结果的R2为0.9554,表明模拟效果较为准确。GANN 采用的全局性的非线性拟合,其模拟结果的R2高达0.994 7,表明其建模能力比RSM 建模能力更加优秀。这也说明醇提龙牙百合总黄酮含量的非线性较强,RSM 拟合效果不如GA-NN,这与ANN 在其它方面的应用结果相吻合[36-38]。尽管本文GA-NN 优化结果仅比RSM 结果值大1.15%,优化结果并不显著,但依旧表明该法具有可行性。因为GA-NN 在优化过程中并不需要增加额外试验,方法较为简单,这与MOZAMMEL等、SALILA 等和DHUPAL 等[39-41]试验方法类似,都是在RSM 的试验数据上进行优化,将RSM 作为GA-NN目标函数的粗糙二阶模型,最终均在优化中取得了较好的结果。在模型的预测结果对比中可知,GA-NN 的RMSE、MAPE 值均低于RSM,因此可以认为GA-NN已对RSM 的二阶模型进一步优化。因此最终采用GA-NN 优化得到龙牙百合粉醇提总黄酮的最佳工艺条件:提取时间50 min、乙醇体积分数53%、液固比43∶1(mL/g)、提取温度73 ℃。该条件下得总黄酮含量为47.17 mg/g。表明,GA-NN 能够优化提取工艺,具有较好的成效,且在解决非线性较强模型的建立及模型参数的优化问题上有相应的优势,可作进一步研究。

猜你喜欢

液固比百合黄酮
赤泥提铝尾渣酸浸提钛的试验研究
不同桑品种黄酮含量测定
桑黄黄酮的研究进展
风吹百合香
两段酸浸法浸出铜烟尘中的铜锌铟①
清心消暑话百合
HPLC法同时测定固本补肾口服液中3种黄酮
精细化控制提高重介旋流器分选效率的研究
DAD-HPLC法同时测定龙须藤总黄酮中5种多甲氧基黄酮
百合依依