APP下载

基于NSGA-Ⅱ算法多目标优化川芎提取工艺研究*

2018-10-30高卫红吕莉莉赖小波

中国中医急症 2018年10期
关键词:藁本川芎内酯

高卫红 石 磊 吕莉莉 赖小波

(浙江中医药大学医学技术学院,浙江 杭州 310053)

川芎是一味常用的活血化瘀中药,为伞形科植物川芎Ligusticum chuanxiong Hort的干燥根茎,记载于《神农本草经》中,并被列为上品[1-3]。 其微苦、性温、味辛,因此常用于治疗胀痛、胁痛及头痛中,临床上也用于治疗心脑血管类疾病和风湿痹痛。其主要有理气止痛、活血化瘀、扩张血管、抗血栓、镇静、解痉及降压等作用[4]。川芎因其独特而广泛的药用价值越来越多地引起了众多中药学科研人员的注意,成为中草药研究中的一大热点中药[5]。据文献记载,川芎主要包含3类活性有效成分,分别为挥发油类物质(以藁本内酯为代表)、酚酸类化合物(以阿魏酸为代表)和生物碱(以川芎嗪为代表)[6]。这3类成分在镇静、镇痛、解痉平喘等方面均显示出很好的生理活性[7]。其中,阿魏酸在碱性环境下非常不稳定,见光易分解,在酸性环境下能抑制其不稳定性的发生[8]。纯品的藁本内酯在室温下极其不稳定,易挥发,并伴随水解、脱氢、降解、氧化等多种化学反应[9]。综上所述,川芎中含有的阿魏酸及藁本内酯稳定性均较差,为后续的进一步提取带来了诸多困难,因此选用合适的提取条件尽可能提高川芎中有效成分的含量从而提高其稳定性显得极为重要。

研究人员在对药物中的有效成分含量进行最佳条件的优化选择时,大多会安排如正交[10]、均匀[11]或者响应面试验设计[12],一般采用某个成分的含量作为对试验效果的总体评价指标。但当需要考察评价的指标不止一个时,则属于对多个目标同时进行优化的多目标问题。以往在优化过程中都会将多个目标进行相加或者加权获得一个综合性的评价指标,而在这些处理方法上人为主观因素较强,因为将多目标转换为单目标,最后可能在一个目标上达到了最优,而其他一个或几个却达到了最差。其实在多目标优化过程中,是将各个子目标的值进行折中处理,对每个目标都进行了平衡,使每个目标都尽可能地达到最优[13]。带有精英策略的快速非支配排序遗传算法(NSGA-Ⅱ)作为目前最为流行的多目标优化算法之一,不仅运行速度快,而且解集的收敛性较好。

本文采用甲醇回流法对川芎进行提取,以阿魏酸以及藁本内酯的得率作为考察评价指标,首先选用均匀设计试验探究影响含量的甲醇体积分数、物料比、提取时间3个因素,然后利用均匀设计获得的数据拟合BP神经网络模型参数,并结合NSGA-Ⅱ算法多目标寻优川芎提取工艺,以期提高川芎有效组分的得率。

1 均匀设计试验

均匀设计又被称之为均匀设计试验法,它考虑了所需试验点在整个实验范围之内的均匀分散,是一种在试验范围内挑选出具有代表性的点的方法 。本研究采用U10(108)均匀设计法,以提取溶剂甲醇的浓度(A)、物料比(B)及提取所需时间(C)为影响因素,考察其对阿魏酸及藁本内酯含量的影响。共3个因素,每个因素5个水平,甲醇浓度水平分别为20%、40%、60%、80%、100%, 物料比水平分别为 20、45、70、95、120 倍,提取时间水平分别为 3、11、19、27、35 min。 采用高效液相测定均匀设计各试验组的阿魏酸及藁本内酯得率,色谱条件:色谱柱Kromasil 100-5 C18(250 mm×4.6 mm,5 μm);洗脱相:乙腈(A)-水(B)梯度洗脱(0~5 min,10%~40%A;5~10 min,40%A;10~15 min,40%~100%A;15~20 min,100%A);检测波长:320 nm,柱温:30 ℃,流速:1.0 mL/min,进样量 5 μL[14]。 结果见表1。

表1 均匀设计试验的阿魏酸及藁本内酯得率

2 数据拟合

2.1 非线性模型拟合 阿魏酸及藁本内酯的非线性逐步回归结果如表2~表5所示。阿魏酸的非线性相关系数为 R=0.964,测定系数 R=0.929,F=45.553>显著水平下临界值 F(Significance F),线性可信;通过表可知,阿魏酸得率非线性回归方程为:得率y1=2.813-2.271X12+0.041 X1X2。藁本内酯线性相关系数为R=0.946,测定系数R=0.895,F=29.825>显著水平下临界值F(Significance F),线性可信;通过表可知,藁本内酯得率线性回归方程为:得率y2=10.785-3.297E-4X32+0.14 X1X3。

表2 阿魏酸得率回归统计

表3 阿魏酸得率方差分析

表4 藁本内酯得率回归统计

表5 藁本内酯得率方差分析

2.2 BP神经网络拟合 BP(back propagation)神经网络作为一种误差反向传播的神经网络,是一种应用较为广泛的神经网络模型。多用于模型识别与分类、时间序列预测、函数逼近及数据压缩当中,通过对样本数据进行训练,网络的权值和阈值不断被修正,从而使误差函数沿着负梯度的方向下降,逐步往期望输出逼近。BP神经网络是由输入层、隐含层以及输出层组成,隐含层可以有一层或多层,使用最多的为3层的BP网络,其结构也最为简单,如图1所示。

图1 BP神经网络结构图

2.3 BP神经网络模型构建 根据考察因素分别建立阿魏酸及藁本内酯相应的BP神经网络模型,设置网络系统的输入层为3个,即甲醇的体积分数、提取时间及物料比,输出层节点设为1个,即阿魏酸或藁本内酯的含量作为输出指标,采用试凑法设置阿魏酸隐藏层节点数为5个,藁本内酯隐藏层节点数为2个。通过设定如下参数对均匀设计的10组数据进行训练,隐藏层及输出层的传递函数分别为tansig(双曲正切传递函数)及purelin(线性传递函数),训练函数选用trainlm,即Levenberg-Marquardt法;该方法梯度下降法与牛顿法的结合,相对于其他的训练函数,其优点为当网络的权值比较少的时候,显示其精度高,迭代步数少、收敛速度快的优点。在训练过程中,达到收敛的目标精度设为0.01,最大迭代步数设为200步,用MSE均方误差来评估BP神经网络模型最终性能。程序编写选用的MATLAB版本为MATLAB2009a,其自带BP神经网络工具箱,其他的参数全部使用工具箱默认的缺省值。通过将数据进行测试分析之后,阿魏酸及藁本内酯拟合的相关系数分别为0.99899和0.99544,训练曲线分别如图2、图3所示。

图2 阿魏酸训练曲线图

图3 藁本内酯训练曲线图

因此通过训练后的BP神经网络模型均能达到较好的拟合效果及预测能力,适用于阿魏酸及藁本内酯得率的预测,将通过网络模型预测得到的数据反归一化之后得到的结果与线性回归所得结果相比较,如表6~表7所示。

表6 阿魏酸得率人工神经网络和多元回归的拟合结果

表7 藁本内酯得率人工神经网络和多元回归的拟合结果

3 NSGA-Ⅱ算法多目标优化

在数学描述上要对一个问题进行多目标优化,由3部分组成,分别为优化的约束条件、目标函数(因变量)以及使用到的决策变量(自变量)。即当所求的目标函数相互冲突时,在一定的可行域范围之内,确定一组由决策变量所组成的向量,使其对应的一系列目标函数值尽可能同时达到最大或者最小。优化概念的数学表达式如式(14)到式(18)所示,用 x表示决策变量,D表示其维度,简单可以理解为变量个数,f(x)为目标函数,N为需要优化目标的总个数,fn(x)为第n个需要优化的目标函数;g(x)和 h(x)为不等式的约束条件,K和M为约束项数,xd_min和xd_max分别为决策变量的上下限值[15]。

3.1 NSGA-Ⅱ算法 NSGA-Ⅱ是当前大多数多目标优化算法之中比较优秀的算法之一,被广泛应用于多目标优化领域之中。它是Deb等在2002年提出的一种对NSGA算法进行优化改进后的算法。具体的算法流程原理图如图4所示。

图4 NSGA-Ⅱ算法流程图

3.2 采用NSGA-Ⅱ算法对已经建立的BP人工神经网络模型进行多目标寻优 本文采用MATLAB自带的函数Gamultiobj,它是基于NSGA-Ⅱ算法的一种多目标优化函数,每个个体的拥挤度距离值及非劣级别根据拥挤度比较算子进行计算,然后产生相应的偏序排序的结果,其中,锦标赛法被用来对个体进行选择,使用了精英策略中的保留机制对采样的空间进行扩大[15-16]。

本文设置ParetoFraction即最优前端个体的系数为 0.3,PopulationSize 即种群大小为 100,Generations即最大进化代数为200,StallGenLimit即停止代数为200,TolFun即适应度函数的偏差为1e-10。运行程序后得到的川芎最佳提取条件为甲醇浓度68.4090%,液料比为119.6076倍,提取时间为34.9116 min,阿魏酸及藁本内酯的预测值分别为2.8347、17.0428 mg/g。通过综合分析并且根据实际情况考虑,采用液料比为120倍的体积分数为70%的甲醇回流提取35 min。根据得到的最优提取条件进行验证试验,实际川芎提取中阿魏酸及藁本内酯的得率分别为2.7340、17.3774 mg/g(n=3),实际值与预测的偏差分别为3.68%、1.93%。

4 讨 论

川芎中阿魏酸及藁本内酯常用的提取方法为水蒸气蒸馏法、超临界流体萃取法、大孔树脂分离法、醇提法及超声辅助提取法。水蒸气蒸馏法由于对提取物的长时间加热操作,在提取过程中一些热敏性物质容易因发生聚合或氧化反应导致变性。超临界萃取法因其提取温度低,过程温和,能够最大限度地保留极易氧化及对热不稳定的挥发性物质成分,已逐渐开始应用于中药有效成分的提取,但因其操作压力较高,设备成本投资较大等问题,还尚未应用于川芎有效成分的提取[5]。不同的提取方法存在不同利弊,本实验通过选用阿魏酸及藁本内酯含量作为测定指标,为保证各成分提取含量达到最大,因此最终选用甲醇进行回流提取。

众所周知,中药的成分一般来说都较为复杂,因此,在提取过程中往往是多指标的,由于影响提取含量的因素不止一个,因此一般都采用多因素多水平的试验设计,使用较多的设计方案有均匀设计、正交设计、因子设计及层次分析联合Box Behnken效应面设计,均为经济、快速且效率高的实验设计方法,主要原理均为在全面的试验过程中,选取出一些代表性较强的试验点进行实验,通过算法对这些点进行组合后,利用多项式或者均值模型对得到的结果进行分析,通常都是采用线性拟合或者非线性拟合规划的方法进行优化,但个别试验设计采用多项式进行模型拟合后效果较差或者均值模型并不适用。由于需要考察的指标不再为单个,因此如何建立各个指标间的相互关系成为一大难题。目前来看,在多目标优化的过程中,通常是将各个需要考察的指标进行加权,即为每个指标分配一个权重,通过权值的相加从而将多目标优化问题转换为单目标优化,综合评分法是在中药提取中常用到的方法,但是其每个指标的权重系数往往较难确定,一般都是专家根据各个成分的重要性进行评分,因此人为的主观因素较强,存在不合理性,不同专家给出的权重系数差别较大,综合评分后的指标也并不相同,随机性大。本实验为川芎成分的多目标优化,并未对阿魏酸及藁本内酯赋予权重系数,因此和单目标优化相比,其更具有效、准确及全面性,也对应了中药具有多成分、多作用的特点[17]。而NSGA-Ⅱ算法根据种群的进化得出Pareto最优解,该方法较为客观,并且排除了人为因素对整个实验的干扰。与NSGA相比较来说,NSGA-Ⅱ具有以下3大优点:第一,原NSGA算法的计算量为量级,而NSGA-Ⅱ通过一种基于新的快速非支配排序(基于分级处理)的方法,成功将计算量降低为量级,其中,M代表了优化过程中需要优化的目标的数量,即目标函数的个数,Np表示在整个种群中个体的数目。第二,NSGA算法中采用了适应度共享的方法 ,而在NSGA-Ⅱ算法中则替换了此方法,提出种群个体之前拥挤距离的概念,不仅能保证得到的Pareto最优解在前端具有良好的分布性,且通过计算种群内部个体之间的拥挤距离来比较经快速非支配排序的操作以后的处于同序值的个体之间的好坏优劣。第三,NSGA-Ⅱ算法引入了竞争的概念,它会将父代个体与子代个体进行合并操作,生成一个全新的种群,再经快速非支配排序操作及计算出拥挤距离,并对新生成的种群进行修剪,使子父代个体在同一个种群中进行竞争,从而产生下一代的新个体及种群,是一种较为新型的精英保留策略,通过这种策略,可保证种群中的优秀个体能一直延续下去,且加快了种群进化的速度。

BP神经网络作为一种智能系统,能够有效地模拟人脑中各个组织之间的结构,实现人脑的运转机制,其具有自适应、自组织的特点,因其具有自学习的能力,可进行函数逼近,在复杂的非线性研究领域中已被广泛使用,是一种在复杂问题中较为有效、简便的方法。其较为强大的拟合以及预测能力,相对于使用回归拟合的正交试验及中心复合试验,它能够在一定范围内找出所需的最优值,大大减少实验次数且获取的条件更加准确可行[18]。目前,大多数研究者仍然使用传统的优化方法优化中药提取工艺,而利用BP神经网络结合NSGA-Ⅱ算法优化提取工艺还有待于进一步深入研究。

本文为研究NSGA-Ⅱ算法应用于川芎提取优化是否可行的探究性实验,为简化实验操作,仅取0.5 g川芎细粉,因此溶剂倍数较大,若用于工业放大,从经济角度考虑物料比一般不超过15倍。本文所采用的方法能对所有的影响因素进行寻优操作,可以获得较为满意的Pareto非劣解方案,且免去了数学建模的操作,但是仍然存在一些不足之处。首先是对神经网络模型其参数的选择,因并没有较为成熟的理论方法能够对网络模型进行构造,因此只能采用的学习的方法来获得令人较为满意的模型。本文选用的方法为试错法,隐藏层选择为一层,刚开始采用较少的隐藏层节点数,然后逐步增加节点数,本文之前采用的是十折交叉验证的方式选取隐藏层的节点个数以防止过拟合的情况出现,然而根据十折交叉验证选取的隐藏层节点个数因为太大,使得遗产算法无法收敛,因此只能通过试错法调试至令人满意的性能为止。其次,均匀设计试验次数较少,因此样本数并不多,且实验过程中试剂的量取,溶剂的配制等必然存在误差,也使最后验证值与理论值有一定差异,理论上来说,如果用于训练的样本数据较多,其拟合的效果越好,模型的建立更加准确,因此本实验中仍出现了过拟合的现象,随机生成的个别样本预测并不准确,当然,样本数量如果越多,拟合过程中产生的噪音也越大,反而不会取得较为满意的效果。因此,本文结合BP神经网络和NSGA-Ⅱ算法多目标优化川芎提取的最佳条件,提高川芎有效组分的得率,可为中药提取多成分多目标的工艺研究提供一定理论指导和借鉴。

猜你喜欢

藁本川芎内酯
基于HPLC指纹图谱和多成分含量测定的辽藁本质量评价研究
川芎的研究进展及质量标志物(Q-marker)的预测分析
辽藁本药材与饮片指纹图谱对比研究
芸苔素内酯与吡唑醚菌酯在小麦上的应用技术
不同基原藁本药材的指纹图谱建立及其化学计量学分析
辽藁本的栽培技术
川芎茶调散治疗耳鼻喉科疾病举隅
芸苔素内酯与吡唑醚菌酯在玉米上的应用技术
穿心莲内酯滴丸
大川芎方多组分制剂释药特性的评价