基于BP神经网络的纤维性根茎药材超滤总皂苷保留率预测模型
2016-09-10王继龙刘晓霞魏舒畅范凌云
王继龙,刘晓霞,魏舒畅,柳 春,金 辉,范凌云
(甘肃中医药大学,甘肃兰州 730000)
基于BP神经网络的纤维性根茎药材超滤总皂苷保留率预测模型
王继龙,刘晓霞,魏舒畅*,柳春,金辉,范凌云
(甘肃中医药大学,甘肃兰州 730000)
为了建立纤维性根茎药材超滤的总皂苷保留率预测模型,避免超滤技术在用于同类药材时需重复优化工艺的问题,以红芪超滤数据为基础,采用Levenberg-Marquardt(LM)算法优化后的BP神经网络(LM-BP神经网络)构建总皂苷保留率预测模型,对模型的预测性能及其对黄芪、甘草的适用性进行考察,并利用连接权值计算输入变量对输出变量的相对贡献率。结果表明,该模型具有良好的预测精度和适用性,对红芪、黄芪和甘草总皂苷保留率预测的平均绝对误差和平均误差率分别为1.10%、1.28%、1.52%和1.48%、1.95%、2.20%,输入变量的相对贡献率大小为膜孔径>压力>温度。该研究可为超滤和智能算法在中药领域的应用提供有益参考。
红芪,黄芪,甘草,总皂苷,超滤,BP神经网络
分离纯化是中药生产过程的共性关键技术环节,超滤是一种可通过错流过滤方式对分子量大小不同的物质进行分离的新技术,因过滤精度高、环保、适合工业化生产等特点而在中药提取液的纯化中显示出独特的优越性[1]。但由于中药水提液是一个复杂体系,其超滤过程为非线性系统,加之基础研究不足,目前该技术在用于每种药材的纯化时需对工艺进行逐一优化,不但延长了工艺研究周期,而且浪费人力物力。因此建立质地和成分相近的同类药材的超滤工艺预测模型具有十分重要的意义。
人工神经网络(ANN,Artificial Neural Network)是通过抽象和模拟生物神经网络的结构与功能,对连续的输入做出状态响应的动态信息处理系统,具有良好的自组织、自适应、自学习的非线性映射能力以及高度的容错性和稳健性,其中以BP神经网络的使用最为广泛。目前,BP神经网络已在中药材鉴定、剂型处方筛选、生产工艺优化及预测、药物构效关系数据分析等方面有所应用[2-6]。
本文以纤维性较强的甘肃道地药材红芪、黄芪和甘草(均为药食两用或保健中药)为建模和验证药材,通过收集其超滤数据,建立适用于纤维性根茎药材超滤的总皂苷保留率BP神经网络预测模型,以期为超滤技术在中药分离纯化领域的应用推广提供参考。
1 材料与方法
1.1材料与仪器
红芪、黄芪、甘草采于甘肃省武都区,均为药典收载品种;纤维素酶、木聚糖酶、果胶酶甘肃华羚生物科技有限公司,比活力分别为1.4×106、1.0×107、1.5×105U·g-1;水超纯水;其余试剂分析纯。
SJM-FHM-02型多通道管状陶瓷复合膜分离设备、SJM-DGN-030型多功能膜分离设备合肥世杰膜工程有限责任公司;UV Blue Star B型紫外-可见分光光度计北京莱伯泰科仪器有限公司;ABT100-5M电子天平德国KERN公司;AKRY-UP-1816超纯水机成都唐氏康宁科技发展有限公司;DK-98-ⅡA型电热恒温水浴锅天津市泰斯特仪器有限公司;1835型乌式黏度计上海笛柏化学品技术有限公司;PB-10型pH计德国Sartorius公司。
1.2实验方法
1.2.1红芪药材的提取为提高成分提取率,采用复合酶(质量比为纤维素酶∶木聚糖酶∶果胶酶=1∶2∶2)按文献[7]方法对红芪饮片进行酶解提取,酶解液离心(4000 r·min-1,10 min)处理后取上清,备用。
1.2.2料液的超滤由于膜组件在临界压力或通量以下运行可避免膜污染的形成,降低工艺成本,提高生产效率,因此超滤前首先测定上清液的浓度、运动黏度及pH,利用临界压力预测模型计算不同温度和膜孔径下料液超滤时的临界压力值,然后分别在临界压力以下按膜孔径(10、50、100 nm)、压力(0.09~0.16 MPa)和温度(20~45 ℃)的各种参数组合进行超滤,收集对应的超滤液,备用。
1.2.3总皂苷的含量测定及保留率计算分别将酶解液上清和超滤液浓缩(药液比1∶4),依文献[7]方法制备总皂苷样品,采用差示比色法[8]测定总皂苷含量,并按下式计算总皂苷保留率:
总皂苷保留率(%)=超滤液中总皂苷含量/超滤前酶解液中总皂苷含量×100
1.2.4输入变量的确定影响超滤的因素较多,包括膜孔径、操作压强、滤过温度、药液的浓度、黏度、pH及离子强度等。由于神经网络的输入变量数越多,网络的结构就越复杂,训练速度越慢。鉴于中药提取液的离子强度变化有限,且药液的浓度、黏度和pH等可通过上述临界压力预测得到较好的控制,因此选取超滤操作过程中的主要控制参数膜孔径、压力、温度作为输入变量,总皂苷保留率作为输出变量。
1.2.5数据分组及预处理将收集到的总皂苷保留率数据随机分为训练组(n=50)和检验组(n=10)。由于各因素具有不同的量纲,为了加快网络的学习速度,更好地反映各因素之间的相互关系,训练前需将样本数据归一化至(0.1,0.9)区间内,即:xn=0.1+0.8(x-xmin)/(xmax-xmin),式中,xn为归一化数据,x为原始数据,xmax和xmin分别为原始数据的最大值和最小值。
1.2.6网络结构的确定理论已证实一个3层(有1个隐含层)的BP神经网络可以逼近任意映射关系[9],因此采用3层BP网络。BP网络隐含层节点数对网络的预测性能有直接影响[10],其数目由输入、输出层节点数及训练样本所蕴含规律的复杂程度等多种因素共同决定,计算公式为m=(l+n)1/2+a(式中,l和n分别代表输入和输出层节点数,a为1~10之间的常数),然后采用节点扩张法确定最佳隐含层节点数:已知输入层和输出层节点数分别为3和1,可计算得出隐含层节点数的整数区间为3~12,先取最小的节点数对网络性能进行测试,然后逐渐增加节点数,直到测得网络的逼近误差不再有明显的减小且收敛速度较快时为止。
1.2.7网络训练本文利用Matlab7.2的BP神经网络工具箱对网络进行训练,隐含层和输出层传递函数均设为logsig。为了克服传统BP算法存在的收敛速度慢、学习精度低等缺点,训练函数设为LM-BP算法对应的trainlm。最大训练次数设为1000次,学习率为0.01,目标误差为0.001。
1.2.8贡献率的计算采用Garson[11]方法,利用连接权计算神经网络输入变量的相对贡献率,其表达式为:
式(1)
式(2)
式中,Si、RIi分别为第i个输入对第k个输出的绝对贡献和相对贡献大小;Wij、Wjk分别为输入层到隐含层和隐含层到输出层的连接权;i、j、k分别为输入、隐含和输出层的节点序号;l、m、n则分别为各层节点数。
2 结果与分析
2.1网络结构和训练结果
当隐含层节点数为6时,网络的收敛速度最快,逼近误差较小,因此将隐含层节点数选为6,BP神经网络的结构最终为3-6-1(图1)。网络在经过189次训练后其输出误差为0.00099,小于0.001,达到了设定的误差要求并停止训练(图2)。
图1 BP神经网络结构图Fig.1 Structure diagram of BP neural network
图2 误差收敛曲线Fig.2 Convergent curve of error
2.2贡献率定量分析
由于神经网络建模具有“黑箱”特性,无法科学解释输入变量对输出变量的重要程度,因此本文利用训练好的神经网络的连接权值(表1)来计算输入变量的相对贡献率(表2),不但有利于最佳超滤条件的选择,而且可找出模型中存在的冗余变量,便于约简模型。由表2可知,膜孔径的相对贡献率最高,其次是压力,温度的最低,但也达到了11.36%,对输出也有较大影响,表明所选的这3个变量代表性较好,可将其确定为模型的最终输入变量。
表2 输入变量对输出的相对贡献率
表1 连接权矩阵
表3 预测值与测定值结果
图3 模型预测输出Fig.3 Predicted output of
图4 模型预测误差Fig.4 Predicted error of BP neural network
2.3模型检验结果
为了检验BP神经网络模型的模拟能力,利用预留的检验组数据对总皂苷保留率进行模拟。结果发现,尽管有局部的高估或低估现象存在,但总体上预测输出与期望输出十分接近(图3)。误差分析结果(图4)显示,模拟的平均绝对误差和平均误差率分别为和1.10%和1.48%,表明模型的模拟精度和适用性较高。
2.4模型适用性考察
为了考察BP神经网络模型对同类药材的适用性,选择甘肃大宗道地药材黄芪和甘草进行考察。将按文献[12-13]提取工艺制得的黄芪和甘草提取液在临界压力以下进行超滤,分别测定不同条件下的总皂苷保留率,并用上述神经网络计算对应的预测值(表3)。结果显示,利用神经网络计算所得黄芪和甘草总皂苷保留率的预测值与实验测定值的吻合性均较好,模拟的平均绝对误差分别为1.28%和1.52%,平均误差率分别为1.95%和2.20%,说明该BP神经网络模型对建模药材红芪以外的同类其他药材具有较高的模拟精度和适用性。
3 结论
通过建立人工神经网络预测模型,对纤维性根茎药材超滤的总皂苷保留率进行预测。研究结果表明,建立的3层结构BP神经网络的预测精度和适用性较好,对于红芪、黄芪和甘草超滤的总皂苷保留率预测的平均误差率分别为1.48%、1.95%和2.20%。该模型的建立将有助于避免对同一类药材超滤工艺的逐一优化,缩短工艺研究周期,节约大量的人力物力,对于膜分离技术及现代信息技术在中药行业的推广应用具有一定参考价值。同时通过大量实验得到的红芪精制工艺资料,可为高品质药品及精加工功能食品的生产提供有力的技术支持。
[1]郭立玮.中药制药工业对膜科学技术的重大需求与关键问题[J].中草药,2009,40(12):1849-1855.
[2]杨诗龙,王瑾,汪云伟,等.基于电子鼻与人工神经网络的陈皮鉴别研究[J].时珍国医国药,2015,26(1):112-114.
[3]李玲,李时凤,何宇新.基于人工神经网络的白芷总香豆素缓释片处方筛选研究[J].中药材,2014,37(5):875-880.
[4]张超,韩丽,杨秀梅,等.BP神经网络结合正交实验优化苦参方中荆芥挥发油的提取工艺[J].中成药,2015,37(1):70-74.
[5]柳春,刘晓霞,魏舒畅,等.基于红芪芒柄花素保留率建立纤维性根茎药材超滤预测模型[J].天然产物研究与开发,2015,27(9):1550-1553.
[6]胡律江,郭慧玲,曾辉,等.基于BP-ANN模型的香附效应成分筛选[J].中国实验方剂学杂志,2013,19(22):27-30.
[7]王继龙,陈方圆,魏舒畅,等.二次通用旋转组合设计优化红芪中芒柄花素和总皂苷的酶解提取工艺[J].中成药,2015,37(9):1926-1931.
[8]陈方圆,闫治攀,魏舒畅,等.差示比色法测定红芪总皂苷含量的方法研究[J].时珍国医国药,2014,25(6):1305-1307.
[9]Robert H N.Theory of the back propagation neural network[D].International Joint Conference on Neural Networks,1989:593-605.
[10]Moody J O,Antsaklis P J.The dependence identification neural network construction algorithm[J].IEEE Transactions on Neural Network,1996,7(1):3-15.
[11]Garson G D.Interpreting neural-network connection weights[J].AI Expert,1991,6(4):46-51.
[12]包旭宏,王继龙,魏舒畅,等.二次通用旋转组合法优化黄芪中毛蕊异黄酮苷和芒柄花素的酶解提取工艺[J].中草药,2014,45(18):2641-2646.
[13]朱中佳,熊富良,张雪琼,等.甘草总皂苷的提取纯化工艺研究[J].中成药,2011,33(2):341-343.
Total saponins retention rate prediction model of ultrafiltration for fibrous rhizome herbs based on BP neural network
WANG Ji-long,LIU Xiao-xia,WEI Shu-chang*,LIU Chun,JIN Hui,FAN Ling-yun
(Gansu University of Chinese Medicine,Lanzhou 730000,China)
The objective of this study was to establish the total saponins retention rate prediction model of ultrafiltration for fibrous rhizome herbs. It could avoid optimizing ultrafiltration technology of similar herbs repeatedly. The model was established based on the ultrafiltration data ofHedysariRadixby Levenberg-Marquardt(LM)arithmetic combining BP neural network. The performance and applicability of the improved LM-BP neural network model were evaluated. Then the relative importance of input variables were assessed using the connection weights of the model. Results showed that the model had the better accuracy and applicability. The mean absolute error forHedysariRadix,AstragaliRadixandGlycyrrhizauralensiswas 1.10%,1.28% and 1.52%,respectively. Mean error rate was 1.48%,1.95% and 2.20%,respectively. The relative contribution of input variables to retention rate presented the order of membrane pore size>pressure>temperature. The study could provide a useful reference for the application of ultrafiltration and intelligence algorithm in Chinese medicine industry.
HedysariRadix;AstragaliRadix;Glycyrrhizauralensis;total saponins;ultrafiltration;BP neural network
2015-11-29
王继龙(1986-),男,硕士,助教,研究方向:中药制剂工艺,E-mail:drake1520@163.com。
魏舒畅(1969-),男,教授,研究方向:中药制剂新剂型与新技术,E-mail:wshch006@sina.com。
国家自然科学基金资助项目(81060345,81460608);甘肃省基础研究创新群体项目(1506RJA034)。
TS218
A
1002-0306(2016)12-0085-04
10.13386/j.issn1002-0306.2016.12.008