基于GA-BP人工神经网络的红霉素肠溶片效价预测研究
2022-06-07武建卓彭洁王婷婷李雪
武建卓,彭洁,王婷婷,李雪
(广东省药品检验所,国家药品监督管理局药品快速检验技术重点实验室,广东 广州 510663)
红霉素为大环内酯类多组分抗生素,目前评价其质量的关键项目含量测定的基本方法是微生物检定法。该法存在操作步骤多,试验过程长,影响结果的人为因素多等缺点。多组分抗生素不同组分生物活性存在差异,且各组分之间的活性存在协同或拮抗等情况,组效之间是非线性关系,不能简单用组分含量等理化测定结果来准确表征药品质量[1]。为此,引入GA-BP神经网络,对多组分抗生素的高度非线性化学成分表征信息和效价进行处理,综合运用模式识别技术中的各种计算方法和手段才可能有效地解决多组分抗生素质量评价难题,实现基于仪器分析数据之上的多组分抗生素质量智能辨识与评价,以期替代传统的微生物检定法。
遗传算法(GA)是模拟自然演化过程搜索全局最优解的方法,它的群体性搜索策略使其不易陷入局部最优,而且其定义域可以任意设定,使得遗传算法的应用范围大大扩展,方便与其他算法相结合。BP神经网络算法本质上为梯度下降法,所以容易陷入局部最优。鉴于遗传算法的优点和BP 网络存在的缺陷,本文将两者结合使用,利用遗传算法不易陷入局部最优的特性,补偿BP神经网络梯度下降易于陷入局部最优的缺陷[2]。
本试验收集了红霉素肠溶片的组分测定和效价测定数据,采用GA-BP人工神经网络技术建立模型,对网络模型进行学习后对红霉素肠溶片效价进行预测,并对预测准确度进行了研究,本试验利用Python 编程软件实现。
1 仪器与试药
1.1 仪器 Shimadzulc-20AT液相色谱仪;Agilent 1260高效液相色谱仪;ZY300-IV抑菌圈测量仪;C2933隔水式培养箱。
1.2 试药 红霉素标准品(批号:130307-201417)与红霉素系统适用性对照品(批号:130670-201501)由中国食品药品检定研究院提供;红霉素杂质A、红霉素杂质B、红霉素杂质C、红霉素杂质D、红霉素杂质E与红霉素杂质F对照品由Toronto Research Chemicals Inc提供;红霉素B与红霉素C为《欧洲药典》(EP)对照品;甲醇与乙腈为色谱纯,由Honeywell International Inc提供;水为超纯水,其余试剂均为分析纯。
本试验总共测定了552批次的红霉素肠溶片样品,其中235批次红霉素肠溶片来自2012年国家评价性抽验,涉及的生产企业37个,涉及批准文号数38个,原料药来自红霉素5个主流原料生产厂的原料;317批次红霉素肠溶片来自2017年国家评价性抽验,涉及的生产企业28个,涉及批准文号数28个,原料药来自红霉素3个主流原料生产厂的原料。
2 方法与结果
2.1 红霉素肠溶片组分测定[3]按照《中国药典》2020年版(二部)红霉素项下“红霉素组分”条件测定,按扣除辅料峰外峰面积归一化法计算供试品中红霉素组分A、红霉素组分B、红霉素组分C、杂质A、杂质B、杂质C、杂质D、杂质E、杂质F和总杂质的百分含量。图谱见图1~2。
图1 系统适用性图谱
图2 供试品图谱
2.2 红霉素肠溶片效价测定 参照《中国药典》2020年版(二部)附录抗生素微生物检定法进行测定。
2.3 GA-BP人工神经网络的构模、训练和预测
2.3.1 BP网络的结构设计 根据红霉素肠溶片组分含量来推断其效价,类似于天然药物定量组效关系的研究,适合采用GA-BP人工神经网络实现较准确的定量预测[4]。网络结构的设计包括确定输入与输出层的节点数目、隐层的数目、每个隐层节点的数目。根据红霉素肠溶片组分测定数据集,选择红霉素组分A、红霉素组分B、红霉素组分C、杂质A、杂质B、杂质C、杂质D、杂质E、杂质F和总杂质共10个变量因素作为网络的输入数据,以抗生素微生物检定法测得的效价作为网络的输出数据。根据Kolmogorov定理,三层BP网络充分学习后能逼近任何函数,因此构建三层结构的BP神经网络。隐含节点数的确定有很多经验法则,本文取2n+1个的隐含层结点数,其中n为输入层的结点个数。因此这里隐含层结点数为21个。输出层包含1个节点,输出红霉素肠溶片效价[5-8]。
2.3.2 GA-BP人工神经网络的参数设置[9-10]GA初训练参数设置:设置种群规模N=50、交叉概率为0.85、变异概率为0.05、最大进化代数1 000,当最优个体的适应度函数比值E<1.05时训练结束。
BP神经网络参数设置:初训练结束后,改用BP算法进行局部搜索。训练过程中,训练要求精度为0.001、最大失败次数20、学习速率为0.1,最大训练次数1 000,其他参数为默认值,经多次训练直至达到误差限。
2.4 红霉素肠溶片组分测定数据统计情况 本试验共获得552批次红霉素肠溶片测定数据,设置训练组和测试组,其中训练组随机抽取502个批次测定样品数据用于构建模型,测试组则取剩余50个批次测定样品数据用于评价模型的预测能力。对两组数据采用T检验比对各组分含量,结果两组差异无统计学意义,有可比性,结果见表1。
表1 红霉素肠溶片的样本数据统计情况
2.5 红霉素肠溶片效价预测 对测试组的50个批次红霉素肠溶片样品的效价进行预测,并与实际测定效价数据进行比较,检验预测效果。结果预测效价误差百分率最高值为-4.61%,均未超过5%,误差百分率平均值为2.22%,优于一般仪器分析相对标准偏差2.50%,说明模型具有较高的效价预测精度,而且稳定性也较好,因而具有较强的预报能力。结果见表2。
表2 红霉素肠溶片测定效价与预测效价的比较
3 讨论
目前,《中国药典》2020年版应用微生物检定法进行含量测定的抗生素品种仍有84个。由于微生物检定法操作步骤复杂,试验周期长,对操作人员技术熟练度和操作细致度要求高等诸多缺点,采用微生物检定方法进行含量测定的比重正在不断缩小,尤其在《欧洲药典》《英国药典》中HPLC法具有明显的替代趋势。但是由于国内绝大多数多组分抗生素的量效统一工作尚未完成,各化学成分的含量还无法完整的反应药品的内在质量情况,HPLC 法的替代应用还是要审慎进行。
本文针对红霉素类抗生素为多组分抗生素的特点,引入GA-BP神经网络,对多组分抗生素的高度非线性化学成分表征信息和效价进行处理,在多种化学组分与药物效价间建立起定量关系模型,通过预测效价值来评价药品质量,替代传统的微生物检定法,改善多组分抗生素微生物检定法测定中诸多缺陷,提高多组分抗生素的质量控制水平,从实际结果来看,取得了不错的效果。