腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究
2021-01-06张永超徐芳芳赵月梅朱文灯王振中
张永超,徐芳芳,张 欣,徐 冰,赵月梅,朱文灯,吴 云,王振中,肖 伟,
腰痹通胶囊4种中间体粒径的近红外光谱通用定量模型研究
张永超1,徐芳芳2, 3, 4*,张 欣2, 3, 4,徐 冰5,赵月梅2, 3, 4,朱文灯2, 3, 4,吴 云2, 3, 4,王振中2, 3, 4,肖 伟1, 2, 3, 4*
1. 南京中医药大学,江苏 南京 210000 2. 江苏康缘药业股份有限公司,江苏 连云港 222001 3. 中药制药过程新技术国家重点实验室,江苏 连云港 222001 4. 中成药智能制造国家地方联合工程研究中心,江苏 连云港 222001 5. 北京中医药大学,北京 100029
旨在通过近红外光谱(NIRS)信息与腰痹通胶囊(Yaobitong Capsules,YC)中间体中值粒径(50)的关系分析,探讨对该品种生产过程中4种中间体建立50近红外通用定量模型的可行性。采集YC生产过程中的原料细粉、干燥颗粒、整粒颗粒和总混颗粒4种中间体的NIRS,考察不同预处理方法对模型的影响,并采用间隔偏最小二乘法(iPLS)、组合间隔偏最小二乘法(siPLS)和移动窗口偏最小二乘法(mwPLS)优选NIRS波段,采用偏最小二乘法(PLS)对4种中间体建立1个50通用定量模型。通用模型的交叉验证均方根误差(RMSECV)为3.918 μm,预测均方根误差(RMSEP)为2.832 μm,预测相对偏差(RSEP)为2.26%,小于5%,性能偏差比(RPD)为4.60,大于3,该模型可以用于定量测定,且与独立模型比,预测准确性相差不大。NIRS通用定量模型可用于YC 4种中间体50的测定。
腰痹通胶囊;近红外光谱技术;偏最小二乘法;粒径;中值粒径;通用模型
腰痹通胶囊(Yaobitong Capsules,YC)是由三七、川芎、延胡索、白芍、牛膝、狗脊、熟大黄、独活8味中药组成,具有活血化瘀、祛风除湿的功效,主要用于治疗腰椎间盘突出症[1]。颗粒粒径是评价制粒所得颗粒是否合格的关键指标[2-3],并对多个关键质量属性有影响,例如吸湿稳定性[4]、流动性[5]、可压缩性[6]、溶出度[7],它还影响制粒工艺参数的选择[8]及胶囊的填充[9]。在实际生产应用中,中值粒径(50)是评价颗粒粒径的主要指标,50是指粒径分布累积达到50%时对应的粒径值[10-11],它能较准确的反映样本的粒径情况。目前,YC正在进行工艺优化提升质量标准,50拟纳入质量内控标准。
近红外光谱(near infrared spectrum,NIRS)技术与化学计量法结合,能够实现快速检测化学成分含量及物理性质指标,在药材鉴别与化学成分含量快速测定中应用较多[12‑14],但较少用来快速检测物性指标。粒径信息可以通过NIRS基线的变化反映出来[15],已有研究者将NIRS技术用于粒径的快速检测。Rosas等[16]以实验室自制尼美舒利为研究对象,成功开发出NIRS快速检测颗粒粒径分布(<125 μm、125~250 μm、>250 μm)的模型,模型的预测均方根误差(root mean square error of prediction,RMSEP)为2.5%。Otsuka等[17]采用NIRS技术实时监控实验室规模的扑热息痛散流化床制粒过程,建立了颗粒50的快速检测方法,模型的校正集相关系数达0.961。Pauli等[18]开发了3个在线NIRS定量分析方法,用于测定双氯芬酸钠湿法制粒和流化床干燥过程中的颗粒粒径分布,预测值在允许的误差范围内。潘晓宁[19]以党参与玄参药材为研究对象,分别构建了粒径分布累积为10%、50%、90%对应的粒径值(10、50、90)的NIRS定量预测模型。上述研究表明,NIRS技术结合化学计量法是可以测定药物颗粒粒径的,但多数研究都是针对某一类样本进行分析,且都集中于化学药领域。通用模型是指针对某个指标建立一个模型,可以用于分析2种及以上的样本,通用性强,可以节约较多成本。建立一个稳定、可靠的NIRS定量预测模型是一项较为复杂的工作,耗时长且成本高。如果能针对两种及以上的样本建立一个通用的模型,将会提升检测效率,节约成本。本研究以YC生产过程中的4种中间体为研究对象,通过采集4种中间体的近红外漫反射光谱,以中间体50为参考值,采用偏最小二乘法(partial least squares,PLS)建立一个检测4种中间体50的通用方法。
1 仪器与材料
1.1 仪器
Antaris II型傅里叶近红外变换光谱仪,配有积分球漫反射采样系统、Result光谱采集软件,美国Thermo公司;BT-2600激光粒度分布仪,丹东百特仪器有限公司。
1.2 材料
YC生产过程中的中间体,包含原料细粉、干燥颗粒、整粒颗粒和总混颗粒,由江苏康缘药业股份有限公司提供。本研究收集的样品为2019年8月至2020年5月生产的中间体样品,收集到的中间体样品批次为Z190801~Z190820、Z190901~Z190918、Z200301~Z200320、Z200401~Z200420、Z200501~Z200502,包含4种中间体共320个样品。
2 方法
2.1 NIRS采集
取4 g左右样品,置于配备的样品杯里,轻轻压实,采用积分球漫反射方式采集NIRS。扫描范围为10 000~4000 cm−1,分辨率为8 cm−1,2倍增益,扫描次数64次,以空气为背景,每小时扫描1次背景。每个样品扫描3次,平均值用于分析。
2.2 参考值测定
激光粒度分布仪法测粒径代表性强且适用于粒径小的颗粒[10],“1.2”项下的样本粒径小于550 μm,采用该法测粒径结果较为准确。取适量样品置于进料斗中,使用BT-2600激光粒度分布仪测定样品的粒径分布,并计算50(粒径分布累积为50%时对应的粒径值)。参数设置:分散介质为空气,空气压力为0.25 MPa,遮光率为3%~12%。
2.3 光谱预处理方法
采集光谱时,由于受到环境温湿度、仪器状态以及颗粒状态等各种因素的影响,NIRS会产生噪声信号、基线漂移等,获取的光谱中包含了自身的信息以及其他不必要的信号。对NIRS进行合适的预处理,可以减少噪声,滤过无关信息,提高模型稳健性。常见的预处理方法有矢量归一化法、导数法(一阶导数、二阶导数)、平滑法[Savitzky-Golay(SG)平滑、Norris Derivative(ND)平滑]、多元散射校正(multiplicative scatter correction,MSC)、标准正态变量变换法(standard normal variate transformation,SNV)、基线校正以及上述几种方法的结合。矢量归一化法能增强光谱差异,可以校正由光程或样品稀释等导致的光谱变化;MSC和SNV可以消除颗粒大小、分布不匀带来的干扰;导数法可以消除基线漂移;平滑法能够滤除噪声[20-21]。
2.4 数据处理与评价方法
采用Unscramble X 10.4(Camo software AS,Norway)软件对NIRS进行预处理,采用Matlab 2016a(Mathwork Inc.,USA)软件对样本进行变量筛选与建模,采用留一交叉验证法以交叉验证均方根误差(root mean square errors of cross validation,RMSECV)为评价指标确定主因子数。以中间体50为因变量,以对应的NIRS值为自变量建立PLS定量模型。本研究以下列参数来评价模型性能,以优选最佳模型。校正集相关系数(cal)、验证集相关系数(pre)分别表示校正模型与验证模型的拟合程度,cal和pre越大,模型拟合效果越好;校正均方根误差(root mean square errors of calibration,RMSEC)、RMSEP分别指校正模型与验证模型中参考值与预测值之间的均方根误差,越小模型预测性能越高;校正集偏差(BIAScal)和验证集偏差(BIASpre)分别表示校正模型与验证模型中参考值与预测值之间的偏差,其越小,模型预测精度越 高[22-23]。预测相对偏差(relative standard error of prediction,RSEP)是模型中参考值与预测值之间的相对偏差,一般RSEP越小模型预测性能越好;性能偏差比(ratio of performance to deviation,RPD)表示模型预测性能,是标准差(SD)与RMSEP的比值,当RPD>3时,表示模型预测精度高[24]。各项评价参数不能孤立参考,需要综合起来评价。
3 结果与分析
3.1 样本划分
采用随机抽样(random sampling,RS)法划分校正集与验证集,并保证验证集中参考值范围包含于校正集中[12]。每种中间体按照3∶1的比例划分校正集与验证集,随机选取60个样品作为校正集,20个样品作为验证集;通用模型的校正集为4种中间体校正集的总和,共240个样品,验证集为4种中间体验证集的总和,共80个样品,划分结果见表1。
表1 样品校正集与验证集参考方法测定值的统计结果
3.2 光谱预处理方法的选择
YC中间体的近红外原始光谱见图1。本研究考察了以下预处理方法:移动窗口平滑(9点)、SNV、S-G 1st(9点)、基线校正、MSC、归一化法。使用上述方法对光谱进行预处理后,建立50的PLS定量模型,不同预处理方法对模型性能的影响如表2所示。以RPD与RSEP为评价标准,筛选最优的预处理方法。由表2可知,原料细粉模型中,一阶求导结合S-G平滑对光谱进行预处理建模效果最优,RPD为4.50,RSEP为2.30%;干燥颗粒模型中,采用移动窗口平滑(9点)预处理方法最佳,RPD为4.12,RSEP为1.88%;整粒颗粒模型里,采用原始光谱建模比进行预处理后建模效果好,RPD为4.15,RSEP为1.80%;总混颗粒模型采用移动窗口平滑(9点)方法对光谱进行预处理后建模效果最好,RPD为4.84,RSEP为1.54%;通用模型中,采用原始光谱建模性能最佳,RPD为4.60,RSEP为2.26%。
图1 YC中间体近红外原始光谱
表2 不同预处理方法对模型的影响
3.3 特征变量筛选
筛选特征变量可以剔除无关信息,提高模型性能。本研究在上述筛选出的最佳预处理方法基础上进一步筛选特征变量。
3.3.1 基于间隔偏最小二乘法(interval PLS,iPLS)筛选变量 iPLS是把全光谱划分成若干个子区间,然后在每个子区间进行建模[25]。本研究将全光谱划分成20个子区间,以RMSECV为评价指标,筛选最佳建模波段。
3.3.2 基于组合间隔偏最小二乘法(synergy interval PLS,siPLS)筛选变量 siPLS是基于iPLS,它是将全光谱划分成若干个子区间后,再把子区间任意组合起来建模。本研究是把全光谱划分成20个子区间,再以子区间组合数为4建立模型,以RMSECV为评价指标,筛选最佳建模波段。
3.3.3 基于移动窗口偏最小二乘法(moving window PLS,mwPLS)筛选变量 mwPLS是从整个光谱的第一个波长点开始移动,沿波长变化的方向截取选定窗口宽度的区间,建立一系列的PLS模型[26]。本研究以初始窗口宽度为31,以10为步长依次增加窗口宽度,建立了窗口宽度为31~311的PLS模型,并根据RMSECV选取最佳建模波段。
3.3.4 筛选特征变量 采用3种方法建立模型的性能参数如表3~7所示。分别以RMSEC、RMSECV、RMSEP为评价指标,综合评价筛选出建模的最佳波段。
原料细粉模型采用全光谱建模与mwPLS优选的波段建模性能相差不大,但是筛选波段后变量减少至115个,建模时间会缩短,因此选择建模波段3 999.64~4 018.92、5 739.12~6 136.38 cm−1。
干燥颗粒模型采用siPLS和mwPLS筛选变量后,模型性能均有所提高,变量数分别减少到392、278个,但mwPLS筛选变量后的波点数更少且cal、pre较大,RMSEC、RMSEP较小,故采用波段4 030.50~4 219.49、4 443.19~4 504.90、6 957.91~7 767.86 cm−1建模。
表3 原料细粉优选区间建模与全光谱建模的比较
表4 干燥颗粒优选区间建模与全光谱建模的比较
表5 整粒颗粒优选区间建模与全光谱建模的比较
表6 总混颗粒优选区间建模与全光谱建模的比较
表7 通用模型优选区间建模与全光谱建模的比较
整粒颗粒模型采用siPLS与mwPLS筛选变量模型性能有所提升,变量数分别减少至312、83个,但mwPLS的cal、pre更大,RMSEC、RMSEP也较小,且波点数也较少,故选用波段4 933.02~ 4 971.59、5 982.10~6 213.52、7 359.03~7 397.60 cm−1建模。
总混颗粒模型采用mwPLS法进行波段筛选后,cal、pre均变大,RMSEC、RMSEP均变小,模型性能提高,因此选用波段4 015.07~42 342.6、 4 396.90~4 524.18、7 667.58~7 698.44、8 369.54~8 454.40 cm−1建模。
通用模型筛选变量后虽然降低了模型复杂程度,但是模型性能却不及全光谱模型,可能是因为通用模型是包含4个中间体信息的共用模型,采用波段筛选可能会使重要信息的流失,造成模型性能降低,故通用模型采用全波段建模。
3.4 主因子数的确定
以RMSECV值为评价指标确定主因子数,主因子数选择不当会导致拟合不充分或拟合过度,一般以RMSECV值最小时对应的主因子数为最佳。本研究采用留一交叉验证法,以RMSECV为指标,考察主因子数对模型的影响。最终确定原料细粉模型、干燥颗粒模型、整粒颗粒模型、总混颗粒模型和通用模型的最佳主因子数分别为6、15、12、11、14。
3.5 D50定量预测模型的建立
采用筛选出来的最佳预处理方法及最优NIRS波段建立50近红外定量预测模型,见图2。优选出来的原料细粉、干燥颗粒、整粒颗粒、总混颗粒和通用模型的评价参数见表8。各项模型的cal、pre接近于1,说明参考值与预测值相关性较高;RMSEC、RMSECV、RMSEP、RSEP较小,RPD大于3,说明模型预测性能较高,可以用于50的定量预测。
3.6 模型验证与评价
将验证集样品的NIRS导入校正模型中,预测中间体的50,并与参考值进行比较,结果见表9~10。原料细粉模型、干燥颗粒模型、整粒颗粒模型、总混颗粒模型及通用模型50的平均相对预测误差分别为1.94%、1.43%、1.46%、1.21%、1.87%,均小于5%,说明2种模型的预测准确性均较高。由表11可知,独立模型与通用模型对各中间体50的预测误差的差值均小于1%,说明二者的预测性能相近。
对原料细粉、干燥颗粒、整粒颗粒、总混颗粒和通用模型的验证集中参考值与预测值进行配对检验,结果值依次为0.22、0.17、−0.42、−0.38、0.75,值依次为0.825、0.866、0.678、0.706、0.454,值均>0.05,说明参考值与预测值之间无显著性差异。
表8 最佳模型的评价参数
表9 NIRS参考值与预测值的比较(独立模型)
表10 NIRS参考值与预测值的比较(通用模型)
表11 独立模型与通用模型相对预测误差比较
4 讨论
本研究以YC为研究对象,收集其生产过程中的原料细粉、干燥颗粒、整粒颗粒及总混颗粒共4种中间体,采用NIRS技术结合PLS建立了预测中间体50的通用定量模型。各项评价指标表明,通用定量模型预测准确性高、能满足实际需求,且与单一模型比预测性能差异不大,可以实现对4种中间体50的测定。
本研究中的通用模型是基于一个品种中差异不大的中间体建立起来的,通用模型预测效果较好,可能是因为中间体的50有一定差异但还在可接受范围内,且由于这种差异使得50的分布范围变宽,更利于建模,但对不同品种建立相关指标的通用模型的可行性还有待探索。相比激光粒度分布仪法,NIRS法测粒径会更快,若应用于在线研究将无需取样,提高分析效率。目前,NIRS通用模型在制药领域研究较少,若将NIRS技术与通用模型结合起来,建立的NIRS通用模型将具备快速准确、无损绿色、节约成本等优点,可以为中药生产过程实现在线检测相关指标提供更好的方法。
本研究是初步证明了YC 4种中间体近红外50通用定量模型的可行性,后续完善该模型还应当加入更多的样本,以及后续生产的持续验证,并朝着在线监测方向上研究。
利益冲突 所有作者均声明不存在利益冲突
[1] 中国药典 [S]. 一部. 2015.
[2] 臧恒昌, 臧立轩, 张惠, 等. 近红外光谱分析技术在制药领域中的应用研究进展 [J]. 药学研究, 2014, 33(3): 125-128.
[3] 姜爽, 杨海龙, 臧恒昌. 近红外光谱分析技术在中药生产过程质量控制领域的应用 [J]. 食品与药品, 2013, 15(2): 135-138.
[4] 李琼, 赵磊, 王权. 不同粒度黄芪三七胶囊粉体学性质及质量的初步对比 [J]. 现代中药研究与实践, 2019, 33(6): 32-35.
[5] Goh H P, Heng P W S, Liew C V. Comparative evaluation of powder flow parameters with reference to particle size and shape [J]., 2018, 547(1/2): 133-141.
[6] Fu X W, Huck D, Makein L,. Effect of particle shape and size on flow properties of lactose powders [J]., 2012, 10(2): 203-208.
[7] 梁兆昌, 褚洪标, 肖琳, 等. 杜仲超微粉体理化特性及体外溶出性能研究 [J]. 中草药, 2015, 46(11): 1609-1614.
[8] 李淞明, 周永全, 王玲, 等. 中药浸膏粉物理性质及其表征方法的研究进展 [J]. 中成药, 2015, 37(11): 2491-2494.
[9] Faulhammer E, Llusa M, Radeke C,. The effects of material attributes on capsule fill weight and weight variability in dosator nozzle machines [J]., 2014, 471(1/2): 332-338.
[10] 许俊男, 涂传智, 陈颖翀, 等. 激光粒度测定法在中药粉体粒径测定中的应用与思考 [J]. 世界科学技术—中医药现代化, 2016, 18(10): 1776-1781.
[11] 宋晓娇, 夏俊, 陈峰, 等. 粒度检测方法研究及其在口服吸入制剂研发中的应用 [J]. 药物评价研究, 2019, 42(12): 2319-2324.
[12] 雷晓晴, 王秀丽, 李耿, 等. 近红外光谱法快速测定当归中7种成分的含量 [J]. 中草药, 2019, 50(16): 3947-3954.
[13] 王晴, 徐芳芳, 张欣, 等. 在线近红外光谱监测桂枝茯苓胶囊流化床干燥过程水分的方法研究 [J]. 中草药, 2019, 50(22): 5429-5438.
[14] 高鸿彬, 瞿敏, 刘浩, 等. 不同产地覆盆子的近红外漫反射快速无损鉴别 [J]. 世界中医药, 2020, 15(10): 1386-1390.
[15] Liu R, Li L, Yin W,. Near-infrared spectroscopy monitoring and control of the fluidized bed granulation and coating processes-A review [J]., 2017, 530(1/2): 308-315.
[16] Rosas J G, Blanco M, González J M,. Real-time determination of critical quality attributes using near-infrared spectroscopy: A contribution for process analytical technology (PAT) [J]., 2012, 97: 163-170.
[17] Otsuka M, Koyama A, Hattori Y. Real-time release monitoring for water content and mean particle size of granules in lab-sized fluid-bed granulator by near-infrared spectroscopy [J]., 2014, 4(34): 17461.
[18] Pauli V, Roggo Y, Kleinebudde P,. Real-time monitoring of particle size distribution in a continuous granulation and drying process by near infrared spectroscopy [J]., 2019, 141:90-99.
[19] 潘晓宁. 基于Kubelka-Munk理论的中药近红外漫反射定量研究 [D]. 北京: 北京中医药大学, 2016.
[20] 范剑. 近红外光谱技术在干姜和桂枝混合蒸馏提取过程中的应用研究 [D]. 济南: 山东大学, 2017.
[21] 杨越. 基于近红外光谱技术的中药生产过程质量控制方法研究 [D]. 杭州: 浙江大学, 2018.
[22] 李春燕. 近红外光谱法在葛根活性成分含量快速测定中的应用研究 [D]. 新乡: 新乡医学院, 2018.
[23] 王永香, 郑伟然, 米慧娟, 等. 热毒宁注射液青蒿金银花浓缩过程近红外快速定量检测方法的建立 [J]. 中草药, 2017, 48(1): 102-108.
[24] 张娜, 徐冰, 贾帅芸, 等. 丹参提取过程多源信息融合建模方法研究 [J]. 中草药, 2018, 49(6): 1304-1310.
[25] 吴静珠, 石瑞杰, 陈岩, 等. 食用油油酸的近红外特征谱区优选 [J]. 中国粮油学报, 2015, 30(2): 118-121.
[26] 陈玥洋, 高志山, 郁晓晖, 等. 基于区间组合移动窗口法筛选近红外光谱信息[J]. 应用光学, 2017, 38(1): 99-105.
Research on near-infrared universal quantitative model of four intermediate particle sizes of Yaobitong Capsules
ZHANG Yong-chao1, XU Fang-fang2, 3, 4, ZHANG Xin2, 3, 4, XU Bing5, ZHAO Yue-mei2, 3, 4, ZHU Wen-deng2, 3, 4, WU Yun2, 3, 4, WANG Zhen-zhong2, 3, 4, XIAO Wei1, 2, 3, 4
1. Nanjing University of Chinese Medicine, Nanjing 210000, China 2. Jiangsu Kanion Pharmaceutical Co., Ltd., Lianyungang 222001, China 3. State Key Laboratory of New-tech for Chinese Medicine Pharmaceutical Process, Lianyungang 222001, China 4. The National & Local Joint Engineering Research Center on the Intelligent manufacturing of TCM, Lianyungang 222001, China 5. Beijing University of Chinese Medicine, Beijing 100029, China
To explore the feasibility of establishing a50near-infrared universal quantitative model for the four intermediates in the productive process of Yaobitong Capsules (YC) by analyzing the relationship between near infrared spectrum (NIRS) information and the median particle size (50).The NIRS of the four intermediates in the production of YC, including raw material fine powder, dry particles, sieving particles and total mixed particles, were collected. Different pretreatment methods were investigated. The interval partial least squares (iPLS), the synergy interval partial least squares (siPLS), and moving window partial least squares (mwPLS) were used to screen the optimal NIRS interval. The partial least squares (PLS) method was employed to build a50universal quantitative model for the four intermediates.In the universal model, the root mean square error of cross-validation (RMSECV) was 3.918 μm, the root mean square error of prediction (RMSEP) was 2.832 μm; The relative standard error of prediction (RSEP) was 2.26%, which was less than 5%; The ratio of predicton to deviation (RPD) was 4.60, which was greater than 3. The universal model could be used for quantitative determination, and its prediction accuracy was close to that of the independent model.The NIRS universal quantitative model can be used to determine the50of four intermediates in YC.
Yaobitong Capsules; near infrared spectroscopy; partial least squares; particle size; median diameter; universal model
R283.6
A
0253 - 2670(2021)01 - 0055 - 10
10.7501/j.issn.0253-2670.2021.01.008
2020-08-24
国家科技重大专项:基于功效成分群的中药口服固体制剂先进制药与信息化技术融合示范应用(2018ZX09201010-004);康缘中药智能化固体制剂工厂项目(KYYY190820)
张永超(1995—),女,硕士研究生,研究方向为中药制药技术与工程。E-mail: zyc020896@163.com
肖 伟,研究员级高级工程师,博士,研究方向为中药新药的研究与开发。Tel: (025)87181851 E-mail: kanionlunwen@163.com
徐芳芳,博士,研究方向为过程分析技术。E-mail: 879164331@qq.com
[责任编辑 郑礼胜]