APP下载

近红外光谱的头孢类药品成分分析与模型传递方法

2020-11-05周子堃李晨曦陈文亮徐可欣

光谱学与光谱分析 2020年11期
关键词:头孢校正组分

周子堃,李晨曦,王 哲,刘 蓉,陈文亮,徐可欣

1. 天津大学精密测试技术及仪器国家重点实验室,天津 300072 2. 天津大学精密仪器与光电子工程学院,天津 300072

引 言

药品安全与质量是关系到民众健康的重要社会问题,发展在线、快速、低成本的药品成分与质量检测方法是保证其质量与安全的关键[1]。药品成分检测方法主要有色谱法、物理常数测定法、官能团测定法等[2-3],这些方法往往需要较为复杂的预处理步骤,分析时间较长,在药品生产以及抽样检查中应用较多,但是在现场快检与在线监测中应用较少。近红外光谱方法具有无损、快速的优势,能够提供准确的定性、定量分析结果,广泛应用于成分检测及过程控制领域[4]。

近年来,基于近红外光谱技术的药品成分检测方法成为研究热点,并在质量与生产现场检测中应用广泛。魏学敏等[5]详细介绍了光谱技术与化学计量学方法在药物分析方面应用的研究情况,近红外光谱技术在成本及检测速度等方面具有显著优势。Boyer等[6]采用近红外光谱法测定了抗疟疾抗生素中有效成分的含量,建立了校正模型并进行验证,结果显示成分预测误差在5%以内。Carvalho等[7]结合分线性判别分析和遗传算法线性判别分析,建立了近红外光谱分类模型,判别精准度达到了94.4%。在实际应用中,光谱测量仪器种类及型号较多,由于光谱仪仪器参数及测量条件变化,所带来的波长偏移及噪声分布特性改变,均会在一定程度上影响光谱建模分析精度。因此,研究不同仪器之间预测模型传递方法具有较为重要的意义。Abel等[8]提出了两种新的模型传递算法,并在应用中与最大似然主成分分析和分段直接校正法两种成熟的模型传递方法的性能进行比较,并取得了较好的结果。研究不同仪器之间所建立的光谱定量模型传递方法,减小或消除不同仪器测得的光谱的差异,对于提高近红外光谱分析效率,推广其在各个领域的应用,具有较高的研究意义和应用价值[9-11]。

针对头孢类药品成分检测需要,研究了基于偏最小二乘法PLS与分段直接校正法PDS的头孢拉定颗粒组分定量分析与模型传递方法。采用两台傅里叶光谱仪分别采集头孢拉定颗粒样本的光谱数据,建立基于PLS方法的头孢类药品组分的定量分析模型。提出了基于马尔可夫链的转换校正集选择及分段校正模型转移方法,该方法通过构建概率矩阵,选择合适的转换集提高模型转换效率及精度。实验结果表明,利用本文所建立的定量分析模型及传递方法,可实现头孢拉丁颗粒样本中头孢拉定、头孢氨苄和水分三种成分定量精准分析,减少不同仪器所建立模型传递误差,与传统的K-S算法相比,其对不同仪器光谱差异的修正效果有着明显的提高。本研究的建模分析与模型传递方法也为药品成分与质量检测提供了技术支撑。

1 实验部分

1.1 样品及光谱测量

实验样品为头孢拉定颗粒,分别选自于白云山药业、金鸿药业等十余家公司生产的不同批次药物,共计56个样本。与其质量密切相关的3种组分:头孢拉定、头孢氨苄和水分含量的参考值由中国食品药品检定研究院检测给出,其中头孢拉定组分浓度范围为30~130 mg·g-1,头孢氨苄组分浓度范围为0.5~3 mg·g-1,水分浓度范围为0.1~2.3 mg·g-1。

光谱测量采用两台傅里叶光谱仪,其一为珀金埃尔默仪器有限公司(PerkinElmer)的FrontierTMFT-IR/NIR分析仪(主机),使用积分球测量附件,检测器为MCT检测器;另一台为赛默飞世尔科技(ThermoFisher)的AntarisTMⅡ FT-NIR分析仪(从机),使用积分球测量附件和InGaAs检测器。光谱测量范围为10 000~4 000 cm-1,分辨率为8 cm-1,测量信噪比可达到3 000∶1以上。为了进一步提高光谱信噪比,光谱扫描平均次数为32次。样品放置于入石英平底皿中并压实,保持每次测量时样品厚度及紧实度一致,减少散射影响,并保证样品厚度大于入射光光程。经研究对比发现,两台光谱仪测得光谱的差异主要为基线漂移、少量波长漂移和噪声。

1.2 光谱预处理及建模

光谱预处理主要目的是去除基线漂移,进一步提高光谱信噪比,保证光谱建模分析准确度。根据样品特点,首先采用标准正态变量校正SNV消除由于样本颗粒分布不均匀及颗粒大小不同产生的散射对光谱的影响;然后,采用S-G三次多项式9点平滑滤波降低噪声。偏最小二乘法PLS是最常用的定量校正模型方法,它集成了主成分分析、典型相关分析、线性回归分析的优点,适用于解决实际问题中数据量较少,且变量之间存在多重相关性的情况[12]。PLS不仅分解了光谱矩阵X,同样也对浓度矩阵Y进行了处理,同时消除了光谱矩阵和浓度矩阵里包含的噪声,提升了模型准确性与抗干扰能力。

1.3 基于马尔可夫链的模型传递

多元校正算法容易出现过拟合的现象,为了避免此类情形,常在模型传递前选择一部分样品集,即转换集用于参数的计算。

马尔可夫链(Makkov Chain,MC)是机器学习等领域中一个很重要的方法,表征状态空间中从一个状态到另一个状态的随机过程[13]。假设存在随机变量集合,且随机变量的条件概率满足p(Xt+1|Xt, …,X1)=p(Xt+1|Xt),则称X为马尔可夫链。在模型传递过程中,通常选取部分样本作为转换集,用于计算模型传递参数。在MC思想基础上,每一个样本都视为一个独立的状态,模型传递的过程可以近似为状态空间中从一个状态到另一个状态的随机过程。将模型传递的评价参数进行处理后作为状态转移概率Pi, j。遍历所有的m个样本,可以得到m×m个转移概率值用于构建转移矩阵P

(1)

(2)

式中,πk表示第k步时的概率分布,m为校正集数目。根据其平稳分布,可以优化选择转换集样品,得到以转移概率Pi, j作为约束条件下的最优解,从而提高模型转换效率及建模准确度。

1.4 模型评价

光谱定量校正模型中,一般采用校正均方根误差(RMSEC)、预测均方根误差(RMSEP)、决定系数(R2)和相对预测误差(RPE)等指标评价定量模型预测精度。为了客观的评定模型传递效果,本文中定义光谱平均差异(ARMS)和光谱校正率(Prcorrected)两个参数评价模型传递效果[14],其计算公式如式(3)和式(4)

(3)

(4)

2 结果与讨论

2.1 单台仪器光谱建模预测结果

分别利用两台光谱仪测量得到光谱,建立头孢拉定中三种组分定量校正模型,使用RANK法将56个样本分为校正集和验证集,并采用蒙特卡洛交互验证法去除校正集和验证集中的异常样本,模型预测结果如表1所示。实验结果可知,样品中主要成分头孢拉定含量的预测精度最高,验证集样本的相对预测误差均在5%以内,而组分头孢氨苄和水分的含量相对较低,部分样品中的组分含量已经接近检测限,所以这两种组分建立模型的相对预测误差较大。综合对比,三种成分在两台仪器上建立的校正模型的预测效果差距不大,其中Frontier建立模型的预测结果略优于Antaris的建模结果。

表1 两台光谱仪建模参数和预测结果Table 1 Modeling parameters and prediction results of two spectrometers

2.2 基于MC的模型传递分析

(5)

将光谱校正率Pr作为转移概率构建马尔可夫链状态转移矩阵,设置初始最大步数为20,演变步数和MSE的关系如图1所示。

图1 演变步数与均方误差的关系Fig.1 Relation between evolution step and mean square error

结果表明,在步数大于10步后三个马尔可夫链的分布均已接近收敛。根据马尔可夫链的平稳分布特性以RMSEP和Prcorrect为标准,依次选择若干个样本作为转换集。三种组分的主从机模型传递中转换集选择情况分别如图2(a),(b)和(c)所示。当转换集数目为6时,光谱校正率的变化已经趋于平稳,当转换集数目大于10个后,随着样本数的继续增加,RMSEP减小并不明显。故在预测均方根误差的变化平稳后,基于增强模型稳健性的原则,选择头孢拉定组分的转换集数目为10个,头孢氨苄组分的转换集数目为13个,水分的转换集数目为11个。

图2 RMSEP和Pr的归一化参数与转换集数目关系(a):头孢拉定;(b):头孢氨苄;(c):水分

2.3 模型传递后建模预测结果分析

由于主从仪器上测得的光谱具有较大差异,在模型传递前,直接使用主仪器模型对从仪器上测得的光谱数据进行预测,得到的预测结果和参考值的误差较大。在MC方法选择转换集基础上,使用PDS算法进行模型传递,并使用DS算法对窗口数据进行传递,三种组分的模型传递参数及结果如表2所列。根据实验结果,传递后可以有效减少光谱差异,以主机建立校正模型,利用从机光谱数据传递后进行预测为例,预测结果RMSEP和RPE在模型传递后得到了极大的改善,模型预测精度与主仪器光谱的预测精度基本相当。

表2 模型传递参数及传递前后光谱差异Table 2 Calibration transfer parameters and spectral differences

将MC算法与使用K-S算法选择转换集[15]时的相关结果进行对比,表3列出了两种方法使用后的模型参数及评价参数。对比光谱校正率Pr,MC的结果明显优于K-S方法。对于质量较好的模型,如头孢拉定定量模型,两种方法建立传递模型后的RMSEP相差较小;对于头孢氨苄定量模型,结合表1中的主仪器模型相关数据,使用MC选择的转换集建立的传递模型使从仪器光谱更好的拟合了主仪器光谱。这些数据充分说明了使用马尔可夫链选择转换集是可行的,并在一些情况下会比使用K-S方法取得更好的结果。

表3 两种模型传递方法建模预测结果比较Table 3 Calibration transfer and evaluation parameters of two algorithms

3 结 论

近红外光谱方法具有无损、快速的优势,在药品成分检测与质量控制方面应用广泛。针对药品质量与成分检测的需要,研究了基于近红外光谱的头孢类药品的定量分析及模型传递方法。采用两台傅里叶光谱仪(主机:Frontier,从机:Antris)分别采集56个头孢拉定颗粒样本的近红外光谱,并建立针对头孢拉定、头孢氨苄和水分三种成分的定量分析预测模型。在此基础上,提出了基于马尔可夫链的转换校正集选择方法,通过构建概率矩阵,选择合适的转换集提高模型转换效率及不同仪器得到光谱数据的建模预测精度。实验结果表明,与K-S算法相比,本文模型传递方法对不同仪器光谱差异的修正效果有着明显的提高。模型传递前后,不同仪器使用同一模型预测三种成分相对误差从9.67%,52.14%和19.25%,分别下降到到4.37%,31.12%和11.67%。利用本模型传递方法可以有效修正主从仪器光谱差异,实现了不同仪器测量光谱及定量分析模型传递共享,也为药品成分与质量检测提供了技术支撑。

猜你喜欢

头孢校正组分
组分分发管理系统在天然气计量的应用
头孢吡肟与头孢呋辛治疗癫痫患者肺部感染的疗效比较
劉光第《南旋記》校正
基于MR衰减校正出现的PET/MR常见伪影类型
黑顺片不同组分对正常小鼠的急性毒性
金雀花中黄酮苷类组分鉴定及2种成分测定
不是所有的头孢,孩子都可以随便吃
在Lightroom中校正镜头与透视畸变
机内校正
注射用头孢呋辛钠静脉滴注致肝功能损害1例