APP下载

贝母混合品中川贝母含量近红外光谱检测方法优化*

2023-01-06齐明辉胡雪婷赵静李正刘明李刚

天津中医药大学学报 2022年6期
关键词:贝母增益分辨率

齐明辉,胡雪婷,赵静,2,李正,2,刘明,李刚

(1.天津中医药大学中药制药工程学院,天津 301617;2.省部共建组分中药国家重点实验室,天津 301617;3.中国医学科学院生物医学工程研究所,天津 300192;4.天津大学精密测试技术及仪器国家重点实验室,天津 300072)

贝母始载于《神农本草经》,因其良好的止咳化痰的疗效,在中国应用较为广泛[1-3],其中川贝母(Fritillariae Cirrhosae,FC) 疗效最佳。 浙贝母(Fritillariae Thunbergii,FT)、伊贝母(Fritillariae Pallidiflorae,FP)因与FC外观相似、颜色差异小,价格远远低于FC,所以市面上将FT、FP掺入川贝母中进行销售的情况屡有发生[4],这给制药企业原料采购带来严重的影响。因此,对贝母样品进行质量检测显得尤为必要。

目前对贝母的质量检测采用的方法有色谱分析、色谱与质谱联用分析、形态学方法、以及DNA分子标记[5]。其中,色谱分析方法是贝母样品质量检测的常用方法,也被列入中国药典作为贝母质量检测的金标准。随着质谱技术的发展,色谱与质谱联用技术也得到广泛的应用[6-7]。如Liu等[8]利用超高效液相色谱-四级杆飞行时间质谱为基础的非目标代谢组学结合化学计量学分析,发现了不同贝母的特异性标记,实现了贝母品种的鉴别。Luo等[9]结合化学计量学方法和UPLC-ELSD指纹图谱,采用相似性分析、层次聚类分析和主成分分析的方法,实现了FC及其混淆品的鉴别。上述方法均获得了较好的FC质量检测结果,然而这些方法要求操作者技术熟练且有丰富的经验,化学试剂,分析过程中需要其他化学试剂的消耗,并且整个分析时间较长,一般用于对原料药材的抽检。不能满足制药企业大批量原料药材快速质量检测的要求。

近红外光谱技术以其具有快速、无损的分析特点,已经被广泛应用于食品、医药、农业等[10-12]多个领域。近红外光谱技术也被应用到贝母的质量检测中来。如:在扫描次数、分辨率分别为32、16 cm-1的参数设定下,Chen et al[13]利用傅里叶变换近红外光谱仪(PerkinElmer,MA,USA)采集四种完整颗粒贝母的光谱,快速准确地实现了川贝母、浙贝母、伊贝、平贝的品种鉴别。赵耀东等[14]利用傅里叶变换近红外光谱系统定量检测浙贝母中有效成分的实验中,将扫描次数设置为64次,分辨率为8.0 cm-1,增益为1,对过60目筛的浙贝母粉末采集光谱,结合偏最小二乘回归模型,实现了浙贝母贝母素甲和贝母素乙含量的快速检测。Yu等[15]设置傅里叶近红外光谱仪器参数扫描次数、分辨率分别为32、4 cm-1,建立了一种简单、准确鉴别七种不同产地贝母药材的方法。邓波等[16]在分辨率为4 cm-1,扫描次数为64,增益为自动增益的参数条件下,利用傅里叶变换近红外光谱仪获取贝母及其近缘物种的光谱数据,并结合主成分分析方法,实现了两者的鉴别。

由上述研究可见,近红外光谱技术为贝母样品的质量检测提供了一种快速便捷的检测方法。然而该方法在数据采集过程中易受到粒径大小、扫描次数、分辨率、增益等实验条件的影响。粒径大小在已有的相关研究中,还没有考虑到对采集条件进行优化。考虑到实际应用中各参数相互影响,本研究以市面上经常出现的FT、FP混入FC进行售卖的混合样品为例,采用正交试验设计,对贝母粉末近红外光谱质量检测中的粒径大小、扫描次数、分辨率以及增益4个参数进行优化研究,并在同样的建模条件和方法下进行模型性能比较,为贝母粉末样品的近红外光谱质量检测参数优化提供参考。

1 实验方法

1.1 样品准备 贝母药材采自四川、浙江、新疆3个省份,共获取FC、FT、FP各6批。为避免贝母的含水量差异对研究造成影响,所有样品经过烘干至恒重,然后进行粉碎、混合处理。为提高模型的丰富性,避免单批样品导致模型的特异性,本研究将6批FC、FT、FP分别混合成3批,针对混合的纯品分别随机选出1种,将3种贝母组合,最终得到6种组合(A1、A2、A3、A4、A5、A6)。FC、FT、FP 的混合比例如图1所示,根据FC在混合品所占比例(0、0.2、0.4、0.6、0.8、1),将混合品分为 6 组,从 group0 到group5表示FC比例增大,从左到右FT比例减小,FP比例增大,其中编号19为FC纯品,因此共得到18×6+3=111例混合品样本。受到采购样品总量的限制,其中获得的2个混合品样本量较少,不能满足近红外光谱数据采集要求,因此用于后续实验的混合品样本共109例。

图1 混合设计与分组方法

1.2 近红外光谱数据采集 本研究采用Thermo Electron公司生产的Antaris Ⅱ FT-NIR System傅里叶变换近红外光谱仪获取样品的漫反射光谱。光谱波数范围为4 000 cm-1~10 000 cm-1。光谱采集过程中,温度始终保持在25℃左右,湿度在35%左右。

采集光谱前,基于 DOE(Design of experiment)的正交试验设计对文献中常用的粒径大小、扫描次数、分辨率、增益4个参数进行优化组合。选择L9(34)正交表,3因素3水平的因素水平表如表1所示。

表1 因素水平表

采集9个实验条件下的贝母粉末样品近红外光谱。在光谱采集过程中,每个样品采集3次,取其平均光谱作为样品光谱,以进行下一步分析。

1.3 数据处理 为消除颗粒分布不均匀和颗粒大小产生的散射现象,本研究采用多元散射校正(Multiplicative Scatter Correction,MSC)[17-18]进行数据预处理,从而去除散射影响。偏最小二乘回归(Partial Least Squares Regression,PLSR)是一种有用的多变量分析方法,广泛应用于自变量(X)与因变量(Y)之间具有大量共线性变量的数据。作为经典的线性回归模型,PLSR已被广泛用于解决农业、食品等领域的定量预测问题。PLSR结合了主成分分析和多元回归的特点。它提取了1组潜在因素,并尽可能解释了自变量和因变量之间的协方差,在处理共线性变量的数据中具有较大的优势,在处理共线性变量的数据中具有较大的优势。本研究利用PLSR对划分的数据集进行建模分析,并采用决定系数R2、预测集均方根误差(Root Mean Square Error of Prediction,RMSEP)以及F值对模型预测能力进行评价,F值计算公式如下所示,F值越大,表明模型的预测能力越好。本研究所有数据处理均使用Matlab R2018a软件完成。

2 结果与分析

2.1 单因素考察 图2a、b、c、d分别为粒径大小、扫描次数、分辨率、增益四个研究因素对光谱的考察。研究通过针对同1个样本,改变其他3个因素,控制一个因素的方法,以考察单因素对样品光谱的影响。图2a表明,粒径大小对样品光谱的吸光度有影响,随着粒径越小,吸光度呈现越小的现象。光谱信噪比大小与扫描次数有关,因此,本文对3水平下4 000~9 000 cm-1波数范围的样品光谱峰谷数量进行比较,以获得光谱平滑度,来评估不同扫描次数的光谱质量。其中,峰谷数量越多,说明光谱波动较大,毛刺较多,光谱质量低;峰谷数量越少,光谱越平滑,毛刺少,光谱质量高。图2b为不同扫描次数峰谷数量的箱线图。图2d直观地表达了不同扫描次数峰谷数量的差异,扫描次数少,峰谷数量多,说明光谱毛刺较多;随着扫描次数增多,峰谷数量减少,光谱越平滑,说明多次扫描平均,能够有效去除光谱中的部分噪声,但扫描次数并不是越多越好,多次测量平均虽然可以去除部分噪声,但是在去除噪声的同时,也可能去除了部分有用信号,导致仪器所产生的系统误差较大。因此选取最佳扫描次数提高后续定量模型的预测能力显得非常必要。分辨率反映了不同光程下的样品信息,增益为信号增强的程度,图2c、d分别显示了不同水平分辨率与增益的样品光谱,右上角分别显示了不同水平分辨率与增益的光谱,从图中发现,不同水平分辨率和增益的光谱彼此重叠,吸光度没有明显差异。利用三维光谱图考察了不同水平分辨率和增益的光谱噪声,从图中发现,依据光谱噪声也不能选出最佳水平。因此,单因素考察不能得出有效结论。

图2 不同影响因素的光谱

2.2 不同因子水平组合下贝母样品的近红外光谱 3种纯品贝母的光谱特征及九组不同因子水平组合下109例样本的平均近红外光谱曲线如图3所示。

图3 九种不同因子水平组合的MSC光谱

由图3可见,9个组合下各光谱曲线的波形无明显差异,均存在6个吸收峰,分别位于4 200 cm-1、4600cm-1、5600cm-1、6300cm-1、6900cm-1、8300cm-1,这与C-H、O-H、N-H的伸缩与倍频振动相关[19]。进一步对九组不同因子水平光谱吸光度进行比较发现,各组间吸光度存在差异,但与文献中已证明的粒径越小,吸光度越小[20]结论不同,表明扫描次数、分辨率、增益对吸光度也有一定的影响,同时进一步证明参数之间相互影响,基于正交实验设计进行参数优化研究是有必要的。

2.3 正交实验结果 由于模型性能涉及到多种指标,实验在保证模型未过拟合的情况下,综合考虑R2、RMSEP对建模效果及模型预测能力的影响,因此采用F值进行综合评价。基于PLSR模型的正交试验结果如表2所示。其中R值反映了同一影响因素不同水平所建模型预测能力的模型差异,R值越大,表明同一因素不同水平的影响越显著。K值反映了同一影响因素对试验指标的影响,K值越大,该水平对应该因素的影响越大,K值最大是因素水平为该影响因素的优水平。

表2 正交实验结果

从表2的极值 R 来看,RC>RA>RB>RD,由此可见影响贝母粉末样品中FC含量定量模型预测精度的主次因素为扫描次数>粒径>分辨率>增益。

严衍禄[22]提到:“扫描次数增加,相应模型的性能有所改善,这是因为扫描次数增加提高了光谱的信噪比,但不是扫描次数越多越好”。本研究中,C3为优水平,即扫描次数为64时,模型较好。进一步对正交试验K值结果进行比较,对于扫描次数,K1<K2<K3,表明扫描次数越大,模型越优,然而扫描次数与模型性能是否呈现线性还有待研究。

粒径大小反映了样品对光谱散射影响,有研究[20]表明粒径越小,光谱质量越高,本研究中过120目药典筛的样品粒径为该影响因素的优水平,其中K2<K1<K3,与已有结论存在差异,这可能是因为 4个参数之间相互影响的结果。

傅里叶变换近红外光谱仪的分辨率与移动反光镜的移动距离有关[23],分辨率越高,波数点越多,光谱数据越丰富;对于对光谱有较强吸收的样品来说,可以获取样品更多光谱特征信息;对于吸收较弱的样品来说,造成光谱数据冗余,有效光谱数据比例降低,从而导致模型较差[24]。本研究将4 cm-1、8 cm-1、16 cm-13个水平的分辨率引入正交试验设计中,其中最佳模型对应的分辨率为介于3个水平的中间值,表明分辨率为8 cm-1时,川贝母及其掺假品有较好的吸收,同时避免了数据冗余对数据处理的影响。

系统信号的增强程度用增益表示,实验设置了2、4、8三个水平的增益,其中增益为8时,模型最佳。

由表2可见,九个不同参数组合下的F值范围为69.07-88.11。F值反映了不同因素的最优水平组合,F值越大,模型预测性能越好,因此正交实验设计的最佳组合是A3B2C3D1。K值反映了同一影响因素对实验指标的影响,K值越大,该水平对应该影响因素的优水平,因此四个影响因素的最佳优水平组合为A3B2C3D3。A3B2C3D3并没有出现于正交实验设计方案中。为了确定最优参数组合,分别对A3B2C3D1、A3B2C3D3两种参数组合下获得的模型预测结果进行比较。图4a、b为A3B2C3D1、A3B2C3D3对应的PLSR模型预测结果。图4c为两参数组合所建模型性能指标参数。其中数值1代表A3B2C3D1参数组合,2代表A3B2C3D3参数组合。图4c直观地反映了A3B2C3D3的模型预测性能整体优于A3B2C3D1。结果表明,A3B2C3D3即粒径为过120目药典筛、扫描次数为64、分辨率为8,增益为8,此时建模结果为:Rp2=0.9742,RMSEP=0.0438,F=93.33。

图4 不同参数组合PLSR模型预测结果

由上述实验结果可见,合理的参数设计可以最大程度地提高模型的可靠性和预测能力。扫描次数、粒径大小、分辨率以及增益4个因素对模型预测精度均有一定的影响,正交实验设计可以综合考虑各因素的共同影响,获取最优参数组合。

3 总结

近红外光谱检测参数的选择直接影响模型的预测能力。本研究以市面上常见的FC中掺入FT和FP的贝母样品为例,对贝母粉末中FC含量的近红外光谱定量检测条件进行优化,为避免对模型单因素影响研究的局限性,本研究通过正交实验设计综合评价粒径大小、扫描次数、分辨率、增益多因素对模型的共同影响。实验结果表明,4个参数均会给贝母粉末近红外光谱定量分析模型精度带来影响。并且贝母粉末粒径大小为120目,扫描次数为64,分辨率为8,以及增益为8时,可以建立最优模型,获得最佳的检测结果。该方法综合考虑了近红外光谱数据采集中的4个重要参数的不同水平组合,有效的避免了单因素研究的局限性,本研究为制药企业中贝母粉末样品近红外光谱质量检测参数优化提供了借鉴。

猜你喜欢

贝母增益分辨率
不同产地的贝母中主要生物碱的含量比较及其毒性评价
基于生成对抗网络的无监督图像超分辨率算法
基于增益调度与光滑切换的倾转旋翼机最优控制
王莹作品赏析
基于单片机的程控增益放大器设计
基于Multisim10和AD603的程控增益放大器仿真研究
原生VS最大那些混淆视听的“分辨率”概念
程控增益射频宽带放大器
贝母素乙对放射性肺损伤大鼠肺组织水通道蛋白的影响
从600dpi到9600dpi