基于近红外光谱技术快速测定口服液中多糖的研究
2017-10-16,,,,,,*
,,,,,,*
(1.无限极(中国)有限公司,广东广州 510623;2.华南理工大学化学与化工学院,广东广州 510641;3.晶格码(青岛)智能科技有限公司,山东青岛 266109)
基于近红外光谱技术快速测定口服液中多糖的研究
鲁亮1,李晶晶2,周昭露2,田淑华3,黄生权1,黄延盛1,*
(1.无限极(中国)有限公司,广东广州510623;2.华南理工大学化学与化工学院,广东广州510641;3.晶格码(青岛)智能科技有限公司,山东青岛266109)
本文建立了一种基于近红外光谱技术快速测定中药提取物中多糖的方法。通过采集102组中药提取物口服液样品的近红外光谱,结合多糖化学检测结果应用偏最小二乘法,通过考察不同光谱预处理方法,包括一阶导数移动窗口宽度、平滑处理移动窗口宽度、波段选择、变量选择方法对模型预测能力的影响,建立并优化得到近红外光谱技术快速测定口服液中多糖的最佳模型。此模型光谱预处理方法为一阶导数结合平滑,一阶导数移动窗口宽度为5,平滑处理移动窗口宽度为9,所选波段为5079.58~5152.86、6159.52~6232.80、6545.21~6695.63、7470.88~7544.16以及8705.09~8778.38 cm-1,共120个变量,模型的交叉验证均方根误差为15.4823,预测均方根误差为16.2807。研究结果表明,通过近红外光谱技术结合化学计量学方法建立口服液中多糖快速测定方法具有一定可行性。
近红外,光谱预处理,移动窗口,波段选择,变量选择
Abstract:Near infrared reflectance spectroscopy technique was employed to measure the polysaccharides of Chinese herb extracts rapidly. The experiment had measured the content of polysaccharides in the 102 groups of the oral liquid of Chinese herb extracts,adopts the partial least squares method combined with the polysaccharides chemical reference values,and establishes the optimal model of measuring the polysaccharides of the oral liquid by the near infrared reflectance spectroscopy technique,which was obtained by comparing method and derivative of different preprocessing and the size,waveband and variable selection way of the smooth window on the predictive ability of the above model:the pre-processing method of spectrum wasthe combination of the first derivative and smooth process,and their moving window widths were 5 and 9 respectively. The chosen wavebands contained 5079.58~5152.86,6159.52~6232.80,6545.21~6695.63,7470.88~7544.16 and 8705.09~8778.38 cm-1in the sum of 120 variables. The root-mean-square error of the model cross validation was 15.4823,and the root-mean-square error of the model prediction was 16.2807. The results showed that the method for rapidly measuring the polysaccharides in oral liquid based on the combination of the near infrared reflectance spectroscopy technique and chemometrics method was of certain feasibility.
Keywords:NIR;pretreatment;moving window;feature bands selection;variable selection
近年来,中药提取物口服液等保健食品逐渐获得国际市场的认可,发展前景广阔。来自于中药提取物中的多糖等是这类产品的主要功效成分,生产过程中控制产品功效成分含量至关重要。传统的多糖测定方法是基于化学容量分析,操作复杂,检测周期长,不能满足生产过程中实时监测多糖的要求。因此,建立一种快速测定中药提取物口服液中多糖的分析技术十分必要。
近红外光谱技术主要是利用一定数量光谱结合化学计量学方法建立模型来预测未知的样品,已在烟草、石油化工、食品、农业等领域得到了较为广泛的发展[1-3]。李连利用近红外光谱分析技术建立模型来快速检测保健品中硫酸软骨素含量[4],黄艳萍采用漫反射光谱法结合化学计量学小波变换-人工神经网络方法建立保健食品西布曲明的快速无损检测[5],王远利用近红外漫反射光谱法结合一阶导数+SG平滑+标准散射校正MSC光谱预处理方法,所建立麦冬多糖模型相关系数达到0.9688[6]。本文结合近红外透射技术以及化学计量学的方法建立多糖快速测定技术,可应用于中药提取物口服液生产过程中多糖的实时监控。
1 材料与方法
1.1 材料与仪器
口服液样品 在2016年3月至6月之间于无限极公司某品种口服液生产现场所采集102组样品;五水硫酸铜、酒石酸钾钠、氢氧化钠、浓硫酸、浓盐酸、硫酸铁铵、高锰酸钾 均为分析纯(AR),国药化学试剂有限公司。
ME2002电子天平 梅特勒-托利多;LXJ-IIB型低速大容量离心机 上海安亭科学仪器厂;EBK-4B型水浴锅 广东环凯微生物科技有限公司;Antaris MX型近红外光谱仪 赛默飞世尔科技有限公司;建模环境 Matlab环境及PLS工具箱。
1.2 实验方法
1.2.1 口服液样品制备 不同中药材原料按照配方比例进行投料经过常压高温水提4 h后得到提取液,再将提取液由真空双效浓缩蒸发器浓缩到一定固形物范围得到浓缩液,所得浓缩液按照产品配方添加一些辅料配制所得到的料液即为所收集的样品。
1.2.2 多糖测定方法 吸取费林氏液甲、乙各25 mL,置于250 mL三角瓶中,准确加入口服液样品10 mL再加入40 mL蒸馏水使总容积调整到100 mL;另外吸取50 mL蒸馏水,费林氏液甲、乙各25 mL做空白样;加热样品液,在4 min内煮沸,再保持沸腾2 min(加热时间必须严格遵守,允许有±15 s误差);样品液趁热用G4耐酸漏斗抽滤到抽滤瓶中,并用60 ℃热水100 mL分数次洗涤三角瓶及沉淀,将抽滤瓶中滤液弃去,洗净;取硫酸铁铵溶液50 mL,分数次将漏斗中红色沉淀物溶解,并将溶液抽至抽滤瓶中,再用60 ℃热水50 mL分数次洗涤漏斗(3~4次);合并滤液,并加入2 mol/L硫酸20 mL,用0.1 mol/L的高锰酸钾标准滴定液滴定至微红色并保持30 s不褪色为终点。
1.2.3 光谱采集 在生产线中用近红外Antaris MX对口服液样品进行光谱采集:每一批样品扫描3次,用于建模的光谱为3次采集光谱的平均光谱。光谱采集条件:波长:4000~10000 cm-1,采用透反射探头,分辨率8 cm-1,光程1 mm,扫描次数32次。
1.2.4 建模 样本划分:在有关近红外建模的文献中,常见有KS(Kennard-stone)法、Random Section法等。SPXY算法是在KS算法基础上发展而来,利用光谱-理化值共生距离作为依据来划分训练集和验证集,以提高模型的稳定性。
模型建立:利用PLS工具箱对采集的光谱进行预处理,分别考察预处理方法、导数窗口宽度、平滑窗口宽度、波段以及变量选择方法对模型的影响,通过选择恰当的处理方法和化学计量学方法建立多糖定量分析模型。
模型评价:建好的模型需要考察数据拟合度及对未知样品的预测能力。以校正集决定系数(R2)、交叉验证均方根(RMSECV)、预测均方根(RMSEP)为综合指标来对模型性能进行考察。RMSECV、RMSEP越小,R2越接近1,表明模型的预测性能越好。
2 结果与分析
2.1 口服液样品多糖含量基础数据
采用化学容量分析法测定的口服液样品多糖含量基础数据见表1。从表1可见,102组口服液样品的多糖含量范围为372.56~495.46 mg/100 mL,各多糖含量数据分布情况如图1所示。
图1 口服液样品多糖含量频率分布图Fig.1 Frequency distribution of polysaccharides
2.2 口服液样品近红外光谱图
口服液样品近红外光谱见图2。从图2可见,多糖含量不同的样品其近红外光谱形状较为接近,未发现多糖含量与特定波长吸光值之间有显著相关性。因此,有必要通过光谱预处理技术等来构建和优化样品相关性模型。
表1 口服液样品多糖含量基础数据(mg/100 mL)Table 1 The mathematical statistics of polysaccharides component of oral sample(mg/100 mL)
表2 不同光谱预处理方法对建模的影响Table 2 Influence of different preprocessing methods
图2 口服液样品近红外光谱图Fig.2 Near infrared spectra of oral sample
2.3 光谱预处理方法对建模的影响
从图2可以看出,样品在不同光谱区的绝对吸收不同,因此,建模时一般考虑根据多糖与光谱的相对变化值来建立关系,采用标准化算法来区分样品间的不同。对扫描得到的原始光谱图进行预处理,可以有效地消除基线漂移和其他背景的干扰,分辨重叠峰,从而提高灵敏度和分辨率。采用PLS建模方法结合不同的预处理方法建立多糖定量模型。在全光谱范围内比较了原始光谱、Detrend、Baseline、MSC(多元散射校正)、SNV(标准正态变量变换)、一阶导数、二阶导数、一阶导数+平滑相结合的预处理方法结合PLS建立模型[7-8]。不同光谱预处理方法建模结果如表2所示。结果表明,多糖含量模型采用一阶导数+平滑相结合的光谱预处理方法效果最佳,其R2cal为0.7312,RMSECV为18.2284。
2.4 一阶导数移动窗口宽度对建模的影响
对近红外原始光谱求导可以有效的提高光谱分辨率,消除干扰,但求导过程中如果差分宽度选择不当,将锐化噪声,反而使模型预测准确性下降。因此,预处理过程中需选择合适的窗口宽度,将光谱信息显现出来,提高建模的有效性。从表3可以看到,当一阶导数的移动窗口宽度是5,交叉验证的误差最小,RMSECV为18.0001,此时模型效果最佳。
表3 一阶导数移动窗口宽度对建模的影响Table 3 Influence of 1st derivative
表4 平滑移动窗口宽度对建模的影响Table 4 Influence of smoothing points
表5 波段选择对建模的影响Table 5 The results of PLS regression models in different spectra ranges
注:A:全波段;B:5538.55~5924.25、7467.02~7852.71、8624.10~9009.79 cm-1;C:4462.47~4516.46、5098.86~5152.86、9380.06~9434.059727.18~9781.18 cm-1。
2.5 平滑移动窗口宽度对建模的影响
在做光谱预处理时,一般先采用求导,但是求导会导致光谱的噪声提高,降低信噪比,因此,一般将求导与平滑相结合对光谱进行预处理。平滑通常是将凹凸不平的分析信号曲线变为变化相对平缓的光滑曲线。平滑方法包括窗口移动平均法、Savitzky-Golay法等[9-10]。Savitzky-Golay法目前应用较广,使用时应注意移动窗口的宽度以及多项式系数的选择。本实验考察不同的移动窗口宽度对建模的影响,从表4可知,当平滑移动窗口宽度为9,交叉验证RMSECV的值最小,此时模型预测能力较好。
2.6 波段选择对建模的影响
在得到最佳光谱预处理方法组合后,利用PLS建立定标模型,通过间隔偏最小二乘法IPLS选择不同波段光谱来建立定标模型。结果表明,选择恰当合理的波段对于提高模型的预测性具有显著效果,由表5可知,使用全波段进行建模RMSECV较高,另外全波段光谱存在噪音等无效信息,进而影响模型的准确性,经过波段选择后,模型的准确性得到提高。因此提取有效波段,不但可以提供反映多糖指标较为全面的信息,而且可以较少噪声以及无关联信息的干扰,缩短了建模时间,提高了模型的预测能力。
2.7 变量选择方法对建模的影响
多糖是复杂的混合物,在近红外区没有特征吸收峰,而且近红外的重叠峰严重,采用有效变量选择方法剔除冗余信息能够在一定程度上提高模型的准确度和精密度。SPXY算法是在KS算法基础上发展而来,利用光谱-理化值共生距离作为依据来划分训练集和验证集,以提高模型的稳定性。采用SPXY方法,将样品数据分为75组训练数据和27组验证数据,采用窗口宽度为5的一阶导数组合窗口宽度为9的平滑预处理方法处理光谱。对比考察不同的变量选择方法:间隔偏最小二乘法(IPLS)、无信息变量消除法(MCUVE)、移动窗口偏最小二乘法(MWPLS)、遗传算法(GA)、变量投影重要性(VIP)、随机蛙(Random frog)、竞争自适应重加权采样(Cars)[11-19],结合偏最小二乘法建模,结果见表6,结果表明,Cars和Random frog交叉验证误差结果比较小,模型的相关系数R2较为接近1,但预测均方根误差RMSEP较大,说明模型可能存在过拟合导致对于未知样品预测效果不佳。使用IPLS选波段方法,所选波段为5079.58~5152.86、6159.52~6232.80、6545.21~6695.63、7470.88~7544.16以及8705.09~8778.38 cm-1,共120个变量,再结合上述预处理方法,对27组验证数据进行预测,预测结果及与化学值之间的相对误差见表7。从表7中可以看到,所有数据的预测效果相对误差可以控制在10%以内,最大误差为-8.19%。
表6 变量选择方法对建模的影响Table 6 Influence of in different variable selections
表7 相对误差统计表(%)Table 7 The table of relative error(%)
3 结论
本研究通过近红外光谱透射技术对口服液中的多糖指标建立定量模型。当一阶导数移动窗口宽度为5,平滑移动窗口宽度为9,采用IPLS变量选择方法进行建模,其训练集的交叉验证均方根误差为15.4823,验证集的预测均方根误差为16.2807。结果表明,通过选择较优的预处理方法建立的模型对中药提取物口服液中多糖含量具有良好的预测能力,可应用于类似产品生产过程中多糖含量快速测定和实时监控。
[1]褚小立,袁洪福,陆婉珍.近年来我国近红外光谱分析技术的研究与发展[J]. 分析仪器,2006(2):1-10.
[2]邓亮,冷红琼,段沅杏,等. FT-NIR 光谱测定烟草中烟碱、总氮、总糖含量的模型研究[J].云南农业大学学报,2013,28(6):814-818.
[3]王加华,王军,王一方,等.基于近红外光谱技术的腐竹脂肪定量分析[J].食品科学,2014,35(18):136-140.
[4]李连.硫酸软骨素关键质量环节近红外光谱分析技术的应用研究[D].济南:山东大学,2012:1-92.
[5]黄艳萍,袁萍,黄勇红.减肥保健品中西布曲明的近红外光谱法快速测定[J].海峡医学,2015,27(11):42-44.
[6]王远,秦民坚,戚近,等.近红外漫反射光谱法测定麦冬的多糖含量[J].光谱学与光谱分析,2009,29(10):2677-2680.
[7]Geladi P,MacDougall D,Martens H.Linearization and scatter-correction for near-infrared Reflectance spectra of meat[J]. Applied Spectroscopy:1985,39:491-500.
[8]RJ Barnes,MS Dhanoa,SJ Lister.Standard normal variate transformation and de-trending of near-infrared diffuse reflectance spectra[J]. Applied Spectroscopy,1989,43(5):772-777.
[9]许良,闫亮亮,塞击拉呼,等.近红外光谱结合可移动窗口偏最小二乘法对克霉唑粉末药品的定量分析[J].计算机与应用化学,2016,33(4):415-418.
[10]侯培国,李宁,常江,等.SG平滑和IBPLS联合优化水中油分析方法的研究[J].光谱学与光谱分析,2015,35(6):1529-1533.
[11]A Oussama,F Elabadi,S Platikanov,et al. Detection of olive oil adulterationusingFT-IR spectroscopy and PLS with variable importance of projection(VIP)scores[J].Journal of the American Oil Chemists’ Society,2012,89(10):1807-1812.
[12]B Lu,I Castillo,L Chiang,et al. Industrial PLS model variable selection using moving window variable importance in projection[J]. Chemometrics and Intelligent Laboratory Systems,2014,135(15):90-109.
[13]W Cai,Y Li,X Shao. A variable Selection method based on uninformative variable elimination for multivariate calibration of near-infrared spectra[J]. Chemometrics and Intelligent Laboratory Systems,2008,90(2):188-194.
[14]H Y Ding,Y Jin,XS Liu,et al. On-line Monitoring of Traditional Chinese Medicinal Powder Blending Process by Using Near-Infrared Spectroscopy[J]. Chinese Pharmaceutical Journal,2013,48(14):1151-1156.
[15]曹楠宁,王加华,李鹏飞,等.基于GA和SCMWPLS算法的NIR光谱信息变量提取研究[J].光谱学与光谱分析,2010,30(4):915-919.
[16]王加华,潘璐,孙谦,等.遗传算法结合偏最小二乘法无损评价西洋梨糖度[J].光谱学与光谱分析,2009,29(3):678-681.
[17]HD Li,QS Xu,YZ Liang. Random frog:an efficient reversible jump Markov chain Monte Carlo-like approach for variable selection with applications to gene selection and diseaseclassification[J]. Analyticachimica Acta,2012,740:20-26.
[18]周昭露,李杰,黄生权,等.近红外光谱技术在中药质量控制应用中的化学计量学建模:综述和展望[J].化工进展,2016,35(6):1627-1645.
[19]后其军,鞠兴荣,袁建,等.不同产地稻谷近红外技术建模效果的比较[J].食品工业科技,2016,37(8):125-134.
Therapiddeterminationofpolysaccharidesinoralliquidbasedonnearinfraredreflectancespectroscopytechnique
LULiang1,LIJing-jing2,ZHOUZhao-lu2,TIANShu-hua3,HUANGSheng-quan1,HUANGYan-sheng1,*
(1.Infinitus(China)Ltd,Guangzhou 510623,China;2.School of Chemistry and Chemical Engineering,South China University of Technology,Guangzhou 510641,China;3.Pharmavision(Qingdao)Intelligent Technology Ltd,Qingdao 266109,China)
TS207.3
A
1002-0306(2017)18-0247-06
2017-03-16
鲁亮(1987-),男,硕士,助理工程师,研究方向:过程检测,E-mail:Liang.Lu @infinitus-int.com。
*通讯作者:黄延盛(1979-),男,硕士,中级工程师,研究方向:制药工程和过程检测,E-mail:Jason.huang@infinitus-int.com。
10.13386/j.issn1002-0306.2017.18.047