红外光谱结合偏最小二乘法对三七主要皂苷含量的预测研究
2023-03-02杨春艳
刘 飞,杨春艳,沈 涛
(1.玉溪师范学院 物理与电子工程学院,云南 玉溪 653100;2.玉溪师范学院 化学生物与环境学院,云南 玉溪 653100)
中药材三七为五加科人参属植物三七(Panax notoginsng(Burk)F. H. Chen.)的干燥根和根茎,是我国特有的名贵药材[1];为人工种植,一般栽种3~5 年采收,主要分布于云南文山和广西那坡靖西一带.三七药材的主要物质成分为淀粉和皂苷,主要药效成分为人参皂苷Rg1(C14H72O23)、Rb1(C54H92O23)和三七皂苷R1(C47H50O18),同时还有氨基酸、三七多糖、黄酮类化合物等[2],已广泛应用于我国的药品和保健品生产.由于三七种植连作困难,采收后的地块一般需要间歇8 年以上才能播种,加之前些年市场需求旺盛,导致三七的种植地域扩散,市场上的三七品质参差不齐.对三七药材的品质鉴别,传统方法以三七的质量大小来进行判别,市面上按每500 克三七的头数来评判三七的等级,头数越少,说明三七的品质越高.随着现代种植技术在三七种植中的应用和三七种植地域的扩散,传统的评判方法已经不能客观的评价三七的品质,研究建立能简便快速的鉴别三七质量的方法很有必要.
中药材的品质鉴定,主要包括药材的道地性和有效成分含量两方面,《中国药典2010》中规定,三七药材干燥品中人参皂苷Rg1、Rb1和三七皂苷R1的总量不得少于5.0%.对中药材有效成分含量的评价,主要采用高效液相色谱法来测量和评价,但此方法比较繁琐,用时长.陈士林等人认为光谱鉴定技术具有指纹特性,在中药材及饮片的质量管理和鉴定中具有实用性[3].在光谱技术中,傅里叶变换红外光谱(FTIR)技术反映样品的整体化学性质,仪器通用,操作简单,既可定性鉴别中药材品质,又可定量分析样本成分含量,在中药材的质量鉴定中有较强的应用发展前景.偏最小二乘回归法是一种多元统计数据分析方法,可实现多元线性回归分析、典型相关分析、主成分分析等多种分析方法的综合应用[4].偏最小二乘回归法对中药材及中成药的药效成份预测已有报道[5-7].本文拟按中国药典中对三七药材主要有效成分含量的测量方法来测量三七主根样品中R1、Rg1、Rb1的含量,以3 种皂苷的总含量作为建模分析中的因变量(实际值),同时测试各三七主根样品的FTIR 光谱,以样品的红外光谱作为自变量,利用偏最小二乘回归法建立定量分析模型来研究三七主根中3 种皂苷Rb1、Rg1、R1总含量的预测方法,以期为市场上三七的定量分析评价提供简便快捷和准确的方法.
1 实验部分
1.1 仪器设备与测试条件
傅里叶变换红外光谱仪,型号Frontier,美国Perkin—Elmer 公司,装备DTGS 检测器,光谱分辨率4cm-1,扫描范围4 000~400 cm-1,累加扫描次数16 次.
高效液相色谱仪,型号HPLC-10,日本岛津公司,包括泵(HPLC-10ATVP)、手动进样器(7725i)、二级管阵列检测器(SPD-M10A VP,190~800 nm).超声波清洗仪,型号SY3200-T,上海声源超声波仪器设备有限公司.
色谱条件,岛津液相色谱柱(Shim-pack VP-ODS,150 mm×4.6 mm,5 μm);流动相,乙腈-水梯度洗脱0~12 min,19%乙腈,12~45 min 19%~4%乙腈.流速1.0 mL/min;进样量10 μL;柱温30℃;检测波长,203 nm.
1.2 材料与试剂
三七主根样品,采自云南文山州及周边7 个县的12 个种植点,共100 株三年生三七的主根,样品在45℃恒温下烘干至恒重,用中药粉碎机粉碎待测.
试剂与标准品:乙腈为色谱纯(Fisher 公司);水为超纯水,其他试剂均为分析纯.三七皂苷R1、人参皂苷Rb1、人参皂苷Rg1,购自中国食品药品检定研究院.淀粉为分析纯(天津市福晨化学试剂厂);溴化钾为分析纯(天津市福晨化学试剂厂).
1.3 试验三七主根样品主要有效成分含量的测量
采用高效液相色谱法测量100 个三七主根样品的主要有效成分R1、Rg1、Rb1的含量,线性回归方程及试验样品所得数据的统计分析数值如表1 所示.
表1 试验三七主根样品有效成分含量的统计分析数值(mg·g-1)
1.4 光谱测量方法及数据处理
测试样品光谱时,将所取样品放入玛瑙研钵磨为均匀粉末,过200 目筛,按样品与溴化钾1∶75 质量比加入溴化钾,并搅磨均匀,然后压片测试光谱.测试中实时扣除背景的影响,然后将所有光谱在Omnic8.0 软件中进行自动基线校正、九点平滑和归一化等预处理.偏最小二乘回归建模时,将预处理后的样品光谱信息和样品中3 种皂苷的含量信息输入光谱分析软件TQ Analyst8.6,并将100 个样品分为校正集75 个,验证集25 个.建模分析中,采用导数光谱时,在TQ Analyst8.6 中计算样品光谱的导数光谱,并进行Norris Derivative 滤波处理.
2 结果与分析
2.1 三七主根及其主要组成物质的红外光谱分析
三七主根及其组成物质淀粉、R1、Rg1、Rb1的红外光谱如图1 所示,图2 为二阶导数光谱.三七主根各组成成分在中红外区域都有明显的吸收,其红外光谱主要吸收峰的峰强及归属[8]如表2 所示.在淀粉的红外光谱中,主要显示了3 400 cm-1、2 929 cm-1、1 647 cm-1、1 465 cm-1、1 159 cm-1、1 082 cm-1、1 018 cm-1、995 cm-1、928 cm-1、858 cm-1、763 cm-1等较明显的吸收峰,1 159 cm-1、1 082 cm-1、1 018 cm-1、995 cm-1附近阶梯增强的峰为C—O 伸缩振动[9],2 929 cm-1附近中等强度的吸收峰为亚甲基C-H 的反对称伸缩振动和对称伸缩振动,1 647 cm-1附近中等强度的吸收峰为O-H 弯曲振动,928 cm-1、858 cm-1附近中等强度的吸收峰为糖环中C-C 伸缩振动,763 cm-1附近的弱吸收为糖环骨架伸缩振动.人参皂苷Rg1、Rb1和三七皂苷R1的红外光谱非常相似,1 077 cm-1、1 042(1 035)cm-1附近的双峰为光谱的强峰,1 160 cm-1附近为中等强度的吸收峰,均为C—O 伸缩振动;1 458 cm-1、1 389 cm-1、1 359 cm-1、1 310 cm-1附近的弱吸收峰为C-H 弯曲振动、变角振动等的吸收峰;1 640 cm-1附近的弱吸收峰为羰基C=O 伸缩振动;2 970 cm-1、2 929 cm-1、2 875 cm-1附近中等强度的吸收峰来自甲基和亚甲基中C-H 的反对称伸缩振动和对称伸缩振动.
图1 三七、淀粉、R1、Rg1、Rb1 的红外光谱(A:三七;B:淀粉;C:R1;D:Rg1;E:Rb1)
图2 三七、淀粉、R1、Rg1、Rb1 的红外二阶导数光谱(A:三七;B:淀粉;C:R1;D:Rg1;E:Rb1)
表2 三七主要红外吸收峰归属情况
对比分析三七、淀粉、R1、Rg1、Rb1的红外光谱和二阶导数光谱,三七与淀粉光谱在1 160~1 020 cm-1范围的峰形、峰位和相对峰强都很相近,说明三七中淀粉的含量较高.R1、Rg1、Rb1的红外二阶导数光谱在3 000~2 850 cm-1范围,亚甲基和甲基的振动形成了一系列的吸收峰;淀粉的红外二阶导数光谱在此范围的吸收峰较少且相对较弱,三七在此范围也显示了多个吸收峰,且吸收光谱与R1、Rg1、Rb1的比较相似,说明此波段内三七的红外光谱主要为皂苷类物质亚甲基和甲基的振动.在1 050~988 cm-1范围,三七的二阶导数光谱显示了一系列吸收峰,对比淀粉及R1、Rg1、Rb1的二阶导数光谱,淀粉的二阶导数光谱在此范围显示了1 个很弱的吸收峰,而R1、Rg1、Rb1的二阶导数光谱在此范围显示了一系列的吸收峰,且相对较强,说明此范围三七红外光谱的振动与皂苷类物质的振动关系密切.上述红外光谱及二阶导数光谱分析反映,三七中富含淀粉和皂苷类物质.
2.2 三七中3 种皂苷总量的定量建模分析
在天然产物样品中,由于组成物质成分非常复杂,样品各组成成分的光谱重叠严重,含量高的物质成分光谱常常掩盖了含量低的物质成分光谱,且光谱变量间具有多重相关性,光谱变量数目大等,采用多元线性回归或主成分回归等方法来建立模型预测其中某种成分或某几种成分的含量比较困难.偏最小二乘回归是一种多元统计数据分析方法,可以实现多因变量对多自变量的回归建模,能较好的解决自变量间的多重相关性、样本数量相比变量数较少的回归问题[4].三七药材是一种天然产物,本试验的测量结果以及前面的光谱分析表明,三七主根中主要皂苷R1、Rg1、Rb1的含量相对较低,因此本试验采用三七主根样品的红外光谱结合偏最小二乘回归方法来建立3 种皂苷总含量的定量预测模型.将预处理后的样品光谱及各样品中3 种主要皂苷的总含量输入TQ Analyst8.6 软件,进行定量建模分析.
2.2.1 3 种皂苷总含量的定量建模分析
将100 个样品按三种皂苷含量大小较均匀的分为校正集75 个,验证集25 个,采用二阶导数光谱,选择全光谱(4 000~400 cm-1)范围的光谱变量进行3 种皂苷总含量的偏最小二乘回归定量建模.以软件自带的对模型性能指数(相对残差和,最大值为100,越接近100 越好)的计算结果来评价模型的优劣,反复调整校正集和验证集样品,直至得到较满意的模型为止.固定校正集和验证集样品,分别对原红外光谱、一阶导数光谱、二阶导数光谱在全光谱范围进行3 种皂苷总含量的偏最小二乘回归定量建模比较.表3 为不同级别的光谱在全光谱范围结合偏最小二乘回归定量分析3 种皂苷总含量的建模情况.由表3 知,3 种级别的光谱结合偏最小二乘回归法建立的模型都能较好的预测三七主根样品中的3 种皂苷总含量,相对而言,基于一阶导数光谱的偏最小二乘回归定量模型,性能更好.校正集样品的预测值与实际值的相关系数为0.980 8,RMSEC 值为7.87;验证集样品的预测值与实际值的相关系数为0.985 6,RMSEP 值为5.67,模型性能指数达到了89.9.图3 为基于一阶导数光谱的偏最小二乘回归定量模型对各实验样品的预测值与实际值的相关曲线,由图可知,预测值与实际值的相关性较高.
图3 一阶导数光谱的预测模型对各样品的预测值与实际值的相关曲线
表3 不同级别的光谱结合偏最小二乘回归法对3 种皂苷总含量的定量分析情况
2.2.2 不同光谱范围的一阶导数光谱对3 种皂苷总含量的建模分析
按照2.2.1 中建模所用的校正集和验证集样品,分别对一阶导数光谱在全光谱、1 800~700 cm-1、3 250~2 650 cm-1等3 个光谱范围的光谱变量进行偏最小二乘回归定量建模比较.表4 为不同光谱范围的一阶导数光谱结合偏最小二乘回归法对3 种皂苷总含量的定量分析情况.由表4 知,一阶导数的3 个不同光谱范围结合偏最小二乘回归法建立的3 种皂苷总含量测定模型也都能预测三七的3 种皂苷总量,相对而言,基于一阶导数全光谱的偏最小二乘回归定量模型,性能更好.
表4 不同范围的一阶导数光谱结合偏最小二乘回归法对3 种皂苷总含量的定量分析情况
3 结 论
利用傅里叶变换红外光谱技术测试了采自云南文山州及周边7 个县12 个种植点,共100 株三年生三七主根的傅里叶变换红外光谱,通过Omnic8.0 软件计算各样品红外光谱的一阶导数光谱和二阶导数光谱.通过与纯物质淀粉、皂苷Rb1、Rg1、R1的光谱比较,样品红外光谱反映,三七主根中富含淀粉和皂苷类物质.按中国药典中对三七药材主要有效成分含量的测量方法来测量三七主根样品中R1、Rg1、Rb1的质量百分比,分别以样品的红外光谱、一阶导数光谱和二阶导数光谱作为自变量,利用偏最小二乘回归法建立定量分析模型来研究三七主根中3 种皂苷Rb1、Rg1、R1总含量的测量方法,相对而言,基于一阶导数光谱的偏最小二乘回归定量模型,性能更好.校正集样品的预测值与实际值的相关系数为0.980 8,RMSEC 值为7.87;验证集样品的预测值与实际值的相关系数为0.985 6,RMSEP 值为5.67,模型性能指数达到了89.9.研究结果表明,基于三七主根的傅里叶变换一阶导数红外光谱结合偏最小二乘回归定量模型可以较好的预测三七主根中主要的皂苷含量,为生产实践中快速预测三七药材中的主要皂苷含量提供了简便快捷且准确的方法.