红外光谱结合化学计量学对栽培滇重楼的产地鉴别研究
2023-03-10王元忠
王元忠,沈 涛
1.云南省农业科学院药用植物研究所,云南 昆明 650200
2.玉溪师范学院化学生物与环境学院,云南 玉溪 653100
滇重楼Paris polyphyllaSmith var.yunnanensis(Franch.)Hand.-Mazz.是百合科(Liliaceae)重楼属ParisL.植物,其干燥根茎是云南特色药材之一[1]。具有清热解毒、消肿止痛、凉肝定惊的功效,在治疗疔疮肿痛、毒蛇咬伤等方面疗效显著[1-2]。现代化学成分和药理活性研究表明,滇重楼含有丰富的甾体皂苷、黄酮类化学成分,具有抗肿瘤、抗菌、止血等药理作用[1]。
滇重楼目前在云南地区已实现广泛种植。然而,栽培技术以及生长环境的差异是影响药材内在品质的主要因素[3-4]。滇重楼属多年生草本植物,市场上不同年限的栽培重楼均有出售,有研究表明8年生滇重楼6 种甾体皂苷含量最高,适合作为滇重楼的最佳采收期。虽然多种分析技术已经广泛应用于重楼药材的质量评价,但栽培重楼的产地鉴别仍是目前资源利用及药材质量控制中的难点[5]。
衰减全反射-傅里叶变换红外光谱(attenuated total reflection-Fourier transform infrared spectra,ATR-FTIR)技术凭借其简单、快速、样品可回收的优势,在中药、食品、环境等领域受到越来越多重视[6-8]。ATR-FTIR 技术结合化学计量学方法在种类鉴别研究方面应用较多,如成功地对五种忍冬属植物进行了鉴别和分类[9]。利用ATR-FTIR 光谱信息结合模式识别方法对4 种巴旦木也可较好地鉴别,正确率为94.45%[10]。此外,ATR-FTIR 技术结合化学计量学对采自12 个月的石斛样品进行鉴别,得到了令人满意的分类效果,正确率达到97.92%[11]。以上研究表明ATR-FTIR 技术应用于中药材鉴别研究具有可行性与有效性。
本实验通过ATR-FTIR 光谱信息结合偏最小二乘判别分析(partial least squares discrimination analysis,PLS-DA)模型,比较3~8年生13 个不同产地栽培滇重楼样品的光谱信息差异,为相同年限不同产地样品鉴别提供快速有效的方法。
1 材料与仪器
1.1 材料
841 株栽培滇重楼样品分别采自云南省和四川省,共计13 个采样点,分别为红河(HH)、丽江(LJ)、怒江(NJ)、昆明(KM)、德宏(DH)、四川(SC)、普洱(PE)、玉溪(YX)、文山(WS)、大理(DL)、楚雄(CX)、保山(BS)和临沧(LC)。每个采样点每年在同一时间采收一定数量不同栽培年限样品,详细信息如表1所示。原植物经云南省农业科学院药用植物研究所张金渝研究员鉴定为滇重楼P.polyphyllavar.yunnanensis(Franch.)Hand.-Mzt.。样品采集后去除泥沙,洗净根茎部位,切成薄片于干净白纸上阴干。将干燥样品分别粉碎,过100 目筛,置于密闭自封袋中避光保存,备用。
表1 栽培滇重楼样品信息Table 1 Sample information of cultivated P.polyphylla var.yunnanensis
1.2 仪器与试剂
Frontier 型傅里叶变换红外光谱仪配备衰减全反射附件(Perkin Elmer 公司,美国);FW-100 型高速万能粉碎机(天津市华鑫仪器厂);100 目不锈钢筛(北京中西泰安技术服务有限公司);KQ5200型超声波清洗机(昆明市超声仪器有限公司);AR1140 型万分之一分析天平(上海升隆电子科技有限公司)。蒸馏水由实验室 Milli-Q 系统(Massachusetts 公司,美国)自制。
2 方法
2.1 红外光谱采集及预处理
称取定量根茎粉末(2.0±0.2)mg 于金属圈中央(ZnSe 晶体表面),调节压力计旋钮,统一进度条为(131±1),使其形成厚度一致的样品粉末片。设定红外光谱扫描范围4 000~550 cm-1,光谱分辨率为4 cm-1,累加扫描16 次,每个样品平行测定3次,取平均光谱。样品粉末片扫描之前,采集空白晶体表面红外光谱,扣除空气和晶体部分散射光谱干扰。切换样品时,使用含蒸馏水的无尘布擦拭晶体表面和压力计顶端,排除不同个体之间的样品残留干扰。光谱测定过程中,保持实验室温度25 ℃,空气相对湿度30%。原始红外光谱经过高级ATR校正(晶体:ZnSe;入射角:45.0°;反射次数:1次;样品折射率:1.50%);校正后的光谱经自动基线校正、自动平滑、导数、多元散射矫正,以减小光散射对光谱的影响,降低信号噪音,消除光谱峰重叠,提高分辨率。
2.2 数据处理
为了减少无关变量信息的干扰,使相应判别模型尽可能代表样品的内在化学变量信息,同时增强模型的计算精度和减少模型运行时间,剔除光谱波段4000~3700 cm-1、2799~1800 cm-1和682~653 cm-1,上述波段分别代表光谱基线区、晶体光谱区和二氧化碳光谱区[12]。3 个光谱区均和样品化学信息无关且影响峰形和后续化学计量学分析。剔除该3 个光谱区之后的其它波段用于判别模型的建立。
PLS-DA 通过降维将原始光谱数据转化为没有相关性的潜在变量(latent variables,LVs)。本节通过最大累计预测值(Q2),选择最佳LVs 数目建立判别模型。此外,通过Kernnard-Stone 算法将相同栽培年限不同栽培产地样品分为训练集(2/3 样品)和预测集(1/3 样品)[13]。训练集用于判别模型的建立,预测集用于对建立模型的外部验证,分析该模型对未知样品的预测能力。累积贡献率(R2)、Q2、交叉验证均方根误差(root measure square error cross of validation,RMSECV)、预测均方根误差(root measure square error of prediction,RMSEP)、训练集和预测集判别正确率作为不同模型性能评价参数。以最佳判别模型为前提,通过置换检验(permutation test,n=30)分析模型的拟合能力。R2X、Q2Y、R2-intercept、Q2-intercept作为置换检验的评价参数。其中,R2-intercept<R2X;Q2-intercept<Q2Y;Q2-intercept≤0 时,表明模型拟合程度较好。Matlab 6.5 软件(MathWorks,美国)用于训练集和预测集的划分,SIMCA-P+14.1 用于PLS-DA 建模。
3 结果与分析
3.1 最佳导数预处理
所有光谱数据首先经过多元散射校正(Multiplicative scattering correction,MSC)去除无关信息波段,然后分别通过一阶导数(first derivative,FD)、二阶导数(second derivative,SD)和三阶导数(third derivative,TD)预处理并建立不同判别模型。分析结果见表2。以训练集和预测集正确率为主,结合其他评价参数筛选不同模型的最佳导数处理方式。FD 和TD 分别处理后,3年生滇重楼产地鉴别模型训练集和预测集正确率均为100%;TD 处理之后模型RMSECV(0.188 8)和RMSEP(0.122 5)均低于FD 处理之后的判别模型(RMSECV=0.188 8;RMSEP=0.122 5),表明前者训练集和预测集判别误差较小。此外,TD 处理之后,R2(0.890 5)和Q2(0.598 3)均高于FD 处理之后模型,表明该模型可以解释89.05%变量信息,对未知样品的预测能力较高(大于0.5)。4年生滇重楼产地判别结果显示,SD 为最佳光谱预处理方式(PLS-DA 训练集和预测集判别正确率均为100%)。SD 处理之后模型对未知样品预测能力(Q2=0.649 7)弱于TD 处理之后光谱建立的判别模型(Q2=0.665 2),但该模型可以解释更多的光谱信息(R2=0.873 6),且对未知样品的预测误差较低(RMSEP=0.138 6)。5~8年不同产地判别模型显示,无论采用何种导数处理方式,模型训练集和预测集判别正确率均为100%。然而,TD 处理之后模型训练集判别误差和预测集判别误差均为同栽培年限最低,且对相同年限不同产地未知样品预测能力最强(Q2最大)。除7年生样品外,TD光谱预处理能够使相同年限产地判别模型解释较多的光谱变量信息。5~8年不同产地判别模型相比3~4年模型,可以解释90%以上光谱信息。综上所述,TD 为5~8年不同产地判别模型最佳光谱预处理方式。
表2 不同导数处理PLS-DA 模型判别结果及其模型参数Table 2 Discrimination results and parameters of PLS-DA models with different derivatives
3.2 相同年限不同产地样品可视化分析
由栽培3年12个栽培产地训练集样品的聚类结果可知,怒江和四川产滇重楼样品聚为一类,玉溪、红河、临沧和普洱聚为一类,其他5 个产地样品聚为一类。由栽培4年11 个栽培产地训练集样品聚类趋势结果可知,4年生样品受产地影响较小,产自四川和云南10 个产地样品,没有明显的聚类趋势。3年生和4年生不同产地样品聚类结果表明,栽培滇重楼生长过程中内部化学成分种类和含量存在一定变化,栽培年限为4年时,同产地不同个体之间和不同产地样品之间化学成分差异减小,品质的一致性较好。文山栽培5年滇重楼样品在得分图上显示单独的聚类趋势,同3年生样品显示出相似的聚类趋势;楚雄栽培5年样品也显示出特殊的聚类趋势。由6年生7 个栽培产地样品显示出3 种聚类趋势可知,丽江和四川聚为一类,文山和红河聚为一类,大理、玉溪和楚雄呈现一定的聚类趋势。7年生样品之间产地差异性逐渐增大,楚雄、玉溪、丽江和保山样品单独聚类趋势明显;红河、大理和文山样品聚为一类,表明红河和文山样品栽培6~7年之后化学成分变化的一致性。8年生滇重楼以甾体皂苷含量为评价指标,被推荐为滇重楼最佳的采收时间。8年生7 个产地不同滇重楼样品显示,玉溪产滇重楼被单独聚为一类;红河和文山样品仍然聚为一类;楚雄、丽江和德宏样品聚为一类。上述聚类结果表明,5~8年栽培时间内,红河和文山栽培样品显示出同步的变化趋势。进一步通过置换检验,判定模型的鲁棒性和拟合效果。基于最佳光谱预处理方式建模之后,每个模型的每一类均可以产生R2X、Q2Y、R2-intercept 和Q2-intercept 4 个参数。通过比较4 组参数,判断模型的鲁棒性和拟合效果。表3 为最佳预处理光谱数据建模之后不同类别的4个参数汇总结果。结果显示,不同模型均满足模型鲁棒性较高和拟合效果较好的条件。
表3 PLS-DA 判别模型鲁棒性参数Table 3 Validation parameters of PLS-DA model robust
3.3 相同年限不同产地样品重要变量分析
去除光谱基线区、晶体光谱区和二氧化碳光谱区之后的红外光谱可以有效反映栽培滇重楼根茎中的大部分化学结构信息。通过变量投影重要性(variable importance for the projection,VIP)分析筛选对产地区分贡献较大的光谱变量,VIP 值大于1 为对产地鉴别贡献较大的重要变量。将VIP 大于1 的重要变量和原始红外光谱对比,分析相应重要变量对应光谱的化学信息。图2 为不同栽培年限VIP 及其对应的平均光谱图。可以直观发现3700~1800 cm-1在不同PLS-DA判别模型中均为贡献较大的变量波段;1800~550 cm-1不同生长年限贡献变量存在一定差异。重要变量数量分析显示,448、455、452 个VIP 大于1 的重要变量分别对5、6、8年栽培滇重楼产地鉴别贡献较大;相比3年生滇重楼,5年需要较少的重要变量。3、4、7年生滇重楼需要较多的重要变量(472、481、486个重要变量)。其中,42 个变量(表4)为6 个栽培年限不同产地判别模型的共有重要变量。
表4 不同栽培年限共有重要变量及其VIP 值Table 4 Common important variables and VIP values of different cultivated years
图1 不同栽培年限下不同栽培产地样品PLS-DA 得分图Fig.1 Score plots of PLS-DA of samples from different cultivated regions with different growing years
图2 不同栽培年限下不同栽培产地模型VIP 图Fig.2 VIP plot of discrimination models of different cultivated regions growing different years
4 讨论
生长年限是影响重楼品质的关键因素。研究表明,滇重楼繁殖率低,药用部位主根的自然生长速度十分缓慢,通常需生长4年达到开花期,且不同生长年限的重楼品质存在较大差异[14-16]。相较于前人研究,本实验进一步关注了生长年限这一关键因素,综合分析年限、产地对滇重楼整体化学成分的影响,为后续开发复杂重楼样品光谱鉴别技术提供研究思路。
利用茎痕判定重楼药材生长年限,是药材传统鉴别方法,也有学者利用该特征对重楼药材质量进行评价[17]。然而该方法需要较多经验积累,受人为因素影响大,在实际操作及药材批量生产、质检过程中仍难以广泛应用。本实验红外光谱指纹图谱分析表明,随着栽培年限的增长,滇重楼根茎中化学成分含量和种类可能发生变化;红外光谱指纹图谱一定程度上能客观反映上述变化。共有重要光谱变量分析显示,不同生长年限滇重楼光谱指纹图谱均有差异。文献报道重楼皂苷I为不同栽培年限滇重楼的共有成分[18];本实验筛选所得重要变量:1641 cm-1和1022 cm-1光谱信号变化均与甾体皂苷含量变化紧密相关[18]。而3045~3664 cm-1的谱带为O-H 的主要吸收峰,与之相关的光谱信号也可用于表征滇重楼甾体皂苷、黄酮、脂肪酸等成分的变化情况[1]。以上研究为后续不同生长年限滇重楼药材光谱快速鉴别技术的开发、完善及生产应用奠定理论基础。
除生长年限,不同栽培产地重楼饮片皂苷含量差异也可能直接影响重楼的临床疗效[2-3]前期市场调查发现市售不同产地3~8年生的栽培滇重楼多数未标明栽培产地。然而产地气候条件和人工栽培技术差异是影响其品质的重要因素。本研究发现PLS-DA 不仅可以作为判别模型,预测同一年限未知样品的产地,其得分图也可显示出训练集中不同产地样品的聚类趋势。通过得分图发现,红河、文山样品有明显的聚类趋势与两者均属于滇东南地区独特的气候条件相吻合[19]。滇重楼生长的滇东南地区降水量与滇西南相比略低,但与滇中、滇东北、滇西北和滇西等地相比,其降水量又相对充盈[19-20];结合文献推测适宜的降水量加之湿润的季风性气候可能是红河、文山栽培滇重楼特殊聚类的可能原因;相关结论还有待进一步栽培实验的观察与验证。
利益冲突所有作者均声明不存在利益冲突