基于近红外光谱技术建立湿加松针叶黄芪苷含量的预测模型*
2022-04-25彭冠明吕欣欣毛积鹏欧惠玲谢李福明
彭冠明 吕欣欣 毛积鹏, 欧惠玲谢 诺 李福明
(1. 台山市红岭种子园,广东 台山529223;2. 华南农业大学 林学与风景园林学院/广东省森林植物种质创新与利用重点实验室,广东 广州 510642)
《本草纲目》中有关于松针入药的记载“细切,以水及面饮服之,或捣屑丸服,可断谷及治恶疾”。通过现代科学技术发现,松针中含有包括挥发油、色素及维生素、氨基酸、蛋白质类、黄酮类、莽草酸、可溶性糖类、木质素等多种化学成分[1],其中黄酮类化合物具有降血糖[2]、调血脂[3]、抗氧化[4]、抑菌[5]、消炎[6-7]等作用。随着生活水平的提高,导致现实生活中人们被各种疾病所困扰,对具有保健功能的纯天然绿色保健品需求也越来越大,作为松树的主要副产品之一,松针在保健品中的应用前景非常广阔。黄芪苷是松针中多种黄酮类化合物,是多种中药材的重要有效成分之一[8],主要的提取方法是通过溶剂提取法[9]。随着提取工艺的不断改进,超声波辅助提取法、减压内部沸腾法等方法被应用于松针黄酮类化合物的提取过程中,结果表明可以提高松针黄酮的得率[10-11]。
传统的植物黄酮类化合物含量测定需要借助于高效液相色谱-质谱(HPLC-MS)、气相色谱-质谱(GC-MS)、紫外分光光度计法等,然而这些提取方法都有一定的局限性,如需要用到具有污染性的化学试剂、成本高、耗时长且对受测样品造成了一定的损坏。近红外光谱分析技术是一项绿色环保的分析技术,具有速度快、成本低、易操作等特点,在农业、食品等领域的研究和应用十分广泛[12-13],例如紫花苜蓿Medicago sativa品质的评价[14],桔梗中总皂苷的快速检测[15],食用产品玛咖粉的真假鉴定[16]等。近红外光谱技术在植物有效成分含量的预测方面有大量的成功案例,如朱斌等[17]利用近红外光谱分析技术建立了能够定量测定金丝桃Hypericum monogynum药材中的金丝桃苷与贯叶金丝桃素的近红外预测模型;黄倩倩等[18]采用偏最小二乘算法建立了近红外漫反射光谱技术快速测定中药黄芩Scutellaria baicalensis中主要活性成分黄芩苷和总黄酮含量的方法。
湿加松Pinus elliottii×P. oaribaea是松科松属的常绿乔木,是湿地松与加勒比松的杂交后代,又称杂种松、杂交松,它综合了其双亲干型通直、生长迅速、适应性强、产脂量高等优点,湿加松还是世界上发达国家商品林基地的主要树种之一[19-20]。本研究旨在建立一种能够快速预测湿加松针叶中黄芪苷成分含量的近红外模型,以期为湿加松针叶黄酮类成分含量的测定提供更加快捷有效的方法,为高黄酮类含量的湿加松选育工作提供技术基础。
1 材料与方法
1.1 试验材料
以种植于广东省台山市红岭种子园的6 a 生湿加松子代测定林为研究材料,于2019 年8 月分别随机采取了112 个生长旺盛且无病虫害单株的当年生松针组织部位鲜样约100 g。75 ℃条件下烘72 h,充分粉碎后过60 目筛,得112 份湿加松松针粉末样本。随机选择其中94 份样本作为预测集,其余18 份样本作为外部验证集。
1.2 样本制备与标准品配制
各样本分别称取100 mg 于10 mL EP 管中,随后加入5 mL 甲醇溶液,充分混匀后在室温下超声60 min,4 ℃条件下,120 00 rpm 离心12 min。取上清液浓缩至干后加200 μL 甲醇复溶,混匀后取上清液过0.22 μm 微孔滤膜,滤液保存于进样瓶中用于LS-MS 分析。称取黄芪苷的标准品适量,并与80%的甲醇溶液混合制成母液。量取适量母液,用80%甲醇稀释至合适浓度,制成工作标准液置于-80 ℃待LC-MS 分析。
1.3 色谱和质谱数据采集
色 谱 条 件:ACQU ITY UPLC®BEH C18 色谱 柱(2.1×100 mm,1.7 μm, 美 国Waters 公司),进样量5 μL,柱温40 ℃,流动相A 为0.1%甲酸,流动相B 为甲醇,流速设置为0.25 mL/min。梯度洗脱条件为0~1 min,10% B;1~3 min,10%~33% B;3~10 min,33% B;10~15 min,33%~50% B;15~20 min,50%~90% B;20~21 min,90% B;21~22 min,90%~10% B;22~25 min,10% B。
质谱条件:电喷雾电离(ESI)源,负离子电离模式。离子源温度500 ℃, 离子源电压4 500 V,碰撞气6 psi,气帘气30 psi,雾化气和辅助气均为50 psi。采用多重反应监测(MRM)进行扫描。
1.4 近红外光谱数据收集
采用DA7200 近红外光谱分析仪扫描样品,收集近红外光谱数据,首先将仪器室温度控制在22 ℃左右,并将样本提前于仪器室放置24 h。开机后预热30 min,近红外光光斑直径为3.5 cm,近红外光谱扫描范围为950~1 650 nm,仪器分辨率为5 nm,光谱采集速度约为100 条光谱/s,扫描次数为100 次/s。每一个松针粉样品扫描3 次和重复装样3 次,取其平均近红外光谱作为样品的原始光谱。
1.5 近红外建模方法
通过采用偏最小二乘法回归(Partial Least Square Regression,PLS)法对近红外光谱数据进行分析,能够对光散射和其它组分带来的干扰做出补偿,比对逐个因变量做多元回归更有效。适用于复杂体系,而且模型比较稳定、分析性能和预测精度更好。因此,本研究采用偏最小二乘法对实验样品进行近红外建模。
1.6 模型评价方法
模型的预测准确性从两个方面评价,一方面是相关系数,包括校正集相关系数(Related coefficient of calibration,Rc)和交互验证集相关系数(Related coefficient ofvalidation,Rv),校正集均方根误差(Root Mean Square Error of Calibration,RMSEC)和交互验证集均方根误差 (Root Mean Square Error of validation, RMSEV)。所建模型应具有较高的Rc和Rv,较低的RMSEC 和RMSEV,其中主要以Rv和RMSEV 作为判断标准。另一方面,模型应该具有较高的相关系数,即预测值与实测值的相关系数(Related coefficient,r)和较低的预测均方根误差(Root Mean Square Error of prediction, RMSEP)。
1.7 数据处理
利用Microsoft Excel 2019 和R 3.5.1 软件对各样本中黄芪苷含量进行统计分析,使用软件The Unscrambler 9.7 对近红外光谱图进行处理和模型建立。
2 结果与分析
2.1 松针粉黄芪苷实测值的数据特征
利用LC-MS 对所有样本中的黄芪苷进行定量检测,各数据集样本黄芪苷含量的统计结果如表1 所示。94 个校正集样本黄芪苷含量的最小值为3.67 μg·g-1,最大值为27.67 μg·g-1,平均值为10.24 μg·g-1,标准偏差为4.99 μg·g-1。18 个验证集样本黄芪苷含量的最小值为4.84 μg·g-1,最大值为17.11 μg·g-1,平均值为10.74 μg·g-1,标准偏差为4.11 μg·g-1。
表1 湿加松针叶校正集和验证集样本黄芪苷含量的基本统计特征Table 1 Descriptive statistics about content of astragalin of calibration set and validation set of P. elliottii × P. caribaea needles
2.2 不同光谱预处理方法的比较
本研究比较了归一化(Normalization)、多元散射校正(Multiplicative Scattering Correction,MSC)、标准正态变量转换法( Standard Normal Variate Transformation,SNV)、 一 阶 导 数(First Deviation,FD)、滤波拟合(Savitzky golay,SG)以及FD+SG 与FD+SNV 共7 种光谱预处理方法。并以校正集相关系数、校正集均方根误差、交互验证集相关系数及交互验证集均方根误差为评价指标,其中Rc在4 个参数中起着主导作用,Rc和Rv越 大 越 好,RMSEC 和RMSEV 越 小 越 好[21]。从表2 可以看出,SNV、SG、FD+SG 预处理下中的Rc都小于0.8,偏低;在Rc高于0.8 的4 个预处理方法中,FD+SNV 的Rc 值最大,RMSEC 和RMSEV 均为最小,模型最好。
表2 不同光谱预处理方法下湿加松针叶黄芪苷含量预测模型的参数比较Table 2 Comparison of parameters of content of astragalin prediction model in P. elliottii × P. caribaea needles under different spectral pretreatment methods
对比无预处理光谱图(图1),经过FD+SNV预处理的光谱图中(图2),光谱分布更加集中,吸收峰更加明显。这表明,经过预处理后,近红外光谱数据能够更好的反应样品中成分含量的近红外吸收特点,对于近红外预测模型的建立有更好的优化效果。
图1 94 个湿加松针叶校正集样品近红外原始反射光谱Figure 1 Near infrared original reflection spectrum of 94 correction set samples of P. elliottii × P. caribaea needles
图2 FD+SNV 法处理湿加松松针黄芪苷含量预测模型近红外光谱图Figure 2 Near infrared spectrum of astragaloside content prediction model of wet plus pine needle treated by FD + SNV method
2.3 黄芪苷定量分析模型的建立
将近红外光谱数据导入软件The Unscrambler 9.7,进行光谱数据预处理和模型建立,采用FD+SNV 预处理,950~1 650 nm 建模波段,主成分数为6,建模结果如图3 所示。Rc=0.808 2,RMSEC=1.931 4,Rv=0.710 9,RMSEV=2.398 8。黄芪苷含量校正集相关系数最大,校正集和交互验证集均方根误差均最低,说明模型预测性能较好。
图3 湿加松黄芪苷含量近红外预测模型Figure 3 The near-infrared prediction model of content of astragalin in P. elliottii × P. caribaea
2.4 近红外模型的外部验证
为检验预测模型的可靠性,本研究利用所建预测模型对18 个验证集样本的黄芪苷含量进行了预测并与其实际测定值进行比较分析(图4)。结果表明,验证集样本的预测值与实际测定值之间存在绝对误差,但最大为6.21,R=0.812 9,RMESP=2.973 8,接近于RMSEC,表明模型预测效果好,可信度高。
图4 黄芪苷含量近红外预测模型的外部验证结果Figure 4 External verification results of near infrared prediction model of astragaloside content
3 讨论
本研究基于近红外光谱技术的应用,结合偏最小二乘法建立了湿加松松针黄芪苷含量近红外快速预测模型,其Rc值为0.808 2,利用外部验证集来对模型进行验证,得到r=0.812 9。吴宪等[22]根据尾叶桉拉丁名木材密度光谱特征值建立了尾叶桉木材密度近红外预测模型,该模型的相关系数达到0.83,具有较高的检测精度。本研究与前人的研究结果相近,说明该模型能够准确预测湿加松针叶黄芪苷的含量。
湿加松的研究多集中在其产脂量的和木材性质的提高上,关于湿加松针叶的生物活性成分含量研究鲜有相关报道。本研究建立的湿加松针叶黄芪苷含量近红外快速预测模型可以用来进行湿加松松针黄芪苷含量的快速预测,在湿加松高活性成分含量的良种选育和利用近红外光谱技术预测植物的活性成分含量工作以及应用推广中起到奠定基础的作用。但是在本研究中的试验样品仅包含于台山市红岭种子园现有湿加松种质资源,为了进一步扩大模型的适用性、提高模型的准确率,还需要在模型中加入其他分布地的湿加松样品。