文冠果脂肪含量的近红外光谱预测模型建立及验证
2023-04-06葛朝红赵爽张洪伟闵卓郭鑫丽李伟明
葛朝红,赵爽,张洪伟,闵卓,郭鑫丽,李伟明
(河北省农林科学院棉花研究所,河北 石家庄 050051)
文冠果为我国特有的药食两用木本油料植物,种 仁含油量高达60%以上,且果实、根和茎均可入药,具有十分重要的经济价值[1,2]。文冠果除加工食用油外,还可以制作高级的工业原油。目前文冠果脂肪含量测定以化学分析方法为主,检验结果准确,但过程耗时费力、破坏样品。因此,急需开发一种简单快速、不破坏样品、绿色环保的文冠果脂肪含量测定方法。
近红外光谱(NIRS)技术可以快速、高效、无损检测出植物中的各成分含量[3,4],近年来已在农业、食品和医药等诸多领域广泛应用[5~13]。其中在农业上,已经建立了大豆、花生、玉米等作物相关成分的NIRS模型,并分析了各成分在不同种质中的含量[14~20],但截至目前,有关文冠果脂肪含量的NIRS 预测研究尚未见报道。本研究将波通公司第三代二极管阵列近红外分析仪DA7250 采集的光谱与对应的化学值相结合,通过The Unscrambler X 10.4(64-bit)软件分析,建立非破坏性快速检测文冠果脂肪含量的数学模型,以期实现文冠果脂肪含量的快速测定,节约测定时间和成本,为文冠果育种材料筛选和工业加工提供快捷有效的途径。
1 材料与方法
1.1 试验材料
试验材料为来自河北、山东、河南、辽宁、陕西等地不同类型的文冠果种质,其中,用于建模的种质46 份,用于模型外部验证的种质32 份。每份样品均随机选取种子100 g,去壳后烘干,进行NIRS 图谱采集;然后,将种子研磨、粉碎,过直径1.0 mm 的圆孔筛,取筛下物置于烘箱中80 ℃烘干至恒重,装入密封袋中保存,用于文冠果脂肪含量化学值的测定。
主要仪器或试剂有近红外分析仪DA7250(美国波通公司生产)、索式提取器(上海洪纪仪器设备有限公司生产)和石油醚(沸程60~90 ℃)等。
1.2 试验方法
1.2.1 样品集脂肪含量化学值的测定 参照GB 5009.6—2016,采用索式抽提法[21]测定文冠果种仁的脂肪含量。
1.2.2 样品集NIRS 图谱的采集 选择46 个文冠果样品种仁,采用近红外分析仪DA7250,在高级模式下创建采集光谱数据项目,每个数据点的分辨率为5 nm,光谱范围为950~1650nm。为了保证试验的准确性,光谱采集时每个样品均重复测定3 次,装样数为3 次。测定每个样品种仁的光谱数据,形成dx 格式文件。
将dx 格式文件导入The Unscrambler X 10.4(64-bit)软件,导入成功后添加每个样品对应的化学值;以光谱波长范围为X 变量、化学值为Y 变量,定义数据库范围;查看原始光谱,删除异常光谱及对应的异常值,形成样品光谱图谱。
1.2.3 NIRS 模型的建立 利用The Unscrambler X 10.4(64-bit)软件,对经过删除异常值的光谱利用1stDerivative、SNV 和Detrending 进行预处理,消除散射光和光程变化带来的影响,对化学值与采集的NIRS 数据分别进行拟合处理;采用偏最小二乘法(PLS)的化学计量学方法建立数学模型,利用反复采用内部交叉验证剔除异值和因子数的影响进行模型优化;通过比较模型的R-Square (决定系数)、RMSE(标准误差)和因子数的影响,筛选最佳模型。RMSE越小,R-Square 越大,模型的预测效果越好。
1.2.4 NIRS 模型的外部验证 随机选取32 个未参加建模的文冠果样品作为验证材料,利用筛选的NIRS 模型进行脂肪含量预测,采用索式抽提方法测定其化学值。通过比较每个样品NIRS 预测值与化学值的相关性和准确性,对所建模型的预测效果进行检验。
1.3 数据分析
采用Excel 2017 和The Unscrambler X 10.4(64-bit)软件进行数据处理与分析。
2 结果与分析
2.1 样品集种仁的化学值
索式抽提法测定结果(图1)显示,46 个文冠果种仁的脂肪含量为49.38%~68.98%,平均含量为61.62%。样品的脂肪含量基本上覆盖了生产和育种材料的常态分布范围,具有良好的连续性与代表性,能够满足NIRS 定标条件的要求。本研究选取的文冠果种仁脂肪含量变幅较宽,可用于NIRS 模型的建立。
2.2 样品集种仁的NIRS 图谱
采集46 个文冠果种仁的光谱信息后,利用The Unscrambler X 10.4(64-bit)软件生成其NIRS 曲线,结果(图2)显示,46 个样品的光谱曲线趋势基本相同,在波长950~1 650 nm 范围均有明显的吸收峰,同一个样品具有多处吸收峰,不同样品在同一吸收峰处的峰值差异明显。说明文冠果种仁的近红外吸收光谱可以反映其成分的定性定量分析结果。
图2 样品的NIRS 图谱Fig.2 NIR spectra of X.sorbifolia samples
2.3 NIRS 模型的构建
通过近红外分析仪采集光谱数据,并利用Unscrambler 软件,将种仁的脂肪含量化学值与采集的NIRS 数据分别进行拟合处理,采用偏最小二乘法(PLS) 建立模型,反复剔除异值,并利用R-Square和RMSE 筛选最佳模型,作为预测模型。结果(图3)显示,模型预测值与化学方法测定值具有较好的线性关系,拟合性较好,回归曲线的R-Square 为0.985 6、RMSE 为0.414 9。文冠果脂肪含量NIRS 模型的预测值与化学方法的测定值吻合性较好,模型可信,对文冠果脂肪含量进行预测具有很好的参考价值。
图3 预测模型的回归曲线Fig.3 Regression curve of the predicted model
2.4 NIRS 模型的外部验证
随机选取32 个未参加建模的文冠果样品,对建立的NIRS 模型的可靠性进行外部验证,结果(图4)显示,NIRS 预测值与化学方法测定值具有较好的线性关系,样品数据比较集中地分布在中心线附近,RSquare 为0.940 1,RMSE 为0.825 9。说明模型预测结果可靠性高。利用NIRS 模型得到的文冠果脂肪含量预测值较准确,该模式可用于文冠果育种材料的筛选和工业生产。
图4 NIRS 模型外部验证的回归曲线Fig.4 Regression curve of externally validation for NIRS model
3 结论与讨论
文冠果为我国特有的木本油料作物,种仁含油量60%以上,其不饱和脂肪酸含量大于90%,含有可修复大脑神经细胞、促进神经纤维再生,对于神经退行性疾病和神经系统紊乱等具有重要预防和治疗作用的神经酸,具有特殊的营养保健功能。近年来,NIRS技术在农业上的应用越来越广泛,在多种作物上建立了预测模型,如,耿立格等[14]建立了利用近红外光谱无损测定大豆种子生活力的模型,纪红昌等[18]建立了基于近红外光谱的花生子仁含油量预测模型,方彦[20]建立了利用近红外光谱法非破坏性测定玉米子粒粗淀粉含量的预测模型。而目前文冠果脂肪含量的测定通常采用索式提取法或酸水解法,需要粉碎样品,并使用化学试剂对样品进行处理,不但花费大量时间,破坏样品的完整性,还容易造成环境污染。本研究利用DA7250 近红外光谱仪采集文冠果种仁的光谱信息,结合Unscramble 软件,建立了种仁脂肪含量的预测模型,该模型可以较准确、快速地测定整粒、半粒、粉状等各种状态下文冠果种仁的脂肪含量。与传统的检测方法相比,该方法不破坏样品,避免了原材料的浪费,可以在无化学试剂污染的条件下,高效、快速地测定文冠果种仁的脂肪含量。
由于近红外光谱的收集受到测量环境、测量技术、背景成分、样品待测成分等多种因素的影响[22],使得光谱信息大量重叠、异常复杂,预测模型的参数构成复杂,因此,近红外光谱模型的预测准确性成为限制其自身发展的最大问题。因此,科学取样,降低试验误差,对提高光谱分析模型的预测准确性非常重要。为了使模型达到理想的预测效果,本研究随机选择了覆盖常态下生产和育种范围,来源于河北、山东、河南、辽宁、陕西等多个产地,脂肪含量分布在49.38%~68.98%的文冠果资源材料,减少了试验误差,提高了模型的稳定性,拓宽了模型的适用范围;模型构建过程中剔除了包含异常光谱的材料,通过预处理消除了散射光和光程变化的影响,并对化学值和光谱进行了多次拟合处理,建立并逐步优化模型,最终得到了R-Square 为0.985 6、RMSE 为0.414 9 的文冠果脂肪含量测定优化模型。综上所述,我们建立的文冠果种仁脂肪近红外光谱预测模型稳定、准确,检测方法经济、快速、高效、无污染,为文冠果育种材料筛选和工业加工提供了快捷有效的途径。