近红外光谱法快速检测美藤果主要品质指标的定量模型研究
2020-04-10杨水艳陈国艳刘付英邵志凌
杨水艳,彭 涛,杨 瑾,陈国艳,郭 颖,陶 银,刘付英,邵志凌
(1.云南省粮油科学研究院(云南省粮油产品质量监督检验测试中心),昆明 650033;2.西双版纳印奇生物资源开发有限公司,云南 西双版纳 666100)
美藤果(PlukenetiavolubilisL.),又名南美油藤、星油藤、印加果、印加花生、印奇果,是大戟科(Euphorbiaceae)的一种木质藤本植物,原生长在南美洲的热带雨林海拔200~1 500 m,印加语称Sacha Inchi或Inca Inchi,已被南美印第安土著居民食用了3 000多年[1-5]。美藤果当年种植,当年可挂果,2~3年即进入盛产期,产量很高[6]。美藤果种子的主要成分是油脂、蛋白质、维生素、甾醇等生物活性物质,以及生物碱、皂甙和香豆素等次生代谢物[7]。美藤果含油量很高,在41%~54%,蛋白质含量25%~27%[8-12]。美藤果油对调节血脂、预防心血管疾病、保养肌肤等方面有显著作用[13]。
水分含量、含油量和蛋白质含量是美藤果的重要品质指标,检测这些指标主要采用烘箱干燥法、索氏抽提法、凯氏定氮法等传统方法。美藤果种子有一层近1 mm厚的果壳,而且美藤果含油量较高,在检测之前须将其粉碎至合适的粒度,普通的实验室粉碎机难以对其进行粉碎。Niu[9]、Zanquia[11]等采用搅拌机进行粉碎后过筛以达到实验要求。GB/T 14488.1—2008《植物油料 含油量测定》中规定对于含油量高的样品,在粉碎前可将其放入-10~-20℃下冷冻,但是粉碎过程中及粉碎后要避免其吸收水分。所以在采用传统方法对美藤果的品质指标进行检测时,样品的前处理过程比较烦琐,耗时长,检测中消耗试剂多。相对于传统方法,近红外光谱法具有分析速度快、效率高、非破坏性、分析成本低、无污染、几乎不需预处理、操作方便、无需使用试剂等优点[14-15]。目前,国内外尚无已知的美藤果品质指标的近红外光谱检测方法。本文通过传统国标方法检测美藤果水分含量、蛋白质含量和含油量的化学值,之后与美藤果(包括颗粒和粉)的近红外光谱进行拟合之后,建立美藤果水分含量、蛋白质含量和含油量的近红外光谱校正模型,并对该模型进行验证。建立的模型可用于美藤果采收及美藤果油生产加工企业快速检测美藤果的品质,同时也可用于美藤果种子培育过程中品质监测。
1 材料与方法
1.1 实验材料
1.1.1 原料与试剂
美藤果,由西双版纳印奇生物资源开发有限公司采集并提供,共121份,每份3 kg,随机抽取其中的101份样品用于建立校正模型,20份用作验证。美藤果主要采自我国云南景洪、普文、勐腊、勐养、大勐龙、普洱市、墨江县、红河州,泰国以及老挝琅勃拉邦、南塔、乌多姆赛、丰沙里。采集时间为2016—2018年的不同收获月份。
石油醚(沸程60~90℃),天津市风船化学试剂科技有限公司;EDTA标准品(含氮量9.58%),丹麦FOSS公司。
1.1.2 仪器与设备
PM200行星式球磨仪,德国Retsch公司;YS-02小型高速粉碎机,北京燕山正德机械设备有限公司;SER148脂肪测定仪,意大利VELP公司;ThermoStable SOFW155电热鼓风干燥箱,韩国DAIHAN Scientific公司;DA7250近红外分析仪,瑞典波通仪器公司;Dumatec 8000杜马斯燃烧定氮仪,丹麦FOSS公司。
1.2 实验方法
1.2.1 样品制备
所有样品在测定之前用孔径4.5 mm的筛子去除灰尘等杂质,手工去除其他固体杂质。用于采集近红外光谱及水分含量测定的美藤果采用YS-02小型高速粉碎机粉碎12 s(粉碎时间过长会导致出油过多,影响后续测定),得到美藤果粉。粉碎的样品装入聚四氟乙烯袋子密封并及时用于水分含量测定及近红外光谱扫描。
用小型高速粉碎机粉碎得到的美藤果粉,粒度达不到含油量(湿基)和蛋白质含量(湿基)测定的要求,故采用PM200行星式球磨仪进行粉碎。通过预实验确定560 r/min速度粉碎美藤果90 s,此时样品成膏状,果肉、果壳粉碎充分且基本不会出油。
1.2.2 化学值检测
水分含量测定参照GB 5009.3—2016《食品安全国家标准 食品中水分的测定》第一法直接干燥法。每个样品重复测定2次,相对误差不得超过10%。
含油量(湿基)测定参考GB/T 14488.1—2008《植物油料 含油量测定》、GB 5009.6—2016《食品安全国家标准 食品中脂肪的测定》及文献[9],按下述操作进行:称取2.5 g(精确到0.001 g)样品于滤纸筒中,用石油醚(沸程60~90℃)于130℃浸提4 h,淋洗3 h,回收石油醚后将含有抽提油脂的恒重烧杯于(103±2)℃的电热鼓风干燥箱干燥1.5 h后冷却称重。每个样品重复测定2次,相对误差不得超过10%。
蛋白质含量(湿基)测定参考GB 5009.5—2016《食品安全国家标准 食品中蛋白质的测定》第三法燃烧法。通过对仪器条件及工作曲线等进行优化,最终确定检测条件:燃烧炉顶部温度1 100℃;燃烧炉底部温度300℃;还原炉顶部温度600℃;还原炉底部温度750℃;恒温箱40℃;IC反应器150℃。以EDTA为标准物质建立工作曲线,称取约100 mg样品进行测定。蛋白质含量为氮含量乘以系数6.25。每个样品重复测定2次,相对误差不得超过10%。
1.2.3 校正模型的建立
1.2.3.1 近红外光谱采集
考虑到模型除了可以用于实验室中快速检测美藤果品质外,还可用于美藤果收购、生产加工油脂以及育种过程中的质量控制,模型必须具有可操作性,尤其在收购环节中,采用模型进行检测时必须快速、简便、易行,所以首先采用整粒美藤果进行扫描光谱后建模。
美藤果种子有一层近1 mm厚的果壳,在扫描近红外光谱时,果壳会影响近红外光的透射从而使吸光度减小,如果将果壳除去,会排除这样的干扰,但是美藤果果壳比较坚硬,剥壳比较耗时。采用小型粉碎机将其粉碎,既可以减少果壳的影响而且样品均匀性更好,更具有代表性。
综上,用DA7250近红外分析仪分别采集美藤果及美藤果粉的近红外光谱,采用漫反射方式扫描,波长950~1 650 nm,光谱分辨率2 nm,每个样品检测4次,取平均吸光度光谱作为最终光谱。
1.2.3.2 光谱预处理
在近红外光谱测量过程中,由于多种因素影响,导致测量光谱中含有噪声、基线漂移、波长漂移等不稳定因素。为了减少不利因素的影响,对光谱信号进行消除噪声等预处理是十分必要的。谱图预处理主要包括噪声和其他谱图不规则影响因素的滤除和谱图信息的优化。在近红外光谱分析领域中,常用的预处理方法包括光谱增强算法、标准正态变量变换(SNV)等多种方法。在实际应用过程中,通常采用一种或多种方法相结合对光谱进行预处理[18]。本文主要采用Savitzky-Golay卷积一阶求导处理(SGFD)、SNV及二者的结合对光谱进行预处理。
1.2.3.3 校正集与验证集选择
在建立光谱多元校正模型之前要进行样本校正集和验证集的挑选,这是光谱分析中的一个重要环节,直接影响所建立校正模型的准确性。目前,常用的样本校正集与验证集划分方法有随机(RS)法、Kennard-Stone(KS)法、含量梯度法(Rank)等[16]。本文采用RS法进行选择,得到101个校正集样品和20个验证集样品。
1.2.3.4 建模方法及模型评价
采用The Unscrambler X10.4软件对光谱进行不同预处理后采用偏最小二乘(Partial Least Squares,PLS)法建立校正模型及交叉验证。采用校正相关系数(Correlation coefficient of calibration,Rc)、校正均方根误差(Root mean square error of calibration,RMSEC)、交叉验证相关系数(Correlation coefficient of cross validation,Rcv)、验证均方根误差(Root mean square error of cross validation,RMSECV)进行模型性能评估。通常一个好的模型应该具有高的Rc、Rcv,低的RMSEC和RMSECV,并且RMSEC和RMSECV值的差异应尽量小[17]。
2 结果与分析
2.1 美藤果品质指标的化学值
美藤果品质指标值的分布范围、平均值和标准偏差见表1。
表1 美藤果品质指标化学值统计分析 %
由表1可见,采用RS法选择的验证集与校正集中各指标的分布、平均值和标准偏差基本一致。美藤果化学值分布直方图见图1。由图1可见,美藤果的3个品质指标的化学值基本呈正态分布。这些说明样品采集较合理,具有代表性,能满足近红外光谱建立定量模型的条件。
图1 美藤果品质指标化学值分布直方图
2.2 美藤果颗粒及美藤果粉近红外光谱图(见图2)
图2 美藤果颗粒(A)及美藤果粉(B)近红外光谱图
从图2可以看出,美藤果颗粒及美藤果粉采集的近红外光谱趋于一致,在1 206、1 450 nm处有2个特征峰,这2个特征峰主要是O—H键的二级振动。由于美藤果粉均匀性比美藤果颗粒好,而且降低了果壳对近红外光的散射作用,所以美藤果粉的吸光度比颗粒高,且特征吸收峰更明显。
2.3 PLS模型的建立
2.3.1 水分含量的PLS模型
在PLS模型建立过程中,主因子数是模型的重要参数,对模型的预测结果有很大的影响。因子数过低时模型精度不足,会丢失光谱的有效信息,导致欠拟合;因子数过高易出现过拟合的现象。当获得较小RMSECV同时RMSEC与RMSECV无明显差异时,判定为最优主因子数[18]。根据美藤果颗粒和美藤果粉的近红外光谱图,对特征峰所在波段1 110~1 270 nm、1 300~1 650 nm、1 110~1 650 nm及全谱的光谱信号进行不同预处理,在最佳主因子数下建立的水分含量PLS模型校正结果及预测结果见表2。
表2 不同光谱预处理下水分含量PLS建模结果
由表2可见,美藤果颗粒的最佳模型是:1 110~1 650 nm波长,经过SNV预处理,最佳主因子数19,校正模型相关系数Rc达到0.993 0,RMSEC为0.061 7%,预测模型相关系数Rcv达到0.975 0,RMSECV为0.117 0%。
美藤果粉全谱经过SNV预处理后建立的PLS模型最佳,最佳主因子数10,校正模型相关系数Rc达到0.988 0,RMSEC为0.081 6%,预测模型相关系数Rcv达到0.983 7,RMSECV为0.096 2%。
2.3.2 含油量(湿基)的PLS模型
含油量(湿基)的建模过程与水分含量的建模过程类似,具体的PLS模型校正结果及预测结果见表3。
由表3可见,美藤果颗粒在1 110~1 650 nm波长的原始光谱建立的校正模型和验证模型效果最好,最佳主因子数10,校正模型相关系数Rc达到0.956 3,RMSEC为0.336 1%,验证模型相关系数Rcv达到0.931 0,RMSECV为0.444 2%。
美藤果粉在1 300~1 650 nm的光谱经SGFD预处理后,最佳主因子数为11的情况下建立的校正模型和验证模型的效果最好,校正模型相关系数Rc达到0.974 1,RMSEC为0.277 8%,验证模型相关系数Rcv达到0.914 1,RMSECV为0.524 3%。
表3 不同光谱预处理下含油量(湿基)PLS建模结果
2.3.3 蛋白质含量(湿基)的PLS模型
蛋白质含量的建模过程与水分含量及含油量的建模过程类似,具体的PLS模型校正结果及预测结果见表4。
表4 不同光谱预处理下蛋白质含量(湿基)PLS建模结果
由表4可见,美藤果颗粒在1 110~1 270 nm波长的光谱经过SNV预处理后,最佳主因子数为8的情况下建立的校正模型和验证模型的效果最好,校正模型相关系数Rc达到0.962 0,RMSEC为0.363 9%,验证模型相关系数Rcv达到0.929 7,RMSECV为0.497 4%。
美藤果粉在1 110~1 270 nm波长的原始光谱建立的校正模型和验证模型最好,最佳主因子数7,校正模型相关系数Rc达到0.947 5,RMSEC为0.424 9%,验证模型相关系数Rcv达到0.918 2,RMSECV为0.508 9%。
2.4 模型验证
在模型投入使用前还需对其进行外部验证,以便检查能否准确预测结果。良好的模型除了满足内部交叉验证需要,在用验证集进行外部验证时,其预测结果与标准方法实际测量结果应有良好的一致性。一般用已建立的模型对5~10个性质参数已知但未参与建模的合格样品(即验证集)进行分析测试,只要误差在能够接受范围内的样品数与误差在不能够接受范围内的样品数之比大于3∶2,则一般认为该模型是有效的,便可投入使用[15]。
将建好的校正曲线拷贝到近红外光谱仪,对未参与建模的20个样品进行检测,实测值与预测值及相对误差(Relative error,RE)见表5。
由表5可见,美藤果颗粒和美藤果粉分别有3个样品的蛋白质含量预测值超出了误差范围(|RE|≤10%),其余预测值均符合误差要求,这表明用两种方法采集近红外光谱建立的校正模型都能较好地实现对美藤果水分含量、含油量(湿基)和蛋白质含量(湿基)的预测。
表5 校正模型验证结果
注:括号中数据为各指标的相对误差。
3 结 论
本文从云南、泰国、老挝等不同美藤果种植基地采集了2016—2018年不同收获月份的121份样品,随机抽取了101份用于建立PLS模型,20份样品用于外部验证。采用传统的烘箱干燥法、索氏抽提法、燃烧法分别测定了121份美藤果样品的水分含量、含油量(湿基)和蛋白质含量(湿基),之后分别采集了美藤果颗粒和美藤果粉的近红外光谱,对光谱进行不同的预处理后进行PLS建模并进行了外部验证。结果表明:采用两种方法建立的PLS模型校正模型的相关系数(Rc)均大于0.94,校正均方根误差(RMSEC)小于0.45%,交叉验证相关系数(Rcv)大于0.91,验证均方根误差(RMSECV)小于0.53%。通过外部验证实验表明用两种方法采集近红外光谱建立的校正模型都能较好地实现对美藤果水分、含油量(湿基)和蛋白质含量(湿基)的预测。虽然两种方法建立的校正模型都能满足对美藤果品质的预测,但是使用美藤果颗粒建立的校正模型进行美藤果品质的检测更简便,而且对样品没有破坏性。