油用牡丹种子水分含量近红外光谱估算研究
2021-05-19刘秀英李亚娟胡佳凤刘晨洲吴姗薇
刘秀英, 李亚娟, 胡佳凤, 刘晨洲, 吴姗薇
(1.河南科技大学农学院, 河南 洛阳 471023; 2.洛阳市微生物与绿色发展重点实验室, 河南 洛阳 471023; 3.洛阳市植物营养与环境生态重点实验室, 河南 洛阳 471023)
油用牡丹种子的出油率较高,且牡丹籽油富含人体需要的氨基酸、维生素、不饱和脂肪酸(含量高达92%以上)等多种成分,其中“植物脑黄金”α-亚麻酸占42%左右[1-2],所以油用牡丹成为了一种新兴的高端木本油料作物,对促进我国粮油生产、保障国家粮油安全具有重要意义。油用牡丹种子的水分含量是衡量种子品质的重要指标之一,也是影响牡丹籽油品质的重要指标,因而在销售、储存及加工过程中快速、准确测量油用牡丹种子水分含量非常重要。而传统测定种子水分含量的方法主要是室内烘干称重法,该方法虽然测定结果准确,但相对比较繁琐,测定时间较长。其他的直接或间接水分含量测定方法也较多,但都存在某些方面的缺点,具有不同的适用范围[3-4]。研究表明,油脂类种子含有不饱和脂肪酸,在研磨、剪切、加热过程中容易氧化,因而较多方法和仪器并不适合进行油脂类种子水分含量测定。
近红外光谱分析技术(Near infrared reflectance spectroscopy,NIRS)是20世纪80年代发展起来的一项物理检测技术,它能够利用有机化学物质中的化学健在近红外光谱区的光学吸收特性,快速估测样品中一种或几种化学成分的含量。与传统分析方法相比,该技术具有检测速度快、非破坏性、低成本、操作简单、无损样品等特点,尤其适用于农产品品质分析和食品品质检测领域[5]。已有研究表明,近红外光谱技术能成功地进行农作物及食品的蛋白质含量[6-9]、纤维素含量[10-11]、蔗糖含量[12]、直链淀粉含量[13-14]、油含量[15-18]等成分的确定。该技术也非常适合测量水分含量,因为在近红外光谱区,水的—OH基团泛音和组合带非常明显[5]。近年来,已有一些国内外学者开展了近红外光谱技术估算种子水分含量的潜力研究。杨传得等[19]应用近红外光谱技术结合偏最小二乘方法建立了鲜食大花生种子含水量的预测模型,结果表明,含水量模型具有较好的预测准确性。刘洁等[20]利用近红外光谱技术对完整带壳板栗果和去壳板栗仁进行含水率的无损检测,并比较了不同预处理方法对预测结果的影响。Mutlu等[21]利用近红外光谱结合人工神经网络对小麦粉末的多个品质参数进行预测,其中水分预测的决定相关系数(R2)为0.92。王雪等[22]结合近红外光谱技术与偏最小二乘回归,建立了灌浆期玉米籽粒水分小样本定量分析模型(Bootstrap-SPXY-PLS),结果表明模型有稳定的预测能力。Sundaram等[5]开展了近红外光谱技术确定不同地区的带皮花生水分含量的研究,结果表明,建立的近红外光谱模型能够成功地进行花生水分含量的预测。朱洁等[23]利用高光谱成像技术结合偏最小二乘回归进行了单粒小麦籽水分含量的预测,并获得整盘单粒小麦籽的水分分布图。但是,Moghaddam等[24]采用400~1 100 nm波段范围经过不同预处理的吸收光谱,结合偏最小二乘回归方法建立烘烤的开心果果仁水分含量及纹理特征的预测研究表明,水分含量的预测效果并不太好。以上研究表明,近红外光谱技术定量估测种子水分含量时,估测精度受种子样本量的大小、水分含量的多少、形状、尺寸或坚硬外壳等影响较大,还与构建模型的方法密不可分,因而对于不同品种种子水分含量的近红外光谱快速估测值得进一步研究。据所查资料可知,至今很少见到近红外光谱法估测油用牡丹种子水分含量的相关报道。
本研究拟用不同时间、不同产地、不同品种的油用牡丹种子为研究对象,采用近红外光谱技术进行油用牡丹种子水分含量无损检测方法的研究,并比较不同光谱预处理方法对油用牡丹种子水分含量估算精度的影响,从而提高油用牡丹种子水分反演精度,为促进我国牡丹产业发展及粮油生产、保障国家粮油安全提供理论依据和技术支持。
1 材料与方法
1.1 供试材料
为了使样本具有代表性,本研究收集了2016年及2017年不同产地的凤丹和紫斑两个油用牡丹品种的156份种子,产地包括:安徽安庆、毫州、铜陵;河南洛阳;山东曹县、吏口、平阴;四川德阳、眉山、资阳。油用牡丹种子进行自然风干,然后通过调节烘干的时间,形成不同的水分梯度,样本含水量范围为0.22%~5.77%,含水量相对较低。
1.2 测试仪器及软件
样本光谱采用美国Spectra Vista公司于2013年推出的高性能地物光谱仪(SVC HR-1024 i便携式光谱仪)测定,该仪器光谱范围350~2 500 nm,其中350~1 000 nm 光谱分辨率小于等于3.5 nm,1 000~1 850 nm光谱分辨率小于等于9.5 nm,1 850~2 500 nm光谱分辨率小于等于9.5 nm。光谱数据处理及多变量分析主要采用光谱仪自带软件(SVC HR-1024 i)及Unscramble软件,作图采用Origin Pro 9.1软件。
1.3 测定方法
含水量测定 种子含水量测定采用常压烘箱干燥法,依照GB/T 5009.3-2003标准进行。
光谱数据采集。开机预热仪器30 min,将油用牡丹种子样本依次放置在光谱仪样品盘中,从4个方向对样品进行扫描,每个方向扫描3次,每个样品总共扫描12次,去掉异常线后取平均值作为该样品的光谱值。
1.4 光谱数据预处理及模型构建
首先利用SVC HR-1024 i软件进行光谱数据的合并(SIG File Merge)及重采样(Resample Spectral Data),将近红外波段(900~2 500 nm)重采样至10 nm。然后在Unscrambler 9.7(CAMO ASA,Trondheim, Norway)软件分别采用标准化处理(Normalize,Nor)、乘积分散校正法(Multiplicative Scatter Correction,MSC)、标准正态变量转换法(Standard Normal Variate,SNV)进行处理,然后结合一阶导数(First Derivative,FD)对吸收光谱(Absorption spectra,AS)及预处理光谱数据进行进一步处理。最后根据估算模型的校正及验证效果确定最佳数据预处理方法及最佳估算模型。
2 结果与分析
2.1 油用牡丹种子的近红外光谱图
图1为油用牡丹种子的近红外光谱吸收光谱图。分析图1可知,油用牡丹种子的近红外光谱图中出现很强烈的吸收,形成多个明显的吸收峰,主要是由于种子样品中含有C—H、O—H、N—H等含氢基团。图1(a)为部分随机选择的油用牡丹种子的近红外吸收光谱图,从图中可知,样品的近红外吸收光谱具有相似的变化趋势,在1 200、1 450、1 940 nm附近有强烈吸收峰,且不同的样品吸收峰强度及位置存在差异,根据前人研究可知,1 450 nm和1 940 nm附近的吸收峰是水分的强吸收引起的。图1(b)为不同含水量油用牡丹种子的近红外吸收光谱图,从图中可见不同含水量样品的近红外吸收光谱的吸收峰存在差异,随含水量增加吸收峰有增大的趋势,并且吸收峰有朝长波方向偏移的趋势,其原因主要是由于样品间含水量不同,造成吸收强度存在差异,从而说明油用牡丹种子近红外吸收光谱可以作为定量分析样品水分含量的依据。
2.2 异常值剔除
首先通过视觉判断,剔除4组光谱或水分含量异常的样本值。然后通过主成分分析检测异常值或离群值。第一、第二两个主成分的得分图提供了显示数据之间关系的二维图,数据点位于95%置信椭圆(Hoteling T 2)之外的被考虑作为强的离群值,从而考虑从数据矩阵中剔除。对样本光谱进行主成分分析后得到第一、第二主成分得分图,从中可以看出18、85、86、43号样本处于95%置信椭圆之外,因而被剔除,最终余下148组样本被用于校正模型建立和验证。根据水分含量进行排序,间隔取1/3作为验证集,样本数为49组;2/3作为校正集,样本数为99组。校正集的水分含量范围为0.22%~4.89%,验证集的水分含量范围为0.42%~4.75%。
2.3 基于近红外光谱的油用牡丹种子水分含量估算
2.3.1水分含量PLSR估算模型的建立
注:a为部分样品近红外吸收光谱图;b为不同含水量样品近红外吸收光谱图。
表1 不同光谱预处理方法获得的油用牡丹种子水分含量PLSR模型参数
2.3.2水分含量PLSR估算模型的验证
表2 PLSR模型的检验结果
已有研究表明,参考值和预测值之间的拟合线斜率越接近于1,截距越接近于0,预测效果就越好[27-28]。图2展示了参考值和近红外水分预测值之间的关系。从图2可知,所有模型的预测值与参考值之间的相关性都比较好,相关系数R2均大于0.94,说明所有模型的预测效果都比较好。进一步比较各参数可知,由标准化吸收光谱建立的PLSR模型预测的水分含量与参考值之间的拟合线斜率为0.964, 与理想值1最接近,截距为0.138,与理想值0最接近,而且R2最大,为0.97,说明由标准化(NOR)吸收光谱建立的PLSR模型是最佳的估算模型,预测效果最好。
3 结论与讨论
通过分析油用牡丹种子的近红外吸收光谱可知,所有样品的近红外吸收光谱形状相似,并且具有相同的变化趋势,随着种子水分含量增加,种子的近红外吸收光谱值整体增大;种子水分含量的特征吸收波段位于1 450 nm和1 940 nm附近,并且随水分含量增加特征波段位置具有朝长波方向偏移的趋势,这与前人研究结论一致[10,24]。水分特征波段位置的确定可以为水分速测仪的波段选择提供依据。
本研究采用近红外吸收光谱及经预处理的吸收光谱,结合PLSR方法建立了油用牡丹种子近红外光谱水分含量估算模型,模型的预测R2大于等于0.94,RPD值大于3.96,结果表明PLSR方法建立的估算模型效果均较好,预测精度较高,而且比较稳定,因此均可用于油用牡丹种子水分含量精确估算。其它研究者采用近红外光谱结合PLSR方法建立花生、板栗水分含量估算模型时,同样预测精度较高[19-20],说明近红外光谱结合PLSR方法是建立种子水分含量估算模型的较好方法。但是,Moghaddam等[24]采用波段范围400~1 100 nm的吸收光谱建立烘烤的开心果果仁水分含量校正模型时,其预测效果并不太好。其原因可能有两个:一是烘烤的开心果果仁的含水量较低,仅0.5%~2.26%,二是在400~1 100 nm范围内仅960 nm附近为水分的弱吸收峰,而水分强吸收波段主要位于1400、1 900、2 100 nm附近。
建模前对吸收光谱进行了不同的预处理,从建立的校正模型及模型验证的参数来看,标准化处理(NOR)光谱的建立校正模型预测结果最优。而其他学者对不同品种种子样本的预处理光谱建模时,最佳预处理方法并不完全相同[5,19,24]。分析原因可能是不同品种种子样本由于其颗粒大小、表面形态和内部结构不同,从而对采集的光谱会产生不同的影响,因此针对不同品种种子样本的光谱需要采取不同的预处理方法才能提高估算模型的精度。另外,对不同预处理方法处理的光谱进一步进行一阶导数处理,并没有明显改善模型的预测精度。Sundaram等[5]在应用近红外光谱确定带皮花生水分含量时,一阶导数处理改善了Virginia花生的预测精度;而对Valencia花生的预测精度没有提高。究其原因可能是样本光谱的形状依赖于光的散射,这种散射受样本颗粒大小及样本表面的反射特性影响,因此对于不同种子样本其光谱反射特性不同,或者经其它预处理后有的样本光谱可能不存在基线漂移或者基线漂移很小,所以一阶导数处理的效果并不明显。本研究表明不同预处理光谱建立的水分估算模型中以标准化处理(NOR)的光谱建立的模型精度最高,说明该模型是进行油用牡丹种子水分含量估算的最佳模型,能满足精度要求较高时油用牡丹种子水分含量的质量控制与评价,而标准化处理是油用牡丹种子样本光谱的最佳预处理方法。本研究所采用的油用牡丹种子样本水分含量范围为0.22%~5.77%,范围相对较窄,水分含量较低,因此下一步需要在扩大样本的水分含量范围的基础上进行进一步的研究,以便扩大模型的适用范围。
图2 近红外预测值与参考值的比较