APP下载

扫描次数对椰子肉含油量近红外光谱建模的影响

2021-06-07刘蕊张军范海阔

热带农业科学 2021年4期
关键词:含油量方根预处理

刘蕊 张军 范海阔

(1中国热带农业科学院椰子研究所海南文昌571339;2农业农村部文昌椰子种质资源圃海南文昌571339)

椰子树是热带地区重要的木本油料作物[1],椰子油是从新鲜成熟椰肉中制得的一种油脂[2]。具备药用、抗氧化活性、减肥美容等[3-5]功效,受到消费者青睐。作为一种功能性油脂,椰子油可用于食品加工、护肤品和生物燃料生产等[6-8],应用十分广泛。椰子油是椰子的重要加工产品,根据USDA数据,2016年世界椰子油消费总量达到321万吨。鉴于椰子油的重要性,选育含油量高的品种是椰子的重要育种方向,筛选高含油量的优良种质是椰子育种的重要内容。传统的油料作物含油量检测主要通过索氏抽提等方法,检测步骤繁琐,所需时间较长,不能实现高通量快速检测。在科研与实际生产中,需要建立一种椰子肉含油量的快速检测方法,这对于椰子种质的高效鉴定评价以及椰子油产量的预测十分必要。近红外光谱是一种高效、无损、易操作、可实时在线检测的技术,已经被广泛应用于医药、食品、农产品[9-12]等检测中。有关近红外光谱技术在油脂检测方面的报道较多,主要应用于油料作物含油量检测等方面。奚如春等[13]依据油茶种子吸收光谱与化学特征分析数据,建立了油茶种仁含油率定标模型。金华丽等[14]结合近红外光谱扫描和索氏抽提法建立了花生种质含油量的近红外测定模型。林艳等[15]采用近红外光谱技术建立了沉香含油量近红外光谱预测模型。Novianty等[16]同样采用近红外光谱技术建立了油棕鲜果的含油量检测模型,并比较了偏最小二乘法(PLS)和多元线性回归(MLR)法预测含油量的准确性。由于近红外光谱分析技术是一种间接测量手段,是依赖复杂的化学计量学校准算法的间接定性定量分析技术,因此分析过程受到许多因素的影响[17],主要包括样品因素、仪器参数、实验操作等。有关学者在此方面进行了大量研究,如李军会等[18]研究发现,提高仪器信噪比、样品重复测量取平均次数等方法可以提高测试精度。王斌等[19]分析了扫描次数对鲜枣近红外光谱响应特性的影响;赵怡锟等[20]发现储存时间对玉米单籽粒近红外光谱检测结果有着重要的影响。在椰子油研究方面,尚未见采用近红外光谱技术的报道,也并未开展扫描条件对相关模型建立的影响研究。本研究以成熟椰肉为试验材料,分析不同扫描次数对椰肉含油量建模的影响,拟筛选适合椰肉含油量近红外定量模型建立的最佳扫描次数,为将来建立实际应用模型时选择最佳的检测条件提供参考。

1 材料与方法

1.1 材料

1.1.1 仪器设备

S400型近红外农产品品质测定仪(上海棱光技术有限公司),FA1204B电子天平(上海天美天平仪器有限公司),DHG-9140A电热恒温鼓风干燥箱(上海精宏实验设备有限公司),JK-CFD-6粗脂肪测定仪(上海精学科学仪器有限公司)。

1.1.2 试验材料

所有试验样品采自海南省文昌市中国热带农业科学院椰子研究所试验基地。

1.2 方法

1.2.1 样品处理

选取已经响水、健康无损的椰子果样本38个;剖开椰果,剥取新鲜椰肉并将椰肉切成6 mm×6 mm大小置于70℃鼓风干燥箱中烘干至恒重;烘干后的样品用粉碎机粉碎成粉末状备用。

1.2.2 光谱数据采集

用S400型近红外农产品品质测定仪对38份椰肉粉末进行光谱采集,光谱采集的参数如下:数据模式为吸光度(A),采样波段范围为1 000~2 500 nm,光谱采样间隔为1 nm,扫描次数分为3、8、16、32、64次。光源采用与光谱仪配套的欧司朗12 V、20 W钨灯。为了减少样品不均匀性带来的误差,试验过程中每个样品都重装样2次并分别采集光谱。

1.2.3 含油量测定

用索氏抽提法测定38份椰肉粉末含油量。

1.2.4 光谱数据预处理与建模分析

分别将每个扫描条件下采集到的76光谱数据导入CAUNIR分析软件,并输入每一条光谱所对应的含油量值,利用CAUNIR软件所提供的定量偏最小二乘分析方法(Quantitative partial least squares,QPLS)建模。建模的波段1 000~2 000 nm,波长间隔1 nm,试验样本按光谱数量1∶1的比例分成建模集和检验集。数据处理过程中,为了消除光谱采集过程中来自随机噪音、基线漂移、样本不均匀等的影响,采用软件提供的一阶导数、二阶导数、散射校正、矢量校正、极差归一、中心化法等6种预处理方法对光谱进行预处理。根据预处理方法的不同,每个扫描条件下建立6个定量模型,从中筛选1个最佳模型,5个扫描条件共筛选5个最佳定量模型。

利用相关系数r、校正样本均方根误差(RMSEC)、预测样本均方根误差(RMSEP)来评价所建模型的精确性。相关系数越接近1和均方根误差越接近于0,并且建模样本均方根误差和检验样本均方根误差越接近时,表明所建模型较优。

1.2.5 模型预测能力检验

利用1.2.4中筛选的5个模型对外部验证集的样品含油量进行预测,通过成对t检验,比较实际值与预测值的差异。

2 结果与分析

2.1 近红外光谱的采集

38份样品含油量最小值为27.50%,最大值为60.00%,平均值为50.21%,符合建模要求。每个样品重装2次,因此3、8、16、32和64次每个扫描条件下均获得76条光谱(图1-a~e)。不同扫描次数下的近红外光谱吸收峰基本一致。

图1 椰肉近红外扫描光谱

2.2 不同扫描次数对定量模型稳定性的影响

依次将3、8、16、32、64次扫描条件下采集的光谱及其对应的含油量数值添加入CAUNIR软件,设置波长范围(1 000~2 000 nm)和间隔(1 nm)后,选用经预处理的光谱进行模型建立,检验集的设置采用随机选择检验样品的方法,以光谱数量1∶1的比例划分建模集和检验集,模型采用的推荐主成分数由内部留一交叉确定。在上述参数条件下试建并保存模型。5种扫描条件下椰肉含油量QPLS定量模型的最优结果,见表1。

表1 椰肉含油量检测QPLS模型结果

理论上检测模型校正均方根误差(RMSEC)和预测均方根误差(RMSEP)越小越好,两者的值应非常接近,且有较高的相关系数,这样才能说明该模型稳定性较好。由表1可知,3次扫描条件下,采用中心化法预处理后的光谱建模效果最好;8次扫描条件下,采用极差归一法预处理后的光谱建模效果最好;而16次扫描条件下采用二阶导数预处理法,32次扫描条件下采用矢量校正预处理法,64次扫描条件下采用散射校正预处理法,建模效果最好。不同扫描次数相比,扫描3次的相关系数(0.838 3)最低,均方根误差最大;扫描64次的相关系数(0.877 6)为最高,均方根误差相对较小。

续图1椰肉近红外扫描光谱

2.3 不同扫描次数对模型预测能力的影响

应用2.2所建的5个预测模型,对其外部验证集的38条光谱对应的样品含油量进行预测,并对模型预测值与实际含油量值进行统计分析;将外部验证集样品所对应的椰肉含油量与模型的预测值进行配对t检验。结果证明,扫描3、8、16、32、64次所建立的预测模型的p值(Sig.)均大于0.05(表2),说明其含油量预测值与真实值间无显著差异。

表2 椰肉含油量实际值与预测值t检验

综合表1~2的结果,在扫描64次条件下,采用散射校正预处理光谱所建立的模型性能较好,其实际值与预测值的相关系数可达0.877 6。

3 讨论与结论

文章探讨了扫描次数对椰肉含油率定量模型构建的影响,并分析了不同扫描条件下所建立的模型对样本含油量的预测能力。结果表明,从相关系数和均方根误差的角度看,扫描64次所建立的模型性能比较稳定;所建的5个预测模型,其含油量真实值与预测值均无显著差异。由上述结果可知,相比而言,64次扫描条件最优,但考虑到试验效率,在后续的大规模样本量建模时,建议采用扫描3次的参数条件,可以节省试验时间,同时也可以保证较高的预测能力。本研究同时分析了不用预处理方法对模型构建的影响,结果表明,不同预处理方法对模型的性能影响存在一定差异,需要根据实际情况筛选最佳预处理方法。

对近红外光谱定量模型构建有影响的因素包括很多,除了扫描次数和预处理方法,谱区范围[21]、环境温度[18]等都会对结果造成影响,在后续椰肉含油量的近红外光谱建模研究中需要进一步分析,为建立稳定性好、实用性高的稳健性模型提供参考。

猜你喜欢

含油量方根预处理
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
粉末预处理对钨坩埚应用性能的影响
污泥预处理及其在硅酸盐制品中的运用
我们爱把马鲛鱼叫鰆鯃
棉子含油量的遗传特性分析
含油污泥的固化实验研究
数学魔术——神奇的速算
数学魔术
高油油菜育种研究荣获湖北省技术发明一等奖