对近红外技术检测玉米养分含量的模型进行优化的探讨
2020-03-14作者林姿伸江青艳
◆作者:林姿伸 江青艳
◆单位:华南农业大学动物科学学院
玉米是饲料企业使用量最多的原料之一,目前玉米养分含量的测定已有一套标准的湿化学方法,但是存在检测成本高和检测效率低等不足,难以满足饲料企业现场快速检测的需要,而使用近红外分析仪具有快速和样品无损等优点,因此饲料企业已广泛应用近红外分析技术对饲料原料的养分含量进行快速测定。建立适宜的模型是保障近红外技术检测准确性的关键。建模需要采集丰富的样品,并进行精确分析,而饲料原料、半成品及成品成分的复杂性都加大了建模难度。鉴于每一种模型只适应一定的时间和空间,测定过程还会受噪声的影响和自身灵敏度的限制。因此,近红外分析方法使用过程中需要不断对模型进行优化,通过模型中海量数据的积累,不断校正模型的参数,从而提高测试的精准度,达到优化效果。
斜率/截距校正法是优化近红外模型的方法之一。目前对于这一方法的报道较少,因此本研究旨在探讨应用斜率/截距校正法对玉米养分测定模型进行优化的可行性以及模型参数的校正方法,为提高模型的质量和检测结果的准确性提供科学依据。
1 材料与方法
1.1 试验材料及样品处理
本试验将玉米分为样本数为50与30的集合,分别采用湿化学方法和近红外分析仪测定,样品均每日定时、定量采样,取自福建省新正阳饲料科技有限公司原料车间,经高速粉碎机粉碎后,分别装入洁净的塑料袋中密封保存,冷却后依次测定。
1.2 试验仪器
近红外分析仪(FOSS-NIRSDS2500F)、自动凯氏定氮仪(上海海能K98840)、600万能高速粉碎机(上海比朗仪器有限公司)、电子天平(奥豪斯仪器有限公司)、干燥器、万用电炉2000w(北京市泰和格润有限公司)、石墨消碱仪(S220N)、550℃马弗炉(上海一恒科技仪器公司)、110℃电热鼓风干燥箱(上海一恒科技仪器有限公司)。
1.3 测定方法
1.3.1 湿化学方法
①采样:按GB/T 14699.1-2005或相关标准规定方法采样;②水分测定:玉米水分测定按GB/T 6435-2014测定;③粗蛋白测定:按GB/T6432-2018饲料中粗蛋白的测定方法;④粗灰分测定:按GB/T 6438-2007中规定的饲料中灰分的测定方法。
1.3.2 近红外分析仪
采用FOSS-NIRS-DS2500F近红外分析仪进行测定,开机后预热0.5h,待仪器自检完成后,把处理好的样品按顺序装入样品槽(装填深度以不低于2 mm,不超过1/2样品杯为宜),采用该公司现有针对玉米的水分、粗蛋白和粗灰分的模型进行扫描测定,扫描波长范围1100~2500 nm。每份样品重复扫描2次,测得对应的质量分数,取每份样品的水分、粗蛋白和粗灰分的质量分数平均值。
表1 湿化学法测定的优化前50个与优化后30个玉米的营养成分质量分数
图1 营养成分差值图
1.4 优化方法
设立原样品集和验证集,分别采用湿化学法和近红外分析仪测定玉米水分、粗蛋白和粗灰分的质量分数。以湿化学法所测值与近红外分析值的差值为纵坐标,近红外分析仪所得预测值为横坐标,得到玉米水分、粗蛋白和粗灰分的散点图,并逐个剔除异常样本点,使模型斜率与1∶1的拟合度增加,截距绝对值减小,直到出现相反效果,计算三种营养成分的平均值,相对分析误差(RPD)、标准偏差(SEP)、标准差(SD)、相对标准偏差(RSD)、决定系数(R2)以及交叉检验(RMSE)等,验证其优化结果。
2 结果分析
2.1 玉米样品及近红外模型的分析
如表1所示,根据饲用玉米水分、粗蛋白和粗灰分评定的国家标准,原样品集玉米的水分含量均达标,按粗蛋白标准评定含二级和三级的样品,按粗灰分标准评定均为一级。玉米样品的营养含量梯度分布均匀,覆盖广,说明样品有一定的代表性和连续性。
玉米原样品集的水分、粗蛋白及粗灰分质量分数的R2为0.893、0.378和0.308。水分的R2达到0.83以上,可用于实际运用。粗蛋白的R2与1∶1拟合度过低,可能与凯式自动定氮仪使用时人为操作因素有关,粗灰分拟合度过低,可能是光谱对粗灰分的吸收较弱,这两个模型的R2都偏低,说明模型方程没有达到预期的理想效果,还有改善的空间。
2.2 异常样本点的判别和剔除
样品的研磨时间、温度控制及噪声等因素会引入部分偏差,使模型的预测结果不佳。为防止剔除错误的样本点,应对拟剔除的样本点逐个进行判别,同时观察模型斜率和截距的变化。每剔除一个点,立即观察模型当前截距点值与模型建议值的差值,当两者无限接近时,截距绝对值最小,在变化出现相反结果前保留所有样本点。
图1为原样品集水分、粗蛋白和粗灰分的差值图,纵坐标是湿化学法测定值与近红外测定值的差值,横坐标是近红外分析仪测定的预测值。
图2 原样品集、验证集水分定量分析模型预测散点图
图3 原样品集、验证集粗蛋白定量分析模型预测散点图
图4 原样品集、验证集粗灰分定量分析模型预测散点图
全部原样本集点经判别后,剔除水分数据中差值≥1.00、粗蛋白数据中差值≥0.75和粗灰分中差值≥0.26的样本点,剔除后各个模型截距当前值和模型建议值无限接近,水分、粗蛋白和粗灰分的截距从-3.993、-0.7850和-2.720分别变化为-3.973、-0.626和-2.440,截距的绝对值均减小,保留剔除异常样本点后的数据即构成优化后的近红外模型。
2.3 优化效果分析
使用优化后的近红外模型测定30个玉米样品的水分、粗蛋白和粗灰分的质量分数,并同时采用湿化学法测定进行比较,三种模型的预测结果表明,近红外分析仪对样品的预测平均值与湿化学法的分析平均值差异不大,说明近红外模型优化后有良好的整体预测效果。
近红外分析模型通常以样品集的R2、内部验证均准差(RMSECV)以及外部验证均方差(RMSEP)作为衡量定标模型的优劣指标。R2越大,SD越小,模型效果越好,预测精准度越高。同时运用RPD对定标模型的定标效果和预测精准度进行进一步验证,RPD是定标组分的SD值与该模型预测标准偏差(SEP)的商,当RPD>3,说明效果良好;3>RPD>2.5,说明可用于分析;RPD<2.5,分析则难以进行。
由图2可看出,水分的验证集模型拟合度比原样品集更靠近1∶1,呈良好的线性关系,模型的预测效果更佳。优化后的模型R2为0.969,大于原样品集的R2为0.893;验证集的标准偏差为61.66%,小于优化前的74.96%;优化后的RPD为5.8,表明效果良好;RSD为4.8%,小于5%。由此可以说明,水分模型经过斜率/截距校正法后精准度提高,稳健性提高,但RMSEP值为0.627,该值偏大可能会对模型的预测偏差存在一定影响,可以通过增加样本量和化学测量精准度来进一步改善和验证。
粗蛋白质量分数的RPD为2.28<2.5;RMSEP 值 较 小 为0.282;RSD为3.6%;验证集模型R2为0.839,大于原样品集的0.378;模型的预测精度有所提高,拟合度得到改善,但仍没有达到预期的优化效果。
粗灰分模型的预测值和真实值间差异不显著(P>0.05);模型R2为0.903,大于原样品集0.308,且大于0.83,化学分析值和近红外预测值之间线性相关性良好;标准偏差为5.3%,小于优化前的10.74%;优化后的RPD为3.3>3,可用于定量控制,还具有很高的稳健性;RSD值为4.6%小于5%;验证集RMSMP数值较小为0.0541,说明粗灰分质量分数模型在斜率截距校正后效果更佳,模型优化基本成功。
表1中,水分、粗蛋白和粗灰分的RMSECV分别为0.206,0.134和0.097,与 RMSECV相比,优化后水分和粗蛋白的RMSEP增大,粗灰分的RMSEP减小,说明水分和粗蛋白的模型不够精准,优化没有达到预期的理想效果,粗蛋白的测量结果极不理想,R2与1∶1拟合度较弱,且RPD的值小于2.5,不建议投入定标检测的应用。
水分和粗蛋白的模型优化不理想的原因可能有以下几个方面:(1)样本数量有限,来源局限性,以及样品的代表性仍然不够。(2)样品扫描时间段固定,仪器内部光谱段重叠及信号微弱。(3)湿化学法测定存在的操作误差。(4)样品物理性质影响预测的效果。
2.4 展望
本试验结果表明,在模型的优化过程中,斜率/截距校证法省时便捷,具有较好的可行性。随着饲料企业对近红外技术接受度的增加以及近红外应用范围的拓宽,对模型的优化还需要不断进行探索和比较。