建立近红外特征波长模型快速测定羊草常规营养成分的研究
2019-09-25陈积山朱瑞芬杜优颖孔晓蕾
陈积山, 朱瑞芬, 张 强, 杜优颖, 孔晓蕾
(黑龙江省农业科学院草业研究所, 黑龙江 哈尔滨, 150086)
近红外光谱(Near infrared spectroscopy,NIRS)分析,是利用有机化学物质在其近红外光谱区内的光学特性,快速测定样品中一种或多种化学成分含量的新技术。它具有处理样品简便甚至无需处理、分析速度快、谱图信息量大、分析效率高、不破坏样品、便于实现在线分析、分析成本低、无污染等优点,现已广泛应用在农牧、食品、化工、石化、制药、烟草、饲料等众多领域。便携式微型近红外光谱仪也在普及和应用,为现场检测提供了便利。建立这种微型仪的测定模型,成为当前广泛关注的研究热点[1-2]。
随着偏最小二乘法(Partial Least Square Method,PLS)的深入研究与应用,使用特定的方法筛选出具有特征的波长或波长区间,才能建立较好的定量模型。特征波长优选可以简化模型,降低模型维数,特别是可以剔除不相关或非线性变量因素,得到鲁棒性好和测定能力强的测量模型[3-12]。目前,普遍认为偏最小二乘法(PLS)具有较强的全波长建模能力。但研究表明,近年来通过波长优选可以消除不相关或非线性变量,简化模型并完全获得鲁棒性好和测定能力强的模型[9,13]。波长优选方法主要有随机蛙跳(Random Frog,RF)[14]、移动窗(Moving Window,MW)[15]、无信息变量消除法(Uninformative Variable Elimination,UVE)[16]、间隔偏最小二乘法(Interval Partial Least Square Method,Ipls)[17]、自适应量加权采样(CompetiveAdaptive Reweighted Sampling,CARS)[18]和遗传算法(GeneticAlgorithms,GA)[19]等。
本文探讨UVE和RF分别与PLS组合,并选择羊草常规营养成分含量的敏感波长变量,建立测定羊草常规营养成分的最适模型,首次建立采用近红外仪快速测定羊草品质稳定可靠的测定模型,为科学评价羊草质量、促进羊草交易、高质量生产利用和安全储存提供技术支撑。
1 材料与方法
1.1 试验材料
试验于2014~2017年6月初在黑龙江及内蒙东部草地选择单一羊草群落,每个样地50亩不少于5个采样点,生物量鲜重不少于500 g,收集地上5 cm以上的羊草为待测样品,装入纱网袋袋中。当天在实验室将其用烘箱干燥(65℃,48 h)。按样品编号,每隔 3个样品随机抽取 1个,共计270个样品作为供试样品。供试样品分别用刀式磨粗磨,再用Foss公司的Cyclotec TM1093旋风磨二次细磨;过1.0 mm筛;放入摇匀器中摇动30 s;按照编号装入自封袋;常温避光保存。
1.2 试验用仪器及测定项目
近红外光谱台式分析仪采用瑞典波通(Perten)公司二极管阵列近红外漫反射光谱仪(DA7200),样品池的光程为 13 mm,材质为石英试样杯。化学仪器:烘箱,瑞典福斯·特卡托2300全自动凯氏定氮仪(Foss公司),索式粗纤维测定仪Fibertec1020(Foss公司);IR35全自动快速水分测定仪。
测定项目为水分(Water,W)、粗蛋白(Crude Protein,CP)、酸性洗涤纤维(Acid Detergent Fiber,ADF)和中性洗涤纤维(Neutral Detergent Fiber,NDF)。3次重复,均以干物质为基础。所有测试数据由农业部谷物及制品质量监督检测测试中心(哈尔滨)测定。
1.3 光谱波长确定
图1 羊草的近红外光谱Fig.1 Near Infrared Spectrum of the samples ofLeymus chinensis
1.4 数据测定与采集
近红外测定。测得的数据为近红外值。在确定了羊草的近红外光谱后,在上述波长内测定羊草品质常规营养成分,包括剔除异常样本后,样品具有较好的差异性和代表性,符合近红外光谱PLS定量模型研究。
化学测定。测得的数据为化学值。水分测定按照GB/T6435-2014标准方法测定。
粗蛋白测定按照GB/T6432-1994标准方法测定。其中,(1)消化:准确称取0.2000 g试样,无损失地转移到消解管的底部,加入1勺催化剂(0.4 g硫酸铜+6 g硫酸钠或硫酸钾),再加入 10 ml浓硫酸摇匀。将消解管放在通风橱的消煮炉上用 290℃炭化 15 min,然后将温度调至420℃进行消解180 min。将消煮完的试验样品从消煮炉上取下,冷却至室温,待测。(2)蒸煮:把配制好的400g·L-1氢氧化钠溶液、1%硼酸溶液和蒸馏水,装在定氮仪上进行测定,直接输出粗蛋白含量数据。注意每次开始试验前要用蒸馏水进行空白管校正试验。
中性洗涤纤维和酸性洗涤纤维测定采用Van Soest方法。中性洗涤纤维的计算公式如下,其中式中:W1为滤袋质量(g),W2为一样品质量(g),W3为提取过程后滤袋和样品的质量(g),C1为空白滤袋校正系数(提取后烘干的空白袋质量/空白袋质量)。每个样品做三个重复,用三个数的算数平均数作为最终结果。
酸性洗涤纤维的计算公式如下,其中式中:W1为滤袋质量(g),W2为一样品质量(g),W3为提取过程后滤袋和样品的质量(g),C1为空白滤袋校正系数(提取后烘干的空白袋质量/空白袋质量)。
计算每个样品测定项目二个重复测量值的平均数,并折算成绝对干重,以百分比表示。
2 数据分析与模型建立
2.1 数据分析工具
本试验采用MATLAB7.0 软件(美国MathWorks公司)的自编程序对试验数据进行处理。利用matlab工具箱(iToolbox)建立羊草水分、粗蛋白、中性洗涤纤维和酸性洗涤纤维的关系模型。用决定系数(R2)和均方根误差(Root Mean Square Error,RMSE)评价新建模型。同时,借助SPSS 17.0进行所有数据的整理和分析。
2.2 数据分析与建模
无信息变量消除法(unknown variable elimination,UVE)将与自身矩阵相同数量的变量之随机变量矩阵添加到光谱矩阵中。然后通过交叉验证,逐个消除非信息变量[10,20],建立偏最小二乘法(partial least squares,PLS)多元回归模型,得到回归系数的矩阵。通过分析回归系数矩阵中回归系数向量的均值和标准偏差的商的稳定性,最后根据商的绝对值确定是否在最终模型中使用变量。
3)可以通过搜索引擎,在百度、搜狐上搜索一些熟知的英文新闻网站和英文学习网站,了解最新国内外大事和与四、六级考试相关的资讯。
随机蛙法(random frog algorithm,RF)是对波长优化计算,用少数变量对羊草品质进行建模[21]。选择每个波长变量输出的概率,并根据可能性的大小选择波长。
UVE和RF2种方法在Matlab代码指令下分别与PLS联合建模(UVE-PLS和RF-PLS),与偏最小二乘法的全波长模型进行比较分析。
3 结果与分析
3.1 羊草水分含量的特征波长模型
把羊草水分含量的近红外值和化学值进行比较,对模型进行校正和预测。图2中(A)、(B)和(C)分别为经过PLS、UVE-PLS和RF-PLS模型获得校正集和预测集的散点图。采用UVE优选特征波长结合PLS测定模型,即UVE-PLS模型测定羊草水分含量的数据分布,更加明显集中在拟合线附近。
表1 波长优选模型对羊草水分的测定效果Tab.1 Predictive effect of wavelength optimization model on water content of Leymus chinensis
图2 不同模型分析羊草中水分含量的预测值与真实值Fig.2 Prediction and measurement of water content in Leymus chinensis by different models注:黑色点为真实值,红色点为预测值,下同Note:The black point is the true value and the red point is the predicted value,the same as below
3.2 羊草粗蛋白含量的特征波长模型
在羊草粗蛋白含量的测定模型中,同样采用1st Derivative、SNV预处理组合法,分析羊草样品的近红外光谱数据,进行UVE、RF和全波长光谱信息建模预测,得出三种模型的相关结果见表2所示。比较UVE、RF和PLS模型及其组合的结果,UVE-PLS与全波长PLS模型相比,显著
表2 波长优选模型对羊草粗蛋白的测定效果Tab.2 Predictive effect of wavelength optimization model on CP of Leymus chinensis
羊草粗蛋白含量近红外值和化学值在PLS、UVE-PLS和RF-PLS三种模型的校正集和预测集的散点图分别见图3中的(A)、(B)和(C)。从图中可知,采用UVE优选特征波长结合PLS的模型,即UVE-PLS模型预测的羊草粗蛋白含量的数据分布,在拟合线附近的集中度更明显。
图3 不同模型分析羊草中粗蛋白含量的预测值与真实值Fig.3 Prediction and measurement of CP content in Leymus chinensis by different models
3.3 羊草酸性洗涤纤维含量的特征波定量模型
表3 波长优选模型对羊草酸性洗涤纤维含量的测定效果Tab.3 Predictive effect of wavelength optimization model on ADF of Leymuschinensis
比较图4中的羊草酸性洗涤纤维含量近红外值和化学值的数据分布,(B)图UVE-PLS测定模型更明显地集中在拟合线附近。
3.4 羊草中性洗涤纤维含量的特征波长模型
图4 不同模型分析羊草酸性洗涤纤维含量的预测值与真实值Fig.4 Prediction and measurement of ADF content in Leymus chinensis by different models
表4 波长优选模型对羊草酸性洗涤纤维含量的测定效果Tab.4 Predictive effect of wavelength optimization model on NDF of Leymuschinensis
变量数Variable number校正均方根误差RMSEC校正集决定系数R2C交叉验证均方根误差RMSECV交叉验证决定系数R2CV预测均方根误差RMSEP预测集的决定系数R2PPLS1200.48320.89550.79670.70280.77360.8029UVE-PLS540.26360.97210.40430.93060.69230.9768RF-PLS660.40210.93230.66310.79320.71250.8337
比较图5羊草中性洗涤纤维含量的近红外值和化学值的散点图,图(B)采用UVE优选特征波长结合PLS的模型,测量效果更接近真实值。
图5 不同模型分析羊草中性洗涤纤维含量的预测值与真实值Fig.5 Prediction and measurement of NDF content in Leymus chinensis by different models