鱼粉近红外光谱模型传递应用研究
2020-11-09郑一航郭丽君张凤枰
郑一航,宋 涛,张 顺,郭丽君,张凤枰*
(1.四川威尔检测技术股份有限公司,四川 成都 610041;2.通威股份有限公司 水产畜禽营养与健康养殖农业农村部重点实验室,四川 成都 610093;3.通威股份有限公司 水产健康养殖四川省重点实验室,四川 成都 610093)
鱼粉是全鱼或分割的鱼体经蒸煮、压榨、干燥、粉碎获得的产品,具有蛋白质含量高、适口性好等特点,富含赖氨酸、蛋氨酸等必需氨基酸,且磷、钙和硒含量高,是水产饲料最重要的蛋白原料。鱼粉质量直接影响水产饲料的品质和养殖效果,因此加强鱼粉营养成分分析对于把控水产饲料品质至关重要。采用传统化学分析方法检测其营养组分耗时耗力,效率较低,很难满足现代饲料生产的要求。与传统化学分析技术相比,近红外光谱(Near-infrared spectroscopy,NIRS)分析技术在分析速度、检测成本、易操作性、掺假识别能力等主要检测性能方面具有显著优势,已被饲料企业广泛应用于饲料原料品质的快速测定[1-5]。在实际应用中,建立可靠的预测模型是近红外光谱分析技术成功应用的前提和关键,而建模需要大量具有代表性且化学值已知的样品,对于存在不同型号近红外分析仪的应用场景,则具有投入大、耗时长、成本高的不足。因此,建立良好的NIRS定量分析预测模型并能实现不同型号近红外分析仪间的传递共享显得尤为重要。
国内外学者已在农业[6-10]、工业[11-12]和模型传递方法[13-15]等不同领域开展了模型转移研究,取得了良好效果,但有关鱼粉营养成分NIRS预测模型传递的研究却很少。本文通过开展国产鱼粉营养成分预测模型在不同型号近红外分析仪之间的传递研究,旨在为饲料生产企业进行近红外分析仪升级换代提供依据,降低近红外分析仪的运行成本,提高使用效率。
1 实验部分
1.1 样品采集与制备
采集2019~2020年国产鱼粉样品150个,样品来自通威股份有限公司华东、华南、华西、华北、华中等地区饲料分公司。所有样品均采用FW100型高速万能粉碎机(天津市泰斯特仪器有限公司)粉碎,过40目筛,混合均匀,装入密闭容器中于2~4 ℃保存。其中每个片区各抽取87%为校正集样品,13%为外部验证集样品(见表1)。
表1 国产鱼粉样品来源Table 1 Source of domestic fish meal samples
1.2 营养组分含量分析
水分:GB/T 6435-2014直接干燥法[16],101-1AB型电热鼓风干燥箱(北京中兴伟业仪器有限公司);粗蛋白质:GB/T 6432-2018[17],Kjeltec 2300全自动凯氏定氮仪(丹麦FOSS公司);粗脂肪:GB/T 6433-2006[18],Soxtec 2055脂肪测定仪(丹麦FOSS公司);氨基酸:GB/T 18246-2000酸水解法[19],S-433D全自动氨基酸分析仪(德国SYKAM公司)。
每种化学组分含量检测均做双平行试验,以2次实验结果的算术平均值为最终测定结果。
1.3 近红外光谱数据采集
取出国产鱼粉样品置于室温下平衡24 h,分别用MPA型近红外分析仪(德国 Bruker公司,简称MPA)、DS2500F型近红外分析仪(丹麦FOSS公司,简称2500F)采集近红外光谱数据,每个样品均扫描2次,取其平均光谱。主要参数见表2。
表2 近红外分析仪的主要参数Table 2 Instrument parameters of near-infrared spectrometer
1.4 近红外光谱差异分析与转换
以MPA型近红外分析仪为目标仪器,DS2500F型近红外分析仪为源仪器,样品经两种仪器扫描获得近红外光谱后需研究两者的差异性。欧式距离(D)能直观定量反映不同仪器间的光谱差异性大小[20],计算公式如下:
(1)
由于两种型号的仪器测量原理不同,近红外光谱格式不一致,根据1 nm=107/cm-1进行对等换算,利用OPUS软件将FOSS近红外光谱转换为Bruker格式,并用OPUS软件中剪切功能将转换为Bruker格式的FOSS光谱截取波段(10 000~4 000 cm-1),使之与Bruker原始光谱波段范围一致。
1.5 近红外光谱传递方法
本文将光栅型近红外分析仪(2500F)光谱传递到傅里叶变换近红外分析仪(MPA),采用分段直接校正(Piecewise direct standardization,PDS)方法进行模型传递[21]。PDS算法是一种多元光谱标准化方法,通过传递矩阵系数b将源仪器光谱矩阵As转换成目标仪器光谱矩阵Am,减小As与Am之间的差异,使二者匹配。其中矩阵系数b为源、目标仪器光谱下的响应差异。
PDS算法具体步骤为:
(1)对应于目标仪器标样光谱矩阵Ams,i,在源仪器标样光谱矩阵Ass选取窗口为(k+j+1)大小的光谱段Ass,k+j+1,组成矩阵As,i=[Ass,i-j,Ass,i-j+1,…,Ass,i+k-1,Ass,i+k]。
(2)将Ams,i与As,i进行关联,Ams,i=As,ibi,转换系数bi可由主成分回归法(Principal component regression,PCR)或偏最小二乘法(Partial least squares,PLS)求出。
(3)循环i求出所有的bi,i=1,2,…,m,m为波长点数。
(4)对源仪器校正集光谱As,un经固定窗口分段,由转换系数bi循环得到与目标仪器Am,un相一致的光谱As,unp。对于As,un两端,窗口大小的波长范围(1 tojandm-ktom)不能转换,一般舍去,也可通过外推法获得。
式中Ams,i为目标仪器的标准光谱矩阵;k、j分别代表与i波长点的前后间隔。
1.6 预测模型建立与评价
分别用化学分析法和建立的近红外模型测定外部验证样品,首先根据样品光谱的MD对模型光谱匹配度做判断,当外部样品光谱MDt大于定标MDv阈值(MDt>MDv,max)时,光谱报警,表明外部样品与定标模型的光谱匹配度低,则预测模型不可用;当MDt≤MDv,max时,表明光谱匹配度高,预测模型可用;再采用预测均方根误差(Root mean square error of prediction,RMSEP)和相对分析误差(Relative prediction deviation,RPD)对预测模型的准确度做进一步判断,当RPD>3时,模型的预测效果良好;当2.25≤RPD≤3时,模型的预测效果基本可用;当RPD<2.25时,模型不可用[26-27]。
2 结果与讨论
2.1 国产鱼粉营养成分含量的化学分析结果
按照上述方法测定国产鱼粉样品的营养成分含量,校正集、外部验证集样品的水分、粗蛋白质、粗脂肪、蛋氨酸、赖氨酸测定结果见表3。
表3 国产鱼粉样品营养成分含量的测定结果Table 3 Determination results of nutrient contents of domestic fish meal samples
2.2 国产鱼粉的原始光谱与传递光谱
按照上述仪器参数扫描国产鱼粉校正集样品,分别获得MPA和2500F仪器的原始NIR光谱,并将2500F仪器的NIR光谱格式转换为Bruker格式(以下2500F原始NIR光谱均为仅转换为Bruker格式的NIR光谱)。选取10个具有代表性的国产鱼粉样品分别在2500F和MPA仪器上扫描获得标准光谱,利用OPUS软件的建立转移模型功能,经反复测试选择最佳窗口为7,建立2500F仪器的NIR光谱传递到MPA仪器的方法(PDS方法)。
图1 MPA、2500F、2500F传递到MPA样本的平均光谱图对比Fig.1 Comparison of average spectrum of MPA,2500F and 2500F transferred to MPA samples
图2 2500F、2500F 传递到MPA的平均NIR光谱与MPA的欧式距离差异分布Fig.2 Euclidean distance of average spectrum of MPA,2500F and 2500F transferred to MPA samples
由于MPA和2500F的测量原理、检测器、波数精度不同,MPA原始NIR光谱的吸光度明显高于2500F原始NIR光谱,与2500F传递到MPA仪器上的NIR光谱吸光度基本一致(见图1)。图2为2500F仪器NIR光谱和2500F传递到MPA仪器上NIR光谱分别与MPA仪器原始NIR光谱平均光谱间的欧式距离差异分布情况,原始光谱均经过归一化处理。由图2可知,MPA原始NIR光谱与2500F传递到MPA仪器上NIR光谱的欧式距离在0.01范围内,与2500F仪器NIR光谱的欧式距离在0.02~0.10范围内,前者较后者的差异小。表明MPA与2500F的原始NIR光谱匹配度低,与传递后的NIR光谱匹配度高,即相似度高。说明实现2500F和MPA仪器的预测模型共享具有可行性。
2.3 国产鱼粉预测模型的建立
按照上述方法对MPA原始NIR光谱的水分、粗蛋白质、粗脂肪、蛋氨酸和赖氨酸进行建模,波段选择范围均为10 000~4 000 cm-1,各预测模型的参数见表4。由表4可知,选择矢量归一化+一阶导数(VN+1stDER)、平滑点17为最佳光谱预处理方法,剔除光谱和化学异常值建立原始预测模型,同理建立2500F原始预测模型和2500F传递到MPA上NIR光谱的预测模型。
表4 3种NIR光谱所建预测模型的参数Table 4 Parameters of prediction models established by three kinds of NIR spectra
2.4 外部样品集验证
由表5可知,外部样品验证MPA预测模型时,仅粗脂肪和赖氨酸各有1个样品报警(MDt>MDv,max),其他均未报警(MDt≤MDv,max);2500F预测模型基本全部报警,不能应用于日常分析,主要原因是两种仪器的测量参数不同,导致两种原始NIR光谱的匹配度较低;2500F光谱传递到MPA仪器上所建的NIR预测模型,仅粗脂肪有3个样品报警,其他均未报警,表明通过PDS方法传递的光谱与MPA基本一致,再次说明2500F传递到MPA仪器的NIR光谱与MPA仪器的匹配度较高。由于2500F预测模型在MPA仪器上不能应用于日常分析,因此只能通过光谱传递实现模型共享,且无需统计2500F预测模型的其他验证参数。通过Bias和RMSEP来看,MPA原始预测模型和2500F传递到MPA仪器上NIR光谱所建模型的预测效果基本一致;通过RPD来看,两种预测模型除了蛋氨酸组分基本可用(2.25≤RPD≤3)外,其他组分的预测效果均良好(RPD>3)。综上,2500F仪器的NIR光谱传递到MPA后,所建国产鱼粉的水分、粗蛋白质、粗脂肪、蛋氨酸、赖氨酸预测模型可以替代MPA原始预测模型。
表5 外部样品验证3种预测模型的参数Table 5 Parameters of external samples verified by three kinds of predictive models