近红外模型转移技术在饲料生产中的应用
2021-03-16王红英常楚晨陈媛媛雷逸群
王红英 常楚晨 金 楠 陈媛媛 雷逸群 谭 宇
(1.中国农业大学工学院,北京100083;2.湖南伟业动物营养集团股份有限公司,湖南长沙410000)
我国作为饲料第一大国,近年来对饲料品质的要求逐渐提高,饲料品质高低和利用效率直接影响畜禽产品的安全[1-2]。采用近红外在线分析技术实时检测饲料原料成分,可动态监控配制过程,实现精准营养,保证饲料品质和利用效率。豆粕是产量最大、使用范围最广的植物性蛋白饲料原料[3];玉米粉能量居谷实类饲料之首,在配合饲料中的用量高达50%~65%。在饲料生产中对作为饲料原料的豆粕和玉米粉进行快速检测,降低生产过程中饲料成分含量的波动引起的配方失真,尤其是水分和粗蛋白的含量,具有重要的现实意义。
目前饲料领域中,关于采用离线光谱建立近红外模型的研究已较为广泛,但生产线检测环境恶劣,获取的在线光谱与离线光谱差异较大,无法在生产线上直接使用离线近红外模型。而仅用在线光谱建模,模型的稳定性不佳,且无法通用于离线近红外检测。当检测环境发生变化时,模型也要随之改变,需耗费巨大的人力物力重新建模[4],近红外模型转移技术可很好的解决以上问题。目前的近红外模型转移方法有斜率∕截距校正、样品扩充[5]、差值转移、直接校正、分段直接校正[6]、Shenk 法[7]、双竞争自适应加权采样法[8]等。但针对离线与在线近红外设备之间的模型转移研究较少,关于离线与非接触式的在线近红外设备之间的模型转移研究更少。近红外建模要求大样本量且样本的化学值分布范围广,但饲料企业受配方和控制的需求限制,原料来源单一,样品数量少,营养成分含量分布范围窄。较大规模的饲料生产企业,不仅有在线监控饲料营养成分的需求,还有在实验室进行饲料营养成分质检的需求,对模型在离线与在线检测间的通用性要求也很高。
本研究采用基于光谱共享法的近红外模型转移技术,该方法能用于小样本量、窄化学值范围样品条件下的近红外建模,且所建模型能在实验室与饲料生产线之间通用,成本低、快速便捷。将离线和在线光谱相结合建立光谱共享模型,对比了仅用离线光谱或在线光谱建模的效果,并评估了光谱共享模型的稳定性和通用性。
1 材料与方法
1.1 样品和光谱的采集
本研究采用在线非接触式傅里叶近红外检测仪MATRIX-F(Bruker 光谱仪器公司,德国)获取在线光谱,光谱范围12 800~4 000 cm-1,波数准确度优于0.05 cm-1,波数精度优于0.1 cm-1[9]。使用中国农业大学自主设计的近红外在线检测平台[10]配合非接触式在线近红外探头采集连续有效的光谱,该装置安装在湖南伟业公司饲料生产线上粉碎-配料运输系统的下料溜管处(图1)。为满足光谱共享法对获取在线和离线光谱样品的一致性需求,用于获取离线光谱的样品也在此处取样。在下料溜管处获取22个豆粕样品和26个玉米粉样品的在线光谱,每20 s采集一次在线光谱,同时进行人工取样,在实验室采用傅立叶变换近红外光谱仪MATRIX-I(布鲁克光谱仪器公司,德国)获得22 个豆粕样品和26 个玉米粉样品的离线光谱,仪器参数为:光谱范围:4 000~12 800 cm-1,分辨率4 cm-1,为降低由于样品装杯时不均匀导致的误差,每个样品扫描两次[11]。样本量过小无法成功建模,为满足建模需求,再额外人工获取15个豆粕样品和23 个玉米粉样品的离线光谱,共取37 个豆粕样品和49个玉米粉样品的离线光谱。
1.2 样品化学成分分析
以豆粕和玉米粉样品的湿化学法检测结果为基准校正近红外模型,按照GB∕T 6435—2014 和GB∕T 6432—2018测定水分和粗蛋白的化学值,每个样品测两次平行,取平均值作为定量分析模型的参考值。
1.3 模型的建立与评价
图1 饲料生产工艺流程及在线近红外探头安装位置示意图
按照3∶1 的比例隔三取一地对样品进行分集,且保证校正集和检验集的平均值相差不大,检验集的数据范围包含在校正集的数据范围内。采用马氏距离法判别异常光谱,采用化学值绝对误差的F检验法判别化学值的异常,并将异常样品剔除。采用平滑校正、导数校正[12]、多元散射校正[13]、标准正态变换[14]等光谱预处理方法降低无关信息和噪声信号对建模的干扰[15]。之后使用偏最小二乘(Partial least squares,PLS)法建立近红外定量分析模型[16-17]。首先使用离线光谱建立离线光谱模型,受样品数量少和样品来源单一的影响,建模效果较差,无法用于在线检测,故本文不予以讨论。之后采用在线光谱和共享后的光谱建立近红外模型,建模结果在下文进行详细分析。采用以下指标综合对模型进行评价:模型校正集相关系数RC和验证集相关系数RP,校正均方根误差RMSEC、预测均方根误差RMSEP,相对分析误差RPD[18],模型改善率Ri。
模型转移后模型预测能力有所提升,本研究定义模型改善率Ri评价模型转移的效果,其含义是与离线光谱模型相比,光谱共享模型的RPD 提高的百分比。Ri的计算公式为:
式中:RPD——相对分析误差(%);
Ri——模型改善率(%)。
采用所建立的近红外模型进行在线预测,通过预测残差绝对值的方差S2评价预测的稳定性。预测残差绝对值的方差越小,说明模型的预测稳定性越好。
式中:Δy——预测残差;
n——校正集或验证集中样品个数;
yi,a——第i个样品的实测值;
yi,p——第i个样品的预测值;
S2——预测残差绝对值的方差。
1.4 基于光谱共享法的近红外模型转移技术
模型转移是避免模型在不同仪器间预测失效、实现模型通用的有效手段[19]。实际生产环境复杂,采集到的在线光谱与离线光谱偏差很大。图2 为豆粕和玉米粉的离线和在线光谱曲线,红色为离线谱线,其余为在线谱线,由于使用了在线近红外检测平台采集在线光谱,光谱质量较高,谱线平滑,趋势合理,在线谱线走向与离线谱线的基本一致,但在线谱线的吸光度明显高于离线谱线。
根据比尔定律[20],对于同一样品来说,吸光度的差异仅由光程不定引起。比尔定律的表达式为:
A=εbC
式中:A——吸光度[L∕(g·cm)];
ε——待测成分的摩尔吸光系数;
b——光程(cm);
C——待测成分的物质的量的浓度(g∕L)。
豆粕和玉米粉由斗式提升机抛出后有较大的初速度,在溜管中主要依靠重力作用运动,其速度高达2 m∕s 左右,物料间的空隙较大且无法均匀流过近红外探头检测位置,而且物料颗粒大小存在差异,故入射光照投射到样品后反射到光纤探头的光程变大,导致样品的吸光度升高。
图2 豆粕和玉米粉的离线和在线光谱
本研究采用光谱共享方法进行模型转移[21],降低吸光度整体偏移的影响。光谱共享法的具体做法为:首先在现场采集不同生产批次的样品和光谱,然后在实验室获取样品的离线光谱,并进行化学值的测量,最后使用离线和在线光谱共同进行建模,以消除生产线在线检测条件的不同带来的误差,增加定标模型的稳健性,并且对不同应用场合的仪器具有通用性。采用同一样品的在线和离线光谱共同建模,即采用吸光度不同但其他光谱特征和化学值相同的光谱共同建模,可使吸光度与光程的偏差对浓度值的影响降低,消除饲料生产线实际条件对在线近红外检测效果的影响。该方法操作简单,无需其他算法或校正方法,适合推广应用于饲料企业。
1.5 数据处理
采用OPUS7.0(Bruker,德国)软件进行异常值剔除、波段选择、光谱预处理和模型构建等,采用Excel软件进行数据分析和绘图。
2 结果与讨论
2.1 离线光谱与在线光谱建模结果
使用离线光谱和在线光谱分别建立豆粕和玉米粉的近红外模型,光谱预处理方法及模型结果如表1和表2 所示。表1 可见,离线光谱模型的相关系数过低,玉米粉粗蛋白的离线光谱模型RP仅0.563;RMSEC与RMSEP差值最高达0.142%,差值越大,模型的预测误差波动越大,稳定性越差,达不到建模要求,故采用小样本量的离线光谱建立近红外模型不可行。在线光谱模型的RP在0.8以上,均方根误差RMSEC、RMSEP在0.25%以下,达到近红外建模的要求。小样本量的在线光谱建模效果优于离线光谱建模效果,但建模效果仍有优化空间。下文采用模型转移技术,以提高近红外建模的效果并实现离线和在线检测间的通用。
表1 豆粕和玉米粉离线光谱建模结果
表2 豆粕和玉米粉在线光谱建模结果
2.2 基于光谱共享法的模型转移结果
本研究采用光谱共享方法,利用在实验室采集的37个豆粕样品和49个玉米粉样品的离线光谱与其中22个豆粕样品和26个玉米粉样品的在线光谱同时建模,即采用样品的所有光谱建模,以提高模型预测效果和稳定性。光谱共享后的建模结果见表3,豆粕和玉米粉样品水分和粗蛋白模型的各评价指标皆较优。相关系数皆在0.94 以上,均方根误差RMSEC、RMSEP在0.19%以下,且校正和预测均方根误差的差值小,说明模型预测误差的波动小,模型稳定性较好。根据评价指标综合衡量,光谱共享模型的建模效果好于离线和在线光谱模型,模型改善率均大于0,其中,粗蛋白指标的模型改善率均超过60%,说明光谱共享法对粗蛋白指标的优化效果更明显。为直观地反映建模效果,本研究绘制了散点图,以1∶1 线为基准,点和拟合线与1∶1 线的重合度越高,模型效果越好。由图3 可知,点和拟合线与1∶1 线重合度很高,光谱共享对模型有明显的优化功能。
表3 豆粕和玉米粉光谱共享模型建模结果
图3 光谱共享近红外定量分析模型预测散点图
近红外检测的重现性在实际应用中也是至关重要的[22],这就需要预测结果具有良好的稳定性,分别使用离线光谱模型、在线光谱模型和光谱共享模型重新预测豆粕和玉米粉样品的水分和粗蛋白含量。使用离线模型对获取的在线谱线进行预测,水分和粗蛋白含量的预测残差绝对值皆较大,预测残差平均值高达7.45%,无法实现在线准确检测,故此处不对离线模型的预测残差予以讨论,只比较在线光谱和光谱共享模型对在线谱线的预测残差。由图4 可知,光谱共享模型的预测残差绝对值的方差S2均小于在线模型,即光谱共享后模型的预测性能和稳定性均优于在线光谱。
图4 在线光谱预测残差图
除了实时在线监控生产线外,饲料企业对饲料的离线近红外检测也有需求,因此近红外模型的通用性是非常重要的[23]。将光谱共享模型应用于离线光谱的预测,预测残差绝对值的平均值为0.3,可用于离线检测。建立离线近红外模型通常需要高昂的建模成本,包括化学试剂的消耗,时间的耗费,技术人员对化学成分的测定,大量样品的采集,光谱共享模型只需采集少量样品即可同时用于在线检测和离线检测,适合在饲料企业推广。
3 结论
①本文获取37 个豆粕样品和49 个玉米粉样品的离线光谱,并获取其中22 个豆粕样品和26 个玉米粉样品的在线光谱,建立了基于光谱共享法的近红外豆粕、玉米粉在线定量分析模型。
②光谱共享模型的建模效果优于离线光谱和在线光谱模型,预测稳定性最佳。既可用于在线检测也可用于离线检测,有较好的通用性。豆粕样品的水分和粗蛋白模型的相关系数Rp分别为0.942和0.959,预测残差绝对值的方差S2为0.075和0.003;玉米粉样品的水分和粗蛋白模型相关系数Rp分别为0.944 和0.994,预测残差绝对值的方差S2为0.042和0.011。
③应用基于光谱共享法的模型转移技术,实现对豆粕和玉米粉成分含量的在线实时检测和离线检测,且适用于小样本量和窄化学值范围条件,为应用在线近红外检测技术在饲料生产线上实现动态调整配方、精准饲料营养提供新方法。