马铃薯近红外光谱无损检测影响因素研究
2023-01-31韩岷杰王相友许英超崔英俊吕丹阳
韩岷杰,王相友,许英超,崔英俊,吕丹阳
山东理工大学农业工程与食品科学学院,山东 淄博 255022
引 言
马铃薯是重要的粮食作物,为保证其质量,通常在加工、运输、储藏过程中对其进行质量检测及产品分级,从而满足市场要求。目前研究学者们采用近红外光谱对马铃薯内部品质进行评价做了广泛而深入的探索,研究结果显示近红外光谱技术可用于马铃薯等农产品质量检测中[1-3],光谱与马铃薯等农产品的营养成分、内部伤病[4]等具有很好地相关性。预测模型的预测精准度会受多种因素影响,如湿度、温度[5]等检测环境因素;产地、品种、收获季节、储存时间等[6]样品本身物化特性;设备工艺、光源类型、检测参数等[7-9]仪器设备本身因素;这些影响会直接或间接降低模型的鲁棒性,从而影响预测结果。
目前有学者采用光谱校正[10]、光谱预处理[11]、变量筛选[12]等方法降低误差因素对预测模型的影响。大多研究停留在单因素试验上,对多影响因素组合试验的研究较少。本研究通过优化马铃薯近红外光谱分选设备的检测条件,研究不同光源类型、光纤探头与检测点距离、光源与检测点的距离及光源功率对光谱质量的影响,建立三因素三水平响应面试验得到最优检测参数。同时预处理算法进一步优化光谱信号的设备噪声和检测精度。本研究为近红外光谱在线分选设备的选型及安装提供理论基础和技术参考。
1 实验部分
1.1 试验材料
样品选用60个大小均匀,重量适中的希森6号马铃薯。试验前用清水将马铃薯表面泥土等杂质清洗干净,置于温度(23±1)℃,相对湿度40%~50%的环境下24 h,以降低温度、表面杂质、湿度等因素对试验带来的误差干扰。
1.2 试验系统
试验硬件系统主要包括光谱采集系统、光源和位移平台(见图1),其中光谱采集系统由光谱仪(型号:FiedSpec4型光谱仪,美国ASD)、光纤、安装光谱采集软件(RS3)的计算机、暗箱和散热设备组成;光源系统由卤素灯杯光源(功率范围0~400 W,上海五铃光学)、环形光源(功率范围0~600 W,上海五铃光学)和“Y”型光纤光源(功率范围0~150 W,上海五铃光学)以及配套的稳压电源组成。
图1 可见/近红外光谱采集系统
1.3 光谱采集
1.3.1 光源类型试验
在相同的暗箱环境、光纤探头和检测点位置、光源与检测点距离、光源功率的条件下,分别用光纤光源、卤素灯杯光源和环形光源三种光源对60个马铃薯样品赤道位置进行三次光谱采集并取平均值。
1.3.2 响应面试验
在最优光源的条件下,固定光纤探头的位置不动,参考其他研究结果[13],初始设置光源功率140 W,光纤距样本检测点5 mm,光源距离样本检测点300 mm,根据响应面试验条件(表2)设置水平大小,对60个马铃薯样品赤道位置依次进行三次光谱采集并取平均值,建立不同因素水平试验条件下马铃薯可溶性固形物含量的预测模型。由于光谱首末两端噪声过大,截取500~2 000 nm波段进行分析。
1.4 光谱预处理
为进一步提高预测模型的鲁棒性,对比S-G平滑法、一阶求导法、标准正态变换法(standard normal variate transformation,SNV)、多元散射校正法(multiple-scatter correction,MSC)和标准变量排序法(standard normal variate transformation,VSN)等不同预处理方法对光谱的去噪效果。其中VSN通过生成加权函数,用于估计变量权重,有效弥补SNV平等对所有变量的缺陷,用自适应的方法来改善光谱信号形状和模型解释[14]。
1.5 预测模型建立方法和评价指标
采用偏最小二乘回归(partial least squares regression,PLSR)作为预测模型。采用表征变量相关程度的预测相关系数(the correlation coefficient of the prediction set,RP)和表征预测值和真值偏差的预测均方根误差(the root-mean-square error of the prediction set,RMSEP)来评估马铃薯可溶性固形物预测模型。
2 结果与讨论
2.1 不同类型光源下光谱质量分析
三种光源分别为光纤光源、环形光源以及卤素灯杯光源[图2(a)]。由图2(b)可知,在相同的检测环境下,在1 000~1 100 nm范围以及大于1 500 nm范围,光纤光源有明显的锯齿状,表明其噪声最大。通过LightTools 8.4软件对三种类型光源进行建模分析,结果由图3可知,光纤光源具有较大的辐照强度,穿透性好,但均匀性最差。而环形光源与卤素灯杯光源相比,环形光源光谱最为光滑,辐照强度及均匀性最好,这与其均匀分布的灯杯有关,在这种分布下,光的均匀性较强,能有效去除阴影影响,降低表面炫光,增加光谱信噪比。因此选用环形均布光源作为响应面影响因素试验的光源。
图2 150 W功率下三种光源的光谱曲线(b)及光源展示(a)
图3 150 W功率下三种光源的辐照强度和均匀度
2.2 响应面影响因素试验
单因素试验[图4(a, b)]表明,光源功率过大,距离过近,检测温度会急剧升高,对样品表面产生灼烧;功率过小,距离过远,则导致光的反射率下降,信噪比降低,从而降低光谱预测的准确性。在线检测过程中,样品厚度和检测装置震动等原因会使检测点到光纤探头的距离发生变化[13],进而致使漫反射的光谱数据产生较大差异。综上所述,采用三因素三水平响应面进行试验,试验影响因素和水平编码如表1所示,试验方案和PLSR模型结果如表2所示。
表1 试验因素水平及编码
表2 试验方案和PLSR模型结果
图4 单因素条件下的光谱曲线
对试验数据二次回归,通过拟合获得预测相关系数Y1和预测均方根误差Y2的回归方程,并进行显著性检验。
表4 预测均方根误差Y2方差分析
表3 预测相关系数Y1方差分析
(1)
(2)
使用Desing-Expert 8.0.6软件分析,得到x1,x2,x3之间较显著和显著作用对Y1和Y2两个评价参数响应面分析。由图5(a)和(b)可知,当光源功率一定时,RP随着光源距样品距离的增加呈现先增加后减小的趋势,同时也随着光纤与样品检测点的距离增加而呈现先增加后降低的趋势,但是趋势趋于平缓。当光纤距样品距离一定时,RP随着光源功率的增加而增加,但是光源功率过大会对样品表面产生灼烧,因此应保证在避免样品表面灼烧的前提下尽可能提高光源功率。同理分析,由图5(c)和(d)可知,RMSEP呈现与RP相反的趋势,这种趋势也验证了试验结果的正确性。
图5 预测相关系数和均方根误差的双因素响应曲面
采用软件的优化模块结合实际的工作情况分析得到最优试验参数为光源功率238.33 W,光纤探头距样品表面距离8.17 mm,光源距样品表面距离370 mm,在最优参数下进行验证试验得到PLSR预测模型(表5),RP为0.867,RMSEP为0.149°Brix。与其他因素水平下的预测模型相比,效果最好。
2.3 光谱预处理
由于设备本身制造工艺,使用年限以及其他环境因素的多方面影响,即使在响应面试验最优参数组合下采集到的光谱中仍含有部分噪声干扰,利用预处理算法的优势对这部分设备因素产生的噪声进行再次优化,如表5所示。
表5 不同预处理方法的PLSR模型对比效果
除SNV外,运用不同预处理方法优化后的预测结果优于未处理光谱,其中VSN预处理算法的PLSR模型RP达到0.914,RMSEP降低到0.132°Brix,表明预处理能有效优化设备因素噪声干扰,增强模型鲁棒性和准确性。过度提高信噪比(如SNV)可导致预测精度降低,原因是过度预处理将原始有用峰认作噪声信号处理,从而降低预测精度。
3 结 论
通过对比试验选取均匀性良好,光谱噪声小的环形卤素光源作为影响因素响应面试验的光源,设计光源功率、光源距样品表面距离、光纤距检测点的距离的三因素三水平响应面,结果表明在最优参数组合下采用VSN预处理算法能有效降低设备及环境噪声干扰,提高预测模型的准确度,增强模型的鲁棒性。本研究为马铃薯近红外在线检测环境搭建和设备选型提供理论和技术支持。
本研究只讨论了设备工艺、光源类型、检测参数等仪器设备本身因素的影响,对产地、品种、收获季节、储存时间等样品本身物化特性的影响需要进一步研究。