基于光谱技术与光学仿真的柚果在线检测托盘设计与试验
2019-04-16孙潇鹏陆华忠
孙潇鹏 徐 赛 陆华忠
(1.华南农业大学工程学院,广东 广州 510642;2.广东省农业科学院农产品公共监测中心,广东 广州 510642;3.广东省农业科学院,广东 广州 510642)
可见/近红外光谱检测技术作为一种无损、快速的检测方法,近年来在农产品品质检测中得到了广泛应用[1-3]。然而,对于柚果等大型厚皮类水果而言,由于体积大,皮厚,光谱透射难[4-6],在线检测难度大,内部品质检测准确率低[7-9],其品质仍靠人工鉴别,正确分辨率不高。目前,国内外厚皮类水果内部品质检测的研究,水果的光谱在线检测,通常采用动态传输以保证检测效率,但易造成机械损伤,通过托盘传送有益于水果在相对稳定的检测环境下完成光谱在线检测。李雄等[10]在可见/近红外漫透射在线检测装置中为柚果提供果杯进行在线检测。郭志明等[11]在透射光谱在线检测系统中为苹果提供果托进行在线检测。但对柚果的果杯或果托,并未进行参数设计、仿真分析等深入研究,则无法判断果杯或果托是否符合柚果的光谱在线检测。笔者前期试验发现,大型厚皮水果的透射光谱信息较弱,托盘的设计参数会对柚果透射光谱信息采集造成影响。
为提高柚果在线检测输送的稳定性,并减少托盘对光谱信息采集的干扰,试验拟以柚果为研究对象,从柚果的形态特征入手,通过光学仿真和光谱采集试验相结合的方法,优化设计柚果传送托盘,并对该托盘进行柚果漫透射光谱采集,光谱特征选取,建立柚果可溶性固形物含量的偏最小二乘法回归预测模型[12],以期为厚皮类水果内部品质在线检测提供参考。
1 材料与方法
1.1 试验材料
从梅州市柚果果园取果后,立即运回广东省农业科学院农产品公共监测中心开展试验。去除有外表损伤、有伤疤或不规则的样品后,采用湿毛巾将柚果擦净、自然晾干,并于室温(19~21 ℃)下存24 h。剩余120个柚果的外形参数如表1所示。
表1 120个柚果的形态特征†
† 夹角:如图1所示,柚果在该姿态下,弧面外切线与水平面的夹角。
1.2 传送托盘的设计
以柚果的外形参数为基础,经计算,如图1所示,D1(内径)设置为50 mm;D2设置为柚果的横径最小值,即130.15 mm;D3设置为柚果的纵径平均值,即172.16 mm。H为托盘厚度,即30 mm。倒角为柚果与水平面夹角均值,即17°。托盘的初始材料为橡胶。
1.3 托盘应用光谱平台与试验仪器
1.3.1 托盘应用光谱平台 根据试验要求,自主搭建光谱试验平台(见图2),由计算机、光谱试验箱体、光谱仪、光纤、光源和积分球等组成,光源使用100 W石英卤素灯(12组),光源入射角为45°。柚果置于传送托盘上,通过皮带传送装置传送至光谱采集装置,光谱采集装置采集光谱的原理,如图3所示。中控系统通过数据分析和模型预测,将柚果及传送托盘传输至品质分级装置进行柚果分级。
1.柚果模型 2.传送托盘
1.传送托盘 2.皮带传动装置 3.光谱采集装置(包括:箱体、光谱仪、光源、光纤和积分球等) 4.中控系统(计算机等) 5.品质分级装置
图2 不同检测环境下的光谱平台
Figure 2 Spectrum platforms in different detection environments
1.箱体 2.机器视觉装置 3.光源 4.风扇 5.积分球 6.光纤 7.光谱仪 8.皮带传送装置 9.品质分级装置 10.计算机
图3 光谱采集装置的原理示意图
Figure 3 Schematic diagram of spectral acquisition device
1.3.2 试验仪器
光谱仪:QE-Pro型(测量波长400~1 100 nm)和NIR-QUEST型(测量波长900~1 700 nm),美国海洋光学公司;
糖度仪:PAL-Grape Must(Brix)型,ATAGO(爱拓)中国分公司;
天平:HTP312型,上海花潮电器有限公司;
游标卡尺:精度0.01 mm,上海申韩量具有限公司;
万能角度尺:测量角度0~320°,上海恒量量具有限公司。
1.4 传送托盘的光学仿真
托盘完成初步设计后,建立传送托盘三维仿真模型,进行参数优化。通过Trace pro软件模拟光谱检测环境进行仿真分析,然后对仿真结果进行试验验证。如图4所示,建立仿真模型。柚果材质设置为植物纤维,托盘材质设置为橡胶。对照明装置进行光源等参数设置。根据积分球的工作原理,模型采用更为简易的聚光镜[13],目的在于将不同方向的光信号聚集增强。图4中红色线条为灯泡的光束照射路径,蓝色和绿色为受托盘影响的光束被反射和折射路径。通过分析所得辉度/照度图判定聚光镜接收到光强的最大值、平均值和最小值,如图5所示。
1.光源 2.柚果模型 3.传送托盘 4.聚光镜
图5 辉度/照度图
1.5 柚果传送托盘的光谱平台试验
启动光谱试验平台,预热15 min使设备达到稳定的工作状态,采用Spectra Suite(Ocean Optics Ins.,USA)软件,设置积分时间、平均次数等,获取和存储光谱数据。将托盘置于光谱平台内,样本光谱采集前,需使用平台配套的白板与黑板,分别贴住积分球进行光谱仪校正。将柚果放置在托盘上,每采集一次旋转90°,取4次光谱的平均值作为该样本的光谱数据。
基于柚果的漫透射光谱信息,作为柚果内部品质的研究参数[14]。在光谱平台内,配套以试验结果最优的传送托盘,采集120个柚果样本在400~1 700 nm波长下的漫透射光谱数据,如图6所示。按式(1)计算柚果样本的透射率。
(1)
式中:
T——采集样本的透射率,%;
Is——采集样本的光谱强度,cd;
Iw——放置白板的光谱强度,cd;
Ib——放置黑板的光谱强度,cd。
图6 120个柚果的可见/近红外漫透射原始谱图
Figure 6 The original spectrum of visible/near-infrared diffuse transmission of 120 pomelo fruits
原始光谱需进行光谱预处理,削弱各种无关信息与背景噪声对目标光谱的影响,以达到提高光谱分辨率,提高模型稳健性等目的。选取图6中650~1 350 nm波长范围的光谱数据进行预处理。光谱预处理有卷积平滑法、导数光谱法和多元散射校验法等。卷积平滑法可降低光谱采集过程中随机白噪声的干扰;在消除光谱基线漂移方面,导数光谱法可有效地消除基线和其他背景的干扰;多元散射校验法(MSC)和标准正态变换法(SNV)可消除因样品的不均匀性产生散射引起的光谱差异。
1.6 标准理化值测定
采用糖度仪测量样本的可溶性固形物含量,从样本的检测点提取部分果肉,挤出果汁,用胶头滴管将果汁滴于糖度仪检测镜面,读取并记录数值,每个样本测量3次后取平均值,结果如表2所示。
1.7 预测模型评价
预测模型评价是验证模型预测值的精度和可信度,判断模型的优劣以及是否发生过拟合,所建立的模型必须经过验证后才具有意义。常用的模型评价指标:校正均方根误差(RMSEC)、决定系数(R2)和预测均方根误差(RMSEP)等。其中R2值越接近1,模型的回归或预测结果越好;RMSEP越小,表明模型的预测能力越强。
表2 柚果的可溶性固形物含量统计
2 结果与讨论
2.1 传送托盘的参数优化与光谱试验
为验证托盘参数优化的合理性,设置不同尺寸参数的托盘进行光学仿真对比分析,如表3~5所示。由表3可知,随着内径的增加,辉度/照度均值(AVE)随之增加,当内径为80 mm时,辉度/照度均值达到最大。如继续增大内径尺寸,托盘会发生内部结构失效,导致光谱透过率过高、数据失真等问题。由表4可知,当内径为80 mm时,改变厚度,辉度/照度值随之改变,但辉度/照度值变化规律不明显。由表5可知,内径80 mm,厚度20 mm,外径100 mm的传送托盘,辉度/照度的MAX和AVE值均最大。对参数优化前后的托盘进行实物加工,如图7所示。
表3 托盘内径与辉度/照度值的关系
表4 托盘厚度与辉度/照度值的关系
表5 托盘外径与辉度/照度值的关系
图7 参数优化前后的柚果托盘对比图
2.2 传送托盘的材料替换与光谱试验
由于采用橡胶的传送托盘,采集漫透射光谱数据不理想,则对传送托盘进行材料替换仿真分析,仿真结果如表6所示。由表6可知,托盘采用聚甲基丙烯酸甲酯和聚丙烯酸酯相较于原始材料橡胶,辉度/照度的MAX和AVE值均有提升,聚甲醛树脂的仿真效果最好。
对参数优化后,4种材料的传送托盘进行加工,在传送托盘上放置柚果,分别进行光谱采集试验,如图8所示,采用聚甲醛树脂的托盘,在400~850 nm的可见光波段,柚果光谱的透过率最高。在近红外波段,采用聚甲基丙烯酸甲酯的托盘,柚果光谱的透过率最高,但聚甲基丙烯酸甲酯属于透光材料,即使采用黑色,对光谱采集也存在一定的影响,最终得到托盘和柚果夹杂在一起光谱,故不可采用。
表6 托盘材料与辉度/照度值的关系
图8 采用不同材料托盘的柚果漫透射光谱对比图
Figure 8 Comparison of pomelo diffuse transmission spectra with trays of different materials
综上所述,当传送托盘尺寸参数设置为:外径100 mm,内径80 mm,厚度20 mm时,选择聚甲醛树脂,即为试验所需的最优方案。
2.3 建模结果与分析
2.3.1 柚果可溶性固形物含量预测模型 光谱预处理后,采用偏最小二乘回归法(PLSR)建立回归模型,预测结果如表7所示。由表7可知,采用3点卷积平滑(SG-smooth)处理原始漫透射光谱,再经一阶微分(1 Derivative)预处理后,建立回归模型[15],模型的预测效果最优,RMSEP为0.512 °Brix,Rpre2为0.851。
表7 不同预处理条件的偏最小二乘回归模型
2.3.2 特征波长选取与预测模型优化 对预处理后的650~1 350 nm光谱数据,运用连续投影法(SPA)提取的特征波段[16],如图9所示。共计18个波长变量,即:650,705,766,782,807,841,887,961,1 056,1 100,1 122,1 165,1 244,1 278,1 316,1 335和1 345。
图9 SPA特征变量选取
稳定性竞争自适应重加权采样(SCARS)算法可对无信息变量进行有效去除和共线性变量进行有效压缩,达到提高模型稳健性的目标[17]。SCARS算法中,设置采样次数为1 000,交互验证主成分因子为3,采样率为0.8。对波长变量选择时,根据文献[18]将N(蒙特卡罗模拟数值),Nmcs(蒙特卡罗抽样次数)及采样率分别设置500,50,0.7。
图10(a)是SCARS算法选取的波长变量随抽样次数的变化趋势图。随着抽样次数的增加,波长变量由快到慢呈递减趋势。由图10(b)可知,随着抽样次数的增加,交叉验证均方根误差(RMSECV)值减少,是因为“欠拟合”现象发生,已剔除受仪器影响且较敏感的波长变量;当交叉验证均方根误差值达到最小,之后又呈递增趋势,是因为“过拟合”现象发生,已剔除最优子集中,部分受不同仪器影响且不敏感的波长变量。“过拟合”与“欠拟合”的连接处,即为最优变量子集。图10(c)为波长变量稳定度轨迹图,即变量的稳定度随抽样次数的变化趋势,得到RMSECV的最优变量子集,由绿色星柱标出。最优变量子集为第27个变量子集,最优变量子集中包括36个波长变量,即:880,891,892,917,919,960,961,962,963,978,979,980,1 028,1 041,1 047,1 066,1 069,1 113,1 117,1 118,1 119,1 134,1 161,1 162,1 163,1 164,1 199,1 201,1 202,1 203,1 210,1 219,1 220,1 221,1 222和1 306。
图10 SCARS算法选择特征变量
遗传(GA)算法中,群体数目为30,交叉概率为50%,变异概率为1%,迭代次数为100,对预处理后的650~1 350 nm 光谱数据进行变量优选[19]。如图11(a)所示,为变量入选次数频率直方图,其中绿线表示全局最小RMSECV的变量数位置,红线表示与全局最小RMSECV统计不显著的最小变量数位置。图11(b)为交叉验证变异解释率,随着入选变量数增加,值逐渐增大,最终达到峰值,维持在相对平稳的阶段,或者略微下降。红绿点的意义同图11(a)红绿线。图11(c)为RMSECV随入选变量数变化图,GA遗传算法最终优选出共计38个波长变量,即734,889,900,982,983,984,1 008,1 009,1 011,1 062,1 073,1 074,1 075,1 160,1 161,1 173,1 211,1 212,1 220,1 247,1 248,1 249,1 276,1 277,1 278,1 290,1 291,1 330,1 331,1 332,1 336,1 342,1 343,1 344,1 345,1 346,1 347和1 348,交叉验证变异解释率为99.999 2,即图中红点位置。
图11 GA算法选择特征变量
建立SPA-PLSR、SCARS-PLRS、GA-PLSR和PLSR模型,并用40个预测样品对模型进行预测,结果如表8所示。由表8可知,SPA-PLSR、SCARS-PLRS和GA-PLSR相较于PLSR,预测精度均有较大提升。GA-PLSR模型的Rpre2=0.957;RMSEP=0.271 °Brix,预测精度最佳。
表8 不同模型的预测结果
3 结论
从柚果的形态特征入手,通过Trace pro光学仿真和光谱采集验证,设计柚果传送托盘。为降低传送托盘对光谱试验的影响,对传送托盘进行参数优化,分别从外径、内径和厚度尺寸进行对比试验。为提高柚果光谱透过率,对传送托盘进行结构优化和材料替换,进行对比试验,验证该方法的可行性。传送托盘的最终设计参数为:外径100 mm、内径80 mm、内部夹角17°、聚甲醛树脂且厚度20 mm,采用该托盘在可见/近红外光谱平台,采集120颗柚果在400~1 700 nm波长范围内的柚果漫透射光谱数据。采用卷积平滑、标准正态变换和多元散射校正等方法对光谱进行预处理,选用SPA、SCARS和GA进行光谱特征选取,建立柚果可溶性固形物含量预测模型。结果显示,经卷积平滑和一阶导数预处理,建立GA-PLRS预测模型,决定系数为0.957;预测均方根误差为0.271 °Brix,预测精度最佳。该托盘运用于柚果在线检测,可实现批量柚果在品质流水线的快速无损检测,预测准确性和稳定性更好。