适合温州蜜柑可溶性固形物无损检测的近红外光谱研究
2020-06-09张喜喜董晨辉上海市柑桔研究所上海市崇明区09浙江财经大学经济与管理实验中心浙江省杭州市008上海市崇明区长兴镇农业综合技术推广服务中心09
张喜喜 徐 璇 董晨辉 蒋 飞 (上海市柑桔研究所,上海市崇明区09;浙江财经大学经济与管理实验中心,浙江省杭州市 008;上海市崇明区长兴镇农业综合技术推广服务中心 09)
近年来,随着人们消费水平的提高,消费者在选购柑橘时不仅注重大小、颜色、外观等外部品质,对诸如糖度、口感、酸度、维生素含量等内部品质也越来越关注。其中,可溶性固形物含量是评价柑橘内部品质的重要指标之一[1],它对柑橘口感的影响很大。随着光谱检测技术的发展,近红外光谱检测技术在南丰蜜桔、不知火杂柑、脐橙、苹果、梨、樱桃等水果的品质检测中得以广泛应用[1-4],且随着近红外光谱检测薄皮水果内部品质研究的不断推进,相关设备也开始在实际生产上得到应用[5-6]。但在仪器的实际使用过程中,仪器对果肉的可溶性固形物的检测会受到仪器初始纠偏的显著影响,若采用普通校正,会导致整体检测值存在较大偏差;同时,笔者通过查阅资料以及与仪器厂家技术人员进行沟通发现,在实际应用近红外光谱检测水果内部品质的过程中,需建立更加精确的计算模型。因此,在实际应用近红外光谱大规模检测同一产地的水果时,应直接建立可溶性固形物浓度与近红外光谱数据之间的关系,经过不同光谱预处理方法和变量筛选方法对光谱数据进行处理,才能提高模型的预测能力,进而建立最优的预测模型[7],以便更精确地对可溶性固形物含量进行预测。
“宫川”丰产、优质,是我国近几年发展的早熟温州蜜柑品种之一,更是上海地区主栽柑橘品种。对温州蜜柑进行品质无损检测,不仅能提升产区产品品质,还能满足消费者日益多元化的需求。因此,笔者以温州蜜柑品种“宫川”为试验材料,对适合温州蜜柑可溶性固形物无损检测的近红外光谱进行研究,即筛选出可溶性固形物的显著特征波段,并采用间隔偏最小二乘法建立温州蜜柑可溶性固形物近红外光谱模型,进而提升对温州蜜柑内部品质无损检测的精准度。现将相关研究结果报道如下。
1 材料与方法
1.1 近红外光谱检测技术原理
近红外光谱检测技术(Near Infrared Spectroscopy,简称NIRS)是近些年发展起来的一种高新分析技术,可直接透过水果样品内部,利用水果对近外红光的吸收、散射、反射和透射来确定水果成分含量。该技术具有测试成本低、样品无需预处理、不会破坏样品、无需化学药剂等优点,故在水果品质检测中得到了越来越广泛的应用[8]。
1.2 试验样品
试验样品为温州蜜柑“宫川”,于2019年11月5日采自上海前卫柑桔有限公司基地,采用随机采样方法,选择形状、大小等基本相近的温州蜜柑。在采集光谱前,清除样品表面灰尘和污染,剔除有损伤和缺陷的样品[8],用清水清洁外表后,对柑橘进行编号标记,最终得到140个样品。将140个样品按不同种植地块分成6组进行分析,其中A、B、C、D、E组均为20个样品,F组为40个样品。然后,抽取每20个样品中的17个样品作为建模样品集,3个样品作为预测样品集,即建模样品集为119个样品,预测建模集为21个样品,以评估模型的预测能力和稳健性。
1.3 可溶性固形物含量的真实值测定
将经过光谱检测后的柑橘沿纵径切成a和b两半,榨汁,用爱拓ATAGO PR-32a糖度计实测榨汁液的可溶性固形物含量,并记录。见表1。
表1 建模和预测样品集可溶性固形物含量真实值分布
1.4 采集光谱
利用韩国Sunforest公司生产、型号为H-100C的水果糖度无损检测仪,将采集部紧贴柑橘的a面或者b面,通过仪器内置卤素灯发出的光,经过柑橘内部发生漫反射,接收器识别射出的光,与空白对照相比较,在电脑上利用仪器自带光谱吸收率采集软件得出分波段光谱吸收率。
1.5 光谱预处理
由于柑橘形状、大小、表面粗糙程度、果实部位不同,其可溶性固形物含量也不同[9],另外电噪声、杂散光、环境差异等也会影响采集的光谱信息[10],故笔者采用移动平均、平滑处理、高斯滤波、中值滤波等方法对光谱数据进行预处理,尽可能剔除与样品自身无关的信息,以提高模型的预测能力和稳定性[10]。
1.6 模型建立及评价
虽然H-100C水果糖度无损检测仪也有检测可溶性固形物含量的自带模型,但它仅能粗略判断样品的可溶性固形物含量,误差较大,且不够准确;同时,在利用该仪器进行柑橘可溶性固形物含量检测前,必须进行初始校正,且校正过程很容易受到其他因素的干扰,如光照、湿度、成熟度等。因此,亟需建立更加精确的模型。笔者针对不同的可溶性固形物含量对应的波段吸收率不同,筛选出可溶性固形物的显著特征波段,采用间隔偏最小二乘法和偏最小二乘法建立数学模型,并调整相关参数,以便更精确地预测可溶性固形物的含量。模型中可溶性固形物特征波段的选择和各个波段的最小二乘模型均采用matlab2019b编写程序建模计算仿真,并采用外部验证法对其性能进行评价。
2 结果与分析
2.1 光谱预处理
对原光谱和处理后的数据进行偏最小二乘建模分析,根据最小交互验证均方根误差确定建模的最佳主成分因子数[11],利用最佳主成分因子数结合最小二乘模型,得到模型的拟合优度和交互验证均方根误差。由表2可知,高斯滤波将原始光谱的相关系数从0.808 0提高到0.818 6,交互验证的均方根误差从0.916 4°Birx降低到0.907 2°Birx;平滑处理将光谱相关系数从0.808 0提高到0.819 0,交互验证的均方根误差从0.916 4°Birx降到0.906 2°Birx;其他几种处理均无明显改善。相关系数越大,模型的拟合优度越高,预测的均方根误差和交叉验证的均方根误差越小,模型的预测能力越优[12],故高斯滤波和平滑处理可消除部分噪声影响,提高模型的预测能力。
表2 不同光谱预处理方法的偏最小二乘交互验证结果
2.2 特征波段的选择
选择650~950 nm的波段,并分为10个光谱波段,在每个光谱波段中,分别利用偏最小二乘法建立可溶性固形物定量校正模型。如果某个波段的交互验证均方根小于全光谱建模的交互验证均方根误差,则判定这波段为特征波段[12]。由表3可知,波段7(830~858 nm)和波段9(890~918 nm)的交互验证均方根误差小于全波段,波段1(650~688 nm)、波段8(860~888 nm)的交互验证均方根误差与全波段很接近,但波段7(830~858 nm)的相关系数较小,仅为0.606 7。由此确定,温州蜜柑可溶性固形物含量的特征波段为波段9(890~918 nm),以波段 7(830~858 nm)、波段 1(650~688 nm)、波段8(860~888 nm)为备选特征波段。
2.3 建模及模型的预测
采用21个未建模样品来评价所建模型的性能,由表4可知,在单个波段的情况下,以波段9的建模效果最好,但考虑到波段7(830~858 nm)、波段8(860~888 nm)、波段9(890~918 nm)相邻,合并这3个波段后建模,相关系数从0.810 3提高到0.9134,交互验证均方根误差从0.908 3°Birx降到0.543 9°Birx,明显优于单个波段建模;另外,组合波段1(650~688)和波段7~波段9(830~918)后进行建模,相关系数提升到0.904 0,交互验证均方根误差降到0.504 6°Birx,也能得到较好的预测结果。
表3 分段光谱波段偏最小二乘法的评价指标
表4 不同波段建模预测性能
3 结 论
以温州蜜柑“宫川”为试验样品,笔者对适合温州蜜柑可溶性固形物无损检测的近红外光谱进行了研究,即筛选出可溶性固形物的显著特征波段,采用间隔偏最小二乘法建立温州蜜柑可溶性固形物近红外光谱模型,来预测温州蜜柑的可溶性固形物含量。结果表明,在波段650~950 nm的范围内,利用高斯滤波和平滑处理,可以在一定程度上消除噪声影响,提高模型的精确性,但效果并不如间隔偏最小二乘的方法,结果与前人的相关研究一致[1、7、12]。经分析,温州蜜柑可溶性固形物特征波段为波段9(890~918 nm),备选特征波段为波段7(830~858 nm)、波段8(860~888 nm)、波段1(650~688 nm);组合这些波段后建模,可以大大提高模型预测的准确性,模型的拟合优度高达0.904 0,交互验证均方根误差降到0.504 6°Birx。综上,利用近红外光谱技术,结合间隔最小二乘特征波段选择方法建立模型,可提高温州蜜柑可溶性固形物检测的预测能力和稳健性。