不同成熟度猕猴桃糖度紫外/可见光谱检测
2020-11-24孟庆龙尚静黄人帅撒雄星张艳
孟庆龙,尚静,黄人帅,撒雄星,张艳
(1.贵阳学院食品与制药工程学院,贵州贵阳550005;2.贵阳学院农产品无损检测工程研究中心,贵州贵阳550005)
“贵长”猕猴桃是美味猕猴桃品种中的优良品种,1989年贵州省修文县开始引入该品种,目前已发展成为当地的特色精品水果之一以及支柱产业[1]。在猕猴桃采收时,为了延长其贮藏时间,经常采摘还未成熟的果实,但是如果过早采摘,果实就会特别生硬,这将会使口感受到影响,果实也易受冷害;若过晚采摘,由于果实十分柔软易腐烂而难以贮藏[2-3]。猕猴桃的糖度是衡量其成熟度的关键指标之一,因此,开展猕猴桃糖度的快速无损检测研究对于指导其采收时间、采后储藏和加工具有非常重要的意义。
检测水果糖度的传统方法是使用折射仪测量被挤出果汁的糖度[4],然而这种方法存在破损样本的缺点。基于光谱技术的无损检测方法具有诸多优势,比如分析速度快、无污染、无损伤等,所以,近年来,这种方法已被广泛地用于水果品质的快速检测[5-8]。目前,世界各地研究学者已开展了关于李子[9]、草莓[10]、苹果[11-13]、西瓜[14]、梨[15-16]、蓝莓[17]和橙子[18-19]等水果糖度的无损检测,并取得了一定的成果。董金磊等[4]研究了采后贮藏期间猕猴桃糖度的无损检测。Hu等[5]无损监测了1-甲基环丙烯(1-methylcyclopropene,1-MCP)对成熟后猕猴桃中糖分积累的诱导机制。但是,对于不同成熟度猕猴桃糖度的无损检测却未见报道,而且在水果品质无损检测中应用的光谱技术存在数据量冗余的问题,严重影响了预测模型的检测效率。
本文采用紫外/可见光谱采集系统获取不同成熟期“贵长”猕猴桃的反射光谱;比较3种光谱预处理方法(一阶导数、多元散射校正、标准正态变换)对光谱的预处理效果,然后应用竞争性自适应重加权算法从全波段中提取特征波长;最后,基于全光谱和特征光谱分别构建预测猕猴桃糖度的误差反向传播(error back propagation,BP)网络模型,确定最优预测模型,以期为猕猴桃糖度无损检测装备的开发提供理论基础。
1 材料与方法
1.1 试验材料
不同成熟期(未熟期、半熟期、成熟期、过熟期)“贵长”猕猴桃于2019年9月17日至2019年10月19日分4批次采自贵州省修文县龙关口猕猴桃果园,样品从不同的果树上随机采摘,每批次采摘50个无病虫害且无机械损伤的样品,共计200个。样品采摘后立即运到实验室,用柔软的纸品轻轻地擦掉猕猴桃样品表面的尘土等杂物,依次对其编号后在室温(22±2)℃条件下采集光谱并测定糖度。
1.2 试验仪器
数字手持袖珍折射仪(ATAGO PAL-α):日本Atago公司。光谱采集系统:蔚海光学仪器(上海)有限公司,该系统由:光谱仪(QEPro,波长范围为198.2 nm~1 006.4 nm,分辨率为 2.84 nm~3 nm)、光纤(R600-7-VIS-125F,直径为 600 μm)、卤钨灯光源(HL-2000,波长范围为 360 nm~2 400 nm)、反射探头支架(RPH-1)、适配器(RPH-ADP)、标准反射白板(WS-1)、计算机(Lenovo)等构成,如图1所示。
图1 反射式光谱采集系统Fig.1 Schematic diagram of spectra acquisition system
1.3 方法
1.3.1 反射光谱采集
试验根据测试标准反射白板的光谱强度,调节积分时间和平均次数等参数,并保证测量猕猴桃时的参数一致。其中,系统的积分时间为110 ms,扫描平均次数为8,滑动平均宽度为1。将待测猕猴桃紧贴在RPH-1上(通过RPH-ADP将反射探头固定在RPH-1上,反射探头支架表面距离样本约1 cm),光谱采集部位为猕猴桃赤道位置,5次采集的平均值作为该样本的数据,光谱采集由软件OceanView(Ocean Optics,Copyright 2013)控制完成。
1.3.2 糖度的测定
试验采用数字手持袖珍折射仪测定猕猴桃糖度值,折射仪的测量范围:0.0~85%,测量精确度:±0.2%。先将猕猴桃榨汁后再离心(离心机的转速为3000r/min,离心时间为5 min),再将猕猴桃汁涂抹在折光棱镜的镜面上,连续按测量键按钮多次,当最后液晶显示屏3次显示值一致时记录该值。
1.3.3 光谱处理及模型评价
1.3.3.1 光谱预处理及特征波长提取
试验采用一阶导数(first-order derivative,D1st)、标准正态变换(standard normal variation,SNV)和多元散射校正(multi-scatter malibration,MSC)对原始光谱进行预处理。应用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)选取特征波长,该算法的核心是利用自适应重加权采样技术和指数衰减函数筛选出每次循环所建偏最小二乘(partial least square,PLS)模型中回归系数绝对值大的变量点,利用五折交叉验证提取出n个PLS子集模型中交叉验证均方根误差(root mean squares errors for cross validation,RMSECV)最小的子集,然后将其确定为最优的变量子集[20]。光谱预处理及特征波长的选取在MATLAB R2016b软件中执行。
1.3.3.2 建模方法及模型评价方法
试验采用误差反向传播(error back propagation,BP)网络分别构建了基于全光谱和特征光谱的猕猴桃糖度预测模型,BP网络模型是当前使用很广泛的人工神经网络模型之一[21]。
将校正集决定系数(RC2)及其均方根误差(root mean squares errors for calibration,RMSEC),预测集的决定系数(RP2)及其均方根误差(root mean squares errors for prediction,RMSEP),剩余预测偏差(residual predictive deviation,RPD)作为模型性能的评价指标。通常一个好的预测模型具有较大的RC2、RP2和RPD值,以及较小的RMSEC和RMSEP值。RPD值位于1.5到2之间意味着模型的预测性能较差,RPD值位于2到2.5之间表明模型可以粗略地完成定量预测,当RPD值位于2.5到3之间甚至大于3时说明模型具有非常好的预测性能[22]。
式中:nC和nP为校正集和预测集中的样本数;yact和ymean为样本糖度实测值和平均值;ycal和ypre为校正集和预测集中样本糖度预测值;SD为预测集中样本实测值的标准偏差。
2 结果与分析
2.1 反射光谱及预处理
由于原始光谱的首末两头含有较多的噪声,因此剔除前10个和后10个波段,选择波段206.33 nm~999.06 nm为有效光谱区域,此区域共有1 024个波段。猕猴桃的原始反射光谱(a)以及经过SNV(b)、MSC(c)和D1st(d)预处理后的相对反射光谱见图2。
从图2可以看出,在波长675 nm附近的吸收峰是由表面叶绿素的吸收而产生的,反映了猕猴桃表面的颜色信息,波长980 nm相近的吸收峰则是由水分的吸收而产生的,体现了猕猴桃的水分含量信息。
图2 猕猴桃的反射光谱Fig.2 Reflectance spectra of kiwifruits
2.2 猕猴桃糖度统计分析
不同成熟期猕猴桃糖度的统计数据见表1。
表1 不同成熟期猕猴桃糖度统计数据Table 1 Statistics data of sugar content of different maturity of kiwifruits
表1表明,猕猴桃的糖度随着其逐渐成熟而增大。在构建回归预测模型之前,需要基于采集的光谱数据和测定的糖度将所有猕猴桃样本划分为校正样本集和预测样本集,校正集中糖度的范围要比预测集的范围宽是划分样本集的评判标准。研究采用基于联合x-y距离的样本集划分法(sample set partitioning based on joint x-y distances,SPXY)[23]将200个猕猴桃按照3∶1的比例划分为校正集(150个)和预测集(50个)。
校正集和预测集中猕猴桃糖度的统计数据见表2。
从表2可见,校正集中猕猴桃糖度的范围要比预测集中的范围宽,这样划分的样本集有利于构建预测性能较好的模型。
表2 校正集和预测集中猕猴桃糖度统计数据Table 2 Statistics data of sugar content of kiwifruits in calibration and prediction set
2.3 特征波长提取
利用CARS选取特征波长时,其蒙特卡洛采样次数设定为50次,利用五折交叉验证方法计算所构建PLS模型的RMSECV。基于CARS从全波段中选取特征波长的结果见图3。
图3 基于CARS算法从全波段中提取特征波长的结果Fig.3 Characteristic wavelengths selection from full spectra by CARS algorithm
从图3(b)可以看出第29次采样获得的RMSECV值最小,包含29个特征波长(占总波长量的2.8%),图3(d)给出了选取的特征波长分布情况,主要位于207.97 nm~390.45 nm,以及810.60 nm~959.22 nm之间。
2.4 BP网络建模结果
分别将全光谱(full spectra,FS)和CARS提取的特征光谱作为BP网络模型的自变量,校正集和预测集中猕猴桃糖度实测值作为因变量,构建不同成熟度猕猴桃糖度预测模型。不同预测模型对猕猴桃糖度的检测结果见表3。
表3 不同预测模型对猕猴桃糖度的检测结果Table 3 Sugar content prediction results of kiwifruits by different prediction model
从表3可以明显看出,相比于基于全光谱建立的预测模型而言,基于特征光谱构建的预测模型不仅提升了模型的检测效率(从1 024个全波段中选取了29个特征波长),而且模型的预测性能得到了明显的提升(RPD值从2.3~2.6之间提高到了2.8~3.3之间),其中SNV-CARS-BP模型的预测性能最优,其预测集决定系数RP2=0.901,均方根误差RMSEC=0.643%,剩余预测偏差RPD=3.217大于3进一步说明该模型对不同成熟度猕猴桃糖度的预测效果非常好[5]。SNVCARS-BP模型对猕猴桃糖度的预测结果见图4。
图4 猕猴桃糖度的预测结果Fig.4 Prediction results of sugar content of kiwifruits
3 结论
本研究以不同成熟期“贵长”猕猴桃为研究对象,利用紫外/可见光谱采集系统采集了校正集和预测集中样本的反射光谱。为了提升预测模型的精确度和稳定性,比较分析3种光谱预处理方法(D1st、MSC、SNV)对光谱的预处理效果,得出SNV预处理效果最优;为解决在水果品质无损检测中应用的光谱技术存在数据量冗余的问题,应用竞争性自适应重加权算法对预处理后的光谱数据进行降维,从1 024个全波段中选取了29个特征波长作为特征光谱,提升了预测模型的检测效率;基于全光谱和特征光谱分别构建预测猕猴桃糖度的BP网络模型,得出构建的SNV-CARS-BP模型最优,该模型对不同成熟度猕猴桃糖度的无损检测具有非常好的预测性能,其预测集决定系数R2P=0.901,均方根误差RMSEP=0.643%,剩余预测偏差RPD=3.217。研究表明基于紫外/可见光谱技术以及BP网络建立的预测模型可快速无损预测猕猴桃的糖度,为开发猕猴桃糖度的无损检测装备奠定一定的理论基础。