APP下载

采后葡萄可溶性固形物含量的高光谱成像检测研究

2017-04-06王运祥叶晋涛马本学

河南农业科学 2017年3期
关键词:校正可溶性预处理

徐 丽,杨 杰,王运祥,叶晋涛,马本学*,吕 琛

(1.新疆惠远种业股份有限公司,新疆 石河子 832003; 2.石河子大学 机械电气工程学院,新疆 石河子 832003)

采后葡萄可溶性固形物含量的高光谱成像检测研究

徐 丽1,杨 杰2,王运祥2,叶晋涛2,马本学2*,吕 琛2

(1.新疆惠远种业股份有限公司,新疆 石河子 832003; 2.石河子大学 机械电气工程学院,新疆 石河子 832003)

提出一种应用高光谱成像技术检测葡萄可溶性固形物含量的方法。使用高光谱成像系统采集葡萄漫反射光谱,在500~1 000 nm光谱,采用多元散射校正(MSC)、标准正态变换(SNV)进行光程校正,结合一阶微分(1-Der)、二阶微分(2-Der)、Savitzky-Golay(S-G)平滑方法及其组合对原始光谱进行预处理,建立可溶性固形物含量的偏最小二乘法(PLS)和逐步多元线性回归(SMLR)模型。结果表明:采用PLS和SMLR建模方法均取得较好的预测效果。采用经过MSC、1-Der和S-G平滑相结合预处理后的光谱建立PLS预测模型,校正集的相关系数Rc为0.979 1,RMSEC为0.265,预测集的相关系数Rp为0.962 0,RMSEP为0.372;采用原始光谱、1-Der和S-G平滑相结合预处理后的光谱建立SMLR预测模型,校正集的相关系数Rc为0.967 8,RMSEC为0.327,预测集的相关系数Rp为0.947 2,RMSEP为0.394。以上表明,基于高光谱成像技术可以实现采后葡萄可溶性固形物含量的准确无损检测。

高光谱成像技术; 光谱分析; 葡萄; 可溶性固形物; 偏最小二乘法

葡萄风味优美,具有丰富的营养价值。随着葡萄产量的不断增加和人们生活水平的不断提高,消费者在选购葡萄时,对其内部营养物质极为看重。可溶性固形物含量是反映葡萄营养物质多少的重要化学成分指标,是影响葡萄收获及市场销售的重要因素。因此,研究准确快速测定可溶性固形物含量的方法具有重要意义。高光谱成像技术,作为新一代的光电无损检测技术,结合了光谱技术和图像技术的主要优势,可以实现光谱和空间信息的同步获取,对待测对象的外部特性和内部成分进行感知和检测。国内外学者利用高光谱技术对水果内部品质,如蓝莓[1]、草莓[2]、香蕉[3]、苹果[4-6]、哈密瓜[7-8]和脐橙[9]等水果的可溶性固形物含量、坚实度、硬度及酸度等进行了检测和分析。已取得的研究结果证明,高光谱成像技术在水果品质检测方面具有广阔的应用前景。在国内外葡萄内部品质检测研究中,Valentina等[10]评价了便携式可见/近红外分光光度计检测葡萄的成熟度的效果;Barbara等[11]通过可见/近红外光纤探针接触到葡萄果渣,对乙醇、乙酸含量等品质指标进行研究;吕刚[12]利用可见/近红外光谱技术对生长期的葡萄可溶性固形物含量进行检测研究;吴桂芳等[13]进行了成熟葡萄浆果糖度的可见/近红外光谱检测研究。但鲜见采用高光谱成像技术对采后葡萄内部品质检测的相关研究报道。鉴于此,以采后新疆红提葡萄为研究对象,利用高光谱成像技术对其可溶性固形物含量进行检测研究,从而为利用高光谱成像技术进行葡萄品质的检测与分级提供技术依据。

1 材料和方法

1.1 试验样本

选取105个红提葡萄果穗,从每个果穗上的穗节部、穗中部、穗内部和穗尖部各选3粒葡萄果粒共12粒作为1个样本,共105个样本。

1.2 高光谱数据的采集

高光谱成像采集系统主要构成部分:线阵CCD摄像机(Hamastsu Ltd.,日本)、线扫描成像光谱仪Imspector V10E-QE(Spectral Imaing Ltd.,芬兰)、镜头OLE-23 (Spectral Imaing Ltd.,芬兰)、光纤卤素灯(DCR Ⅲ型,150 W,Schott,美国)、电移台PSA200-11-X(北京卓立汉光有限公司)、光源调节器(3900,Schott,美国)、电移台控制器SC300-1A(北京卓立汉光有限公司)。

采集光谱前将仪器预热30 min,以防基线漂移造成数据不准,通过对高光谱图像黑白校正,以消除光源强度分布不均匀的噪音与暗电流,确定曝光时间和位移台运行速度。最终仪器使用参量设置为:光谱范围408~1 013 nm,光谱分辨率2.8 nm,曝光时间12.7 ms,物距348 mm,移动平台速度3.54 mm/s。全套系统的外部被黑色的密闭柜封闭,以避免外界光照对采集图像的影响。

1.3 可溶性固形物含量的测定

应用数字式折射仪(PR-101α,Atago Co.,Ltd.,日本)测定葡萄可溶性固形物含量。测量前,用蒸馏水对数字式折射仪校正零点。使用手工压榨机将经高光谱图像采集和剥皮后的葡萄榨汁,经纱布过滤后覆盖折射仪镜面并读取数值。重复取样测量3次,取平均值作为葡萄样品可溶性固形物含量的实际值。

采用含量梯度法[14]将上述105个样本所测可溶性固形物含量进行高低升序排列,然后按3∶1的原则分成校正集和预测集,最终校正集含有79个样本,预测集含有26个样本。表1列出了被测葡萄可溶性固形物含量实测值的最大值、最小值、平均值和标准偏差。

表1 可溶性固形物含量校正集与预测集实测值分布

1.4 高光谱数据处理分析方法

1.4.1 高光谱图像中漫反射光谱响应信息的获取 高光谱图像数据基于Spectral cube 软件(Spectral Imaging Ltd.,芬兰)进行采集,通过ENVI4.7(Research system Inc,Co.,美国)选择样本感兴趣区域(region of interest,ROI),为了提高化学计量学模型的准确性,选取整个样本的每粒葡萄的图像作为ROI(饱和点除外),并计算光谱的平均反射值,得到样本反射光谱曲线(图1)。由于小于500 nm和大于1 000 nm的光谱数据存在明显噪声,因此,选取500~1 000 nm波长数据进行分析。

图1 葡萄可溶性固形物含量的原始光谱曲线

1.4.2 光谱数据处理与数据分析 采用多种方法及其组合对原始光谱进行预处理,多元信号修正(multiplicative signal correction,MSC)、标准正态变换(standard normal variate,SNV)方法来光程校正,消除散射对样本造成的影响。一阶微分(first derivative,1-Der)、二阶微分(second derivative,2-Der)净化图谱消除光谱偏移或漂移,卷积平滑(Savitzky-Golay,S-G)消除光谱中包含的高频噪声。建立葡萄可溶性固形物含量的高光谱无损检测数学模型,来预测其可溶性固形物含量,并对数学模型的预测能力进行验证和精度评价。应用偏最小二乘法(PLS) 和逐步多元线性回归法(SMLR)建立预测模型。

采用相关系数R和均方根误差RMSE对模型进行评价。校正/预测相关系数(Rc/Rp)的值越接近1,所建模型精度越高,校正/预测均方根误差(RMSEC/RMSEP)的值越接近零,且RMSEC和RMSEP差异越小,所建模型越稳健。

2 结果与分析

2.1 异常样本的剔除

在建模之前,需要对异常样本进行剔除。个别样本在光谱成像或光谱采集时出现操作失误,为减少异常样本对检测结果的影响,本试验采用的剔除方法为狄克松(Dixon)检验法,采用偏差在95%置信区间外的光谱判定为异常的原则,105个样本光谱的分析结果按照马氏距离值(mahalanobis distant)[15]由低到高依次排序如图2所示。由图2可知,样本42和样本52超过Chauvenet测试临界阈值1.683,将其视为异常样本剔除后得到77个校正集、26个预测集。

图2 葡萄样本的狄克松检验结果

2.2 PLS与SMLR的可溶性固形物含量预测分析

2.2.1 不同预处理应用PLS建模评估 PLS算法是集主成分分析和因子分析为一体的回归预测模型。通过建立葡萄光谱信息和葡萄可溶性固形物含量的PLS模型,对预测集可溶性固形物含量进行预测。目前在建模过程中,最为常用的确定因子数标准方法是预测残差平方和(PRESS),PRESS越小,表明模型的预测能力越好。因此,一般取PRESS最小时对应的主因子数作为建模最佳主成分数[14],一般因子数应限制在20个以内,以防止过拟合现象出现[16]。采用MSC、SNV进行光程校正,结合S-G平滑、1-Der、2-Der方法及其组合对原始光谱进行预处理,将预处理后的光谱数据建立PLS数学模型。通过综合比较分析Rc、Rp、RMSEC、RMSEP值的大小,确定最优的可溶性固形物含量定量分析模型。各组合最优定标结果见表2。

表2 不同预处理应用PLS建模结果

对经过MSC、1-Der和S-G平滑相结合预处理后的光谱建立PLS预测模型,采用PRESS进行因子数获取,因子数与PRESS值关系如图3所示。当因子数为1~11个时,PRESS值从73.893 9到15.632 1,呈近似线性下降,因子数为12~16个时,PRESS值缓慢下降,当因子数为16个时达到最小值(14.270 7),然后又上升,因此,最佳因子数为16个。

图3 因子数与PRESS值的关系

在对原始光谱进行预处理后的数据建立的PLS模型中,使用MSC、1-Der 结合S-G(11,1)平滑处理过的模型相对稳定,建模效果较好,当因子数为16个时,校正集可溶性固形物含量的相关系数Rc为0.979 1,RMSEC为0.265,预测集可溶性固形物含量的相关系数Rp为0.962 0,RMSEP为0.372。

其中Rc、Rp都较高,RMSEC和RMSEP均低且接近。葡萄可溶性固形物PLS建模校正集和验证集相关性结果如图4所示。

图4 葡萄可溶性固形物含量的PLS建模结果

2.2.2 不同预处理应用SMLR建模评估 SMLR算法将全部葡萄光谱数据参与回归,在回归方程中,根据F检验,逐步剔除对可溶性固形物含量影响不显著的变量,直到无法剔除为止。采用MSC、SNV进行光程校正,结合S-G平滑、1-Der、2-Der方法及其组合对原始光谱进行预处理,将预处理后的光谱数据建立SMLR数学模型。通过综合比较分析Rc、Rp、RMSEC、RMSEP值的大小,确定最优的可溶性固形物含量定量分析模型。各组合最优定标结果见表3。

表3 不同预处理应用SMLR建模结果

在对原始光谱进行预处理后的数据建立的SMLR模型中,使用1-Der 结合S-G(11,1)平滑处理过的模型相对稳定,建模效果较好,当因子数为12个时,校正集可溶性固形物含量的相关系数Rc为0.967 8,RMSEC为0.327,预测集可溶性固形物含量的相关系数Rp为0.947 2,RMSEP为0.394。其中Rc、Rp都较高,RMSEC和RMSEP最低且最接近。葡萄可溶性固形物SMLR建模校正集和验证集相关性结果如图5所示。

图5 葡萄可溶性固形物含量的SMLR建模结果

3 结论

本试验提出了应用高光谱成像技术检测红提葡萄内部可溶性固形物含量的方法。运用多种预处理方法,减少非目标因素影响,并建立了检测定量分析模型。结果表明,采用PLS及SMLR建模方法均取得较好的预测效果,采用经过MSC、1-Der和S-G平滑相结合预处理后的光谱建立PLS预测模型,其Rc为0.979 1,RMSEC为0.265,Rp为0.962 0,RMSEP为0.372;采用原始光谱、1-Der和S-G平滑相结合预处理后的光谱建立SMLR预测模型,其Rc为0.967 8,RMSEC为0.327,Rp为0.947 2,RMSEP为0.394。表明利用高光谱成像技术对采后葡萄可溶性固形物含量检测是可行的。在今后的研究中可以增加样本数量和种类,研究生长期、温度等对葡萄内部品质指标模型的影响,建立一个预测性能高且可移植的模型,促进该技术在农产品检测中的应用。

[1] Gabriel A,Leiva V,Lu R F,etal.Prediction of firmness and soluble solids content of blueberries using hyperspectral reflectance imaging[J].Journal of Food Engineering,2013,115:91-98.

[2] Eimasry G,Wang N,Adel E,etal.Hyperspectral imaging for non-destructive determination of some quality attributes for strawberry[J].Journal of Food Engineering,2007,81:98-107.

[3] Rajkumar P,Wang N,Eimasry G.Studies on banana fruitquality and maturity stages using hyperspectral imaging[J].Journal of Food Engineering,2012,108:194-200.

[4] Mendoza F,Lu R,Ariana D,etal.Integrated spectral and image analysis of hyperspectral scattering data for prediction of apple fruit firmness and soluble solids content[J].Postharvest Biology and Technology,2011,62(2):149-160.

[5] 单佳佳,彭彦昆,王伟,等.基于高光谱成像技术的苹果内外品质同时检测[J].农业机械学报,2011,42(3):140-144.

[6] 黄文倩,李江波,陈立平,等.以高光谱数据有效预测苹果可溶性固形物含量[J].光谱学与光谱分析,2013,33(10):2843-2846.

[7] 李锋霞,马本学,何青海,等.哈密瓜坚实度的高光谱无损检测技术[J].光子学报,2013,42(5):592-595.

[8] 马本学,肖文东,祁想想,等.基于漫反射高光谱成像技术的哈密瓜糖度无损检测研究[J].光谱学与光谱分析,2012,32(11):3093-3097.

[9] 薛龙,黎静,刘木华,等.基于遗传算法的脐橙可溶性固形物的可见/近红外光谱无损检测[J].激光与光电子学进展,2010,47(12):109-113.

[10] Valentina G,Roberto B,Cristina M.Wavelength selection with a view to a simplified handheld optical system to estimate grape ripeness[J].Am J Enol Vitic,2014,65(1):117-123.

[11] Barbara B,Massimo D M,Milena C.Indirect evaluation of microbial spoiling activity in grape marcs by near-infrared spectroscopy[J].Am J Enol Vitic,2013,64(3):411-415.

[12] 吕刚.基于光谱和多光谱成像技术的葡萄内部品质快速无损检测与仪器研究[D].杭州:浙江工业大学,2013.

[13] 吴桂芳,黄凌霞,何勇.葡萄浆果糖度可见/近红外光谱检测的研究[J].光谱学与光谱分析,2008,28(9):2090-2093.

[14] 张小超,吴静珠,徐云.近红外光谱分析技术及其在现代农业中的应用[M].北京:电子工业出版社,2012.

[15] 严衍禄,陈斌,朱大洲,等.近红外光谱分析的原理、技术与应用[M].北京:中国轻工业出版社,2013.

[16] 刘便霞.PLS校正集对FT-IR光谱定量分析精度的影响[D].合肥:中国科学技术大学,2011.

Detection of Soluble Solids Content of Postharvest Grape Based on Hyperspectral Imaging

XU Li1,YANG Jie2,WANG Yunxiang2,YE Jintao2,MA Benxue2*,LÜ Chen2

(1.Xinjiang Huiyuan Seed Industry Co.,Ltd.,Shihezi 832003,China; 2.Mechanical and Electrical Engineering College,Shihezi University,Shihezi 832003,China)

A detection method of soluble solids content in grape based on hyperspectral imaging technology was proposed.The hyperspectral imaging system was used to collect the diffuse reflectance spectra of grape.In the spectra of 500—1 000 nm,multiplicative signal correction(MSC) and standard normal variate(SNV) were used to correct spectra,combined with first derivative(1-Der),second derivative(2-Der),Savitzky-Golay(S-G) smoothing and their combinations to preprocess the original reflectance spectra.Different calibration models of soluble solids content were developed based on partial least square(PLS) and stepwise multiple linear regression(SMLR).The results showed that the modeling effects were both very good using the method of PLS and SMLR.PLS prediction model was established after the pretreatment of MSC,1-Der and S-G smoothing.The correlation coefficient of calibration set(Rc) was 0.979 1 with the root mean square error of calibration set(RMSEC) of 0.265,and the correlation coefficient of prediction set(Rp) was 0.962 0 with root mean square error of predition set(RMSEP) of 0.372.SMLR prediction model was established after the pretreatment of original spectra,1-Der and S-G smoothing.TheRcwas 0.967 8 withRMSECof 0.327,and theRpwas 0.947 2 withRMSEPof 0.394.The study showed that hyperspectral imaging technique could determine soluble solids content of postharvest grape accurately and non-destructively.

hyperspectral imaging technique; spectrum analysis; grape; soluble solids content; partial least square

2016-11-25

国家科技支撑计划项目(2015BAD19B03)

徐 丽(1970-),女,河南永城人,硕士,主要从事农产品智能化检测与分级装备研究。 E-mail:626061652@qq.com

*通讯作者:马本学(1970-),男,山东章丘人,教授,主要从事农产品智能化检测与分级装备研究。 E-mail:mbx_shz@163.com

S663.1;O657.39;TP274

A

1004-3268(2017)03-0143-05

猜你喜欢

校正可溶性预处理
劉光第《南旋記》校正
鲜地龙可溶性蛋白不同提取方法的比较
一类具有校正隔离率随机SIQS模型的绝灭性与分布
基于预处理MUSIC算法的分布式阵列DOA估计
机内校正
浅谈PLC在预处理生产线自动化改造中的应用
络合萃取法预处理H酸废水
可溶性Jagged1对大鼠静脉桥狭窄的抑制作用
可溶性ST2及NT-proBNP在心力衰竭中的变化和临床意义
基于自适应预处理的改进CPF-GMRES算法