宁夏赤霞珠葡萄水分含量的高光谱无损检测研究
2017-03-08蔡正云吴龙国马建荣李梓溢
蔡正云,吴龙国,王 菁,潘 媛,马建荣,李梓溢
(1.宁夏大学农学院,宁夏银川 750021;2.宁夏大学土木与水利工程学院,宁夏银川 750021)
宁夏赤霞珠葡萄水分含量的高光谱无损检测研究
蔡正云1,吴龙国2,王 菁1,潘 媛1,马建荣1,李梓溢
(1.宁夏大学农学院,宁夏银川 750021;2.宁夏大学土木与水利工程学院,宁夏银川 750021)
利用可见近红外高光谱成像技术对宁夏赤霞珠葡萄含水量的无损检测进行了初步探讨。通过高光谱成像系统(400~1000 nm)采集了136幅赤霞珠葡萄图像,对原始光谱、平均平滑、高斯滤波、中值滤波、卷积平滑、归一化、多元散射校正、标准正态化、基线校准、去趋势化等预处理的偏最小二乘回归(PLSR)模型进行对比分析;采用主成分分析(PCA)、偏最小二乘回归(PLSR)、连续投影算法(SPA)、竞争性自适应重加权(CARS)方法选择特征波长,建立4种特征波长下的PLSR的葡萄含水量预测模型,优选CARS提取特征波长的方法。在此基础上,对比分析了全波段与特征波长下的MLR、PCR、PLSR的葡萄含水量预测模型。结果表明:采用多元散射校正(MSC)光谱建立的PLSR模型优于原始光谱和其他预处理光谱的PLSR模型;CARS提取特征波长建立的PLSR模型优于多元线性回归(MLR)、主成分回归(PCR)模型,预测集的相关系数(R)和预测均方根误差(RMSEP)分别为0.806、0.144。因此,利用可见近红外高光谱成像技术提取特征波长进行宁夏赤霞珠葡萄含水量的检测是可行的。
高光谱成像技术,酿酒葡萄,含水量,无损检测
酿酒葡萄产业是宁夏农业特色优势产业之一,也是自治区政府大力培育和支持发展的产业。尤其是贺兰山东麓酿酒葡萄产区,其已发展成为我国三大“原产地保护区”之一。截止2012年底,宁夏酿酒葡萄种植面积已达2.93万公顷,成为全国最大的酿酒葡萄产区[1-2]。得天独厚的地理环境和优良的生态条件,使宁夏酿酒葡萄产区越来越受到世人的瞩目。然而,新鲜的酿酒葡萄含水量高且极易受损,因此对于鲜酿酒葡萄品质的检测是必不可少的。传统的检测方法费时费力且效率低,无法满足生产需求。这就亟需发展一种快速、无损、高效的检测方法来检测酿酒葡萄的品质。
随着科技的快速发展,光谱检测技术已成为当下无损检测的前沿。在农产品检测方面,高光谱成像技术应用广泛,将图像信息和光谱信息进行融合,可同时检测被测样品的全面信息。国内外学者利用高光谱图像(400~1000 nm)技术不仅可以实现对农产品表面缺陷[3-6]、损伤[7-11]、大小[12]等的检测,而且对水果的酸度、水分、硬度、可溶性固形物含量等也做了大量的研究[13-19]。以上研究成果表明高光谱成像技术在水果检测方面所具有的巨大应用前景。然而,应用高光谱成像技术(400~1000 nm)对酿酒葡萄含水量的研究尚少。
本文采用高光谱成像技术(400~1000 nm)对赤霞珠酿酒葡萄含水量进行检测,提取赤霞珠酿酒葡萄的光谱曲线并比较不同预处理的建模效果;基于主成分分析法(Principal Component Analysis,PCA)、偏最小二乘法(partial least-squares regression,PLSR)、连续投影算法(Successive Projections Algorithm,SPA)、竞争性自适应重加权(Competitive Adaptive Reweighted Sampling,CARS)等算法提取特征波长,对比4种提取特征波长方法的PLSR模型,优选最佳特征提取方法,对比分析全波段与特征波段下建立的多元线性回归(Multiple linear regression,MLR)、主成分回归(Principal component regression,PCR)、PLSR模型对赤霞珠酿酒葡萄含水量的预测能力,选取最优建模方法,实现酿酒葡萄含水量的无损检测,以期为高光谱成像技术应用于酿酒葡萄品质分级分选提供参考。
1 材料与方法
1.1 材料与仪器
葡萄 选取新鲜采摘的136个大小均匀、无损伤的贺兰山东麓酿酒葡萄赤霞珠样本,装入密封塑料袋中,置于4 ℃冰箱下保存,测试前将样本至室温(22 ℃)条件下2 h,并对其进行编号,测其初始重量,记录数据。
HyperSpec VNIR高光谱成像系统 美国Headwall Photonics公司生产,包括:高光谱成像光谱仪(Imspector N系列,Golden Way Scientific CO.,Ltd.,US)、CCD相机(G4-232,Golden Way Scientific CO.,Ltd.,US)、光源系统(含2个线光源,90-254VAC,47~63 Hz,Golden Way Scientific CO.,Lab.,EQUIP)、电控位移平台(VT-80,Headwall Photonics Instruments Co.,Ltd.,Beijing,China)、计算机(ThinkPadX220 Inter(R)Core i5-2450CPU@2.5GHz,RAM 3.41G)和数据采集软件(Hyperspec-N for AndorLuca Rev A.3.1.4.vi,Headwall Photonics Instruments Co.,Ltd.,Beijing,China)等部件组成,图像分辨率为1004×501,光谱范围400~1000 nm,光谱分辨率为2.8 nm;DP-307DGY冷冻干燥设备 无锡德谱仪器制造有限公司;JA3102电子天平 上海海康电子仪器厂。
1.2 葡萄的干燥
对采集图像后的贺兰山东麓酿酒葡萄,用精度为0.005 g的电子天秤称取样品,进行编号并记录数据。然后将葡萄放入105 ℃冷冻干燥箱中进行干燥,干燥后用相同的电子天秤称其干重。
1.3 葡萄水分含量的测定
采用水分含量分析仪进行测定,实验重复三次。含水值为鲜重与干重之差。
1.4 高光谱成像的采集
由于采集高光谱图像时,有许多影响因素,如曝光时间、扫描速度、物距等,因此需要进行预实验进行反复尝试。最终经过预实验确定最佳的图像采集的参数如下:物距为400 mm,输送装置的步距为180 μm/s,成像光谱仪的曝光时间为35 ms,扫描起始位置90 mm,扫描线实际长度为60 mm。在采样之前,为减弱成像光谱仪暗电流和室内照明对图像的影响,应在暗室进行操作仪器,避免杂散光对采集样本的干扰。同时需对仪器进行黑白校正[20],如式(1)所示。
式(1)
式中,R是校正后的漫反射光谱图像,RO是样本原始的漫反射光谱图像,D是暗图像,W是白板的漫反射图像。
实验过程中,由于葡萄个体小,为了节约光谱采集时间,每组取6个酿酒葡萄样本,编号,按照一定的顺序摆放在载物台上。因被测酿酒葡萄表皮颜色为紫黑色,为了与背景区分明显,选择白色背景做参考。图像数据处理之前,采用系统自带的ENVI 4.6软件分割高光谱图像,得到136个去掉背景的酿酒葡萄的单个图像。
1.5 特征波长的预处理
本实验利用Unscrambler X10.2软件对原始光谱曲线进行平均平滑(Average Smoothing)、高斯滤波(Gaussian Filter)、中值滤波(Median Filter)、卷积平滑(Savitzky-Golay Smoothing)归一化(Normalize)、多元散射校正(Multiple scattering correction,MSC)、标准正态化(Standard normal variate,SNV)、基线校准(baseline correction)、去趋势化(Detrending)等预处理。
1.6 特征波长的提取及建模
由于高光谱数据的冗余性,需要对其数据进行降维处理,提取出特征波段。实验采用PCA、PLSR、SPA[21-22]、CARS[23]法对MSC预处理光谱数据进行特征提取。采用MLR、PCR、PLSR进行酿酒葡萄水分值的模型建立。
1.7 模型评估
模型采用相关系数(R)、均方根误差(RMSEC/RMSEP)进行评估,一个好的模型应该有高的R值,较低的RMSEC/RMSEP。高光谱图像数据处理的分析软件有仪器自带的ENVI4.6、MATLABR 2011a(The Mathworks Inc.,Natick,MA,USA)以及Unscrambler X 10.2(CAMO Software AS,OSLO,Norway)软件。
表2 原始光谱与预处理光谱的PLSR模型对比分析Table 2 Comparison and analysis of the PLSR model of original and the pretreatment spectrum
2 结果与分析
2.1 葡萄水分的测定
对于136个葡萄样本,选取111个样本作为校正集,其余的25个样本作为预测集,并保证最大值和最小值均在校正集中,葡萄的水分实测值见表1。
表1 葡萄的形态特征参数与水分含量Table 1 Morphological properties and moisture contents of grape samples
2.2 光谱曲线提取
对原始图像进行感兴趣区域提取,获得136个样本的平均光谱曲线,见图1所示。从图1可以看出:光谱波段在511~680 nm直接有强吸收,这主要是葡萄表皮里叶绿素成分的吸收所致[24];而在690 nm之后,随着波段的延长,反射率逐渐增高,到达891 nm处达到峰值,这主要是由于葡萄表皮受红外光所致导致强烈的反射;随之逐渐降低至970 nm处,出现波谷,这主要是水的吸收有关[25]。因此,选择400~1000 nm全波段进行后续数据分析。
图1 原始光谱曲线图Fig.1 Original spectral curve
2.3 原始光谱与预处理光谱的PLSR模型对比分析
由于光谱曲线中存在噪音和其他无关水分的信息的影响,为了提高建模的精确度和稳定性,需要对原始光谱进行预处理。采用PLSR分别对原始光谱和预处理光谱建立葡萄含水量模型,并对建模效果进行对比分析,结果如表2所示。
表3 特征波长提取Table 3 Extraction of characteristic wavelengths
表4 不同特征波长提取方法的PLSR建模对比分析Table 4 Comparison and analysis of PLSR model based on different extraction characteristic wavelengths method
从表2可以看出:原始光谱与不同预处理光谱的PLSR模型差异显著。对比结果如下,a.对比平均平滑、高斯滤波、中值滤波的PLSR模型,参数设为3点的PLSR模型优于其他其他参数点,而且随着参数点的增加,模型预测效果越低;b.对比卷积平滑的不同参数处理,参数设为2项1点,相对应的PLSR模型较优;c.对比分析归一化的不同参数处理,峰值归一化的PLSR模型较优;d.对比分析原始光谱与9种预处理光谱的PLSR模型,综合主成分数与建模预测相关系数因素,优选出MSC光谱作为后续数据分析的光谱数据。
2.4 特征波长提取及模型对比
为了降低数据处理量,利用Unscrambler X 10.2软件对MSC预处理光谱进行特征提取,采用PCA法,软件选择了第五主成分为最优主成分数,提取第五主成分的4个特征波长(473、680、723、800 nm),同时采用PLSR的β系数,软件给出最优主成分数为12个潜变量,在β系数图上基于局部绝对值最大的原则,提取了9个特征波长(459、502、675、689、713、848、877、944、987 nm);利用Matlab2011b软件进行编程,采用SPA法提取特征波长,在选择mmax=15时获得最小RMSECV值,模型拟合效果最佳。选取了15个特征波段数,其对应的特征波长(445、454、464、488、555、675、685、704、771、853、910、939、978、987、992 nm)如图2所示。另外采用CARS法选择特征波长,最大主成分数A=18,交互验证分组数fold=10,数据方法method=‘center’,筛选中蒙特卡洛采样次数设定为100次,提取了22个特征波长(478、497、512、531、565、584、675、689、723、781、790、800、814、848、862、877、881、920、925、934、982、987 nm)。结果如表3所示。
图2 SPA提取特征波段Fig. 2 Extraction of the characteristicwavelengths based on the SPA method
为了进一步确定较佳的特征波长,对比分析PCA、PLSR、SPA、CARS四种方法提取特征波长的建模效果,采用PLSR方法进行模型分析,结果如表4所示。
从表4可以看出:SPA与CARS方法提取特征波长的PLSR模型优于PCA与PLSR提取特征波长的PLSR模型;对比分析SPA与CARS方法,虽然CARS的PLSR模型具有较高的主成分数和较低的RP,但CARS方法提取特征波长PLSR模型的RC、RCV优于SPA方法提取特征波长PLSR模型的RC、RCV,RP=0.806,RMSEP=0.144。因此,选择CARS方法提取特征波长进行后续模型计算。
2.5 特征波长下的不同建模对比分析
对于CARS提取的特征波段进行模型优化,选择MLR、PCR、PLSR方法进行数据拟合,结果如表5所示。
表5 特征波长的模型建立对比Table 5 Comparison and analysis of different models based on characteristic wavelength
从表5可知:MLR模型和PCR模型具有较高的潜变量和RC、RCV,但RP略低;PLSR模型具有较低的潜在因子数,且具有较高的RP和较低的RMSEP值。因此,综合考虑选择PLSR模型为最优模型,其校正集与预测集的模型效果结果如图3所示。图3a为111个校正集样本建立的校正模型,相关系数为0.887,均方根误差为0.125;图3b为25个预测集应用校正模型得到预测结果,真实值与预测值的相关系数为0.806,均方根误差为0.144。
图3 葡萄含水量的特征波长的PLSR模型Fig.3 PLSR model of grape’s moisture content based on important wavelength 注:a:校正集;b:验证集。
3 结论
本文选择400~1000 nm全波段范围内的原始光谱与不同预处理(平均平滑、高斯滤波、中值滤波、卷积平滑、归一化、多元散射校正、标准正态化、基线校准、去趋势化)光谱的PLSR模型的比较,优选MSC方法;采用CARS提取特征波长,建立特征波长的PLSR模型,其Rp=0.806,RMSEP=0.144,显示了较好预测效果。结果表明:利用高光谱成像技术对宁夏酿酒葡萄水分含量进行无损检测是可行的。
[1]李红英,张晓煜,王静,等.宁夏不同熟性酿酒葡萄生态适宜性区划[J].生态学杂志,2014,33(11):3120-3126.
[2]李雅善,李华,王华,等.基于作物水分亏缺指数的宁夏酿酒葡萄干旱时空差异分析[J].自然灾害学报,2014(23):203-211.
[3]吴龙国,王松磊,康宁波,等.基于高光谱成像技术的灵武长枣缺陷识别[J].农业工程学报,2015,20(31):281-285.
[4]刘德华,张淑娟,王斌,等.基于高光谱成像技术的山楂损伤和虫害缺陷识别研究[J].光谱学与光谱分析,2015,11(35):3167-3171.
[5]Nicola B,Ltze E,Peirs A,et al. Non-destructive Measurement of Bitter Pit in Apple Fruit Using NIR Hyperspectral Imaging[J].Postharvest Biology and Technology,2006,40:1-6.
[6]李江波,饶秀勤,应义斌,等.基于高光谱成像技术检测脐橙溃疡[J].农业工程学报,2010,26(8):222-228.
[7]Diwan P Ariana,Renfu Lu. Hyperspectral waveband selection for internal defect detection of pickling cucumbers and whole pickles[J]. Computers and Electronics in Agriculture,2010,74:137-144.
[8]Byoung-Kwan Cho,Moon S Kim,In-Suck Baek,et al. Detection of cuticle defects on cherry tomatoes using hyperspectral fluorescence imagery[J].Postharvest Biology and Technology,2013,76:40-49.
[9]Lü Qiang,TANG Mingjie. Detection of Hidden Bruise on Kiwi Fruit Using Hyperspectral Imaging and Parallelepiped Classification[J]. Procedia Environmental Sciences,2012,11:1172-1179.
[10]Baranowski P,Mazurek W,Wozniak J,et al. Detection of early bruises in apples using hyperspectral data and thermal imaging[J]. Journal of Food Engineering,2012,110(3):345-355.
[11]Li J,Rao X,Ying Y. Development of algorithms for detecting citrus canker based on hyperspectral reflectance imaging[J]. Journal of the Science of Food and Agriculture,2012,92(1):125-134.
[12]马本学,应义斌,饶秀勤,等.高光谱成像在水果内部品质无损检测中的研究进展[J]. 光谱学与光谱分析,2009,29(6):1611-1615.
[13]Gamal ElMasry,Ning Wang,Adel ElSayed,et al. Hyperspectral Imaging for Non-destructive Determination of Some Quality Attributes for Strawberry[J].Journal of Food Engineering,2007,81:98-107.
[14]洪添胜,乔军,Ning Wang,等. 基于高光谱图像技术的雪花梨品质无损检测[J].农业工程学报,2007,23(2):151-155.
[15]Jianguo He,Yang Luo,Guishan Liu,et al. Prediction of soluble solids content of jujube fruit using hyperspectral reflectance imaging[J].Advanced Materials Research,2013,706:201-204.
[16]Rajkumar P,Wang N,EImasry G. Studies on Banana Fruit Quality and Maturity Stages Using Hyperspectral Imaging[J]. Journal of Food Engineering,2012,108:194-200.
[17]Shuang Wang,Min Huang,Qibing Zhu. Model Fusion for Prediction of Apple Firmness Using Hyperspectral ScatteringImage[J].Computers and Electronics in Agriculture,2012,80:1-7.
[18]P Rajkumar N,Wang G EImasry. Studies on Banana Fruit Quality and Maturity Stages Using Hyperspectral Imaging[J]. Journal of Food Engineering,2012,108:194-200.
[19]Gabriel A,Leiva-Valenzuela,Renfu Lu,et al. Prediction of Firmness and Soluble Solids Content of Blueberries Using Hyperspectral Reflectance Imaging[J].Journal of Food Engineering,2013,115:91-98.
[20]Polder G,Gerie WAM,Van Der Heijden. Calibration and Characterization of Imaging Spectrographs[J].Near-Infrared Spectroscopy,2003,11:193-210.
[21]Galvão R K H,Araújo M C U,Fragoso W D,et al. A variable elimination method to improve the parsimony of MLR models using the successive projections algorithm[J]. Chemometrics and Intelligent Laboratory Systems,2008,92(1),83-91.
[22]Liu F,He Y. Application of successive projections algorithm for variable selection to determine organic acids of plum vinegar[J]. Food Chemistry,2009,115(4):1430-1436.
[23]丁希斌,张初,刘飞,等.高光谱成像技术结合特征提取方法的草莓可溶性固形物检测研究[J].光谱学与光谱分析,2015,4(35):1020-1024.
[24]梁亮,杨敏华,张连蓬,等. 基于SVR算法的小麦冠层叶绿素含量高光谱反演[J].农业工程学报,2012,28(20):162-171.
[25]SimsDA,GamonJA. Estimation of vegetation water content and photosynthetic tissue area from spectral reflectance:A comparison of indices based on liquid water and chlorophyll absorption features[J].Remote Sensing of Environment,2003,(84):526-537.
Non-destructive determination of moisture composition in Ningxia wine grapes based on visible near-infrared hyperspectral imaging technique
CAI Zheng-yun1,WU Long-guo2,WANG Jing1,PAN Yuan1,MA Jian-rong1,LI Zi-yi1
(1.School of agriculture,Ningxia University,Yinchuan 750021,China;2.School of Civil and Hydraulic Engineering,Ningxia University,Yinchuan 750021,China)
This article summarizes a visible near-infrared(Vis-NIR)hyperspectral imaging technique was investigated for non-destructive determination of moisture composition of cabernet sauvignon grape produced in Helan mountain. The hyperspectral images of grape over the spectral region between 400 nm and 1000 nm were acquired for 136 grape samples and the difference between raw wavelength and pretreatment wavelength(Average Smoothing,Gaussian Filter,Median Filter,Savitzky-Golay Smoothing,Normalize,MSC,SNV,Baseline Correction,Detrending)by partial least-squares regression(PLSR)were obtained. The efficient wavelengths were selected using weighted coefficients of principal component analysis(PCA),weightedβ-coefficients of partial least-squares regression(PLSR),SPA and CARS. Then the 4 characteristics wavelength of PLSR model of the moisture of cabernet sauvignon grape were built and the CARS method of PLSR model was the best. On this basis,the MLR,PCR and PLSR model of raw wavelength and optimal wavelength for the prediction of grape moisture were established. The results suggested that MSC method was considered to the optimal preprocessing method. The characteristic wavelength extracted by CARS method preformed better than MLR and PCR methods,and the correlation coefficient of prediction and the root mean square prediction error(RMSEP)were 0.806,0.144,respectively. Hence,It’s feasible to determinate the moisture of cabernet sauvignon grape using these optimal wavelengths by hyperspectral imaging technique.
hyperspectral imaging technique;wine grape;moisture content;non-destruction
2016-07-05
蔡正云(1981-),男,硕士,副教授,主要从事农产品检测方面的研究,E-mail:caizhy@nxu.edu.cn。
2014年度国家级大学生创新创业训练计划项目(141074917)。
TS255.2
A
1002-0306(2017)02-0079-06
10.13386/j.issn1002-0306.2017.02.007