基于高光谱技术的马铃薯外部品质检测
2016-12-29王红军
王红军
黎邹邹
黎源鸿
(华南农业大学工程学院,广东 广州 510642)
基于高光谱技术的马铃薯外部品质检测
王红军
黎邹邹
黎源鸿
(华南农业大学工程学院,广东 广州 510642)
为了快速无损检测马铃薯外部品质,研究采用高光谱成像技术对马铃薯外部品质分级。选取合格、发芽、绿皮、孔洞4种马铃薯外部特征,获取光谱数据,采用不同预处理方法对光谱数据进行处理,并分别建立偏最小二乘判别模型,结果显示采用标准正态变量变换法(SNV)获得的模型效果最优。对预处理后的光谱数据利用连续投影算法(SPA)及加权权重法(WWM)分别优选出了13个和9个特征波段,对两种不同方法得出的特征波段分别建立了支持向量机判别模型,结果显示两种方法对预测集的判别准确率均达到了100%,WWM-SVM判别模型对校正集的交叉验证率为99.5%,高于SPA-SVM判别模型的交叉验证率。利用高光谱成像技术结合SPA-SVM和WWM-SVM对马铃薯外部品质进行分级具有可行性。
高光谱成像技术;马铃薯;连续投影算法;加权权重法;支持向量机
马铃薯是人类四大粮食作物之一,仅次于水稻、小麦、玉米[1]。中国是世界上种植马铃薯面积最大的国家,实现马铃薯的主粮化,也是中国今后必然的战略选择[2]。然而目前中国的马铃薯质量不高,商品利用率低,一个很大的问题就是没有对马铃薯进行严格的分级[3]。
传统的分级方法主要为人工识别,依据人自身的经验判断,虽然正确率非常高,但是效率低,劳动强度大。高光谱技术是近年来高速发展的一门新的技术,它是光谱技术与图像技术的有机结合[4]。利用高光谱技术既可以检测农产品的大小[5]、损伤[6-9],也可以对农产品糖度、硬度等其他内部成分进行定量分析[10-13]。洪添胜等[14]基于高光谱图像技术,利用人工神经网络建立了雪花梨含糖量和含水率的预测模型,结果显示预测值和实际值的相关系数分别为0.996,0.94;单佳佳等[15]结合高光谱图像处理和光谱分析方法,实现了苹果内部品质和外部品质的同时检测;Zhu等[16]以高光谱成像技术结合判别分析方法对6个品种小麦单粒种子进行了识别,取得了较好结果。在马铃薯检测方面,周竹等[17]通过缺陷及合格样本的高光谱图像,采用主成分分析法确定了5个特征波段并结合波段比算法和均匀二次差分算法,使缺陷识别率达到了95.65%;高海龙等[18]分别采集了正对、侧对及背对相机的三种马铃薯的透射和反射的高光谱图像,对所获取图像使用两次IC分析,并建立相应的PLS-DA识别模型,结果表明正对相机的透射图像的准确率最高,最后利用子窗口排列分析算法进一步优化了PLS-DA识别模型,使得损伤总体的识别率达到了97.39%。
目前利用高光谱技术对马铃薯外部品质的检测主要集中在利用马铃薯的高光谱图像结合图像处理技术分割出缺陷区域,对于缺陷种类的判别比较复杂[12]。本研究主要基于马铃薯外部不同特征的光谱数据之间的差别,比较不同预处理方法及不同特征波段的选取方法建立判别模型的效果,并且提出一种基于主成分分析法选择特征波段的改进算法,将改进算法结合支持向量机进行试验数据分析,旨在为马铃薯外部品质的无损检测提供参考。
1 材料与方法
1.1 马铃薯样本
所用的马铃薯样本均采购自广东省广州市长湴果蔬市场,品种为费乌瑞它。按照马铃薯等级规格[19],选取240个马铃薯,其中外部损伤(发芽、绿皮、孔洞)各60个,合格60个。将样本经过简单处理进行高光谱图像的获取,图1为4种外部品质的马铃薯样本的高光谱图像。
图1 4种品质的马铃薯样本(510 nm图像)Figure 1 Four qualities of potato samples(510 nm image)
1.2 仪器设备
试验使用北京卓立汉光公司研发的Zo-lix-HyperSIS高光谱成像系统见图2。硬件主要由成像光谱仪(含CCD摄像头)、光源、暗箱、电移动载物台、驱动电机和装有图像采集卡的计算机等组成,光谱仪的测量范围为370~1 000 nm,采样间隔为1.2 nm。利用HyperSIS高光谱成像系统配套的SpectraSENS-V3.0软件采集高光谱数据,设定曝光时间为5 ms,平台移动速度为12 mm/s,扫描距离为200 mm。研究中用到的数据分析软件有Envi 4.7、Unscrambler 9.7、Excel 2007、Matlab 2014a。
图2 高光谱成像系统Figure 2 Hyperspectral imaging system
1.3 方法
1.3.1 高光谱图像的采集 全部样本在开始采集图像前需要预先进行校正处理。分别通过盖住相机镜头获取全黑图像和采集标准背板图像获取白图像,最终通过式(1)得到校正后的光谱图像(R):
(1)
式中:
R0——获得的原始高光谱图像,Lux;
D——全黑图像,Lux;
W——反射率为99%的白图像,Lux;
R——校正后的图像,Lux。
1.3.2 感兴趣区域光谱的获取 选取经过校正的高光谱图像中感兴趣区域的光谱平均值作为该样本的光谱反射值,每个感兴趣区域的像素值范围在20~120。高光谱图像在采集范围内的首端和末端存在较大的噪音,去掉首端和末端噪音大的波段,确定450~950 nm的光谱及图像用于后续分析,得到了图3所示的各缺陷马铃薯在450~950 nm的平均光谱曲线图。
图3 4种品质马铃薯样本光谱曲线Figure 3 Four qualities of potato sample spectral
由图3可知,各缺陷马铃薯样本的平均光谱曲线差别较大,其中合格、发芽、孔洞马铃薯样本的平均光谱在450~950 nm呈现递增趋势,并且合格马铃薯样本平均光谱一直大于发芽、孔洞马铃薯样本平均光谱;绿皮马铃薯样本的平均光谱起伏比较大,在680 nm左右处呈现明显波谷,并在720 nm左右超过合格马铃薯样本的平均光谱值。
1.3.3 波段选取方法 光谱数据量一般比较大,虽然能够更多地体现对象的属性特征,但是也会在一定程度上造成数据的冗余,给后续的分析处理带来一定的麻烦。在利用光谱数据建立数学模型时,一般要先进行特征波段的选取。SPA算法是一种新兴的波长选取方法[20],能够有效消除众多波长变量之间的共线性影响,是一种特征变量前向选择算法。
本研究采用了连续投影算法(successive projections algorithm,SPA)和一种基于主成分分析法的改进算法来选取特征波段。
2 结果与分析
2.1 光谱数据预处理
高光谱数据采集过程中,光源分布不均以及各种噪声和误差的存在都会对光谱数据产生一定的影响。在利用获取的光谱数据建模前必须进行光谱预处理,本试验采用了无处理、移动平滑(MAS)、Savitzky Golay平滑、中值滤波平滑(MFS)、归一化、一阶导数、二阶导数、多元散射校正(MSC)、标准正态变量校正(SNV)、中心化(MC)10种方法对原始光谱数据进行预处理。将240个样本按照K-stone算法[21]选取192个样本作为建模集,剩余48个样本作为预测集,其中每个品种建模集48个,预测集12个。通过Unscrambler 9.7软件建立192个建模集样本的偏最小二乘判别模型,采用全交叉验证,利用剩余的48个预测集样本进行预测,结果见表1。
表1 不同预处理方法的最小二乘判别模型结果
Table 1 Partial least squares discriminant model results of different pretreatment methods
预处理方法预测样本数/个判别正确个数/个正确率/%R2均方根误差(RMSE)无484695.80.9350.283移动平滑484695.80.9350.285SG平滑484797.90.9380.280中值滤波484593.80.9350.286归一化484797.90.9160.333一阶导数481225.00.9370.281二阶导数481225.00.8920.367多元散射484695.80.9190.318标准正态4848100.00.9380.278中心化4848100.00.9350.286
由表1可知,不同预处理方法对判别结果有不同的影响,不同方法建立的模型的决定系数(R2)基本上都能达到0.9 以上,其中一阶导数、二阶导数进行处理后判别的正确率均为25%,这可能是进行导数处理后引进了较大的噪声,对判别模型产生了不利影响;标准正态化和中心化预处理的判别率均达到了100%,考虑到标准正态化预处理的决定系数(R2)更大为0.938,均方根误差更小,所以本试验采用标准正态化来对光谱进行预处理。
2.2 基于主成分的聚类分析
由图4可知,4种不同缺陷的马铃薯样本明显分成4类,其中合格马铃薯样本主要聚集在第一象限内,发芽马铃薯样本主要集中在坐标原点附近,绿皮马铃薯样本主要位于第四象限,孔洞马铃薯样本主要聚集于横坐标轴的左侧,沿坐标轴上下分布,说明PC1、PC2对4种缺陷的马铃薯有较好的聚类作用。
图4 第一、二主成分得分图Figure 4 Scores scatter plot of PC1 and PC2
2.3 特征波长的选取
利用SPA算法对4种经过光谱预处理后的缺陷马铃薯光谱数据进行特征波长的选取,所得结果见图5。由图5(a)可知,当特征波段数量为13时,RMSE的值较小且随波段数的增加也没有明显变化。由图5(b)可知,特征波段所对应的波段的位置从matlab得出的结果集中可获取,选择(450,556,563,590,653,725,764,832,844,846,856,863,868 nm)这13个特征波段进行后续建模分析。
图5 SPA算法特征波段选择结果Figure 5 SPA algorithm feature band selection results
主成分分析法是高光谱数据降维以及特征波长选择中常用的方法之一[22]。它的基本思路为:先对光谱数据进行主成分分析,得出各主成分的贡献率,根据贡献率选择主成分或者主成分对应的权重曲线图来选择特征波段。经过前面的主成分分析可知马铃薯不同缺陷光谱数据的第一、二主成分的总贡献率为97%,因此考虑用第一、二成分的权重曲线图来选取特征波段,图6为第一、二主成分权重载荷图。 根据图6在选择特征波段时常用的思路为分别选择第一、二主成分权重曲线的极值点对应的波段作为特征波段,本试验提出了一种加权权重法(WWM),考虑到每个主成分的贡献率不同,提出式(2):
(2)
式中:
P——最终权重值;
刘少奇因势利导接着说,要做到赤白区间物资交换,除了筹集物资,还要运输物资。前者已有外贸局在做,后者谁来做呢?当然是我们工会做最合适。一来我们有充足的人力,二来我们有大量的木船、独轮车等工具,三来我们还有丰富的运输工作经验。况且我们这里有赣江这条河流贯通赤白区,河道运输比陆路运输不仅运量大,而且自身消耗少、周转速度快。所以,我们应该下大力气做好河道运输工作,为反封锁斗争作出我们工会应有的贡献。
C1、C2——第一、二主成分贡献率;
ω1、ω2——第一、二主成分各波段的权重值。
图6 第一、二主成分权重载荷图Figure 6 The loading plot of PC1 and PC2
由于在选择特征波段时只关注权重值的数值大小,所以给权重值加了绝对值。对图6利用式(2)进行变换,得到加权权重载荷图见图7。选取上述加权权重载荷曲线的极值点以及首尾波段总共9个波段作为特征波段,从图7中可以看出这9个特征波段分别为450,547,559,581,680,697,714,844,951 nm。经过上述连续投影算法(SPA)和加权权重法(WWM)分别选择了13个和9个波段作为特征波段。
2.4 基于特征波长的判别模型
特征波段作为训练数据,选择径向基(RBF)核函数为核函数类型,结合交叉验证和网格搜索,让c和g在一定范围内取值来寻找最优参数c和g,利用优化后的c和g再来训练模型并对48个预测集样本进行预测,所得结果见表2。由表2可知,两种特征波段的选取方法建立的支持向量机判别模型预测集的准确率均达到了100%,其中WWM-SVM判别模型的交叉验证准确率为99.5%高于SPA-SVM判别模型的96.9%,模型的适用性更强,并且 WWM方法得到的特征波段数量要少于SPA,建立模型的时间短,综合评价WWM-SVM判别模型优于SPA-SVM判别模型。
图7 加权权重载荷图Figure 7 Weighted loading plot
表2 支持向量机判别模型结果Table 2 Results of SVM discrimination model
3 结论
本试验以马铃薯的4种不同缺陷为研究对象,采用高光谱成像技术获取4种缺陷马铃薯感兴趣区域的光谱数据,采用不同预处理方法,利用全波段数据建立偏最小二乘判别模型,根据均方根误差(RMSEP)、决定系数(R2)以及预测准确率选择标准正态变量变换法(SNV)为最优预处理方法。采用连续投影算法并提出了一种加权权重法来选取特征波段,分别选取了13个波段和9个波段作为特征波段。
针对不同特征波段的选取方法,分别建立两个支持向量机判别模型,结果显示两个判别模型的预测集的判别准确率均达到了100%,而WWM-SVM判别模型的交叉验证准确率为99.5%高于SPA-SVM判别模型的96.9%,综合分析WWM-SVM判别模型优于SPA-SVM判别模型,也说明了利用高光谱技术对马铃薯外部缺陷检测是可行的。
[1] 李小平. 马铃薯机械化生产现状及发展对策[J]. 青海农林科技, 2015(2): 111-112.
[2] 谢建华. 我国马铃薯生产现状及发展对策[J]. 中国农技推广, 2007, 23(5): 4-7.
[3] 周伶俐, 胥成刚, 周耀建. 马铃薯质量缺陷原因分析及防范措施[J]. 现代农业科技, 2010(22):132-133.
[4] 马本学, 应义斌, 饶秀勤, 等. 高光谱成像在水果内部品质无损检测中的研究进展[J]. 光谱学与光谱分析, 2009, 29(6): 1 611-1 615.
[5] 程国首, 郭俊先, 石砦, 等. 基于高光谱图像技术的新疆红富士苹果重量预测[J]. 新疆农业大学学报, 2011, 34(3): 249-252.
[6] DIWAN P, ARIANA, LU Ren-fu, et al. Near-infrared hyperspectral reflectance imaging for detection of bruises on picking cucumber[J]. Computer and Electronics in Agricultures, 2006, 53(1): 60-70.
[7] 赵杰文, 刘剑华, 陈全胜, 等. 利用高光谱图像技术检测水果轻微损伤[J]. 农业机械学报, 2008, 39(1): 106-109.
[8] BARANOWSKI P, MAZUREK W, WOZNIAK J, et al. Detection of early bruises in apples using hyperspectral data and thermal imaging[J]. Journal of Food Engineering, 2012, 110(3): 345-355.
[9] LI Jiang-bo, RAO Xiu-qin, YING Yi-bin. Development of algorithms for detecting citrus canker based on hyperspectral reflectance imaging[J]. Journal of The Science of Food and Agriculture, 2012, 92(1): 125-134.
[10] 郭恩有, 刘木华, 赵杰文, 等. 脐橙糖度的高光谱图像无损检测技术[J]. 农业机械学报, 2008, 39(5): 91-93, 103.
[11] ZHAO Jie-wen, CHEN Quan-sheng, VITTAYAPADUNG S, et al. Determination of apple firmness using hyperspectral imaging technique and multivariate calibrations [J].Transactions of the CSAE, 2009, 25(11): 226-231.
[12] 周竹, 李小昱, 高海龙, 等. 马铃薯干物质含量高光谱检测中变量选择方法比较[J]. 农业机械学报, 2012, 43(2): 128-133, 185.
[13] RAJKUMAR P, WANG Ning, EIMASRY G, et al. Studies on banana fruit quality and maturity stages using hyperspectral imaging[J]. Journal of Food Engineering, 2012, 108(1): 194-200.
[14] 洪添胜, 乔军, MICHAEAL O Ngadi, 等. 基于高光谱图像技术的雪花梨品质无损检测[J]. 农业工程学报, 2007,23(2): 151-155.
[15] 单佳佳, 彭彦昆, 王伟, 等. 基于高光谱成像技术的苹果内外部品质同时检测[J]. 农业机械学报, 2011, 42(3): 140-144.
[16] ZHU Da-zou, WANG Kun, PAN Bin-shuang, et al. Identification of Wheat Cultivars Based on the Hyperspectral Image of Single Seed[J]. Journal of Nanoelectronics and Optoelectronics, 2012, 7: 167-172.
[17] 周竹, 李小昱, 陶海龙, 等. 基于高光谱成像技术的马铃薯外部缺陷检测[J]. 农业工程学报, 2012, 28(21): 221-228.
[18] 高海龙, 李小昱, 徐森淼, 等. 透射和反射高光谱成像的马铃薯损伤检测比较研究[J]. 光谱学与光谱分析, 2013, 33(12): 3 366-3 371.
[19] 中华人民共和国农业部. NY/T 1066—2006 马铃薯等级规格[S]. 北京: 中国农业出版社, 2006.
[20] ARAUJO M C U, SALDANHA T C B, GALVAO R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J]. Chemometrics and Intelligent Laboratory Systems, 2001, 57: 65-73.
[21] WU Wei, WALCZAK B, MASSART D L, et al. Artificial neural networks in classification of NIR spectral data: design of the training set[J]. Chemometrics and Intelligent Laborary System, 1996, 33(1): 35-46.
[22] 吴佳, 汤全武, 史崇升, 等. 马铃薯品质无损检测技术研究进展[J]. 食品与机械, 2014, 30(3): 257-271.
Detection of potato external quality based on hyperspectral technology邓建猛DENG Jian-meng
WANGHong-jun
LIZou-zou
LIYuan-hong
(CollegeofEngineering,SouthChinaArgriculturalUniversity,Guangzhou,Guangdong510642,China)
In order to detect the external quality of potato quickly, the hyperspectral imaging technology was used. Potato with germination and other three kinds of common defects were studied. The partial least-squares discriminant model were built after different pretreatment methods for spectral data processing. The results showed that pretreatment method of SNV was the best. 13 and 9 feature bands were selected after using successive projections algorithm (SPA) and weighted weight method (WWM) for spectral data preprocessed. The support vector machine (SVM) discriminant model were established for both SPA and WWM. Our results also showed that the two methods to predict the set of discriminant accuracy reached 100%. WWM-SVM discriminant model of calibration set of cross validation rate was 99.5%, higher than that of the SPA-SVM discriminant model. The study demonstrated the feasibility of using hyperspectral imaging technology combined with WWM-SVM and SPA-SVM for potato external quality grading.
hyperspectral imaging technology; potato; successive projection algorithm; weighted weight method; support vector machine
广东省科技计划项目(编号:2016A010102013)
邓建猛,男,华南农业大学在读硕士研究生。
王红军(1966-),女,华南农业大学教授,博士,硕士生导师。E-mail: xtwhj@scau.edu.cn
2016—10—31
10.13652/j.issn.1003-5788.2016.11.027