基于高光谱成像的水果损伤分析研究
2018-05-30韩浩然李蒙杜德伟潘明康王鑫野
韩浩然 李蒙 杜德伟 潘明康 王鑫野
摘 要:高光谱成像技术包含图像信息和光谱信息。本文利用高光谱成像技术检测苹果摔伤,主要采用主成分分析、波段比算法和支持向量机分析所采集的高光谱图像数据。实验结果表明,波段比算法和主成分分析法分类识别正确率为93.3%,与支持向量机相比更适用于苹果摔伤的实时快速检测。
关键词:水果损伤;高光谱;波段比算法;主成分分析;支持向量机
中图分类号:TS255.7 文献标识码:A 文章编号:1003-5168(2018)10-0028-05
Damage Analysis of Fruits Based on Hyper spectral Imaging
HAN Haoran1,2 LI Meng1,2 DU Dewei1,2 PAN Mingkang1,2 WANG Xinye1,2
(1.College of Physics and Electronic, Yunnan Normal University,Kunming Yunnan 650500;2.Provincial Key Laboratory for Opto-electronic Information Technology,Kunming Yunnan 650500)
Abstract: Hyper-spectral imaging technology includes image information and spectral information. This paper used hyperspectral imaging technology to detect apple fall. In the process of experiment, principal component analysis, band ratio algorithm and support vector machine were used to analyze hyperspectral image data collected. The experimental results showed that the accuracy of band ratio algorithm and principal component analysis was 93. 3%, which was more suitable for real time and fast detection of apple fall than support vector machine.
Keywords: fruit injury;hyper-spectral;band ratio algorithm;principal component analysis; support vector machine
我國是水果生产和消费大国,但目前的水果检测与分类分级技术还比较落后,主要靠人工进行分类分级,这种方法存在劳动时间长、容易疲劳、主观性强等缺点。因此,迫切需要一种客观、准确、无损的检测分类技术。而融合了光谱信息和图像信息的高光谱成像技术,可以更全面地反映农产品的信息,因此,被广泛应用。高光谱成像技术,配合合适的光谱重建算法,其光谱维和空间维信息既可以检测水果的内在物理性质和化学成分等,又能全面反映出农产品的外部特征、表面缺陷[1]及污染[2]等情况。从农产品的高光谱图像中提取出相应的特征光谱波长,就能对农产品的品质进行准确快速地检测。因此,在检测水果的品质时,可以从光谱信息或是图像信息的角度分析其有效特征信息。由于高光谱图像具有海量、高维的信息,因此,在光谱重建和后期光谱分析时需要对其进行降维。主成分分析(principal component analysis,PCA)、波段比算法(Band Ratio Algorithm)和支持向量机法(Support Vector Machine Method)等是常用的降维方法,在高光谱图像的处理中得到广泛应用。主成分分析法利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息;其通过计算综合主成分函数得分,对客观经济现象进行科学评价。波段比算法可以使光照不均匀影响达到最小化,增强波段之间的差异性,提供一些单波段下无法得到的有效信息。支持向量机法选取感兴趣区,抽取少量波段,运算速度较快。本研究应用高光谱成像技术,研究了无损检测肉眼看不到的苹果机械损伤的可能性,并用主成分分析、波段比运算、监督分类的支持向量机三种方法对高光谱图像进行分析研究,确定了合适的检测方法。
1 降维算法
1.1 主成分分析法
1.1.1 主成分分析的原理。主成分分析法是利用降维(线性变换)的思想,把多种指标化简为少数的几个综合指标(主成分),化简后的前几个主成分就能反映原始数据的绝大部分信息,而且所含信息之间没有重复。这种方法将复杂因素归结为少数几个主成分,使问题得以简化,且数据信息更加科学有效[3]。主成分分析的特点是利用线性拟合的思路把分布在多个维度的高维数据投射到几个轴上。如果每个样本只有两个数据变量,这种拟合就是:
[a1x1+a2x2=PC] (1)
其中,[x1]和[x2]分别是样本的两个变量,而[a1]和[a2]则被称为载荷,计算出的[PC]值就被称为主成分。
实际上,当一个样本只有两个变量时,主成分分析本质上就是一个线性回归。式(1)本质上就是一条直线。主成分坐标旋转图[3]见图1。
如果一个样本有m个变量,那主成分就变为:
[a1x1+a2x2+…+amxm=PC1] (2)
其中,[PC1]称为第一主成分,而且还可以获得一系列与这个[PC]直线正交的其他直线,如:
[b1x1+b2x2+…+bmxm=PC2] (3)
[PC2]被称为第二主成分,以此类推。若令[A=a1,a2,…,am],[X=x1,x2,…,xm],则
[ATX=PC] (4)
此时,向量[A]称为主成分的载荷(Loading),计算出的主成分的值[PC]称为得分(Score)。
1.1.2 主成分分析处理高光谱数据的计算步骤。设高光谱数据含有[P]个波段,每幅图像包含[K=M×N]个像素,其中[M]表示行数,[N]表示列数,用矩阵[X=x1,x2,…,xp]表示高光谱图像数据,其中[xi](1≤i≤p)为各波段图像,为[K×1]维的列向量,则X为[K×P]维矩阵[4],主成分分析的计算步骤具体如下。
①对原始数据分波段进行标准化处理,标准化后得到矩阵Y,Y矩阵为:
[yij=xij-xjVarxji=1,2,…,K,j=1,2,…,P] (5)
其中,[xj]和[Varxj]分别为:
[xj=1Kk=1Kxij] (6)
[Varxi=1K-1i=1Kxij-xj2j=1,2,…,K] (7)
②得到相关系数矩阵R,并计算 的特征值和特征向量。经标准化处理后的数据构成相关系数矩阵R(P×P方阵):
[rij=1K-1t=1Kyityjti=1,2,3,…,P,j=1,2,3,…,P] (8)
相关系数矩阵R对应的特征值[λ1≥λ2≥…≥λP]和特征向量[ai=ai1,ai2,ai3,…,aik],其中[i=1,2,3,…,P]。
③以AT对原图像进行计算,得到主成分PC,计算公式见式(4)。
④给出一个数值T(如0.85),根据公式(7)计算出累计贡献[Tm≥T]的主成分个数m。
[Tm=i=1mλii=1Pλi] (9)
⑤当前,m个主成分大于等于[T]时,选取前m个主成分,代替原来的高光谱图像X。
1.2 波段比算法
1.2.1 波段比算法原理。波段比算法又称为比值增强(Ratio Enhancement),是计算同一幅图像不同波段间相应像元的像元值之比的图像增强方法。波段比就是用一个波段除以另一个波段生成一幅能提供相对波段强度的图像。比值函数的数学表达式如式(10)所示[5]:
[BVi,j,r=BVi,j,m/BVi,j,n] (10)
式(10)中,[BVi,j,m]和[BVi,j,n]分别是第m和n波段相同位置像素[i,j]的亮度值。[BVi,j,r]是该位置下像素[i,j]的m和n波段的比率值。分母[BVi,j,n]若为0,输出比值[BVi,j,r]将赋值为0。使用归一化函数进行进一步处理,如式(11)所示[5]:
[BVi,j,o= 0 BVi,j,r=0IntBVi,j,r×127+1 BVi,j,r∈1255,1IntBVi,j,r2+128 BVi,j,r∈1,255] (11)
式(5)中,[BVi,j,o]表示像素[i,j]的输出亮度值,[Int]表示取整运算。
1.2.2 特征波长选取。由于高光谱图像数据量非常大,相邻波段之间相关性很强,因此特征波段的选择非常关键。波段之间的相关性越小,波段比值图像的信息量就越大,所以必须寻找相关性较小的特征波长。Sheffield指数(Sheffield Index,SI)[6-8]可以很好地用来确定和评价最佳波段,如式(12)所示:
[SI=Covp×p] (12)
其中,p为所选择的波段数目,当选择p>2时,根据[SI]确定的波段数也大于2,仍需确定相关性最小的两个波段,因此只需考虑P=2的情况。分別计算各种波段组合的[SI]值,[SI]值越大,相关性越小。对[SI]值进行排序,就可以选到特征波长[6]。
1.3 监督分类的支持向量机
1.3.1 支持向量机方法原理。支持向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,其在解决小样本、非线性及高维模式识别中表现出特有的优势,并能推广应用到函数拟合等机器学习问题中[9]。在机器学习中,支持向量机是与相关学习算法有关的监督学习模型,可以分析数据、识别模式以及用于分类和回归分析。
SVM的关键在于核函数。低维空间向量集很难划分,解决的方法是将其映射到高维空间。但是,带来的问题是计算变得更复杂。解决这个问题的方法是引入核函数。只要选用适当的核函数,就可以得到高维空间分类函数。在支持向量机理论中,采用不同的核函数将产生不同的支持向量机算法。常见的核函数有以下四种[10]。
①线性核函数(Linear Kernel)。计算公式为:
[kx,y=xTy+c] (13)
②多项式核函数(Polynomial Kernel)。计算公式为:
[kx,y=acTy+cd] (14)
③径向基函数(Radial Basis Function)。计算公式为:
[kx,y=exp-γx-y2] (15)
④二层神经网络核函数(Sigmoid Kernel)。计算公式为:
[kx,y=tanhaxT+c] (16)
本研究采用多项式核函数和径向基函数。
2 实验及数据处理
2.1 实验材料
市场购买不同品种的苹果15个,目视检测均完好无损。将苹果置于室温下1d后开始实验。将苹果在高1m左右摔落于硬质地板,表面肉眼观察不到损伤。摔后损伤区手感稍微发软。
2.2 图像采集
图像采集采用北京卓立汉光仪器有限公司的Gaia Sorter高光谱分选仪,获得一个包含图像信息和光谱信息的三维数据立方体。在采集高光谱图像之前,需要對系统各参数进行调整、设置,以保证采集到清晰的图像。CCD曝光时间设置为15ms,扫描宽度设为150mm,输送速度设为0.6cm/s。为校正CCD暗电流等对图像的影响,对图像进行黑白校准处理。设W为扫描白板采集到的全白的图像,B为盖上镜头采集到的全黑图像,I是原始的高光谱图像,R是黑白校准后的高光谱图像。采用高光谱系统配套的SPECview软件进行处理。光谱黑白校正的计算公式为[6-12]:
[R=I-BW-B] (17)
2.3 数据分析
2.3.1 主成分分析方法。主成分分析法处理高光谱图像就是为了把实验样品中包含的海量信息用少数几个变量来表示,对高光谱图像信息进行降维。采用ENVI5.0软件选取760~1 000nm波长进行主成分分析,取前6个主成分。各主成分经ENVI5.0软件处理后的图像如图2所示。
从图2可以清楚地看到,第1至第3主成分图像,完全观察不到损伤的痕迹,第4至第6主成分图像,可以观察到损伤部分,以第5主成分图像显示损伤效果比较好,图像最清晰。
2.3.2 波段比算法。波段比运算就是用两个波段相除生成新的相对波段强度图像的过程。其可以降低苹果表面不平整带来光线反射不均匀的影响,还可以增强波段之间的波谱差异,提供一些单波段无法得到的信息。从几组正常和摔伤的苹果中各选3组光谱数据,正常完好的苹果某一部位的光谱反射曲线如图3所示,同一部位损伤后的光谱反射图像如图4所示。
对比图3和图4可得出,损伤部分和正常部分的光谱反射在红外部分差别明显。正常苹果的在红外部分反射率斜率较大;两个损伤部分的光谱反射在560nm附近有个峰值,与正常部分相近波段的光谱反射率有明显区别。损伤部分在红外区反射率起伏不大,较正常部分变化平缓。总之,苹果正常部分的光谱反射率与摔伤部分的光谱反射率存在明显差异,为通过特征波段进行分类识别提供了可能性。
通过对比两个光谱反射率,应用波段比率法原理,对SI值进行排序。损伤区在近红外波段选取801nm和1 000nm做波段比运算,处理后的图像如图5(c)所示。
图5(a)是损伤水果在555nm附近的灰度图像,图5(b)损伤水果在700nm附近的灰度图像,图5(c)是经过波段比法处理过的图像。图5(a)和图5(b)比较亮的部分是镜面反射,看不到损伤。根据人眼感知机理,人眼对555nm波长最敏感,但在图5(a)中却看不到损伤情况;苹果颜色多为红色或黄色,但在图5(b)700nm附近也察觉不到损伤;图5(c)为经过波段比法处理过的图像,清楚地显示出了中间近似圆形的损伤区,周围为完好区域。通过图5综合分析,波段比运算能在近红外波段快速准确检测出苹果原始图像不易显示的机械损伤。
2.3.3 监督分类的支持向量机法。支持向量机方法是采用ENVI5.0软件,在损伤区与完好区选取感兴趣区,采用多项式核函数和径向基函数,分别进行数据处理。因为肉眼看不到损伤,尽管损伤区在560nm有个峰值,不选为特征波段。从图4与图5可知,在近红外区,正常苹果与损伤区的光谱反射率差别较大,所以在近红外区选取760、761、810、811、860、861、910、911、960nm和961nm作为特征波段。利用这些波段对图像进行处理,图5(a)的苹果处理后的图像如图6所示。图6(a)是多项式核函数的图像处理结果,图6(b)是径向基函数的图像处理结果。图6(a)分类效果较主成分分析和波段比算法差,图像不规则,因为苹果是摔在硬的地板砖上的,损伤区应该是接近圆形的规则图像。图6(b)没有准确反映出损伤部位,反映的只是光照较强的部分。
3 数据分析结果及对比评价
对15个样本数据分别采用以上三种算法进行分析,得出的分类、筛选结果如表1所示。
主成分分析和波段比运算有14个样本能很好地显示出损伤区,正确率为93.3%。对于同样一组高光谱数据,监督分类的支持向量机(多项式核函数)方法只有11个在摔伤区有不规则投影,图像质量很差。
主成分分析选用的是波长760nm到1 000nm进行主成分分析,数据量大,检测速度较慢。波段比算法选取801nm和1 000nm做波段比运算,数据量小,计算速度快,损伤区检测也比较准确。监督分类的支持向量机效果较差。综合比较,波段比运算是最有前途的检测水果机械损伤的无损检测方法。
4 结论
①本研究采用主成分分析法、波段比算法和监督分类支持向量机三种方法分析高光谱图像,对肉眼看不到的苹果机械损伤进行识别,前两种方法检测正确率达到93.3%,支持向量机效果较差。
②主成分分析法与选取的波段、选用协方差矩阵或相关系数矩阵均有关。选用不同的波段及不同的矩阵,最后采用的主成分不一样。
③实验结果表明,克服相邻波段之间的相关性强的方法是SI。SI可以快速确定出特征波长,从而快速实现高光谱数据降维。
④波段比算法可以有效克服光照不均匀对样品产生的影响,提取光谱间的差异,迅速从高光谱数据中找出准确信息,准确地确定肉眼看不见的损伤区域的轮廓。通过选取合适的特征波段,就可以达到快速检测出水果机械损伤的目的。
参考文献:
[1]赵娟,彭彦坤,赵松玮,等.基于高光谱技术检测苹果外观缺陷[J].食品安全质量检测学报,2012(6):681-684.
[2]索少增,刘翠玲,吴静珠,等.高光谱图像技术检测梨表面农药残留试验研究[J].北京工商大学学报(自然科学版),2011(6):73-77.
[3]彭谨.主成分分析入门[EB/OL].(2016-10-16)[2018-03-01].https://www.cnblogs.com/SCUJIN/p/5965946.html.
[4]张明月,贺金兰,田尉霞.主成分分析在高光谱图像降维中的应用[J].内蒙古科技与经济,2017(15):88-90.
[5]蔡健荣,王建黑,陈全胜,等.波段比算法结合高光谱图像技术检测柑橘果锈[J].农业工程学报,2009(1):127-131.
[6]Inoue Y, Pe?uelas J, Miyata A, et al. Normalized difference spectral indices for estimating photosynthetic efficiency and capacity at a canopy scale derived from hyperspectral and CO2 flux measurements in rice[J]. Remote Sensing of Environment, 2008(1):156-172.
[7] Steve De Backer, Aleksandra Pi?urica, Bruno Huysmans, et al. Denoising of multicomponent images using wavelet least-squares estimators[J]. Image and Vision Computing, 2008(7):1038-1051.
[8] Thomas Koenig,Lester Melie-Garcia, Maria Stein, et al. Establishing correlations of scalp field maps with other experimental variables using covariance analysis and resampling methods[J]. Clinical Neurophysiology, 2008(6):1262-1270.
[9]百度百科.支持向量機[EB/OL].(2015-01-13)[2018-03-01].https://baike.baidu.com/item/%E6%94%AF%E6%8C%81%E5%90%91%E9%87%8F%E6%9C%BA/9683835.
[10]常用的核函数[EB/OL].(2016-07-03)[2018-03-01].https://blog.csdn.net/qq_27231343/article/details/51817866.
[11]赵杰文,刘剑华,陈全胜,等.利用高光谱图像技术检测水果轻微损伤[J].农业机械学报,2008(1):106-109.
[12]陈全胜,赵杰文,蔡健荣,等.利用高光谱图像技术评判茶叶的质量等级[J].光学学报,2008(4):669-674.