APP下载

基于近红外高光谱图像的冬枣损伤早期检测

2017-02-08孙世鹏朱兆龙zquezArellanoMANUEL傅隆生

食品科学 2017年2期
关键词:冬枣正确率波长

孙世鹏,彭 俊,李 瑞,朱兆龙,Vázquez-Arellano MANUEL,傅隆生,*

基于近红外高光谱图像的冬枣损伤早期检测

孙世鹏1,彭 俊1,李 瑞1,朱兆龙1,Vázquez-Arellano MANUEL2,傅隆生1,*

(1.西北农林科技大学机械与电子工程学院,陕西 杨凌 712100;2.霍恩海姆大学农业工程研究所,德国 巴符 斯图加特 70599)

为了对冬枣损伤进行早期检测,采用近红外高光谱图像技术对损伤区域成像。针对高光谱图像波长多的特点,分别采用连续投影算法、相关特征选择算法、一致性(Consistency)算法选择冬枣损伤的特征波长,对提取的特征波长分别应用k-邻近、朴素贝叶斯(naive bayes,NB)、支持向量机(support vector machine,SVM)3 种分类方法进行损伤区域识别。结果表明:所有方法选择的一致特征波长在1 353 nm和1 691 nm附近。Consistency算法选择的特征波长在SVM分类器下分类识别正确率达到95.16%,一致特征波长在NB分类器下分类识别正确率达到84.26%,验证了一致波长的有效性,为多光谱成像技术实现在线检测冬枣损伤提供参考依据。

冬枣;高光谱成像;特征波长;轻微损伤;检测

冬枣甘甜可口,营养丰富,VC含量高,并且富含其他维生素、氨基酸、环磷酸腺苷、矿物质(钾、铁)等[1]。根据GB/T 22345—2008《鲜枣质量等级》规定[2],枣分为未熟枣和成熟枣,成熟枣又细分为白熟期、脆熟期、完熟期。处于白熟期的鲜枣,果皮退绿发白至着色,含糖量低,适合加工蜜枣。处于脆熟期的鲜枣,果实着色至全红,含糖量高,适合鲜食。

冬枣皮薄肉脆,在振动机械采摘和分选时容易造成摔伤和碰伤,初期人眼很难发现。随着时间的延长,冬枣损伤部位颜色变暗甚至腐烂,不仅影响果实品质,甚至引起其他枣的霉变,造成经济损失。水果的损伤区域和正常区域颜色纹理相近,普通彩色相机无法区分[3]。

高光谱图像含有图像信息和光谱信息,不仅能够检测果实内部的物理结构和化学成分,也能够检测果实的外部品质,已经越来越多应用到农产品的品质检测中,如红枣、芒果、香蕉等[4-9]。近年来,枣的高光谱检测已经有了初步的研究。魏新华等[10]对擦伤的冬枣进行损伤检测采用了无信息变量消除法和相关系数法选取4 个特征波长,然后对4 个特征波长进行主成分分析,选取第1主成分作为缺陷识别图像,检测结果的正确率达98%。Wang等[11]在可见光与近红外范围对梨枣的外部虫眼进行识别,对原始数据取对数后求一、二次导获得三类数据,利用逐步判别分析提取特征光谱,采用原始数据的对数对虫咬枣、正常枣和茎端识别正确率达98%。Yu Keqiang等[12]在可见光和近红外区域对梨枣的裂纹进行识别,利用偏最小二乘、主成分和独立成分3 种方法选取特征波长,并对偏最小二乘选取的5 个特征波长进行主成分分析,选取第4主成分进行裂纹识别,检测正确率为90.5%。

上述研究中不同的降维方法选取的特征波长有所区别,特征波长的有效性有待检验[3]。据查阅文献,还没有学者利用高光谱成像技术对冬枣机械振动采摘和自动化分选中的机械损伤进行研究。本实验对1.5、1、0.5 m掉落的脆熟枣损伤区域进行高光谱成像,分别提取损伤区域和正常部分的感兴趣区域(region of interest,ROI)光谱平均值,进而获得损伤和正常区域的平均光谱曲线。采用连续投影算法(successive projections algorithm,SPA)、相关特征选择(correlation based feature selection,CFS)算法、一致性(Consistency)算法进行特征波长选择,得到3 种方法选择的一致波长。随后将选取的特征波长采用k-邻近(k-nearest neighbor,k-NN)、朴素贝叶斯(naive bayes,NB)、支持向量机(support vector machine,SVM)3 种分类器进行分类识别。最后通过一致波长对应光谱分量的图像处理检验识别效果。

1 材料与方法

1.1 实验样本

选用没有明显缺陷的陕西省大荔县脆熟期冬枣55 个,如图1所示,装置获得1.5、1 m和0.5 m高度掉落后的损伤样本。由于果皮组织遭到破坏,损伤区域明显变软,通过人工触摸,获得损伤区域位置,沿损伤区域边界对损伤区域标记。

图1 摔伤实验示意图Fig. 1 Schematic illustration of the falling experiment

1.2 高光谱成像采集系统

图2 高光谱图像采集系统示意图Fig. 2 Schematic illustration of hyperspectral image acquisition

高光谱采集系统(图2)主要包括:图像光谱仪(ImSpector N17E,Spectral Imaging Ltd,Finland)、4个100 W的光纤卤素灯、电控移动平台、暗箱、计算机等,其中卤素灯相距载物台60 cm。在900~1 700 nm光谱范围内每隔5 nm进行采样,共得256 幅图像,像素大小为250×320像素。系统获取图像前已进行黑白标定以消除相机暗电流的干扰。

1.3 高光谱图像采集

损伤样本在拍照前常温放置1 h,将样本通过索环固定,使标记的损伤区域尽量与镜头垂直,先采集完损伤区域高光谱图像。再翻转果实,进行果实正常区域的图像采集。采用图像获取软件(SECN-V17E,Gilden Photonics Ltd.,England)获取图像数据。合理的曝光时间和移动速度能避免信息过度饱和失真[13],多次反复实验后确定曝光时间为10 ms,平台移动速率为20 mm/s。

1.4 特征波长的选择

通过SECN-V17E获得图像采集数据后,运用ENVI4.6、MATLAB 2014b、WEKA 3.6软件处理和分析数据。

1.4.1 高光谱图像数据处理

分别在55 个冬枣的损伤区域和正常部分随机选取感兴趣区域(region of interest,ROI),为减少误差,取ROI的平均光谱值作为为输入波长。其中损伤和正常ROI个数比例为1∶2。本实验将含有大量噪声的波长去除,只保留波长范围为924~1 695 nm的234 个波长进行后续研究。

1.4.2 特征波长选择算法

高光谱图像波段之间存在较多冗余,因此进行数据降维十分必要。本实验采用SPA、CFS和Consistency选择特征波长。SPA通过随机选择一个起始波长,计算未选入波长对其最大投影向量,对应波长作为引入波长,多次循环迭代后,通过代价函数评价得到特征波长[14],该方法能有效消除波长共线性的影响。CFS通过评价特征之间的相关性筛选、组合特征波长,能够有效地剔除不相关的特征,并筛选出相关的特征,并且这些特征之间不存在较强的相关性[15]。Consistency致力于找出能够与完整特征集分类效果一致的最小特征子集,利用特征子集进行分类时的结果一致率评价选取特征波长的优劣[16],该方法能够寻找到预测能力较强的波长。

SPA算法采用一个基于MATLAB开发环境的图形用户界面来实现[17],它主要用于信号处理和多元校正的变量选择。CFS和Consistency算法在WEKA 3.6软件中实现[18],WEKA包含大量的数据挖掘算法。将全部特征波长数据与对应分类结果在上述图像用户界面和WEKA 3.6软件上进行特征波长的提取。

1.5 分类方法

常见的分类方法包括k-NN、NB、SVM。k-NN是一种简单、有效、非参数化的分类方法,根据特征空间最邻近k个样本中的大多数决定所属类别,现已广泛应用到文本分类、模式识别等领域[19]。NB是一种利用贝叶斯定理进行分类的算法[20],同时NB是以训练样本之间是相互独立为假设前提的,预测性能会被训练样本的冗余属性降低[15]。SVM是由Vapnik根据统计理论提出的学习分类方法[21],它是一种二类分类模型,以最大分类间隔构造最优超平面来解决分类问题,具有冗余样本少和较好鲁棒性的特点。将提取的特征波长数据和对应分类结果在MATLAB 2014b中进行分类检测,其中训练集和预测集按照3∶1随机分配。

2 结果与分析

2.1 光谱数据分析

冬枣在不同高度掉落以及不考虑掉落高度时,损伤和正常区域的平均光谱曲线如图3所示。主要有3 个反射谷,分别位于960、1 190 nm和1 450 nm区间。这些反射谷与水的吸收有关,其中960 nm为O—H的2 倍频吸收峰,1 190 nm为O—H的合频吸收峰,1 450 nm是O—H的伸缩振动的一级倍频[22]。此外,1 440 nm附近也是C—H的合频吸收带,1 450 nm是C=O伸缩振动的3 级倍频[22]。不同高度掉落的摔伤区域平均光谱反射率明显低于正常表面,并且在960 nm和1 190 nm附近差别明显,这与通常损伤区域的含水量要高于其他正常组织的结论一致[23]。

图3 不同高度掉落和不考虑掉落高度时冬枣的损伤和正常区域平均光谱曲线Fig. 3 Average reflectance spectra for bruise and normal areas on jujubes with consideration of dropping heights

2.2 特征选取与分类结果

表1 冬枣从不同高度掉落时SPA、CFS、Consistency选择的特征波长Table1 Selected wavelengths using SPA, CFS, and consistency of jujube fruits dropping from different heights

在924~1 698 nm的波长范围内,采用3 种特征选择方法,选取的特征波长如表1所示。不同的掉落高度采用3 种不同降维方法选取的波长变量较多,且有所不同。虽然3 种降维方法选取的特征波长之间的联系不明显,但是可以找到一致的特征波长。由于SPA方法采用Savitzky-Golay滤波器,这种滤波器的原理是通过移动窗口利用最小二乘进行拟合来平滑去噪,存在的一个主要的缺陷是窗口结构决定了左右两端的点被截断[24]。本实验截断了左右两端各12 个波长,因此965~1 658 nm波长范围以外的一致波长采用CFS和Consistency选取。

不同掉落高度3 种降维方法选取一致的特征波长如下:1.5 m掉落为1 359 nm和1 695 nm;1 m掉落为1 376 nm和1 688 nm,0.5 m掉落为1 127、1 329、1 353 nm和1 691 nm。3 种降维方法提取的一致特征波长都在1 353 nm和1 691 nm附近,其中1 688 nm处主要为碳水化合物的吸收波长[25],所以糖分在冬枣损伤判别分类起重要作用。不考虑掉落高度时,SPA、CFS和Consistency提取的特征波长如表2所示,一致特征波长为1 366 nm和1 695 nm,与上述结果相近。

表2 不考虑掉落高度SPA、CFS、Consistency选择的特征波长Table2 Selected wavelengths using SPA, CFS, and consistency without consideration of dropping heights

表3 冬枣从不同高度掉落k-NN、NB、SVM对特征波长的分类正确率Table3 Correct classification rates of k-NN, NB, and SVM for selected wavelengths of jujubes dropping from different heights %

为了检验数据降维后的损伤区域识别效果,分别采用了k-NN(k值选取为5)、NB和SVM 3 种分类方法决定像素是否属于损伤区域,分类结果如表3所示。冬枣在1.5 m掉落时两种方法分类识别正确率最高93.62%,分别是SPA的特征波长提取方法与SVM的分类方法的组合和Consistency与SVM的组合。1 m掉落时3 种方法的分类识别正确率最高94.69%,分别是SPA与k-NN的组合、Consistency与k-NN的组合和Consistency与SVM的组合。0.5 m掉落时采用SPA与SVM的组合分类识别正确率最高95.58%。当采用NB分类时,分类正确率有所下降,主要原因是NB方法受波长相关性的影响,当波长存在较大的相关性,NB的性能就会显著下降。

当采用一致波长1 353 nm和1 691 nm作为输入波长,1.5 m掉落时采用SVM分类器的分类识别正确率最高为81.38%。1 m掉落时采用k-NN分类器的分类识别正确率最高为87.61%。0.5 m掉落时采用NB分类器的分类识别正确率最高为82.30%。一致波长的损伤识别效果相对其他波长选择方法较差,主要原因是特征波长较少,不能全面反映波长的信息。

表4 不考虑掉落高度k-NN、NB、SVM对特征波长的损伤识别正确率Table4 Correct classification rates of selected wavelengths using k-NN, NB, and SVM without consideration of dropping heights %

不考虑冬枣掉落高度时,特征波长在k-NN、NB、SVM分类器下的分类识别效果如表4所示。采用Consistency提取特征波长与SVM分类器的分类识别正确率最高为95.16%。采用一致波长与NB分类器的分类识别正确率最高为84.26%。综上可知,一致波长的分类正确率虽然相对其他波长选择方法较低,但是因为波长较少,证明了一致波长用于损伤检测的有效性。

2.3 高光谱图像信息融合

图4 冬枣轻微损伤特征提取的图像处理过程Fig. 4 Image processing for extracting bruise area of jujube fruits

冬枣损伤表面的原始RGB图像如图4a所示,可以看出标记的损伤区域采用人工观察难以识别。图像处理过程如下,首先对1 353 nm波长处所对应的特征光谱分量灰度图提取果实区域的二值图像,包括采用直方图增强,以增强对比度;选择5×5的模板进行中值滤波,以保持图像边缘特性;通过观察灰度直方图,采用灰度阈值14进行图像分割效果最佳;最后通过开、闭运算,以去除微小杂质和填充内部细小空洞,获得二值图像。将其作为掩模图像,分别与上述一致波长1 353 nm和1 691 nm的图像相乘,得到2幅果实区域图像,如图4b、c所示。因为SVM在上述分类方法中效果最佳,所以对2 幅果实区域图像的灰度数据利用SVM分类器进行分类,获得每个像素的分类结果,进而得到损伤区域识别效果图,如图4d所示。图4d表明冬枣的损伤区域的中心部分容易误检,主要是由于果实形状不平整造成光线反射不均,在中心区域呈现一些亮斑造成的。再次利用闭运算将损伤区域补充完整,如图4e所示。

表5 冬枣轻微损伤的检测结果Table5 Results obtained from the detection of subtle bruises on jujubes

从表5可以看出,55 个冬枣损伤表面,检测出43 个,检测正确率为78%。55 个冬枣正常表面检测出47 个,检测正确率为85%。实验结果表明损伤冬枣的检测正确率较低,主要原因是冬枣形状多变和表面的凹凸不平使得某个光谱分量下该区域的灰度值和轻微损伤的灰度值相似,造成误检。同时有些果实区域图像并不光滑和完整,造成这一现象的原因是果实表面边缘灰度与背景差别不大导致上述图像算法提取的果实掩模图像并不十分合适。

3 结 论

近红外高光谱系统用来检测脆熟期冬枣初期机械损伤,针对高光谱图像维数较多,采用3 种数据降维方法。虽然降维方法有效减少了特征波长个数,但是特征波长仍然较多,基于滤波片的实时检测还无法实现,因此选取3 种方法的一致波长。结果表明所有方法提取的波长变量都包含1 353、1 691 nm附近的波长。此外,选择3 种分类方法k-NN、NB、SVM来检验特征波长对损伤区域的识别效果,结果表明SPA、CFS和Consistency提取的特征波长以及一致波长都达到较好的分类识别效果,验证了所选波长的有效性,为搭建多光谱在线检测平台提供理论参考依据。最后,通过对1 353 nm和1 691 nm波长处光谱分量的图像处理,有效地识别冬枣的微观损伤,检测正确率达到81.8%。

[1] GAO Q H, WU P T, LIU J R, et al. Physico-chemical properties and antioxidant capacity of different jujube (Ziziphus jujuba Mill.) cultivars grown in loess plateau of China[J]. Scientia Horticulturae, 2011, 130(1): 67-72. DOI:10.1016/j.scienta.2011.06.005.

[2] 质量监督检验总局, 中国国家标准化委员会. 鲜枣质量等级: GB/T 22345—2008[S]. 北京: 中国标准出版社, 2008.

[3] 张保华, 黄文倩, 李江波, 等. 基于高光谱成像技术和MNF检测苹果的轻微损伤[J]. 光谱学与光谱分析, 2014(5): 1367-1372.

[4] 辛世华, 何建国, 王松磊, 等. 红枣表面损伤的特征光谱提取[J]. 食品科学, 2013, 34(8): 145-148.

[5] 胡鹏程, 孙晔, 吴海伦, 等. 高光谱图像对白萝卜糠心的无损检测[J].食品科学, 2015, 36(12): 171-176.

[6] FU L, OKAMOTO H, SHIBATA Y, et al. Distinguishing overripe berries of Japanese blue honeysuckle using hyperspectral imaging analysis[J]. Engineering in Agriculture, Environment, and Food, 2014, 7(1): 22-27. DOI:10.1016/j.eaef.2013.12.004.

[7] 薛建新, 张淑娟, 张晶晶. 壶瓶枣自然损伤的高光谱成像检测[J]. 农业机械学报, 2015, 46(7): 220-226. DOI:10.6041/ j.issn.1000-1298.2015.07.032.

[8] RIVERA N V, G☒MEZ-SANCHIS J, CHANONA-P☒REZ J, et al. Early detection of mechanical damage in mango using NIR hyperspectral images and machine learning[J]. Biosystems Engineering, 2014, 122: 91-98. DOI:10.1016/j.biosystemseng.2014.03.009.

[9] RAJKUMAR P, WANG N, ELMASRY G, et al. Studies on banana fruit quality and maturity stages using hyperspectral imaging[J]. Journal of Food Engineering, 2012, 108(1): 194-200. DOI:10.1016/ j.jfoodeng.2011.05.002.

[10] 魏新华, 吴姝, 范晓冬, 等. 基于高光谱成像分析的冬枣微观损伤识别[J]. 农业机械学报, 2015, 46(3): 242-246. DOI:10.6041/ j.issn.1000-1298.2015.03.035.

[11] WANG J, NAKANO K, OHASHI S. Nondestructive evaluation of jujube quality by visible and near-infrared spectroscopy[J]. LWTFood Science and Technology, 2011, 44(4): 1119-1125. DOI:10.1016/ j.lwt.2010.11.012.

[12] YU K, ZHAO Y, LI X, et al. Identification of crack features in fresh jujube using Vis/NIR hyperspectral imaging combined with image processing[J]. Computers and Electronics in Agriculture, 2014, 103: 1-10. DOI:10.1016/j.compag.2014.01.016.

[13] 张初, 刘飞, 孔汶汶, 等. 利用近红外高光谱图像技术快速鉴别西瓜种子品种[J]. 农业工程学报, 2013, 29(20): 270-277. DOI:10.3969/ j.issn.1002-6819.2013.20.035.

[14] SOARES S F C, GOMES A A, ARAUJO M C U, et al. The successive projections algorithm[J]. Trends in Analytical Chemistry, 2013, 42: 84-98. DOI:10.1016/j.trac.2012.09.006.

[15] HALL M A. Correlation based feature selection for machine learning[D]. Hamilton: University of California, 2000: 15-55.

[16] LIU H, SETIONO R. A probabilistic approach to feature selection: a filter solution[C]//Proceedings of the International Conference on Machine Learning, 2010.

[17] GALV☒O R K H, ARA☒JO M C U, SILVA E C, et al. Crossvalidation for the selection of spectral variables using the successive projections algorithm[J]. Journal of the Brazilian Chemical Society, 2007, 18(8): 1580-1584.

[18] WITTEN I H, FRANK E, HALL M A. Data mining: practical machine learning tools and techniques[M]. San Francisco: Morgan Kaufmann Publishers Inc., 2011: 206-207.

[19] 闭小梅, 闭瑞华. KNN算法综述[J]. 科技创新导报, 2009(14): 31.

[20] BECKER B, KOHAVI R, DAN S. Visualizing the simple bayesian classifier[J]. Information Visualization in Data Mining and Knowledge Discovery, 2001, 18: 237-249. DOI:10.1007/s13398-014-0173-7.2.

[21] CORTES C, VAPNIK V. Support-vector networks[J]. Machine Learning, 1995, 20: 273-297.

[22] FRIEND J, RHODES M J C. Recent advances in the biochemistry of fruits and vegetables[M]. New York: Academic Press, 1981: 41-61.

[23] LU R, CEN H, HUANG M, et al. Spectral absorption and scattering properties of normal and bruised apple tissue[J]. Transactions of the ASABE, 2010, 53(1): 263-269.

[24] 蔡天净, 唐瀚. Savitzky-Golay平滑滤波器的最小二乘拟合原理综述[J].数字通信, 2011(1): 63-68.

[25] YANG C, LEE W S, WILLIAMSON J G. Classification of blueberry fruit and leaves based on spectral signatures[J]. Biosystems Engineering, 2012, 113(4): 351-362. DOI:10.1016/ j.biosystemseng.2012.09.009.

Early Detection of Mechanical Damage in Chinese Winter Jujube (Zizyphus jujuba Mill. cv. Dongzao) Using NIR Hyperspectral Images

SUN Shipeng1, PENG Jun1, LI Rui1, ZHU Zhaolong1, Vázquez-Arellano MANUEL2, FU Longsheng1,*
(1. College of Mechanical and Electronic Engineering, Northwest A&F University, Yangling 712100, China; 2. Institute of Agricultural Engineering, University of Hohenheim, Stuttgart 70599, Germany)

Fruits of Chinese winter jujube (Zizyphus jujuba Mill. cv. Dongzao) are sensitive to mechanical stress and can easily develop brown spots after suffering mechanical stress during mechanical harvesting and postharvest handling. The damage cannot be detected easily by machine vision at very early stages of maturity. Thus, a near-infrared (NIR) hyperspectral imaging system was used to detect mechanical damage in Chinese winter jujubes. For reducing the dimensionality of hyperspectral data, three feature selection methods, successive projections algorithm, (SPA), correlation-based feature selection (CFS), and consistency, were used. In addition, three classifiers, i.e., k-nearest neighbor (k-NN), naive bayes (NB), and support vector machine (SVM), were evaluated to segment the pixels of the jujubes into two regions: damaged and nondamaged. Results revealed that two consistent wavebands, i.e., 1 353 nm and 1 691 nm, were established by all the feature selection methods. Besides, SVM offered the best performance with a correction recognition rate of 95.16% using the selected features by the consistency method. NB offered similar performance with a correction recognition rate of 84.26% in the selected wavebands. Hence, this work can pave the foundation for early on-line detecting Chinese winter jujube damage caused by mechanical stress.

Chinese jujube; hyperspectral imaging; feature selection; slight damage; detection

10.7506/spkx1002-6630-201702047

TP391.4

A

1002-6630(2017)02-0301-05

孙世鹏, 彭俊, 李瑞, 等. 基于近红外高光谱图像的冬枣损伤早期检测[J]. 食品科学, 2017, 38(2): 301-305. DOI:10.7506/ spkx1002-6630-201702047. http://www.spkx.net.cn

SUN Shipeng, PENG Jun, LI Rui, et al. Early detection of mechanical damage in chinese winter jujube (Zizyphus jujuba Mill. cv. Dongzao) using nir hyperspectral images[J]. Food Science, 2017, 38(2): 301-305. (in Chinese with English abstract)

10.7506/spkx1002-6630-201702047. http://www.spkx.net.cn

2016-06-21

陕西省自然科学基础研究计划-青年人才项目(2015JQ3065);中国博士后科学基金项目(2015M572602);西北农林科技大学国际科技合作种子基金项目(A213021505)

孙世鹏(1991—),男,硕士研究生,主要从事果实智能化分选研究。E-mail:18717307301@163.com

*通信作者:傅隆生(1984—),男,副教授,博士,主要从事农业智能化技术与装备研究。E-mail:fulsh@nwafu.edu.cn

猜你喜欢

冬枣正确率波长
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
门诊分诊服务态度与正确率对护患关系的影响
冬枣深加工 延伸产业链
“智耕牛”指尖“种”冬枣
一种锯齿状冬枣采摘装置
双波长激光治疗慢性牙周炎的疗效观察
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
日本研发出可完全覆盖可见光波长的LED光源