高光谱成像结合SIS与RFS的蓝莓腐烂病检测
2019-03-26田有文乔世成古文君
何 宽, 田有文*, 乔世成, 姚 萍, 古文君
(1. 沈阳农业大学 信息与电气工程学院, 辽宁 沈阳 110866; 2. 辽宁省农业信息化工程技术研究中心, 辽宁 沈阳 110866.)
1 引 言
蓝莓学名越橘,深蓝色浆果,原产于美国,国内主要分布于东北和西南地区[1]。蓝莓富含花青素、维生素,具有极高的营养保健价值[2],深受人们喜爱。但蓝莓采后易患腐烂病,影响蓝莓的可食用性,降低了蓝莓的加工品质和商业价值[3]。故病害蓝莓的分拣是蓝莓销售或加工前的一个重要环节。传统的蓝莓病害检测通常为理化分析检测或人工肉眼检测。前者检测时间长,且具有破坏性。后者检测效率低、误差大。这两者都难以满足蓝莓在线分拣的要求。因此,研究蓝莓病害无损检测技术对蓝莓的在线实时分拣、提高蓝莓行业自动化水平和生产效益具有重要意义和应用价值。
国内外一些研究学者利用机器视觉和高光谱成像等无损检测技术对水果的病害进行无损检测[4-23],并且取得了一定的效果。Georgina等[7]利用机器视觉技术提取柑橘颜色、形状及纹理等14类特征,并采用分类回归树(CART)、朴素贝叶斯(NB)、多层感知器(MLP)模型对柑橘溃疡病、黑斑病和结痂病进行无损检测,Shubhangi等[8]利用机器视觉技术对石榴进行病害检测,实验使用k-均值和阈值图像分割方法提取石榴病变区域。利用离散小波变换方法提取病变部位的一组视觉特征作为支持向量机(SVM)模型的输入矢量,对石榴进行病害识别。Sun[20]利用高光谱成像系统获取无损、轻度腐烂、中度腐烂、重度腐烂桃子的高光谱图像,采用阈值分割法来识别桃子病害区域,并采用连续投影法(SPA)提取6个特征波长,建立偏最小二乘判别分析(PLS-DA)模型进行病害识别,进一步提高了桃子腐烂病害识别率。Folch-Fortuny等[21]利用高光谱成像技术获取感兴趣区域光谱数据,利用排列测试法提取5个特征波长并采用多路偏最小二乘回归判别分析模型对真菌感染的柑桔病害检测柑桔腐烂病。刘思伽等[22]利用高光谱成像技术获取苹果光谱数据,采用阈值分割法分割出苹果病害区域并提取高光谱数据,采用连续投影算法从全波长中提取3个特征波长,建立线性判别分析、支持向量机和BP人工神经网络模型对苹果病害进行检测。黄锋华等[23]采用高光谱成像技术对中油9号油桃的裂纹果、锈病果、异形果和暗伤果进行检测判别。研究提取了10条特征波长,进行主成分分析得到前10个主成分值。利用阈值分割方法等分割出油桃病害区域并提取纹理特征。最后将主成分值和6项纹理指标(均值、对比度、相关性、能量、同质性、熵值)纹理值融合建立极限学习机(ELM)模型对外部缺陷样本和完好样本进行检测判别。
上述研究中,无论采用机器视觉技术还是高光谱成像技术,都需要将柑橘、石榴等中型水果的病害区域从正常区域中分割出来。因为上述水果病害区域与正常区域颜色特征对比明显,采用阈值分割很容易将病害区域分割出来。而蓝莓的表皮颜色较深,其正常区域与病害区域颜色特征相近,利用常规的阈值分割法难以将蓝莓病害有效分割。因此,本研究根据蓝莓正常区域与病害区域的光谱相对反射率的差异,提出光谱信息分割法(SIS)来分割病害区域。另外,蓝莓正常区域和病害区域在可见光范围内的光谱相对反射率存在差异,并且蓝莓正常区域和病害区域在近红外范围内的光谱相对反射率也存在差异,故本研究提出区域特征筛选法(RFS),将蓝莓光谱相对反射率分成可见光第一区域(450~760 nm)和近红外第二区域(760~1 000 nm)进行研究,再结合CARS与SPA算法提取出特征波长,最后用RVM模型与RBF神经网络模型对蓝莓病害进行检测,为实现快速、无损的蓝莓病害在线检测、分拣提供理论支持。
2 实 验
2.1 实验材料
蓝莓样本采摘于沈阳市铁西经济技术开发区彰驿站街道彰驿站村时圣蓝莓种植基地,采摘时间为2017年7月。蓝莓样本选择果形匀称、大小相近、腐烂面积占总面积15%以内、无明显霉斑的轻微腐烂病害蓝莓220个,正常蓝莓100个。采后利用高光谱成像系统采集所有蓝莓的高光谱图像。
2.2 实验设备
本实验采集蓝莓高光谱图像的高光谱成像系统如图1所示,其组成部分为高光谱成像光谱仪(ImSpector V10 E,Spectral Imanging Ltd,Finland),面阵CCD相机(IGV-B1410M,IMPERX indorporated,USA),精密位移控制平台(IRCP0076-1 COM,台湾),无光暗箱(120 cm×50 cm×140 cm),两个150 W光纤卤素灯(3900Illuminatior,Illumination Technologies,Inc.美国),一台计算机(DELL Vostro 5560D-1528)。高光谱成像系统的光谱采集范围是400~1 000 nm,光谱分辨率为1.27 nm,一共472个波段。
图1 高光谱成像系统示意图Fig.1 Schematic diagram of hyperspectral imaging system
2.3 高光谱图像采集
蓝莓图像采集前调整高光谱成像系统,调整镜头光圈确定合适焦距,采集反射率99%的白板的白色标定图像RW和盖上镜头盖的全黑标定图像RD。将蓝莓样本20个按照5排4列摆放在位移台上。为确保图像不失真,位移台速度控制为1.7 mm·s-1。最后通过高光谱图像采集系统获取蓝莓样本的高光谱图像,并分割出单个蓝莓高光谱图像,如图2所示。
图2 蓝莓高光谱图像
2.4 蓝莓高光谱图像处理
采集高光谱图像时,由于暗电流的存在会使光源强度不均匀从而导致高光谱图像产生噪声,因此需要对高光谱图像进行黑白板校正,并按照公式(1)计算得到校正后的高光谱图像I以消除噪声:
(1)
式中RS为蓝莓的原始高光谱图像反射率,RW为全白校正图像反射率,RD为全黑校正图像反射率,I为校正后的蓝莓高光谱图像反射率。
本实验处理蓝莓高光谱图像选用ENVI 4.8(Rese archSystem Inc.,美国)、Matlab 7.1(The MathWorksInc.,美国)软件。ENVI用于光谱数据和图像的提取,Matlab用于光谱数据处理、图像分割、特征波长的提取以及模型的建立。
2.5 实验流程
本实验的蓝莓病害检测实验流程为:首先获取蓝莓高光谱图像;然后图像分割确定感兴趣区域,提取光谱相对反射率,筛选特征波长;最后利用模型对蓝莓病害进行检测。具体操作流程如图3所示。
图3 蓝莓病害检测处理流程图Fig.3 Processing flow chart of blueberry disease detection
3 实验结果与讨论
3.1 高光谱曲线分析
从图2中可以看出在波长400~450 nm范围内,蓝莓病害区域与正常区域的光谱数据存在噪声。为了不影响后续检测的准确率,本研究去除该范围波段的光谱数据。另外在可见光波段(450~760 nm)范围内,蓝莓病害区域的光谱相对反射率比蓝莓正常区域的光谱相对反射率稍大一些。而在近红外波段(760~1 000 nm)范围内,蓝莓正常区域的光谱相对反射率比蓝莓病害区域的光谱相对反射率大。蓝莓病害区域与正常区域光谱相对反射率存在差异的原因是由于蓝莓正常区域与蓝莓病害区域颜色稍微有些差异,而且蓝莓病变腐烂使蓝莓病害区域主要成分及理化性质发生改变,从而使光谱反射率发生变化。因此采用450~1 000 nm波段范围的光谱数据建立模型检测蓝莓的病害。
3.2 感兴趣区域分割
蓝莓颜色为深蓝色,病害部分与表皮颜色相近,采用阈值分割方法容易把正常区域误当作病害区域分割出来。本实验分割图像时,由于866.5 nm波段图像中蓝莓病害区域与正常区域差异相对明显,所以实验选择866.5 nm波段图像作为特征图像进行分割。再利用阈值分割对866.5 nm波段蓝莓图像进行二值化,得到图像如图4(c)所示。然后用该二值化图像对高光谱图像进行掩膜得到图4(d),再对图4(d)进行阈值分割,阈值设定为0.65,得到病害区域分割图像,如图4(e)所示。最后,对图4(e)图像进行腐蚀膨胀,实现病害区域分割,如图4(f)所示。由该图可看出常规的阈值分割法未能比较完整地分割出蓝莓病害区域,并将部分正常区域当作病害也分割出来。所以,本研究根据蓝莓正常区域与病害区域光谱信息的差异,提出了光谱信息分割法SIS,利用光谱信息将蓝莓病害区域从蓝莓正常区域中分割出来。实验同样选择866.5 nm波段图像。该波段下背景的光谱相对反射率为0.05左右,光谱相对反射率较小。故提取866.5 nm波段图像所有像素点的光谱相对反射率,并求其平均值g=0.21作为蓝莓分割阈值。比较蓝莓图像每个像素点的光谱相对反射率与分割阈值的大小,若该像素点的光谱相对反射率小于0.21,该像素点的光谱相对反射率赋值为1,该像素点的像素值赋值为255;若该像素点的光谱相对反射率大于等于0.21,该像素点的光谱相对反射率不变,该像素点的像素值也不变。得到蓝莓分割图像,如图5(c)所示。
图4 阈值分割结果Fig.4 Result of threshold segmentation method
图5 光谱信息分割结果
在866.5 nm波段,蓝莓正常区域的光谱相对反射率均大于0.35,病害区域的光谱相对反射率在0.3左右,且均小于0.35,故设定蓝莓病害区域的分割阈值为0.35。比较图5(c)蓝莓图像每个像素点的光谱相对反射率与蓝莓病害分割阈值的大小,若该像素点的光谱相对反射率小于0.35,该像素点的像素值赋值为1;若该像素点的光谱相对反射率大于等于0.35,该像素点的像素值赋值为0。蓝莓病害分割图像如图5(d)所示。因为蓝莓边缘正常区域的光谱相对反射率有一部分小于0.35,导致将蓝莓边缘正常区域分割出来,所以再对图4(d)进行腐蚀膨胀运算得到最终分割后的蓝莓病害图像,如图5(e)所示。
从分割结果可看出,本研究提出的光谱信息图像分割法能够准确分割出蓝莓病害区域,解决了由于蓝莓正常区域与病害区域颜色特征相近难以有效分割病害区域的问题。
3.3 提取特征波长
根据前面的蓝莓分割图像,5×5大小区域提取光谱数据并求其平均值以代替该区域的平均光谱相对反射率。
由于光谱存在小锯齿噪声,所以采用Savitzky-Golay平滑方法对光谱曲线进行平滑处理,为后续研究提供理想数据。
原始高光谱图像光谱数据维数大,信息量冗余,增加了检测模型计算量,降低了检测模型性能,需要对其进行降维,提取特征波长。根据可见光范围(450~760 nm)和近红外范围(760~1 000 nm)内病害区域的光谱相对反射率和正常区域的光谱相对反射率分别存在不同的差异,本研究提出区域特征筛选法(RFS),将光谱分成可见光第一区域波段(450~760 nm)和近红外第二区域波段(760~1 000 nm),然后再采用CARS与SPA算法分别对两个区域的光谱信息提取特征波长,并提取出特征波长对应的光谱相对反射率[24-26]。采用区域特征筛选法方法的优点在于强制减少了近乎一半维数,降低了CARS与SPA算法的筛选工作量。特征波长的筛选结果如表1所示。
表1 特征波长提取Tab.1 Feature wavelength extraction
3.4 检测结果与讨论
本研究采用RVM和RBF神经网络两种模型检测病害蓝莓,模型输出为1和0两种结果,1表示正常蓝莓,0表示病害蓝莓。将220个正常蓝莓和100个病害蓝莓分成训练集和测试集,其中训练集样本数量选60个正常蓝莓和140个病害蓝莓,测试集样本数量选择40个正常蓝莓和80个病害蓝莓。
采用RBF模型检测时,隐含层的径向基函数采用高斯函数作为传递函数,输出层的传递函数为线性函数,分布常数speed为10。采用RVM模型检测时,内核函数采用高斯函数,核长度尺度为1,最大迭代次数为1 000。选择第一区域特征波长的光谱相对反射率、第二区域特征波长的光谱相对反射率、第一区域和第二区域特征波长组合的光谱相对反射率分别作为RVM模型和RBF模型的输入矢量,比较不同模型的检测效果。检测结果如表2所示。
表2 蓝莓病害检测结果Tab.2 Result of blueberry disease detection
从采用不同区域特征波长的相对反射率矩阵进行检测的结果来看,第一区域与第二区域组合的识别模型检测结果最好,第二区域的模型次之,第一区域模型检测结果最差。根据前面的高光谱曲线分析,蓝莓的病害区域与正常区域的光谱相对反射率在近红外范围的差异比可见光范围的差异要大很多,因而正常区域与病害区域在近红外范围内的光谱特征差异更明显,所以检测模型在近红外范围的检测效果要比可见光范围的检测效果好。两个区域组合的特征波长光谱相对反射率则能更全面地表达出蓝莓的病害区域与正常区域之间的差异,所以第一区域与第二区域特征波长组合的模型检测效果最好。
通过比较CARS与SPA两种方法提取特征波长的模型检测效果来看,CARS提取特征波长在训练集和测试集中的检测效果要比SPA提取特征波长的检测效果好。CARS提取特征长的检测效果较好可能是因为CARS提取的特征波长基本分布在正常蓝莓光谱曲线与病害蓝莓光谱曲线相对反射率差异较大的波段,SPA提取的特征波长则大多数分布在正常蓝莓光谱曲线与病害蓝莓光谱曲线相对反射率差异较小的波段。
通过比较RVM和RBF模型检测蓝莓病害的检测结果,可以看出RBF的检测效果比RVM的检测效果要好。这可能是RVM模型中惩罚项会随着距离的增大而增大,惩罚因子越大,该项所占的权重越大,使得训练会尽可能地将所有样本点拟合,从而产生过拟合现象,导致置信区间较小对,对预测数据产生误判[27]。RBF模型具有任意逼近的能力,其网络可以自动增加神经元直到满足精度要求为止,这使得RBF模型的检测结果要准确得多[28]。
Gabriel等[29]利用机器视觉技术对腐烂蓝莓进行无损检测,检测准确率达到98%,效果较好,但是该实验检测的病害蓝莓都是存在霉斑菌落覆盖较多、腐烂程度较严重的蓝莓,蓝莓病害图像与蓝莓正常图像的纹理特征差异明显,利用机器视觉技术容易识别病害,而对于轻微腐烂的蓝莓并没有进行检测。本文则是采用高光谱成像结合SIS与RFS方法对轻微腐烂蓝莓进行无损检测,其训练集和测试集的病害检测效果比较理想。
4 结 论
本研究通过高光谱成像技术对采后蓝莓的腐烂病进行病害检测,研究结论如下:
(1)本研究提出的基于光谱信息图像分割法(SIS)利用866.5 nm波段下的光谱相对反射率对该波段下的蓝莓图像进行分割,达到了准确分割蓝莓病害区域的效果。
(2)本研究提出的区域特征筛选法(RFS)根据病害区域与蓝莓正常区域的光谱相对反射率在可见光与近红外光谱范围内的不同差异,将光谱分成可见光第一区域和近红外第二区域两个光谱范围,有效地选择出了第一区域与第二区域组合的7个特征波长(655.8,710.9,752.2,759.9,761.2,866.5,969.7 nm),提高了检测模型的病害检测效果。
(3)通过比较RVM和RBF模型检测蓝莓病害的检测结果,可知检测模型CARS-RBF的检测结果最好,达到了比较理想的检测效果,能够满足在线检测要求。
本文提出的高光谱成像结合SIS和RFS研究方法对提高蓝莓腐烂分拣的准确性、保证蓝莓深加工产品的品质以及提升蓝莓产业自动化分拣水平具有参考意义。