APP下载

基于机器视觉的辣椒外部品质检测

2021-01-25张淑娟赵华民孙海霞李成吉廉孟茹

食品与机械 2021年1期
关键词:特征值方差均值

任 锐 张淑娟 赵华民 孙海霞 李成吉 廉孟茹

(山西农业大学工学院,山西 晋中 030800)

辣椒是世界最大的调味品作物,主要以果实为食,营养丰富,维生素C含量在蔬菜中占首位。辣椒市场价值主要受其外观质量的影响,依据NY/T 944—2006标准,正常辣椒形状均匀,色泽油亮光洁呈红色,部分辣椒出现黑斑、虫蚀和花皮等缺陷,需分选出来。

目前的分选主要靠人工分选,效率低、主观性强且工作量大,机器视觉利用计算机技术代替人眼获取图像的信息,具有无损、检测精度高、节省劳动力等优点,科研人员在机器视觉方面对农产品做了大量的研究,取得较大的发展。毕智健等[1]利用番茄表面的颜色特征对不同成熟度的番茄进行判别分类,完熟番茄训练集与验证集最高均为90%。解博等[2]通过机器视觉对杏核纹理特征进行识别,杂质杏核识别率可达94%。项辉宇等[3]采用基于Halcon的图像处理方法,依据RGB颜色模型,采用模板匹配的方法,对苹果品质的大小、缺陷、颜色检测判别苹果是否合格。Xu[4]提出利用最小核值相似区和脉冲耦合神经网络识别苹果果实,在测试的50幅图像中,识别率为93%。Arakeri[5]利用计算机视觉技术,运用图像处理技术分析番茄的缺陷和成熟度,对番茄的质量评估的准确率达到96.47%。Habib[6]利用图像提取木瓜色彩特征,解决木瓜病害识别,通过支持向量机对疾病特征分类,准确率达到90.15%。综上所述,机器视觉研究主要利用颜色特征、纹理特征、形态特征和直接利用图像进行判别,其他学者的研究大都采取单一特证判别。

研究拟利用机器视觉检测辣椒外部品质,通过机器视觉系统进行图像采集,图像增强,将提取颜色特征、纹理特征和形态特征作为特征值。通过回归系数法和连续投影法优选特征值,利用偏最小二乘回归法和最小二乘支持向量机建模分析,验证研究中选择特征值和模型的有效性,为今后的辣椒在线检测提供参考和技术支持。

1 材料和方法

1.1 试验样本

试验所采用的干辣椒购买自山西省襄汾县赵雄村的三樱椒。利用K-S(Kennard-Stone)算法[7]按3∶1划分训练集和预测集,其中正常样本训练集225组,预测集75组;缺陷样本训练集225组,预测集75组。

1.2 机器视觉系统和数据采集

机器视觉系统包括暗箱(440 mm×335 mm×425 mm)内壁使用黑色拷贝纸进行贴壁处理,屏蔽外界自然光;将相机(尼康D3300)和镜头(尼康尼克尔镜头焦段:18~140 m,光圈:f/3.5-5.6G ED VR)安装于暗箱顶部,采集辣椒图像信息;暗箱顶部布置环形荧光灯(YH327200KE)提供光源,暗箱下部安装可调节载物台,载物台顶部位于镜头正下方24 cm处。通过存储卡(SDSQUNC-032G-ZN6MA)将图像传入计算机(处理器:Y50Pi5-4210H,CPU:2.90 HZ,显卡:NVIDIA GTX 960M)中,采用MATLAB R2010b软件进行图像处理。

2 结果与分析

2.1 图像增强

图像增强是为了去除噪声,提高处理图像的质量和速度。中值滤波法为线性滤波器,可以减少噪声,保护图像边缘不受影响。对图像进行裁剪和灰度处理,利用中值滤波去噪,达到增强图像的目的,为后续提取特征值作准备,图像增强结果如图1所示。

图1 图像增强Figure 1 Image enhancement

2.2 特征值提取

2.2.1 颜色特征值提取 颜色特征描述图像区域所对应的目标物的表面性质[8]。RGB颜色空间是最基础的模型;HSI颜色空间接近于人眼视觉特性;HSV颜色空间由色调、饱和度和亮度组成;Lab颜色空间是范围最大的色彩模式。从RGB、HSV、HSI、Lab颜色空间中分别提取R、G、B、H、S、V、H、S、I、L、a、b颜色特征值的最大值、最小值、均值和方差,提取样本各颜色特征值如表1所示。

2.2.2 纹理特征值提取 纹理特征描述图像或图像区域所对应的表面性质。主要从灰度差分统计法和灰度共生矩阵来提取能量、熵、惯性矩、相关性、逆差距的4个方向(0°,45°,90°,135°)的特征值的均值[9],提取结果如表2所示。

表1 样本各颜色特征值Table 1 Sample color eigenvalue

表2 样本纹理特征值均值Table 2 Mean of texture feature values of sample

2.2.3 形态特征值提取 图像形态特征是在物体从图像中分割出来后进行分析,在机器视觉中起着十分重要的作用[10]。通过计算缺陷面积比值和欧拉数确定辣椒类别。利用Otsu算法阈值分割,二值化分别提取模板图像和缺陷图像,如图2、3所示。

(1)

式中:

S——面积比;

s1——模板图像像素面积;

s2——缺陷图像像素面积。

EUL=C-H,

(2)

式中:

EUL——欧拉数;

C——代表对象总数;

H——孔洞数。

2.3 优选特征值

研究中,通过提取出600组图像,每幅图像46个特征值。由于特征值提取数据量大,每一组特征值对辣椒检测影响不同,因此需要提取影响效果显著的特征值建模检测。

2.3.1 RC方法优选特征值 回归系数法(RC)通过建立偏最小二乘回归法(PLS)模型的回归系数中的局部极值进行提取,其表达了PLS方法建模中每个特征值对此次建模相关性的情况。RC方法优选特征值如图4所示,优选出21个特征值,分别为5(0°方向的熵),6(45°方向的熵),7(90°方向的熵),8(135°方向的熵),9(0°方向的惯性矩),11(90°方向的惯性矩),20(135°方向的逆差距),21(比值),24(RGB中R值方差),25(RGB中G值均值),26(RGB中G值方差),27(RGB中B值均值),29(HSV中H值均值),30(HSV中H值方差),31(HSV中S值均值),35(HSV中H值均值),36(HSV中H值方差),37(HSV中S值均值),41(Lab中L值均值),42(Lab中L值方差),44(Lab中a值方差)。

图2 提取模板图像Figure 2 Extraction of template image

图3 提取缺陷图像Figure 3 Extraction of defect image

2.3.2 SPA方法优选特征值 连续投影法(SPA)是一种研究系统确定性与不确定性相互作用的分析理论[11]。SPA方法优选特征值如图5所示,可得14个优选特征值最优解依次排列为42(Lab中L值方差),26(RGB中G值方差),34(HSV中V值方差),21(比值),18(45°方向的逆差距),5(0°方向的熵),6(45°方向的熵),17(0°方向的逆差距),8(135°方向的熵),32(HSV中S值方差),45(Lab中b值均值),46(Lab中b值方差),7(90°方向的熵),30(HSV中H值方差)。

2.4 建立检测模型

偏最小二乘回归法(PLS)是一种多元统计数据分析方法[12]。利用PLS方法与RC方法优选特征值和SPA方法优选特征值分别建模检测,判别结果如表3所示。

最小二乘支持向量机(LS-SVM)是支持向量机(SVM)的一种扩展,解决问题的线性性能。利用LS-SVM方法与RC方法优选特征值和SPA方法优选特征值分别建模检测,判别结果如表3所示。

由于模型预测出的结果非整数型,因此将0.5作为最大偏离值,预测类别值和假设类别值相差小于0.5的判定为此类样本[13]。由表3可知,利用PLS方法和LS-SVM方法分别结合RC方法和SPA方法优选特征值分别建模分析,RC-PLS模型判别率为95.33%,SPA-PLS模型和RC-PLS模型判别率为96.67%,PLS模型判别率为97.33%,LS-SVM模型和SPA-LS-SVM模型判别率为98.67%,6种方法检测结果都达到了90%以上。显然LS-SVM模型和SPA-LS-SVM模型检测结果最好,SPA-LS-SVM方法可以通过SPA方法优选特征值简化模型,提高检测精度和效率,因此选用LS-SVM方法建模结合SPA方法优选特征值检测模型最优。

图4 RC曲线Figure 4 RC curve

图5 SPA优选特征值Figure 5 Preferred eigenvalues by SPA

表3 检测模型判别结果分析Table 3 Analysis of detection model discrimination results

3 结论

研究主要利用机器视觉系统进行图像采集,利用中值滤波增强图像,减少噪声;通过提取RGB、HSV、HSI、Lab 4种颜色空间各颜色特征值的均值和方差,提取纹理特征的能量、熵、惯性矩、相关性、逆差距的4个方向(0°,45°,90°,135°)的特征值,利用Otsu算法阈值分割图像,提取形态特征缺陷比值和欧拉数作为特征值,共提取46个特征值。结果表明,选用连续投影法优选14个特征值,结合最小二乘支持向量机法进行建模,所得模型的检测准确率为98.67%,模型最优。

猜你喜欢

特征值方差均值
利用LMedS算法与特征值法的点云平面拟合方法
概率与统计(2)——离散型随机变量的期望与方差
单圈图关联矩阵的特征值
迭代方法计算矩阵特征值
方差越小越好?
计算方差用哪个公式
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
浅谈均值不等式的应用
方差生活秀