基于计算机视觉核桃质量预测方法的研究
2019-05-24李成吉张淑娟孙海霞陈彩虹邢书海赵旭婷
李成吉,张淑娟,孙海霞,陈彩虹,邢书海,赵旭婷
(山西农业大学工学院,山西晋中 030801)
我国是核桃原产地之一,已有3 000多年的栽培历史[1]。核桃食用价值高,具有良好的健脑效果和丰富的营养价值,随着社会的发展和消费者健康意识的提高,对核桃的需求越来越大,也给核桃产业带来巨大的经济效益。在核桃分级过程中,确定核桃质量是一个必要的过程。传统获得物体质量一般是使用物理器械,如天平、电子秤和适用于工业化的质量传感器。随着信息电子技术的发展,自动、智能化逐步代替人工,以实现农产品检测和分级一体化,传统称重方法很难满足要求,这就需要研究相应的技术手段。
计算机视觉技术是一种无损检测方法[2],20世纪70年代末就已经出现。就计算机视觉系统的价值看,其能够有效模仿和参照人的视觉功能,并且对物体的三维立体化状况形成合理化感知,并且发挥人脑的价值功能[3]。机器视觉技术最大的特点是速度快、信息量大、功能多,目前计算机视觉技术广泛运用于农产品检测中。Szczypiński等人[4]通过计算机视觉技术提取不同品种大麦图像的形状、颜色、纹理特征进行品种判别,精度达86%。Rong D等人[5]等通过计算机视觉技术采用一种滑动比较窗口局部分割算法对橙子表面缺陷进行检测,判别准确率达97%。李晓斌等人[6]用κ-means图像法和主成分分析法监测生菜生长态势,单株生菜模型的显著性检验概率均小于0.000 1,除第4株生菜外,其余模型的决定系数均大于0.80;群体生菜模型显著性检验概率均小于0.000 1,且决定系数均大于0.89。潘磊庆等人[7]为检测稻谷的霉变程度,提取不同霉变程度和霉变类型样本的68个图像特征,优选特征并构建模型。试验表明,使用连续投影算法(SPA)优选特征和支持向量机(SVM)构建模型能较好地对稻谷霉变进行识别和区分。
针对体重预测问题,计算机视觉技术多应用于水产领域。唐杨捷等人[8]基于计算机视觉技术和GA-SVM对梭子蟹体重进行预测。结果表明,梭子蟹体重预测值与实测值平均绝对百分比误差(MAPE)为2.23%,均方根误差(RMSE)为5.80 g,优于BP神经网络和参数未优化的SVM预测。刘伟等人[9]采用切片得到白鲢体长方向质量分布模型,利用机器视觉技术预测白鲢质量。结果表明,预测相对误差均值为6.04%。张超等人[10]采用计算机视觉技术提取梭子蟹面积参数,利用最小二乘法对面积和质量进行拟合。结果表明,二次多项式相关性可达0.922 0。
综上,计算机视觉技术已广泛应用于农产品的检测及分级当中,关于核桃质量预测方面鲜有报道。研究基于计算机视觉技术对核桃投影面积与质量建立预测模型,为实现核桃产业自动化、智能化提供技术基础。
1 材料和方法
1.1 试验材料
山西为核桃种植大省,试验所用样本为“礼品2号”核桃,购于山西省太谷县农贸市场,使用核桃去空壳装置去除空瘪核桃样本,人工挑选质地均匀、无破损样本123个,并使用电子天平称质量(精度为0.01 g)。利用Kennard-Stone算法将样本按3∶1分成校正集和预测集,其中校正集92个,质量在6.51~25.23 g,预测集31个,质量在9.44~18.51 g,校正集质量范围包含预测集质量范围,建模样本有很好代表性。
1.2 图像采集系统及数据处理工具
搭建图像采集系统,由暗箱、相机、环形荧光灯、载物板组成。
图像采集系统见图1。
图1 图像采集系统
暗箱(长×宽×高为440 mm×335 mm×425 mm)内刷成黑色,外部用黑布遮盖,防止外界光线干扰,顶部有一个圆形口(直径为80 mm)用于放置相机(FRD-AL00)和镜头(传感器:索尼IMX286,BSI CMOS;光圈:f/2.2),暗箱内上方安置三基色环形光源(北京松下照明有限公司,YH327200KE),底部设有高度可调载物台,用于放置样本。
将样本做好标签放置在载物台上,然后调整载物台高度(210 mm)、光源和相机,使达到理想的成像效果,依次采集图像。每次采集3幅图像,选取其中成像质量最好的样本图像。使用计算机内置图像采集卡(恒大公司,DH-CG300)将采集好的样本图像存储于计算机(1.7 GHz CPU,512 MB内存,50 GB硬盘) 中,使用 Matlab R2012a(The MathWorks,Natick,USA)对图像进行预处理、形态学分割,提取面积特征值。最后使用Matlab R2012a及SAS(SAS INSTITUTE INC,USA) 建立LS-SVM质量预测模型和多项式回归质量预测模型。
2 结果与分析
2.1 图像预处理
预处理是为了去除或抑制图像中噪声,以达到凸显特征信息的目的[11]。通过试验对比,采用3×3模板中值滤波和四领域锐化处理,以消除噪声影响,增强细节表现力。
图像预处理见图2。
图2 图像预处理
2.2 样本投影面积获取
经过大量研究表明,在物体的形态特征中,投影面积与其质量的相关性最高[12-13]。在提取图像中样本投影面积时,需要将样本与背景分割开,最大类间方差法(Ostu)[14-15]是比较常用的阈值分割方法,但是有些核桃样本外壳布有黑斑(主要是残留青皮或单宁氧化、病虫害造成),这与黑色背景极为相似,在分割过程中将黑斑部分也分割出去,造成投影面积减小。
黑斑核桃Ostu阈值分割效果见图3。
采用形态学和逻辑学运算获取样本投影面积,在Matlab中先将样本RGB图像转换为灰度图像并进行二值化,然后分别进行膨胀和腐蚀运算,将膨胀和腐蚀后的图像相减得到样本边缘图像,依次使用“Imclearborder”“Bwareaopen”“Imfill”算法清除离散孤立点并进行填充,正常与黑斑核桃均可得到完好的投影形状。
形态学逻辑算法分割效果见图4。
图3 黑斑核桃Ostu阈值分割效果
图4 形态学逻辑算法分割效果
在Matlab中使用“Bwarea”算法计算样本投影像素点数目,为转换成真实面积,需进行图像标定[16]。以25 mm标准直径的一元硬币为参照物,采用相同拍摄条件采集图像。
标定物见图5。
图5 标定物
根据标定物实际面积和计算的像素点数目,可计算得样本的实际面积,计算公式如公式(1)所示。
式中:S1——样本实际面积;
S2——样本像素点数目;
N1——标定物实际面积;
N2——标定物像素点数目。
2.3 核桃质量预测模型建立
2.3.1 LS-SVM质量预测模型的建立
最小二乘支持向量机(LS-SVM)[17-18]是一种改进优化版的支持向量机(SVM)算法,不仅有更好的泛化能力,还能减少训练时间、简化训练复杂度。研究将校正集通过计算的投影面积作为输入,质量作为输出,建立质量预测模型。然后对预测集进行质量预测。
LS-SVM模型预测结果见图6。
图6 LS-SVM模型预测结果
模型正则化参数 γ=1 747.007 9,核宽带 σ2=1.054 2,相关系数R=0.897 4。经过结果分析,最大绝对误差为2.9 g,最小绝对误差为0.012 g,相对误差均值为6.5%。
2.3.2 多项式回归方程建立
回归分析(Eegression analysis)是确定2种或2种以上变量间相互依赖的定量关系的一种统计分析方法,只有一个自变量,因此在SAS软件中建立一元多项式回归方程,并进行分析。经过多次试验,二次多项式拟合效果最好,回归方程如公式(2)所示。
Y=-1.47×10-7X+4.356×103X-5.862. (2)多项式回归方差分析见表1,多项式回归参数估计及其t值见表2。
表1 多项式回归方差分析
表2 多项式回归参数估计及其t值
由表1、表2可知,回归模型的p值小于0.000 1,决定系数R2=0.857 207,说明该模型极其显著且精度较高。然后,将预测集实际投影面积代入回归方程中,输出预测的质量结果。经过结果分析,最大绝对误差为2.54 g,最小绝对误差为0.016 g,相对误差均值为5.9%。
二次多项式回归方程预测结果见图7。
图7 二次多项式回归方程预测结果
3 结论
以“礼品2号”核桃为试验样本,采用计算机视觉技术针对核桃质量在线检测问题,建立质量预测模型,结果如下:
(1)构建图像采集系统获取样本图像,经过预处理、形态逻辑学算法和参照物标定,能很好地获取样本投影面积。
(2)以投影面积为输入、质量为输出,建立LS-SVM质量预测模型,并对预测集进行质量预测,模型相关系数R=0.897 4,输出结果相对误差均值为6.5%。
(3)以投影面积为自变量,质量为因变量,建立一元二次多项式回归质量预测模型,并对预测集进行质量预测,模型决定系数R=0.857 207,输出结果相对误差均值为5.9%。
2种质量预测模型预测结果均可满足在线检测要求,为实现核桃产业自动、智能化提供部分技术支持。参考文献:
[1]李俊南,习学良,熊新武,等.核桃的营养保健功能及功能成分研究进展 [J].中国食物与营养,2018,24(5):60-64.
[2]应义斌.农产品品质无损检测技术研究进展 [G]//中国农业工程学会.农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第四分册.中国农业工程学会:中国农业工程学会,2005:14.
[3]周伟.基于机器视觉的茶叶自动采摘机械手装配系统设计 [J].福建茶叶,2018,40(12):13-16.
[4]Szczypiński, Piotr M, Klepaczko A, et al.Identifying barley varieties by computer vision[J].Computers and Electronics in Agriculture,2015(4):1-8.
[5]Rong D,Rao X,Ying Y.Computer vision detection of surface defect on oranges by means of a sliding comparison window local segmentation algorithm[J].Computers&Electronics in Agriculture,2017(2):59-68.
[6]李晓斌,王玉顺,付丽红.用κ-means图像法和主成分分析法监测生菜生长势(英文) [J].农业工程学报,2016,32(12):179-186.
[7]潘磊庆,王振杰,孙柯,等.基于计算机视觉的稻谷霉变程度检测 [J].农业工程学报,2017,33(3):272-280.
[8]唐杨捷,胡海刚,张刚,等.基于计算机视觉和GASVM的梭子蟹体重预测 [J].宁波大学学报(理工版),2019(1):32-37.
[9]刘伟,谭鹤群,黄丹,等.白鲢质量与截面积沿体长方向分布模型 [J].农业工程学报,2012,28(12):288-292.
[10]张超,徐建瑜,王文静.基于机器视觉的梭子蟹质量估计方法研究 [J].宁波大学学报(理工版),2014,27(2):49-51.
[11]刘军,郭俊先,帕提古丽·司拉木,等.基于机器视觉与支持向量机的核桃外部缺陷判别分析方法 [J].食品科学,2015,36(20):211-217.
[12]杨立,赵杰文,邹小波.基于机器视觉的软胶囊重量在线分选研究 [J].食品工业,2008(5):64-66.
[13]马国强,田云臣,李晓岚.基于不规则图像面积测量的窄体舌鳎个体重量估计 [J].微型机与应用,2016,35(16):67-71.
[14]李龙,彭彦昆,李永玉,等.基于纹理和梯度特征的苹果伤痕与果梗/花萼在线识别 [J].农业机械学报,2018,49(11):328-335.
[15]宋彦,谢汉垒,宁井铭,等.基于机器视觉形状特征参数的祁门红茶等级识别 [J].农业工程学报,2018,34(23):279-286.
[16]李晓斌.汽油机火花塞间隙图像法测量 [J].山西农业大学学报(自然科学版),2015,35(6):664-667.
[17]刘德华,张淑娟,王斌,等.基于高光谱成像技术的山楂损伤和虫害缺陷识别研究 [J].光谱学与光谱分析,2015,35(11):3167-3171.
[18]王斌,薛建新,张淑娟.基于高光谱成像技术的腐烂、病害梨枣检测 [J].农业机械学报,2013,44(S1):205-209.◇