基于外部特征信息的蟠桃质量预测模型
2015-12-31温宝琴徐虎博王志鹏
蒋 伟 温宝琴 吴 杰 李 玲 冯 哲 徐虎博 王志鹏
(石河子大学机械电气工程学院,新疆 石河子 832000)
蟠桃是新疆特色果品产业之一[1],尤其是新疆石河子143团的蟠桃从口感、外貌到营养价值都属于蟠桃中的极品,2000年10月被中国农业特产专业委员会正式命名为“中国蟠桃之乡”。新疆蟠桃的销量逐年增长,2013年销量已达15万t以上,但是增速在逐年降低[2]。经调查[3]发现,新疆蟠桃的自动化分级水平不高,生产效率低下,这是影响增速的原因之一。为了提高新疆蟠桃的商品价值及其在国际桃类高端市场上的竞争力,河北省地方标准[4]规定了根据蟠桃单果质量的不同分为特级、一级和二级的分级标准,通常特级蟠桃单果质量:早熟品种≥100g,中熟品种≥120g,中晚熟品种≥220g。
目前,蟠桃的称重分级主要依靠人工处理,分级效率较低,而且损伤率较高。由于果蔬的尺寸与其质量存在一定关系,因此为了避免果品单果称重所存在的效率低下、人为误差较大,以及果品损伤率较高的缺点,通过分析国内外针对梨、马铃薯、猕猴桃等果蔬质量的预测方法,利用蟠桃的几何特性尺寸来预测蟠桃质量。蟠桃几何尺寸的获取,可以采用计算机图像处理技术,实现非接触式测量,以减少蟠桃不必要的机械损伤,同时也可以降低人工成本。本研究拟采用计算机图像处理技术对蟠桃的几何特性进行分析,建立预测蟠桃质量的数学模型,旨为依据蟠桃质量来自动分级的装备的设计提供依据。
1 材料与方法
1.1 材料
蟠桃:由新疆石河子垦区143团提供。随机挑选无损伤、无虫害,且剔除畸形果的蟠桃90个,将蟠桃气调贮藏(4%~6%O2,2%~4%CO2,-1~1℃)。
1.2 几何特性参数实测
本研究假设蟠桃的形状为扁平状[5],蟠桃的几何参数有:蟠桃横剖面的面积x1、纵剖面的面积x2、缝合中线处的直径x3,缝合中线垂直处的直径x4,蟠桃厚度x5。用数显游标卡尺测量x3、x4、x5,采用数方格法[6]测量x1、x2。蟠桃的质量y由数字式电子称(精度为0.01g)称量。蟠桃的三维图见图1。
图1 蟠桃的三轴径图Figure 1 Three axes diameter of flat peach
1.3 蟠桃几何参数图像法获取
蟠桃的图像采集装置(图2)由计算机、背景板、CCD数码相机、高度调节装置、光源箱组成。采集图像时,将相机摄像头与测量台间距调节至19cm,光源为白炽灯点光源,蟠桃放置于白色背景的底板上,处于摄像头正下方。采集蟠桃正、反两面以及侧面(图2中的蟠桃样品为正面),应用MATLAB R2014a软件对图像进行滤波、二值化等预处理[7],进而进行边缘检测[8]、背景分割、RGB分量提取[9-11]。同时对图像进行形态学处理,以便得到蟠桃的外轮廓图像,达到对图像分析和识别的目的[12,13],最终获得轴径参数、厚度参数和投影面积参数的像素值。图像处理过程见图3。
图2 图像采集系统Figure 2 Image acquisition system
图3 蟠桃图像处理过程Figure 3 Image processing process
1.4 蟠桃质量预测
针对蟠桃质量与各几何参数(如缝合中线处的直径,缝合中线垂直处的直径,蟠桃横、纵剖面的面积等)之间的关系,本研究采用了多元线性回归方法拟合出实测值与蟠桃质量的预测模型,并比较了不同参数所得模型的拟合优度,找到最优质量预测模型。同时通过将MATLAB R2014a软件获取的像素值与相应几何参数进行拟合,最终得到像素—质量预测模型。
2 结果与分析
2.1 实测值—质量模型
多元线性回归:
式中:
b0~bn——回归系数;
在3GPP国际标准中,4G移动网络包括核心网与无线网,涉及网元主要有eNodeB、MME以及SAEGW。eNodeB主要负责用户手机的无线接入以及给用户手机分配无线带宽和优先级,MME负责手机的移动会话管理,SAEGW负责手机流量的路由[2]。
x1~xn——样本特征值;
y——目标特征值。
回归函数:
式中:
b——回归系数;
bint——回归系数的区间估计;
r——残差;
stats——检验回归模型的统计量。
本试验有5个自变量:蟠桃横剖面面积x1,蟠桃纵剖面面积x2,缝合中线处的直径x3,缝合中线垂直处的直径x4,蟠桃厚度x5;一个因变量:蟠桃质量y。5个自变量的箱形图见图4。由图4可知,x1的变化最大并且异常量较多,x2次之,x3最小。
图4 箱形图Figure 4 Box-plot
分别对5,4,3个自变量进行线性拟合,同时得出各自的残差图,见图5。最终统计结果见表1。
表1 不同自变量拟合结果统计表Table 1 Fitting results of different independent variables
图5 残差图Figure 5 Residual plot
由表1可知,4种回归方程的拟合优度均较高,达到了90%以上。它们的显著性概率P=0.000 0<0.05(默认95%置信区间),故拒绝零假设,认为回归模型中至少有一个自变量的系数不为0,回归方程有意义。其中第1个回归方程拟合优度最高,达到了93.65%。但是自变量过多,统计繁琐。第4个回归方程只有3个自变量,拟合度达到了91.87%。综上所述,第4个模型是最适合的模型。
最优回归方程:
2.2 实测值与像素关系
通过MATLAB R2014a软件获取相应几何参数的像素值,并将实测值与像素值进行拟合,结果见图6。
通过 MATLAB R2014a对蟠桃x3、x4和x53个自变量与对应像素进行拟合,得到3个拟合模型:
由式(3)~(6)得像素—质量模型:
式中:
x′3——蟠桃缝合中线处的直径,mm;
x′4——缝合中线垂直处的直径,mm;
x′5——蟠桃厚度所对应的像素值;
y——蟠桃质量,g。
图6 实测值与像素值拟合图Figure 6 Fitting between the measured value and the pixel value
3 结论
本试验分析了蟠桃质量与几何特征参数间的关系,并运用多元线性回归方法得到预测模型。选取的几何参数自变量不同,所得质量预测模型的准确率不同。通过比较分析,第4种实测值—质量模型最优。将像素值与相应几何参数进行代换,最终得到最优像素—质量模型,预测准确率达到91.87%,该模型可以准确的对蟠桃质量进行预测。同时,本研究方法也适用于其他种类的球体果蔬或物品的质量预测。通过残差图分析,实测值有6~7个异常值,在今后的研究中,可以分析异常值出现的原因并解决此问题,以达到更准确的效果。
1 赵建军,丁继高.新疆石河子蟠桃食心虫防治技术[J].果农之友,2011(3):30.
2 新疆维吾尔自治区统计局.新疆统计年鉴(2014年)[Z].北京:中国统计出版社,2014.
3 付洪波,何轶,张汝廷,等.蟠桃产业发展的SWOT分析及政策建议[J].中国集体经济,2013(3):31~33.
4 河北省地方标准.DB13/T 1069—2009无公害果品蟠桃[S],河北:河北省质量技术监督局,2009.
5 周祖锷.农业物料学[M].北京:农业出版社,1994:55~62.
6 于东宁,张国安,李建宁.瘢痕面积及其不规则程度的定量测量方法研究[J].中国美容医学,2005,15(5):486~489.
7 施健,何建国,张冬,等.基于计算机视觉鲜枣大小分级系统研究[J].食品与机械,2013,29(5):134~137.
8 周林妹.数字图像边缘检测算法及其在农产品加工中的应用[J].食品与机械,2009,25(3):139~142.
9 杨杰.数字图像处理及MATLAB实现[M].北京:电子工业出版社,2009.
10 王红君,陈伟,赵辉,等.复杂背景下植物叶片的彩色图像分割[J].中国农机化学报,2013,34(2):207~211.
11 谢中华.MATLAB统计分析与应用:40个案例分析[M].北京:北京航空航天大学出版社,2010.
12 Xu Li-ming,Zhao Yan-chao.Automated strawberry grading system based on image processing[J].Computers and Electronics in Agriculture,2010(72):32~39.
13 Joseph D,Eifer T,Gabriel C,et al.Prediction of raw produce surface area from weight measurement[J].Journal of Food Engineering,2006(74):552~556.