基于支持向量机的翠冠梨大小等级评定模型构建
2023-10-18郑华伟
刘 现*,郑华伟
(1.福建省农业科学院数字农业研究所,福建 福州;2.福建农林大学计算机与信息学院,福建 福州)
引言
翠冠梨属砂梨系,品质上等[1-2],是福建三明市建宁县的特色水果。我国果品普遍存在分级、包装、商标等商品化处理能力差的弊端,降低了在国际和国内市场竞争中的优势[3]。梨的分级是梨采后一个十分重要的环节,建立完整的分级制度可促进果品优质优价,助力产业化进一步发展[4]。
支持向量机(Support Vector Machine,SVM)理论最初来源于对数据分类问题的处理[5],适合分析小样本和多维数据,常被用于分类和预测[6]。胡晓依等[7]结合SVM 分类器搭建适用滚动轴承故障诊断的改进型深度卷积神经网络模型,极大提升了轴承故障识别准确率、模型收敛速度及泛化能力。时雷等[8]基于支持向量机和灰色BP 神经网络提出冬小麦晚霜冻害预测模型,预测结果与实际情况基本一致;张冬至等[9]提出通过麻雀搜索算法对支持向量机的关键参数寻优,对瓶盖装配进行检测,准确率达到98.33%。
综上所述,支持向量机已在工业与农业中加以应用,但未见在翠冠梨分级上的研究报道。翠冠梨是福建三明市建宁县的特色水果,研究它的分级进而实现它的分类计价,可助力翠冠梨果业进一步发展。本研究立足于当前研究现状,构建翠冠梨大小分类图像数据集,利用支持向量机技术搭建翠冠梨大小等级评定模型,并与贝叶斯分类、决策树算法所构建的分类模型进行对比,评判模型的分类效果与性能。
1 材料与方法
1.1 材料
1.1.1 供试材料
本试验所使用的翠冠梨采购自福建福州市永辉超市。
1.1.2 试验平台
本单位自主构建了一套图像获取试验平台,如图1 所示。平台包括1 台吉农牌计算机分选机(型号TN-68A)、3 个CCD 工业相机(型号MV-SUA1600,分辨率4 608 px×3 456 px,镜头焦距8 mm)、笔记本计算机1 台(Acer Aspire V15 T5000)、LED 光源(功率128 W)、机器视觉检测光源(功率17 W)3 盏等部件,图像采集组件安装于黑色暗箱内。平台内图像采集箱正中央果盘下方安装有重量传感器,当翠冠梨经由传送带向前输送时,传感器可获取翠冠梨重量数据。参照福建地方标准[10]与获取的重量数据将翠冠梨分为大果与小果两类,单果重≥250 g 属于大果类,除此之外为小果类。使用本单位自主研发的图像获取试验平台获取两个类别的翠冠梨图像,获取的图像分辨率为4 608 px×3 456 px,分别从正上方、侧前方、右侧方三个方向获取图像。于2022 年8 月在30 ℃下采集了1 600 张图片,其中含1 000 张大果类图片,600 张小果类图片。获取的翠冠梨图像见图2。
图1 试验平台结构
图2 获取的翠冠梨图像
1.1.3 硬件设备
本研究模型训练使用的深度学习服务器为AMD EPYC 7763 64-Core Processor*2 CPU,64GB*16 内存,GeForce RTX 3090 BULK*8 GPU,Ubuntu 20.04系统,Pytorch 1.12.1 深度学习框架。
1.2 试验方法
本研究基于翠冠梨大小图像数据集采用支持向量机算法(Support Vector Machine, SVM)构建翠冠梨大小等级评定模型并分别使用决策树(Decision Tree)与贝叶斯(Bayes)算法构建模型,作为对比参照。翠冠梨大小等级评定模型构建与评估流程见图3。
图3 翠冠梨大小等级评定模型构建与评估流程
1.2.1 构建翠冠梨大小图像数据集
将获取的1 600 张翠冠梨图像作为数据集并按留出法以8:2 的比例划分为训练集和测试集。训练集含1 280 张图像,其中大果类800 张,小果类480 张;测试集含320 张图像,其中大果类200 张,小果类120 张。
1.2.2 基于支持向量机构建翠冠梨大小等级评定模型
采用Python 语言编程,利用深度学习服务器进行模型训练。先将图像进行预处理后输入,然后进行特征提取,使用SVM 算法进行训练,构建基于SVM 的翠冠梨大小等级评定模型。
1.2.3 与其他算法进行比较
为了评估模型的分类效果与性能,分别使用Decision Tree 与Bayes 算法来构建翠冠梨大小等级评定模型作为对比并重复每一种算法建模过程十次,对比各个模型之间的分类准确率与模型运行耗时。
2 结果与分析
在数据集上重复三种算法建模过程十次后,得到的结果,见图4-图7。
图4 各个模型运行10 次分类准确率
图4、图6 表明SVM 算法构建的模型运行10 次过程中每一次模型分类准确率均高于其他两种算法,其中最小值、最大值及平均值分别为84.06%、87.81%、85.94%;图5、图7 表明SVM 算法在1、4、5、6次的运行耗时小于其他两种算法,SVM、Bayes 算法运行耗时最小值、最大值以及平均值分别为247.32 s、248.00 s、247.50 s 与234.61 s、248.53 s、246.13 s, 最小值和平均值略高于Bayes 算法。
图5 各个模型运行10 次耗时
图6 各个模型分类准确率最小、最大及平均值
3 讨论与结论
试验结果表明,SVM 算法构建的模型10 次分类准确率均为最高,说明分类效果最好,程序运行耗时最小值和平均值均高于Bayes 算法,但高的很少,特别是平均值才高1.37 s。因此综合考虑分类效果与性能因素得出使用SVM 算法相比较于其他两种算法所构建的翠冠梨大小等级评定模型是最佳的。