基于机器学习算法的食用菌分类识别研究
2021-12-07王振杰张乐乐李双芳章萩月付倩倩刘生杰
王振杰,张乐乐,李双芳,章萩月,付倩倩,刘生杰
(1.阜阳师范大学 信息工程学院,阜阳 236041;2.阜阳师范大学 生物与食品工程学院,阜阳 236037)
引言
食用菌是可供人们食用的大型真菌的统称,多数俗称蘑菇[1]。我国食用菌资源十分丰富,被广泛食用的有200 种左右[2]。食用菌营养素种类和含量较为丰富,必须氨基酸种类齐全,富含菌菇多糖等多种生物活性成分,具有较高的保健功效和药用价值[3-4]。随着人们生活水平的不断提高,营养价值高、附加值高的野生食用菌也逐渐进入大众的视野[5]。误食一些有毒的食用菌可引起急性中毒,由于目前对毒蘑菇种类及其毒素认知尚不完全,缺乏快速区分有毒与可食用蘑菇的有效办法,蘑菇中毒已成为我国食源性疾病中病死率最高的一类急症[6]。
传统食用菌鉴定主要根据菌菇的生长特性、外观形貌、显微结构等综合判断,受主观因素干扰较大[7]。分子生物学和光谱法在食用菌鉴别应用研究较多[8-10]。Sen Yao 等人利用紫外光谱和红外光谱技术,以SVM 构建模型对不同野生疣柄牛肝菌进行区分,验证集正确率达94.74%[11]。杨天伟等人采用傅里叶变换红外光谱结合多元统计分析方法对10 个不同种类的牛肝菌进行鉴别研究,通过对牛肝菌红外光谱特征的优化处理,得出基于马氏距离的分类模型在验证集和预测集准确率分别为90%、95%[12]。Li Yan 等人研究了基于紫外光谱的指纹图谱技术对不同储藏年份的野生大白口蘑的区分[13]。刘洋等人提出一种应用近红外光谱技术对13 种野生蘑菇识别的方法,在建立的SVM 识别模型中,测试集识别率为95.3%[14]。Georgios I.Zervakis 等人利用漫反射红外傅里叶变换漂移光谱对食用菌平菇进行快速分类研究[15]。刘洋等人研究建立出一种应用近红外光谱技术鉴别野生台蘑的方法,对未知样本的识别正确率为100%[16]。分子生物学鉴定方法具有操作复杂、价格昂贵和不易推广等缺点。光谱法具有快速无损等特点,识别精度较为理想[3]。
计算机视觉技术涉及CCD 技术、数字图像处理、模式识别、数学形态学、人工智能等众多学科,在农产品分类、分级、表面缺陷检测等质量和品质安全方面应用研究较为广泛[17-18]。陈红等利用视觉技术实现了天白花菇、白花菇、茶花菇和光面菇4 种类型香菇的分选,正确率可达93.57%[19]。Wang Fengyun 等人研究了基于图像处理的新鲜双孢蘑菇在线分级系统,平均准确率为97.42%[20]。林楠等人利用机器视觉技术对血红铆钉菇、橘黄刺杯菌、棕色灰菇3 种野生食用菌进行识别研究,综合识别率达到90.78%[21]。计算机视觉技术在食用菌种类识别方面还未深入研究,食用菌图像数据库尚未建立,赵铖博等人也提出大型真菌种类识别模型的建立的需要[22]。因此,本文选取常见的五种食用菌作为初步研究,通过设计一种通用的图像处理算法,提取有效的特征数据,搭建多种识别模型,达到对食用菌种类识别的目的,以期为食用菌的快速无损识别和图像数据库的搭建提供技术支持。
1 材料与方法
1.1 试验材料与数据处理软件
材料:香菇(Lentinus edodes)、海鲜菇(Hypsizygus marmoreus)、白蘑菇(Agaricus bisporus)、蟹味菇(Hypsizigus marmoreus)、白玉菇(White Hypsizygus marmoreus),购买于当地永辉生鲜超市,共分三批次购买。
数据处理软件:MATLAB 2016a、DPS 数据处理系统(v18.10)。
1.2 图像采集系统
1.2.1 系统组成与搭建
如图1 所示,系统主要由计算机、相机、光源、支架和图像采集软件组成。其中,相机分为机身(型号:WP-UE500)和镜头(型号:VM15030MPIR,500 万像素手动定焦)。光源为高密度LED 阵列环形视觉光源,可调亮度。图像采集相机参数设置为:焦距30 mm,光圈1.0,区域自动曝光,样品与镜头距离50 cm。
1.2.2 图像采集
对五种食用菌分别采集70 副图像,为降低菌菇生长差异性的影响,共分三批次购买,三批次图像采集。将每种食用菌70 副图像打乱顺序保存,随机分配50 副图像作为建模集,20 副作为验证集。五种食用菌图像见下图2。
图2 五种食用菌图像
1.2.3 图像处理
图像处理的目的是将图像中感兴趣区域定位及分割,以便后期目标区域特征提取[23-24]。在图像处理过程中,图像分割步骤是非常重要的一步,图像分割常用的方法有阈值分割、边缘检测、区域分割等[25]。针对五种食用菌原始图像特点并结合灰度直方图,采用了定阈值分割方法,即根据灰度直方图得出目标和背景像素灰度级分布,定义最佳一个阈值T,灰度值小于T 定义为0(黑),大于T的定义为1(白),通过大量的实验最终确定阈值为35/255 最佳,可以将背景与目标较好的分割出来。
图像闭运算是将图像进行膨胀、腐蚀处理的过程,目的是填平二值图像中的小孔,弥合小裂缝,而总的位置和形状不变。经闭运算处理后的二值图像仍会残留少量噪点,通过检测图像中的闭合区域,利用最大面积法提取出最大连通区域,然后进行内部孔洞填充和掩模运算操作,最终得到只有目标菌菇的图像。图像处理流程见下图3,该方法具有很好的通用性,且运行速度较快,平均处理速度为0.3s/幅。
图3 五种食用菌图像处理流程
1.2.4 特征提取
通过对五种食用菌图像观察分别从形态、颜色、纹理三个方面提取15 个特征作为分类识别研究,其中形态学特征包括面积S、周长L、圆形度e(e=(4π*S)/L2)、矩形度R(R=S/SMER,其中SMER为目标区域最小外界矩形面积)和宽长比r(r=W/L,W 为目标区域最小外接矩形宽度,L 为最小外接矩形长度)五个形态学特征。
RGB 模型是目前应用最广泛的颜色模型之一,几乎所有颜色都可以由红(Red,R)、绿(Green,G)、蓝(Blue,B)3 种颜色组成,它能很好的对一副图像的色彩进行描述。根据五种食用菌表面颜色的差异,分别提取R、G、B 三分量的颜色分布均值用来描述各自的颜色信息,并作为分类的特征之一。HSV 颜色空间是由色调H、饱和度S、亮度V组成的一种六角锥体颜色模型,可很好的描述图像的颜色深浅及明亮程度。
灰度共生矩阵(gray level co-occurrence matrix,GLCM)是一种通过研究灰度的空间相关特性来描述纹理的常用方法[26]。它不仅反映亮度的分布特征,也反映具有同样亮度或者接近亮度的像素之间的位置分布特性,是有关图像亮度变化的二阶统计特征。本文采用该方法从0°、45°、90°、135°四个方向提取角二阶矩(angular second moment,ASM)、能量(energy,E)、对比度(contrast,CON)、熵(entropy,ENT)4 个特征均值用于进一步分析。
综上,五种食用菌分别提取5 个形态特征(S、L、R、r、e)、6 个颜色特征(`R、`G、`B、H、S、V)和4个纹理特征(ASM、E、CON、ENT),共计15 个特征数据用来构建识别模型。
1.2.5 模型构建
支持向量机(Support vector machines,SVM)[27-28]:是目前应用最广泛和发展最快的机器学习方法。其原理是将所待分类的样本映射到“高维空间”,然后在高维空间中找到一个能将这些样本分类的“超平面”,SVM 对多分类问题能够提供良好的解决方法。
随机森林(Random forest,RF)[29-30]:其分类原理是通过自助法重抽技术,从原始训练样本数据集中N 有放回地重复随机抽取n 个样本量生成新的训练样本集,再根据自助样本集生成k 个分类树,然后由众多的分类树组成随机森林,预测样本的分类结果是通过分类树投票的得分多少的方式来定。RF 在分类识别方面具有很好的分类率,尤其对大数据也有较高的效率,且在分类过程中能够给出各个变量的重要性。
2 结果与分析
2.1 基于全部特征的模型区分结果
由表1 可知,RF 分类模型在建模集和验证集中对五种食用的识别正确率均达到100%。SVM模型验证集正确率为100%,建模集正确率为99.2%,在模型训练学习过程中将2 个海鲜菇样本划分为白玉菇,由上图2 观察可知,海鲜菇与白玉菇在颜色、形态及纹理上较为接近,是造成SVM模型学习错误的主要原因。总体可以得出RF 模型在以全部特征作为分类依据识别精度最高,在15 个特征数据中,矩形度的重要性为0.12,其他的14 个个特征变量重要性均在0.06 左右。RF 模型参数为:决策树数量NTress=300,节点变量数为4。SVM 模型参数为:核函数为RBF,核函数gamma 参数值为0.5,Degree 值为3,惩罚系数cost 值为1。
表1 基于全部特征构建SVM 和RF 模型对五种食用菌区分结果
2.2 基于形态学特征的模型区分结果
由表2 可知,以形态学特征构建的RF、SVM模型在建模集和验证集正确率上均低于以全部特征构建的两个模型正确率。其中RF 建模集和预测集正确率分别为100%、79%,SVM 建模集和预测集正确率分别为82%、82%。在SVM 模型中,建模集中区分误差主要来源于白玉菇和蟹味菇,从表2 中可以看出,29 个蟹味菇样本判别为白玉菇,5 个白玉菇样本错误划分为蟹味菇,由上图1可知,蟹味菇和白玉菇在面积周长大小、圆形度、矩形度、长宽比5 个几何特征中都比较接近,是导致区分误差的主要原因。其次,香菇与白蘑菇、海鲜菇与白玉菇在形态学特征上也较为接近,但仅有少量样本判别错误。在验证集中,两种模型的正确率均不理想,从表中可以看出,判别误差依旧来源于白玉菇和蟹味菇。整体上看,白蘑菇在两个模型区分度均为最好,正确率都到达100%,其次为香菇、海鲜菇。在RF 模型中,面积、周长、圆形度、矩形度、长宽比五个特征变量在建模过程中所占的重要性分别为0.19、0.17、0.17、0.35、0.16。两种模型参数设置与2.1 中一致。
表2 基于形态特征构建SVM 和RF 模型对五种食用菌识别结果
2.3 基于颜色特征的模型区分结果
由表3 可知,基于颜色特征构建的SVM 和RF 模型在识别精度上总体高于以形态学特征建立的模型精度,但低于以全部特征建立的模型识别精度。其中,RF 在建模集和验证集的准确率分别为100%、94%,识别精度优于SVM 的86.8%、90%。从下表可以看出,SVM 模型判别误差主要由海鲜菇、白蘑菇、白玉菇三种颜色较为接近的菌菇造成,由图1 可知,三种菌种均偏向于白色,且从原始特征数据分析得出三种菌的饱和度均值和亮度均值非常接近。RF 模型验证集正确率为94%,其中将3 个白蘑菇样本判定为海鲜菇,2 个白玉菇判定为海鲜菇。整体上,香菇和蟹味菇在两个模型中区分正确率上为最好,均达到100%。在RF 模型中,6 个颜色特征变量在建模过程中所占重要性均在0.15 左右,较为接近。两种模型参数设置与2.1 中一致。
表3 基于颜色特征构建SVM 和RF 模型对五种食用菌识别结果
2.4 基于纹理特征的模型区分结果
由表4 可知,SVM 在建模集和验证集正确率分别为87.2%、73%,与RF 模型的建模集为100%、验证集为94%正确率差距较大。在SVM识别模型中,建模集的10 个海鲜菇样品划分为白玉菇、10 个白玉菇判定为海鲜菇、9 个蟹味菇划分为海鲜菇,且验证集中判别误差原因与建模集中类似,SVM 模型区分效果较好的为白蘑菇,建模集和验证集准确率均达到100%,其次为香菇,建模集和预测集正确率分别为98%、100%。在RF模型中,建模集正确率为100%,与全特征、颜色、纹理三类特征建模正确率一致,说明RF 模型在建模学习能力方面具有较好的准确率和稳定性。验证集误差主要由2 个蟹味菇判别为白玉菇、1 个白玉菇判别为海鲜菇、1 个香菇判别为白蘑菇。RF模型中,4 个颜色特征变量在建模过程中所占重要性均为0.2。RF 模型参数为:决策树数量NTress=300,节点变量数为4。SVM 模型参数为:核函数为RBF,核函数gamma 参数值为0.5,Degree 值为3,惩罚系数cost 值为1。
表4 基于纹理特征构建SVM 和RF 模型对五种食用菌识别结果
3 小结
本研究表明,计算机视觉技术能够很好的区分五种常见食用菌的种类。RF 模型识别精度最高,整体识别精度优于现有无损检测方法,为搭建大型真菌图像数据库模型选择上提供了重要参考价值。由于食用菌种类繁多,颜色形态变化多样,且在不同的生长阶段其形态、颜色及纹理不断发生变化,在后期图像识别数据库搭建研究中,需要对通用图像处理算法进行改进,特征提取须有更重要的代表性来提高识别模型的准确率和稳定性。