茶叶图像特征提取及其应用研究进展
2021-09-09刘自强周紫英
刘自强,周紫英
(湖南交通工程学院,湖南 衡阳 421001)
1 引言
近年来,随着计算机科学技术快速发展,图像处理技术在诸多领域已有广泛应用研究。机器视觉图像检测技术具有简单、快速和客观等特点,已在农业生产及农产品品质检测方面有较广的应用。研究者利用数字图像处理技术对成品茶叶或植物叶片提取颜色、形状大小和纹理等特征,对其进行分类识别并得到较好结果。不同品种的茶叶叶片大小、形状、颜色差异较小,利用计算机视觉图像识别方法对茶叶种类进行识别,从叶片图像中挖掘具有显著性差异的特征参数,成为基于图像识别茶叶品种过程中的关键问题。
2 特征提取
数字图像处理是对目标图像进行去噪、检测、分割及特征提取等处理的技术和方法。研究者利用此技术对成品茶叶或相关植物叶片预处理后,提取传统的颜色、形状等特征进行研究,分析能够区分不同种成品茶叶及植物叶片的特征因子,并建立相应识别模型进行预测分析识别。其中一些研究成果为识别不同茶树品种的鲜茶叶图像种类,提供技术理论依据[1]。
2.1 基于颜色和形状特征
陆江锋等[7]介绍了茶叶图像预处理的方法,如对茶叶图像的中值滤波、阈值变换、图像标记及边界轮廓跟踪等。并对径山茶、龙谷丽人和觉农龙井三种商品茶叶图像提取包括茶叶周长、面积、圆形度、形状复杂性等17项外形特征,并建立基于BP神经网络的茶叶预测模型,预测准确率达80%,表明视觉图像技术对于鉴别商品茶叶外形品质及类别方法可行。吴正敏等[8]利用逻辑回归、决策树、支持向量机以及均值计算大红袍的品质指标,选取圆形度、矩形度、线性度、周长和紧凑度五种特征向量作为指标,通过多种算法选出最佳分类算法,最终达到较高的分类准确率,实现茶叶精选。武斌等[9]选取安徽岳西翠兰,六安瓜片,施集毛峰和黄山毛峰4种茶叶的样本进行实验,提出可能模糊鉴别C均值聚类算法并且利用近红外光谱对数据进行处理,PFDCM聚类准确率最高为98.84%,研究表明FTNIR技术结合MSC,PCA,LDA和PFDCM为茶叶品种的分类与鉴别提供了可行方案。黄藩等[10,11]由于传统的感官检测茶叶的品质易受到茶叶审评人员的个人因素以及环境因素的带来的误差较大,因此利用计算机视觉技术,提取茶叶图像颜色、形状等特征对茶叶品质进行检查,研究表明该技术能有效保证茶叶各个生产过程中的品质,从而提高茶叶生产质量。
鲜茶叶图像特征提取方面,陈怡群等[12]对包含鲜茶叶全芽、一芽一叶和一芽多叶的嫩芽图像提取茶叶周长、面积、短轴、等二阶距椭圆长轴等7个几何外形特征和RGB分量均值、标准偏差等12个颜色、形状特征,并基于神经网络对3种不同嫩芽分类,并达到90%的识别率。Camilla Pandolfi等[13]用聚类等方法对植物叶片进行分析归类,用分类器预测识别,以鲜茶叶叶片作为例子来说明方法的可靠性。对分属越南,菲律宾,中国的17种鲜茶叶,提取茶叶图像的面积、周长、长轴、短轴、圆形度、伸长率等9个传统几何形状特征及5个颜色灰度值特征,并以颜色灰度值做聚类分析归为两类,再用BP神经网络建模预测识别区分,并达到较好识别效果。高震宇等[14~16]针对机采茶叶品种的精选问题,选取颜色、形状等特征利用反向传播和学习速率的方法提高卷积神经网络对茶叶的训练成效,经过对数据的整理和计算,测试茶叶分选准确率为92.24%。毛腾跃等[17]基于鲜茶叶图形的开关和纹理特征利用SVM和支持向量机分类器进行分类并且结合特殊角点及距离矩阵从而提高鲜茶叶分类准确率,准确率达94.24%。徐泰燕[18]基于茶叶外形颜色和形状特征、香气和口感,利用人工神经网络技术的精密仪器设备对茶叶大量数据和信息加工处理,提高对茶叶检测的精准度。
学者利用计算机视觉技术,提取茶叶图像的颜色、形状等特征,建立网络神经模型,在模式识别上具有较好高准确性,能无损、快速识别。未来将可在食品安全、病虫害防治、农业发展中发挥重要作用。随着大数据时代发展进步,计算机视觉技术在图像和多维数据的处理和信息获取等功能上有着快、大、多的特点,因此对茶叶图像和数据的处理中也可使信息简洁化,并且还可以解决茶叶采摘中嫩梢定位问题[19],未来将在5G技术、数据监管和安防等领域的作用更加突出。
2.2 基于纹理和分形特征
对于植物叶片图像识别研究,S.Mugnai等[20]对生长于日本的山茶花,提取其叶片图像的面积、周长等9个传统特征及5个颜色灰度值特征,依据各颜色通道的分形维数值做聚类分析归类,最后用BP神经网络建模预测识别,达到较好分类效果。同样,Camilla Pandolfi等[21]运用与S.Mugnai相类似的方法,对斑克木叶片进行分类识别研究。随着分形理论与应用的发展,有学者将分形理论应用于植物叶片图像识别领域。袁津生等[22]提出把分形维度作为纹理特征,提取植物叶片图像的分形维度,并另外提取叶片8个周长、面积等传统特征参数建模分类识别。试验结果表明,对于9种不同的植物叶片,加入分形维度的特征数据集有更高的识别精度。同时,基于分形理论的特征提取,也为植物叶片图像特征提取提供新的思路。芦兵等[23,24]对病害茶叶进行了相关实验研究,基于高光谱图像提取LBP值,由于茶叶样本数据间存在大量相关性,造成信息冗余,增大特征维数,反而降低识别精度,因此通过Uniform模型对多且杂的LBP数据值进行处理,从而更加精准和清晰的提取LBP值,利用灰度共生矩阵(GLCM)对病害茶叶的对比度等5个相关量计算提取病变茶叶的纹理信息,最后用Softplus函数优化使得病变茶叶分类准确率达92.73%。林丽惠等[25]结合茶叶边缘的纹理信息进行细化分析,提取纹理特征建立CNN模型,并利用IGL-CNN模型研究武夷岩茶的9个品种,通过茶叶全局的信息来研究分类准确率,研究表明整体和局部综合研究得来的准确率更高。燕娅等[26]基于图像纹理特征,将SVM和KNN算法结合成SVM-KNN算法,避免了临界纹理间识别误差,此方法识别准确率最高达90%。张程等[27]提取叶片图像的颜色和纹理特征,利用支持向量机训练识别,准确率达97.36%,且结果发现多种特征信息共同识别准确率明显高于单个特征识别准确率。
提取叶片图像的颜色、形状、纹理、分形等特征,利用多种分类器训练建模识别,能显著提高识别率。伴随茶叶加工工艺提高,研究者更注重茶叶加工和商品茶制作,而不同种类茶叶叶片大小、形状、颜色区别细微,光凭肉眼难以分辨鲜茶叶所属品种,因此需要借助数学方法辅以计算机为工具来提高模式识别精度。
3 结语与展望
传统识别鲜茶叶品种主要有专家感官评定和化学分析方法。其中感官评定受评定者个人经验、心理与生理等因素影响,此方法效率较低、工作量大、主观性强,难以达到客观评审结果。化学分析方法虽能准确鉴别茶叶,但步骤繁琐、机器设备昂贵,难以快速识别,很难满足科研需要。提取多种茶叶品种图像的颜色、形状、纹理、多重分形特征,利用分类器训练建模识别,能识别不同茶树品种。为快速、无损、客观识别茶树品种提出一种新的思路与方法,这对茶树名优品种的发展保护及茶树品种的认知有重大现实意义。
提取茶叶图像有效特征,结合模式识别方法,可实现对茶叶的种植、加工和生产等方面进行全面的品质检测,对病虫害监测、茶树栽培和植保、茶叶加工和审评等领域有重要意义。另外,提高茶叶优良品种筛选精度,能给消费者带来更好的品茶体验感,保证消费者权益。提高茶叶的筛选分类准确率,也会给茶叶生产商带来口碑和品牌等有益效应。未来可通过数据图像处理提取更多有效特征结合多种高性能检测技术,在农作物实时、无损、快速在线营养检测与病虫害防治方面将大有发展前景。