Bayes决策理论在茶叶分类分级中的应用
2017-12-20王宏伟
王宏伟
(湖北理工学院,湖北 黄石 435003)
Bayes决策理论在茶叶分类分级中的应用
王宏伟
(湖北理工学院,湖北 黄石 435003)
针对茶叶感官审评当中存在的问题,提出了一种新的茶叶分类分级方法,首先对茶叶颜色特征进行定量描述,再根据Bayes决策理论对茶叶进行识别,识别率在91%以上,具有较好的效果。实验结果表明,利用计算机视觉技术和Bayes决策理论对茶叶进行分类和分级是可行的。
茶叶分类分级;计算机视觉技术; Bayes决策理论
0 前言
目前,国内外茶叶的品质和等级大多数是通过感官审评方法来评定的,感官审评是利用眼、舌、鼻、手等人体各种感觉器官,依靠个人经验和规范的操作技术来鉴别茶叶色香味形的优劣幷评定其等级。
但是,人的感觉器官的灵敏度易受外界因素如环境变化、精神状态及身体状况的干扰,而且不同的人员面对相同的茶叶,由于感觉器官的灵敏度不一致,得到的结果,往往存在一定的偏差,最终都会影响感官审评结果的准确性。
随着计算机技术的发展,可以利用计算机视觉技术对茶叶的颜色进行量化检测,进而对所检测对象进行分类和分级,使结果更具客观性和一致性[1~3]。
1 实验材料和图像采集方法
1.1 实验材料
实验所用茶叶分别为碧螺春、龙井、英山毛尖等三种绿茶,所有样本均购自湖北黄石当地超市,茶叶初产地分布于江苏苏州、浙江杭州和湖北英山三地。
1.2 图像的采集
本实验采用一套基于漫反射的光源系统,如图1所示。
1. 光源 2.样品台 3.光源箱 4.CCD摄像头 5.图像采集卡 6.串行接口 7.计算机
实验时,将茶叶样本放在样品台上,利用摄像头对茶叶样本进行图像采集,所有采集到的原始数据均以RGB颜色格式保存。
2 茶叶图像颜色特征提取
2.1 图像颜色格式转换
为了便于用计算机视觉技术来定量描述茶叶颜色,必须把原始的RGB颜色格式转换成HIS颜色格式,转换公式如下[4][5]:
式中:R、G、B分别是摄像头拍摄到的图像RGB颜色格式中红、绿、蓝三原色的值,H、I、S分别为转换后HIS颜色格式中图像的色度、亮度和饱和度,其中色度H用角度表示,其取值范围在0~2π之间。
2.2 茶叶颜色特征参数提取
茶叶颜色是一个视觉多要素综合作用的效果,包括茶叶的基本色度、饱和度、光泽、亮度和纹理等多个特征参数,本文通过多次试验,选择干茶的6个颜色特征参数,3个纹理特征参数, 3个茶汤颜色特征参数共12个参数进行分析[6]。
3个纹理特征参数分别是:熵e、能量Q和相关性T。公式表示为[7]:
式中p(zi)是一个区域中的灰度直方图。熵e是茶叶图像中灰度随机性的度量。
相关性T是用来描述灰度共生矩阵的元素在列方向或行方向上的相关程度。
由于这12个选中的特征参数具有各自不同的数量级和量纲,为了使这些特征参数具有可比性,必须将这些数据进行初始化处理。
3 模式识别中的Bayes决策理论
3.1 统计模式识别
统计模式识别对于需要通过已知类别的样本特征参数值来建立一个分类的预测模式比较实用,是一种根据特征参数判断样本分类的多参数统计方法。常见的统计模式识别有判别函数法(又称决策理论方法)和聚类分析法[8]。 判别函数法是从已知类别的样本中推断出判别函数,然后用判别函数预测未知类别的相关样本的类别归属,判别函数法的关键是判别函数的确立。按照所采用的判别规则划分,常用的判别函数法有Fisher判别、Bayes判别和最小距离判别等。本实验采用Bayes判别法。
3.2 Bayes决策理论的算法[9]
设有一批M类的训练样本:
1) 计算各类样本的先验概率p(ωi),i=1,2,…,M;
2) 计算各类样本的均值、协方差,得到协方差矩阵和逆矩阵;
3) 由均值、协方差矩阵和逆矩阵计算出类条件概率密度函数p(x|ωi);
4)由先验概率和类条件概率密度函数得到Bayes判别函数:
5)对于任一待分类样本X,代入M个判别函数Gi(x)=p(x|ωi)p(ωi)中,看哪个判别函数最大,就把X归于这一类。
4 采用Bayes判别法对茶叶进行分类识别
茶叶样本共分3个类别(碧螺春、龙井、英山毛尖),每个类别各取40个样本,将其中20个样本作为训练样本,剩下的20个样本作为测试样本,总共有120个样本。使用电子天平每次称取20g茶叶作为一个样本,用白纸托着,置于样品台上,在CCD下采集图像。
然后依次在各样本中称取10g茶叶,用90度开水冲泡,滤去茶叶之后,将茶汤放在同一个烧杯中,置于样品台上,在CCD下采集图像。
采用Bayes判别法进行分类判别,结果如下:
由表1可以看出,采用Bayes判别法对三种茶叶进行分类,96.7%的训练样本可以被准确分类,91.7%的测试样本可以被准确分类。
表1 分类判别结果
5 采用Bayes判别法对茶叶进行分级识别
分别选取3个类别的茶叶一级、二级、三级各40个样本,总共360个样本。其中每一个类别每一个级别取20个样本作为训练样本(共180个),剩余20个样本作为测试样本(共180个)。使用电子天平每次称取20g茶叶作为一个样本,用白纸托着,置于样品台上,在CCD下采集图像。
然后依次在各样本中称取10g茶叶,用90度开水冲泡,滤去茶叶之后,将茶汤放在同一个烧杯中,置于样品台上,在CCD下采集图像。
采用Bayes判别法进行分级判别,结果如表2:
表2 分级判别结果
由表2可以看出,采用Bayes判别法对三种茶叶进行分级,98.0%的训练样本可以被准确分级,94.8%的测试样本可以被准确分级。
6 结论
[1]高 华,周 林.计算机视觉及模式识别技术在农业领域中的应用[J].山东农业大学学报,2003,34(4):590~593.
[2]陈全胜,赵文杰,张海东,等.利用计算机视觉识别茶叶的色泽类型[J].江苏大学学报,2005,(11):461~464.
[3]Sarkar N,Wolfe R R.Computer vision based system for puality separation of fresh market tomatoes[J].Trans of the ASAE,1985b,28(5):1714~1718.
[4]蔡健荣.利用计算机视觉定量描述茶叶色泽[J].农业机械学报,2000,(7):67~70.
[5]Tao Y,Heinemann P H.Machine vision for color inspection of potaaoes and apples[J].amerrican Society of Agricaltural Engineers.1995,38(5):1555~1561.
[6]严 峻,林 刚.测色技术在茶叶色泽及品质评价中的应用研究[J].茶业通报,1995,(1):7~9.
[7]王新宇.基于计算机视觉和电子舌技术的绿茶分类分级研究[M].苏州:江苏大学,2007.
[8]沈庭芝,王卫江,闫雪梅.数字图像处理与模式识别[M].北京:北京理工大学出版社,2007.
[9]盛立东.模式识别导论[M].北京:北京邮电大学出版社,2010.
ApplicationofBayesdecisiontheoryinteaclassification
WANG Hong-wei
(Hubei Polytechnic University, Hube Huangshi 435003)
To overcome the problem in tea Sensory Evaluation , a new method of tea classification was proposed. Based on quantitative description to tea color features through computer vision, the tea identification rate can reach above 91% by applying Bayes decision theory. The experimental result showes the good effect to tea classification by the application of computer vision and Bayes decision theory.
tea classification;computer vision; Bayes decision theory
TP312
A
2096-3149(2017)04- 0006-05
10.3969/j.issn.2096-3149.2017.04.002
2017—03—11
湖北省自科基金科研项目(项目编号:2009CDZ004) ;湖北省教育厅科研项目(项目编号:B20104403)
王宏伟(1968— ),男,湖北黄冈人,副教授,主要从事计算机模式识别、信息安全的教学与研究工作.