基于HIS模型的茶叶分类技术研究
2019-07-11吴发辉
吴发辉
(武夷学院 福建武夷山 354300)
一、HIS彩色模型与茶汤图像处理
茶汤是有颜色的,在分类过程中须对颜色进行处理,实际应用中,常见的颜色处理模型有RGB 模型、CMY 模型、HSV 模型、Lab 模型以及 HIS 模型等[1],其中 HIS 模型是从人的视觉系统出发,符合人眼特性比较适合用于茶汤的计算机识别。
(一)HIS 彩色模型。每一种颜色都是由色调(Hue)、饱和度(Saturation 或Chroma)和亮度(Intensity 或Brightness)三要素来表示,HIS 模型就是从人的视觉系统出发,直接使用颜色三要素来描述颜色。其中色调是决定颜色的本质,是彩色中最重要的属性,物体反射光线中占优势的波长的差别来决定了色调的不同,不同的波长产生不同的颜色感觉,便有了红、黄、蓝等各类色彩的相貌称谓。饱和度是指颜色的深浅和浓淡程度,饱和度越高,颜色越深。饱和度的深浅和白色的比例有关,白色所占比例越高,饱和度越低。亮度是眼睛对光源和物体表面的明暗程度的感觉,主要是由光线强弱决定的一种视觉经验,光线越强,亮度越大。
HIS 彩色空间可以用一个圆锥空间模型来描述,如图1所示。人们通常把色调和饱和度统称为色度,用来表示颜色的类别和深浅程度。在图中圆锥中间的横截面圆就是色度圆,而圆锥向上或向下延伸的便是亮度分量的表示。
图1 HIS模型示意图
从图1可得:(1)I(亮度)的分量与图像的颜色信息无关;(2)H(色调)和S(饱和度)分量与人眼获得颜色的方式密切相关。这是由于人的视觉对颜色浓淡的敏感程度远远弱于对亮度的敏感程度,为了便于颜色处理和识别,人的视觉神经系统常采用HIS 彩色空间,它相比于RGB(Red,Green,Blue)或其它色彩空间更符合人的视觉特性,描述也很接近人眼感知色彩的方式。在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,选择HIS色彩空间作为彩色图像处理的模型进行图像分析和处理,以达到不同色彩的物体进行分类,可大大简化其工作量。
由于通过相机采集到的茶叶茶汤图片是RGB 格式的,为了使图像色彩更能符合人眼的视觉要求,本研究在图像处理时将RGB模型转换为HIS模型,以便更准确的实现茶叶的分类。此外,由于HIS 空间中亮度和灰色度具有可分离特性,使得图像处理和机器视觉中大量灰度处理算法都可以在HIS彩色空间中方便地使用。
HIS 彩色模型和RGB 彩色模型只是同一物理量的不同表示法,它们之间存在着转换关系。给定一幅RGB 格式的图像,每一个RGB像素和H分量可以用下面的公式得到[2]:
此处
饱和度分量由下式给出:
最后,强度分量为:
假定RGB 值归一化为[0,1]范围内,色调可以用第一个式子得到的值除以360度归一化为[0,1]范围内,而其它两个HIS分量已经在[0,1]范围之内[3]。
(二)茶汤图像预处理。利用计算机图像处理技术实现茶叶分类分为三个阶段:首先对原始图像进行图像预处理,选择图像的关键部分;接着是图像特征提取阶段,计算机对提取的图像进行关键的加工处理,从图像中提取物体的客观特征的颜色信息;最后是识别阶段。
茶叶茶汤图像预处理主要有以下几种方法:
1.图像增强。在实际应用中,由于图像在电路传输时所产生噪声影响,或图像光线不足导致的图像灰度过于集中等问题,使得图像质量下降,因此获取的原始图片图像清晰度并不很高,常是模糊的或根本难以看清。为了改善图像质量,在图像分析前对图像进行预处理是不可缺少的。目前在图像预处理所用的改善图像质量的方法常用的有图像增强和图像复原两种。因为本研究对茶汤图像处理的目的是进行分类,所谓的分类是指按照种类、等级或性质分别归类,图像中最能体现某种物体所具有的且与其它种物体不同的属性才能做为分类的依据,而图像增强可以对图像感兴趣的特征进行有选择的突出,衰减不需要的特征,从而减少图像的复杂度,提高图像的可懂性,所以运用图像增强对茶叶茶汤进行图像预处理是最佳选择。
2.图像平滑。在图像预处理时图像平滑是一种可以减少和抑制图像噪声影响的数字图像处理技术[4],是用于突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分的图像处理方法,目的是使图像亮度平缓渐变,减小突变梯度,改善图像质量。图像平滑的方法包括插值方法,线性平滑方法,卷积法等多种方法,而中值滤波是一种常用的非线性平滑技术,在图像处理中,是经典的平滑噪声的方法,它是把邻域图像的像素按灰度进行排序,然后选取该组中间值作为输出像素值,中值滤波器对与周围像素灰度值差别较大的像素不那么敏感,在降噪的同时引起的模糊效应较低。因此运用中值滤波这种非线性的信号处理方法进行图像预处理,它在一定条件下可以克服如最小均方滤波、均值滤波带来的图像细节模糊,而且可以有效的滤除脉冲干扰和图像噪声。它不同于卷积的邻域运算,中值滤波将一个包含奇数个像素的滑动窗口G在图像上移动,将领域中的像素按灰度级排序,取其中间值作为输出像素。
中值滤波的数学描述:
若S为像素(x0,y0)的邻域集合(包含(x0,y0)),(x,y)表示S中的元素,f(x,y)表示(x,y)点的灰度值,|S|表示集合S中元素的个数,Sort表示排序,则对(x0,y0)平滑可以表示为
窗口G可以是方形(m×n),长方形(m×n)或者是十字形等,中值滤波可以表示为:
对于方形与长方形窗口,上式可以表示为:
3.图像直方图均衡化。茶叶茶汤的图像在采集的时候容易受到诸多环境因素的影响,如光线、拍摄角度等,采集到的茶叶图像的品质会有所下降,这样不利于后续的图像处理,因此需要利用计算机,借助一些特殊的图像处理方法来降低这些不良因素的影响,改善图像的质量,提高图像的使用价值。为了改善图像的质量,需要使用直方图修正方法实现图像增强。针对不同的原始图像有各自特点的直方图,通过分析一幅图像的直方图的形状,能判断图像的黑白对比度以及图像的清晰度。如果一幅图像的直方图的效果不能满足需求,就使用直方图均衡化处理对图像做适当的修改,将原始图像的不均衡的直方图变成一幅具有均匀分布的新图像[5],直方图均衡化拓展了像素元素的动态范围,从而达到了使图像清晰的效果。
直方图均衡化的数学描述为:
数字图像中灰度级为γk的像素出现的概率为:
式中N是一幅图像的总像素数,nk为第k级灰度的像素数,γk表示第k个灰度级,P(γk)表示该灰度级出现的概率。对该数字图像进行直方图均衡化时对应的离散形式为:
二、茶汤图像特征提取
茶叶特征选择是茶叶分类的重要前提,要是茶叶特征选择不对,那么对茶叶分类的准确性将产生偏差。
在HIS模型中主要特征参数有3个,分别是茶叶茶汤图像的所有像素点的H、I、S的值,同时分析数据,计算3个分量的平均值和标准差。
通过提取茶汤颜色特征,计算这些数据,比较不同茶汤的颜色特征,实现茶叶的分类。
三、实验
(一)图像截取功能。为了排除图像中无关部分的影响,将样本图像截取有用的部分,使接下来的图像预处理不受背景的无关因素的干扰。图像截取如图2所示。
图2 图像截取
(二)图像预处理模块。图像预处理主是对茶汤图像先进行去噪平滑,排除一些不良因素对图像质量的影响,再进行中值滤波,中值滤波的目的是为了减少图像的噪声,最后还要将图像从RGB 彩色模型转换为更符合人眼感官的HIS模型。图像预处理结果如下:
图3 图像预处理
图像预处理模块代码如下:
%执行RGB转换HIS
num=0.5*((r-g)+(r-b));den=sqrt((r-g).^2+(r-b).^(g-b));
theta=acos(num./(den+eps));%·防止除数为0
H=theta;H(b>g)=2*pi-H(b>g);
H=H/(2*pi); num=min(min(r,g),b);
den=r+g+b;den(den==0)=eps;%·防止除数为0
S=1-3.*num./den;H(S==0)=0;
I=(r+g+b)/3; HIS=cat(3,H,I,S);
(三)图像特征数据提取功能。图像特征数据提取功能是将转换为HIS模型的图像的H分量和S分量的均值和方差计算出来,是后续实现茶叶茶汤的分类重要颜色特征数据。图像特征数据提取模块的截图如图4所示。
图4 图像数据特征提取
通过MATLAB自带的mean2()函数和std2()函数[7]分别计算转换成HIS模式的茶汤图像的H分量和S分量的均值和方差,用于茶叶的分类。模块代码如下所示:
global HIS;
mH=mean2(HIS(:,:,1));%求 H 分量的均值
stdH=std2(HIS(:,:,1));%求 H 分量的方差
mS=mean2(HIS(:,:,2));%求S分量的均值
stdS=std2(HIS(:,:,2));%求 S分量的方差
四、结论
根据图像特征数据提取的颜色特征,通过对比两幅图像的颜色特征,可用于对图像中的茶汤分类。本实验是通过提取H分量和S分量的颜色特征,即求得H分量和S分量的均值和标准差的方法。