柑橘叶面病害监测颜色空间改进算法研究
2019-12-22张建敏于冬雪
张建敏,于冬雪
(贵州大学 a.机械工程学院;b.大数据与信息工程学院,贵阳 550025)
0 引言
柑橘病害必然引起叶面、茎秆等颜色的改变。现有的图像检索技术大多是以图像的颜色、形状、纹理为特征,获取精确度较高的目标图像,这给图像检索带来巨大的压力,直接影响信息的有效获取。因此,对于柑橘叶面病害的图像检索的研究是非常有价值的[1]。
国内外在柑橘叶面病害图像检索中以颜色为特征进行描述主要分为两类:以全局颜色为特征和以局部颜色为特征,这两种方法在病害图像中有效性非常高,但对于不同的应用场景和检索需求,采用不同的方法产生的检索效果不同[2]。
常见的RGB彩色空间采用红、绿、蓝3种人眼感知的基色来表示。其优点是可以很好地运用到显示器设备中,缺点是不能够充分说明人眼识别颜色的实际过程[3]。
孟赛尔(Munsell)在1939年提出HSV颜色空间的概念;A.R.Smith在1978年建立了HSV颜色空间,也称六角锥体模型(HexconeModel)。此后,HSV颜色空间开始了蓬勃发展。HSV颜色空间的颜色直观特性要素为色调H(Hue)、饱和度S(Saturation)和亮度V(Value),3个分量相互独立,更接近人眼对色彩的主观感受,可以更加容易、方便地处理图像的信息。从20世纪70年代开始,有人就开始研究基于文本的图像检索技术(Text-based Image Retrieval,TBIR),利用文本描述的方式描述图像的特征。到20世纪90年代以后,出现了基于内容的图像检索(Content-based Image Retrieval,CBIR),以图像的颜色、纹理、形状等分析的检索图像技术。张凯兵利用HSV颜色直方图SUV分类器实现不同缺素油菜叶片图像的分类识别[4];王长斌提出了一种基于云计算农作物病虫害多源遥感数据挖掘框架[5];濮永仙研究了烟草病斑的颜色、形状及纹理特征病害图像检索[6]。
本文主要研究以全局颜色为特征利用HSV颜色直方图非均匀量化空间改进算法对其进行检测,并且在柑橘叶面病害监测的应用方面进行了实现。传统方案是将HSV颜色空间非均匀量化成(8:3:3)72 bin的颜色矢量的算法。与传统方案相比,本实验的全局颜色特征HSV颜色直方图算法(以下称改进算法)在保证算法运行的速度较快的情况下,提高了算法的精确度,有利于准确监测柑橘叶面病虫害及实现现代农业的科技化管理[7]。
1 柑橘病害颜色特征提取HSV直方图改进算法
本文的改进算法是基于内容的图像检索系统(CBIR)的一种。经过统计柑橘病害图像的每一种颜色分量,统计叶面病害图像中的各像素点所占比例,再经过归一量化,可获得颜色在图像中出现的概率,最终获得对应的HSV颜色直方图。这种方法可以简单直观地对柑橘病害进行检索,即使图像分割困难或者不知道图像的空间位置信息,用颜色直方图这一方法都可以将病害图像的颜色特征非常便捷、有效地表示出来。
1.1 柑橘病害颜色特征提取HSV改进量化方案
传统的柑橘病害颜色空间非均匀(8:3:3)量化方案是将H(色调)、S(饱和度)、V(亮度)对应分成8、3、3份的比例[8],而这3个颜色分量可用一维矢量来表示,从而可得到8×3×3=72bin的颜色矢量如下公式所示。
本文对(8:3:3)矢量量化方案进行改进,形成(16:4:4)的矢量量化方案,(16:4:4)量化方案和(8:3:3)量化方案相比较,颜色的辨别能力较强,对图像的颜色区域范围划分的更细致,更符合人的视觉特征。由于在项目的多媒体素材库中储存着很多精度很高、颜色丰富的图片和视频片断,为了满足项目中对高检索精度的需求,本文对柑橘病害颜色特征检索采用的是(16:4:4)颜色矢量量化方案,如下公式所示。
1.2 柑橘病害颜色特征提取HSV直方图改进算法流程
1)假设1幅柑橘叶面图像I[M,N],颜色直方图可由以下公式计算得出,即
式中M—图像的长;
N—图像的宽;
a(m,n)—(m,n)像素点上的颜色统计值;
p(i)—第i个颜色分量的值(0~255)。
假设一幅柑橘病害图像G,L表示它的颜色级数范围,则每一种颜色qK(K=1,2,...,L)在图像中出现的频数可以记为
h(qK)=nK/n
式中qK—柑橘病害图像G中某一颜色的值;
L—病害图像的颜色级数范围;
nK—病害图像中具有颜色值为qK的像素数;
n—病害图像中图像像素的总数。
则统计柑橘病害图像G中的所有像素得到图像G的HSV颜色直方图,从而获得各颜色出现的频数h(q1)、h(q2)、...h(qK)、...、h(qL),可以用以下公式表示,即
H={〈h(q1),h(q2),...h(qK),...,h(qL)〉|
2)本文选择HSV颜色空间模型,经过(16:4:4)颜色量化方案量化后可获得256 bin颜色分量。假设给出一幅图像,可以由3个独立的H、S、V一维直方图统计而出[9]。为了计算简便,本文将柑橘病害的颜色特征量化后的各H、S、V分量加权合成为一维矢量直方图,由如下公式表示,即
Z=DHQSQV+DSQV+DV
式中DH—病害图像中H分量量化后的数值;
DS—病害图像中S分量量化后的数值;
DV—病害图像中V分量量化后的数值;
QS—病害图像中S分量量化级数范围;
QV—病害图像中V分量量化级数范围。
此公式实际上是将柑橘病害图像色调H的权重为QS×QV=4×4,柑橘病害图像饱和度的权重为QV,图像亮度的权重为1。以上公式可以化简为
Z=16H+4S+V
由上式可以看出:为了减少检索结果中柑橘病害图像的亮度V和饱和度S的影响,尤其突出色调H对病害图像的影响,需对色调不同的柑橘病害图像进行有效的区分,进而通过充分利用图像的颜色信息满足对其病害检索的要求。
3)计算柑橘病害图像的相似度[10]。假如查询病害图像的直方图特征矢量为(q0,q1,...qL),自制数据库中病害图像的直方图特征矢量为(s0,s1,...sL),则本文通过利用欧氏距离来计算病害图像相似性度量公式为
式中qt、st—特征矢量归一化的值;
L—一维直方图颜色特征矢量维数范围。
经过将其归一化处理后,柑橘病害图像直方图的相似度为
4)通过比较原算法和改进算法在柑橘病害图像的检索中查全率和查准率的高低,来表明算法的有效性。其中,对柑橘病害图像查准率和查全率越高的算法,其检索算法越好,则
2 实验结果及分析
本研究选取100幅各种病害的柑橘叶面病斑图像作为测试库来进行实验,主要以jpg和png格式为主[11]。随机抽取12幅不同病害的图像作为查询图像(测试图像包含12幅查询图像)来进行实验,其算法流程通过MatLab R2013a软件平台来实现(以图库中1.png为例),如图1所示。
图1 1.png原始图像及其HSV分量图Fig.1 The Original Image of 1.png and its Hue、Saturation and Value Component Image
图1为1.png原始图像及其HSV分量图。图1(a)为原始图像,图1(b)为图像的色调图(H分量图),图1(c)为图像的饱和度(S分量图),图1(d)为图像的亮度(V分量)。
图2为(8:3:3)传统方案和(16:4:4)改进方案图像的HSV颜色直方图对比。图2(a)为(8:3:3)传统方案图像的HSV颜色直方图,图2(b)为(16:4:4)改进方案图像的HSV颜色直方图[12]。HSV直方图的横坐标为图像的颜色分量,纵坐标为颜色分量值。由图2可知:(16:4:4)方案的HSV颜色直方图更细化,颜色分量更丰富。因此,本文采用的HSV非均匀量化(16:4:4)256 bin这一改进方法的改进量化方案更为有效。
图2 (8:3:3)传统量化方案和(16:4:4)改进量化方案的HSV颜色直方图对比Fig. 2 The comparison of (8:3:3)Traditional quantitative plan drawing and (16:4:4) Improved quantitative plan drawing of HSV Color Histogram Distribution
图3为(8:3:3)传统方案应用在柑橘病虫害检索的结果图。选取1张柑橘病害检索图像(图库中9.jpg),应用传统检索算法,检索框里将按相似度从近到远的顺序排列出8幅病害图像。由检索结果可看出:图中出现扰乱图像西瓜和柑橘,检索结果不理想。
图3 (8:3:3)图像检索结果Fig.3 (8:3:3)Image retrieval results
图4为本实验的全局颜色特征改进算法所做的柑橘病害检索出的8幅病害图像。由检索结果可看出:图中按照检索图像的原图像相似性从高到低排列出来,检索结果较精确。
图4 (16:4:4)图像检索结果Fig.4 (16:4:4)Image retrieval results
对比以上两种非均匀量化方案检索得出的结果可知:本研究改进算法(16:4:4)比传统算法(8:3:3)的量化方案检索结果精确度要高,且图像的排列相似程度更高。所以,用本文的(16:4:4)的量化方案足够证明柑橘叶面病害检测检索精度的精确性。
图5 原始方案与改进方案查准率和查全率的对比Fig.5 The original algorithm’s recall rate and precision rate compared with the improved algorithm
实验采用10次实验的平均值作为最终结果,将柑橘病害图像中的10幅查询图像进行检索,并将所获得的平均值用来计算实验的查准率和查全率[13]。图5为原始方案与改进方案查准率和查全率的对比。图5(a)为原始方案与改进方案在柑橘病害监测方面查准率的对比,图5(b)为原始方案与改进方案在柑橘病害监测方面查全率的对比。图形中的12对柱形图为12种柑橘病害,实心柱形图为原始方案检索,空心柱形图为改进方案检索,纵坐标为各柑橘病害的查准率和查全率。由结果可以看出:与HSV非均匀量化(8:3:3)方案相比较,本文的HSV非均匀量化(16:4:4)方案颜色直方图改进算法在保证检索效率的同时,在柑橘病害特征检索中效果突出,对叶面病虫害的监测更准确。
本文采用的改进算法能够在一定程度上更细致的体现颜色变化过程及程度,因此更能体现图片间的区别,提高了检索性能。
3 结论
1)以柑橘叶面常见病害(如疮痂病、粉虱类病、黑刺粉虱病、黄龙病、介类病、溃疡病、木虱病、潜叶蛾病、全爪螨病、炭疽类病、锈壁虱病、蚜虫病等)病斑图像为研究对象,重点研究了基于HSV颜色非均匀量化空间的柑橘病害图像检索改进算法技术[14]。将传统的HSV颜色空间非均匀量化(8:3:3)方案与实验最终采用的HSV非均匀量化(16:4:4)方案对比,发现(16:4:4)方案更准确、直观和高效,更能细致地体现柑橘病害颜色特征,更能明显地反映病害图像全局特征。该方案将H、S、V三维向量归一化成一维向量直方图,可简便计算图像间的相似度距离及按相似性从近到远检索出循环结果。通过使用这种方案,提取柑橘叶面图像的病斑颜色信息来反映病害,能够判断出病害属于哪种并采取有效防治。
2)实验表明:本方法可以对柑橘叶子常见的病害(如疮痂病、粉虱类病、黑刺粉虱病、黄龙病、介类病、溃疡病、木虱病、潜叶蛾病、全爪螨病、炭疽类病、锈壁虱病、蚜虫病等)通过图像检索的方式来诊断;但在对于实际应用中,由于柑橘的外界环境的变化,各种病害也不尽相同。所以,仍需要逐渐加强研究柑橘叶面病害及种类,扩充病害图像的采样库[15]。