APP下载

基于数码摄像的蓝藻识别研究及工程实现

2016-10-21王丽霞马美英许媛等

安徽农业科学 2016年4期
关键词:傅里叶变换

王丽霞 马美英 许媛等

摘要针对近年来我国内陆水体富营养化程度日益严重,导致蓝藻水华大规模爆发的情况,为了简单快速识别蓝藻,结合当前数码摄像技术不断提高的实际,提出并实现了利用高分辨率、高质量的图片对蓝藻的关键特征进行识别的方法。该方法从空间域和频域这两个领域对蓝藻图片进行分析,首先引入色彩空间原理,根据预先所设的蓝藻特征值门限处理图片,提取蓝藻在空间域上的颜色特征;然后利用傅里叶变换把空间域信号变换到频域,并通过带通滤波及高通滤波技术分析蓝藻图片,得到蓝藻在频域上的纹理特征;最后结合这两个不同领域各自的结果交叉识别图片中的蓝藻。试验结果表明,该方法能够正确得到蓝藻图片的颜色特征和纹理特征,通过两个特征能很好地识别蓝藻,取得了较好的效果。

关键词蓝藻识别;颜色特征;傅里叶变换;纹理特征

中图分类号S126文献标识码A文章编号0517-6611(2016)04-304-05

Research and Engineering Realization of Cyanobacteria Identification Based on Digital Photography

WANG Lixia, MA Meiying, XU Yuan, Shao Yubin*(College of Information Engineering and Automation, Kunming University of Science and Technology, Kunming, Yunnan 650000)

AbstractIn recent years, Chinas inland water eutrophication is becoming more and more serious, which results in algal outbreak in large scale. With the improvement of digital photography technology, a method was proposed and realized to identify cyanobacteria better and faster, which makes use of the high resolution and high quality images to identify the key features of cyanobacteria. This method analyzed the images in spatial domain and frequency domain. A spatial color principle was introduced firstly, images were handled according to predetermined Double Eigenvalue Threshold of cyanobacteria to get the color characteristics of spatial domain, and then the signal of spatial domain was transformed to frequency domain by Fourier transform. At the same time, cyanobacteria images were analyzed by bandpass filtering and highpass filtering technology, so as to obtain the texture characteristics on the frequency domain. Finally, the cyanobacteria in the images were identified by the results of the two domains. The experimental results showed that this method could get the color characteristics and texture characteristics from cyanobacteria images accurately, and identify cyanobacteria better by the two characteristics, and the result was satisfactory.

Key wordsCyanobacteria identification; Color characteristics; Fourier transform; Texture characteristics

根據历年湖水检测的数据,国内2/3以上的水质由于不同程度的污染呈现严重的富营养化状态[1],水体富营养化导致蓝藻大面积滋生,最终形成蓝藻水华现象,这也是水体恶化的突出表现[2]。水华现象的形成从根本上来说取决于蓝藻的生物学特性,同时还受污染水体恶化程度、富营养化元素浓度、水体流速及环境变化等影响,严重的水质污染已使蓝藻水华几乎连年爆发,其对大自然的危害程度非常大。

我国湖泊河流众多,水质监测和治理技术通过多年的积累和发展已经逐渐形成了一套行之有效的体系,但仍然不够精确地识别蓝藻。该研究结合当前数码摄像技术不断提高的实际,提出利用高质量图片,提取蓝藻特征,主要包括颜色特征和纹理特征,进而识别蓝藻。对纹理特征的提取方法,各国研究者都进行了广泛的研究,许多纹理特征提取方法也被相继提出,如灰度共生矩阵法(GLCM)、灰度行程长度法(Gray Level Length)、自相关函数法、小波变换法、傅里叶变换法等。该研究主要采用傅里叶变换法提取了蓝藻的纹理特征,针对此项变换在图像处理中的研究十分广泛,并取得了一定成果。 比如Zhou等[3]将图像以8×8的正方形窗口分割,然后对分割后的图像分别采用傅里叶变换变换到频域,在此变换域中,变换后的系数通过相关设置和计算得到其纹理特征;文献[4]中对图像的最大矩形区域进行了傅里叶变换,然而结果得不到图像的全局文体特征。王金满等[5]通过研究木材切片中各种纹理与傅里叶周向谱能量的高、中、低频段的关系,解译出原细胞的规律结构。朱小燕等[6]利用傅里叶变换分析了字体单多间图像及与傅里叶谱分布的关系,建立了粘连文字的判别算法,以及基于傅里叶变换的单字和多字图像的判定准则。Tsai等[7]采用傅里叶功率谱的灰度对砂纸和皮革上的纹理缺陷进行了分析[8]。笔者结合蓝藻识别的关键技术,以Visual Studio作为开发平台,用C#语言进行代码编写,分别根据颜色特征值提取蓝藻、由所选区域确定蓝藻的特征值、根据傅里叶变换分析蓝藻的频域特征、提取蓝藻图像的纹理特征,由此实现了利用高质量图像对蓝藻的识别,为水体中的蓝藻监测提供了更简便的方法。

1蓝藻识别的关键技术

1.1色彩空间描述颜色的空间主要有RGB空间和HSV空间,通过照片识别蓝藻首先是对蓝藻颜色的识别。蓝藻的颜色主要为黄绿色,在RGB空间和HSV空间分别具有不同的表示[9]。

1.1.1 RGB空间。RGB颜色方案将颜色编码为三基色[红(R))、绿(G)、蓝(B)]的混合。它是一个加性颜色系统。起初所有的颜色都为黑色,通过添加基色来形成不同的颜色,可以用公式(1)表示混合后的颜色[10]:

C=R(R)+G(G)+B(B)(1)

通常把RGB的值归一化到区间[0,1],所以最终的颜色形成了一个单位立方体。

根据照片识别蓝藻,这些照片都是在自然条件下拍摄的,因此必须运用相关算法减小光照强度产生的影响,将颜色模型采用归一化颜色分量表示,用来克服光照变化及阴影的影响。

1.1.2HSV模型。HSV色彩空间模型是依据人们辨别颜色的习惯而研究出来的,是一种视觉上的生理模型。在图像处理过程中,有时获取到的图像是基于RGB模型,而分析图像时要用HSV模型,这样就需要R、G、B成分转换为H、S、V。HSV颜色模型的计算公式[11]如下:

SHSV=CrngChigh,Chigh>0

0,其他(2)

VHSV=ChighCmax(3)

其中Chigh、Clow、Crng定义如下:

Chigh=max(R,G,B)

Clow=min(R,G,B)

Crng=Chigh-Clow(4)

当3个RGB分量相等的时候,便是灰度图像。这时Crng=0,饱和度SHSV=0,因此,色调无定义。于是只需计算Crng>0情况下时HHSV的值,首先将各分量归一化:

R′=Chigh-RCrng,G′=Chigh-GCrng,B′=Chigh-BCrng(5)

然后,基于原始颜色分量中的最大值,计算出一个初步的色调H′:

H′=B′-G′,R=Chigh

R′-B′+2,G=Chigh

G′-R′+4,B=Chigh(6)

因为H′的值处在区间[-1,5],通过将其归一化到区间[0,1],然后乘以360,得到最终的色调值范围为0°~360°。

HHSV=16×(H′+6),H′<0

H′,其他(7)

H°HSV=HHSV×360(8)

1.2直方图模块任何一幅图像的直方图都包含了大量的信息,某些类型的图像还可以通过其直方图完全还原出原图。灰度直方图是图像灰度的线性函数,描述的是图像中0~255各个灰度级的个数。灰度直方图的分布函数[12]为h(k)=nk,在直角坐标系中表示,k的取值范围为0~255,表示为在灰度级为k时,图像中所含像素的个数为n。如果是8位灰度图像,k=0,1,…,255。

24位彩色图像每个像素用3个字节表示,每个字节对应着R、G、B分量的亮度(红、绿、蓝),一个字节为8位。R、G、B在计算机中的存储顺序是蓝、绿、红。当R、G、B分量值不同时,表现为彩色图像。为了得到R、G、B的直方图,对整张图片进行扫描,每个像素又对应着R、G、B这3个分量。可分别统计R、G、B所处字节处的分量值,得到RGB直方图。将RGB转换到HSV空间后即可得到HSV的直方图。RGB直方图和HSV直方图获取与保存为蓝藻特征值的提取做好了充分准备。

1.3傅里叶变换任何一幅图像的直方图都包含了大量的信息,某些类型的图像还可以通过其直方图完全还原出原图。不同的图像有可能会有相同的颜色特征值。于是需要用傅里叶变换来研究图像在频域的特征值。傅里叶变换的作用是把空间域信号变换到频域,图像的数据是二维离散数据,则它们的傅里叶变换为离散的。

令f(x,y)表示一幅大小为M×N的图像,x,y是空间域中图像的横、纵坐标轴,其中x=0,1,2,…,M-1;y=0,1,2,…,N-1。f(x,y)的二维离散傅里叶变换可表示为F(u,v)。F(u,v)是频域图像谱[13],通常F(u,v)是两个实频率变量u和v的复值函数,频率u是对应于x轴,频率v是对应于y轴。

F(u,v)=M-1x=0N-1y=0f(x,y)e-j2π(ux/M+vy/N)(9)

其中u=0,1,2,…,M-1;v=0,1,2,…,N-1。离散傅里叶逆变换为:

f(x,y)=1MNM-1u=0N-1v=0F(u,v)ej2π(ux/M+vy/N)(10)

當以上两式成立时,f(x,y)和F(u,v)形成了一个离散傅里叶变换(DFT)对。

傅里叶变换的振幅谱、相位谱和能量谱[14]分别为:

|F(u,v)|=R2(u,v)+I2(u,v)(11)

φ(u,v)=arctan(I(u,v)/R(u,v))(12)

E(u,v)=R2(u,v)+I2(u,v)(13)

其中R(u,v)、I(u,v)分别表示F(u,v)的实部和虚部,P(u,v)=|F(u,v)|2是傅里叶功率谱,又称为能量谱。傅里叶变换具有共轭对称性,即|F(u,v)|=|F(-u,-v)|,也就是频谱分布是以图像原点为对称的。

一幅没有丝毫纹理的光滑平坦图像,其功率谱只有空间频率为0的分量;当图像中的纹理比较粗,也就是颜色的变化周期较大,则在低频段会有较大能量;当纹理比较细,或比较复杂时,则在高频段会有较大能大能量。

傅里叶变换提取图像纹理特征常用的方法是周向谱和径向谱能量法[15],特别是周向谱能量法。它的计算公式为:

P(u,v)=|F(u,v)|2(14)

其值表示空間域频率强度,p(u,v)把用极坐标表示[16],设为p(r,θ),其中:

r=u2+v2,θ=arctan(v/u)(15)

则周向谱能量为p(r)=2πθ=1p(r,θ),即在功率谱中,计算以图像形心为中心的一系列同心圆环内能量的和值(如图1中圆环),通过p(r)可以看到能量强度在不同频率的分布情况。

一般的图像都是长方形,由于u,v与x,y是对应的,又根据傅里叶变换的共轭对称性,则图像功率谱[p(r,θ)]也为相同的长方形,并且以图像的形心为中心。而圆环r=u2+v2与功率谱形状不相似,另外一系列逐渐外扩的圆环(最大圆环与长方形图像短边边界内切,如图1所示)累加后不可能完全把图像功率谱覆盖,所以这种算法得到的傅里叶周向频率分布图不可能真正反映图像的频率特性。而与此图像相似的一系列变大的长方环(如图1中相似长方环),不仅与图像形状相似,而且可以完全覆盖整个长方形的功率谱,所以长方环内的功率谱能量可以反映出图像不同频率成分的能量强度,故此需要将传统的圆环改进成形状相似的长方环。

由于图像大小不一,为了具有可比性,所以该研究采用各个长方环内功率谱能量占整个图像功率谱总能量的百分比作为纹理特征,均匀地把图像功率谱分成M=20个等宽度的长方环,求出每个长方环功率谱占总能量的百分比。设图像大小为L×W,图像中心为(L/2,W/2),则每个长方环内能量百分比为fhi=Ei/Mu=0Nv=0P(u,v)[17]。

离散傅里叶变换的计算量是巨大的。对一幅M×N的图像,它需要M2N2次复数乘法和加法。例如,M=N=512,则需要236=6.9×1010次复数乘法或者加法。

离散傅里叶变换的快速算法——快速傅里叶变换(FFT)在许多年以前就己经被提出,并广泛应用到各个领域。它是利用复指数(WN=e-j2π/N)的对称性和周期性,通过蝶形结来简化运算量的,它的计算复杂度不超过MN×log2MN。

2蓝藻识别试验

2.1功能分析为了提取蓝藻的特征值,该研究选取Visual Studio作为开发平台,用C#语言进行代码编写,分别实现蓝藻的特征值提取的以下4个子功能,并按照以下顺序分析:

(1)根据颜色特征值提取蓝藻。根据设定的HSV门限值,将照片中在门限内的像素部分提取出来显示并计算其面积,并实现对蓝藻的RGB直方图和HSV直方图的统计。

(2)由所选区域确定蓝藻的特征值。在图片中将肉眼可观测到的蓝藻部分用矩形圈出来或着曲线描出来,系统自动分析所选区域的HSV的门限值。

(3)傅里叶变换分析蓝藻的频域特性。将图像经过傅里叶变换到频域后,观察蓝藻的高频、低频、中频等分量和幅度图像。

(4)纹理特征的提取。根据长方环周向谱能量百分比法提取蓝藻图像的纹理特征值。

2.2根据颜色特征值提取蓝藻根据设定的颜色特征值的门限提取出照片中有蓝藻的部分,并计算其面积。为了分析图片中蓝藻部分的各种特征值,得到图片的RGB直方图和HSV直方图。

对现场采集图像数据进行统计的过程中发现,蓝藻污染程度不同使得采集到的图片中的蓝藻区域的色彩特征有所不同,即使同一个蓝藻区域,由于时间、光照强度和角度的不同也会使其色彩特征产生不同,所以综合采样样本,选取显著蓝藻区域的HSV信息之进行统计,根据肉眼观测时对蓝藻色彩的感受,得到蓝藻评估预警经验HSV判定模型值域为:H∈(70°,150°)。此门限值忽略了饱和度和亮度的影响,只根据色调进行蓝藻的初步判断。图2中左边分别为不同程度蓝藻污染的图片,肉眼可直接看出蓝藻污染程度自上而下越来越严重。

结果表明,通过HSV特征值识别蓝藻模块基本能做到对蓝藻有效的识别。

安徽农业科学2016年2.3由所选区域确定蓝藻的特征值上述功能中颜色特征值门限的获取只是大致分析统计了H的数据,观察分析到的HSV门限与蓝藻的门限存在一定差别,接下来在一张图片中将认为是蓝藻的部分用矩形圈出来或用曲线描出来,处理分析所选区域的HSV门限,并根据分析出来的HSV门限计算图片中门限内的面积,得到所有区域的颜色特征值RGB和HSV的值。这里只考虑HSV的门限,分析像素的HSV值,取其最小者为门限的下限,最大者为门限的上限,这样可以获得HSV的门限值,最终根据分析出来的门限值识别图片中的蓝藻。

从图3可以看到,图中矩形区域内的门限值为:H∈(82°,138°),S∈(14%,43%),V∈(48%,82%)。在门限内图像显示区域下方可得到门限为H∈(82°,138°),S∈(14%,43%),V∈(48%,82%)时,门限内像素占整个图像的百分比为97.7%,图4为描点法的显示结果。2.4傅里叶变换分析蓝藻的频域特性空间域和频率域是数字图像处理中两个不同的领域。空间域是指图像平面自身,它是以对图像的像素直接处理为基础的;频率域是以图像的傅里叶变换为基础的。由于以上两个功能只对时间域的蓝藻的颜色进行了分析,通过颜色识别蓝藻,但有些情况,在空间域内表述十分困难,而在频率域内却变得非常简单,如不同的图像会有同的颜色。例如草地、树叶,有可能只通过颜色分析,软件将其视为蓝藻,于是还需要分析蓝藻的频域特性。

将一张图片进行快速傅里叶变换,在进行快速傅里叶变换时,序列的长度一般都是以2为底的整数次幂,即基二算法。首先将图片的大小调整为256×256。该研究采用按频率抽取法进行运算,得到了图片的幅度图像和经过成分滤波后的图像。用该功能模块分析蓝藻和树叶、草地的频谱后,得出树叶和草地的频谱分布比较高。

打开任意一张图片并执行FFT处理,结果见图5。

由图6a和b能明显看出,树叶和蓝藻的频域分布是不同的。

2.5纹理特征的提取接下来对图像进行纹理分析,此功能主要使用长方环傅里叶周向谱能量百分比算法,均匀地把图像功率谱分成20个等间距同心长方环,然后计算每一个长方环内功率谱能量占总能量的比值作为图像频率分布特征。图像FFT变换后得到以图像中心为形心的频谱图像,由公式P(u,v)=|F(u,v)|2可得到图像的功率谱,计算整个图像的功率谱总能量EA。将图像功率谱分为等间距的20个同心长方环,分别计算每个长方环中的功率谱能量E[i]。然后计算每一个长方环内功率谱能量占总能量的比值p作为图像频率分布特征。

对具有相同颜色特征值的草地、树叶和蓝藻进行纹理的对比。先将这3种图像先经过颜色特征的提取,结果见图7,左半边分别为草地、树叶、蓝藻的原图,右半边分别为经过颜色特征值提取后所对应的图片。

从图7可看出,这3种图片只经过颜色特征值的门限处理后,并没有将上述3张图片完全区分开来,未达到识别蓝藻的效果。然后对经过颜色特征提取后的图像继续进行纹理特征的提取,结果分别如图8~10所示。

图8~10分别为草地、树叶、蓝藻原图、FFT变换图及其频率分布,从纹理特征值的结果可明显看出,蓝藻的频域分布主要集中于低频,而树叶和草地的频域分布主要集中在中间的频域部分。

3结语

该研究提出一种利用蓝藻高质量图片进行特征值提取的简单方法,实现了对蓝藻的识别,将RGB模型和HIS模型配合使用,获得RGB图像和HSV直方图。根据蓝藻颜色特征值HSV的门限参数的设置处理图像后,得到目标图像的边缘和区域,以此来提取蓝藻空间域的特征值,再对有相似颜色特征的图片以及不同程度的蓝藻污染,采用傅里叶变换来分析其纹理差别,以此来提取蓝藻在频域的特征值。在实证中,对多种不同图片进行了分析,结合提取出的颜色特征和纹理特征,能够识别出图中的蓝藻,以此验证了该方法的可行性,基本达到了预期目标,但仍然存在一些问题。如何提高特征提取的精确度,以便更好地满足蓝藻识别的准确性和高效性,还有待进一步研究。

参考文献

[1] 刘文杰.内陆湖泊蓝藻水华的遥感监测与评价研究[D].北京:中国地质大学,2013:1-3.

[2] 周立國,冯学智,王春红.太湖蓝藻水华的MODIS卫星监测[J].湖泊科学,2008,20(2):203-207.

[3] ZHOU F F,SHI J Q.Texture feature based on local Fourier transform[J].IEEE international conference on imageprocessing,2001,17(2):610-613.

[4] CASTALMAN K R.Digital image processing[M].NY:Prentice Hall,1998.

[5] 王金满,曲艳杰,李坚.傅里叶变换图像方法在木材解剖特征研究上的应用[J].四川农业大学学报,1998,16(1):177-181.

[6] 朱小燕,王松.傅里叶变换在粘连文字图像切分中的应用[[J].计算机学报,1999,22(12):1246-1252.

[7] TSAI D M,HUANG T Y.Automated surface inspection for statistical textures[J].Image and vision computing,2003,21(4):307-323.

[8] CONNERS R,HARLOW C.A theoretical comparison of texture algorithms[J].IEEE transactions on pattern analysis and machine intelligence,1980,2(4):204-222.

[9] 孙燮华.数字图像处理:Visual C#.NET编程与实验[M].北京:机械工业出版社,2010:30-150.

[10] 田玉敏,林高全.基于颜色特征的图像检索[J].西安电子科技大学学报,2002,2(1):43-46.

[11] LIAPIS S,TZIRITAS G.Color and texture image retrieval using chromaticity histograms and wavelet frames[J].IEEE transactions on multimedia,2004,6(5):676-686.

[12] 赵春江.C#数字图像处理算法典型实例[M].北京:人民邮电出版社,2009:24-178.

[13] 章毓晋.图象工程(上册):图象分析与处理[M].北京:清华大学出版社,1999:231-241.

[14] REED T R,HANS J M,DU BUF.A review of recent texture segmentation and feature extraction techniques[J].Computer vsion,graphics and image processing,1993, 57(5):359-372.

[15] FURHT B,SMOLIAR S W,ZHANG H J.Video and image processing in multimedia systems[J].Boston:Kluwer Academinc Publishers,1995:226-270.

[16] CHANG S K,HSU A.Image information systems:Where we go from here[J].IEEE trans on knowledge and data engineering,1992,4(5):431-442.

[17] 周云龙,范振儒,苏耀雷.基于图像傅里叶变换纹理特征和概率神经网络的气固流化床流型识别[J].化工自动及仪表,2009,36(2):38-42.

猜你喜欢

傅里叶变换
一种新型油介质损耗测试系统研究
转动光谱学与微波光谱技术研究进展
多采样率信号处理的发展