基于纹理特征的地基云分类识别研究
2014-12-14李含光
李含光,王 琦
(南京信息工程大学计算机与软件学院,江苏南京210044)
0 引言
云的形成和变化不仅反映了当时大气的运动、稳定程度和水汽状况,也是预示未来天气变化的重要征兆之一[1]。对卫星云图的分类识别主要采用统计模式法和结构法,统计模式法是对卫星云图像模式的统计特征进行提取,并对这些特征值集合进行识别;统计结构法是选取图像的结构特征基元,把这些基元按一定的规则进行组织、排列来实现分类识别。利用这些方法对卫星云图的分类识别,都取得了较好的效果[2]。由于地基云观测具有成本低、易操作、简单直观以及对局部地区天气指导性强等优势,逐渐成为研究的热点。但由于受到获取图像设备的限制,目前取得的研究成果有限,主要靠人工目测和经验分析为主,具有很大的局限性。Singh等[2]对地基云图自动识别进行了研究。通过纹理特征提取的方法来对图像进行纹理特征的提取,使用了k最近邻和神经网络作为分类器来对不同的云类进行分类。TIAN B等 提取了卫星云图中红外和可见光两通道的纹理特征和频域,利用神经网络对云团进行了分类。CALBO等[4]利用位于不同地区的TSI和WSC仪器收集到的数据对晴空、积状云、层状云、卷状云、波状云这5类不同的天空状况进行了分类。虽然,目前地基云分类识别的研究取得了一定的成绩,但是也存在识别率较低等问题,本文在研究了目前地基云识别已有的成果上,分析得出,一般可以通过纹理提取的方法提取图像纹理特征,然后,利用图像纹理特征构成特征向量,实现对地基云图的分类和识别。通过对地基云云图云状的分析与研究,提出用Gabor变换对地基云图像的纹理特征进行分析,获得能够最有效地表示云图云状的纹理特征。然后,应用这些纹理特征,利用最短距离来构造陀螺分类器,采用BP神经网络进行分类样本训练,用陀螺分类器实现对地基云的分类识别。
1 地基云图像纹理特征的Gabor小波变换
图像纹理是一种重要的视觉手段,使图像普遍存在而又难以准确描述的特征。纹理分析一直是计算机视觉、图像处理、图像检索等领域的研究热点,一般通过对图像纹理特征的处理实现对图像的分析。因此,如何提取图像特征就成为解决问题的关键,目前采取的主要方法有自相关法、LAW能量法以及灰度共生矩阵法等[2]。由于地基云具有不规则性,并且存在过渡云和边界消融等特征,上述方法取得的效果普遍较差,而Gabor小波变换利用其自身具有多方向的分析能力,在空间分布和方向上有很强的特性,具有很好的时域和频域分辨能力,非常适用于图像特征提取[5],因此,采用Gabor小波变换来提取地基云图纹理特征是不错的选择。
1.1 Gabor小波
Gabor小波是一种功能强大的纹理分析工具[6-8],二维 Gabor滤波器与哺乳动物视觉皮层简单细胞二维感受剖面非常相似,因此,Gabor小波变换在图像纹理分析上具有独特的优势,Gabor小波的核函数定义为
(1)式中:φμ,v(z)是 Gabor小波的核函数;kμ,ν表示波向量,μ和ν分别表示波向量的方向和波长;z=(x,y)为图像坐标函数;运算符‖·‖则表示标准的运算操作。kμ,ν定义为
(2)式中:kν=kmax/fν,kmax表示最高频率的带通滤波器中心频率,f是频率域中核函数的间隔因子[9];Φμ=πμ/8。
在(1)式中的小波核心可以由波向量kμ,ν生成。模‖k‖控制高斯窗口的宽度以及正弦波的波长;Φ可以控制滤波器的方向,改变Φ可以进行滤波器的旋转,σ定义了高斯窗口宽和波长的比。
1.2 地基云图的Gabor小波特征提取
对于一幅大小为I(z)的地基云图像,进行M个尺度、N个方向上Gabor小波变换可得到在不同方向和尺度上能量信息。
(3)式中,Xμ,ν(z)表示在尺度 ν方向 μ 上 Gabor核函数的卷积结果。地基云图像在5个尺度(5个像素单位)和8 个方向(0°,45°,90°,135°,180°,225°,270°,315°)上卷积结果如图1 所示。
图1 地基云图像卷积结果Fig.1 Convolution results of a ground nephogram
虽然Xμ,ν(z)能有效地表示地基云的纹理特征,但易造成较高的分类误差。因此,这里采用能量均值Pμ,ν(z)和标准方差 Qμ,ν(z)作为纹理特征,则更能达到较高分类准确率的目的。尺寸为M×N图像I(z)的均值和标准方差为
用T表示图像I(z)的纹理特征向量,则T可以表示为
为了增强该纹理特征向量在图像特征表示中的鲁棒性和抗噪声性以及后期数据处理,将能量信息在纹理特征向量中的元素按从大到小的顺序排列。假设在μ1方向和ν1尺度具有最大能量,在μ2方向和ν2尺度上具有次大能量,则T可以修改为
2 基于BP神经网络的陀螺分类器
BP神经网络包含了前向传播训练和反向传播连接权值修正的过程,具有很强的识别和分类能力[10]。前向神经网络学习训练的误差反向传播算法解决了多层网络中隐含层神经连接权值的学习问题。将提取的地基云图的纹理特征向量作为BP神经网络的输入,利用中国云图库中的标准云图结合气象站实际地基云图数据作为训练样本,得到BP神经网络分类器。为了提高解决方案的效率和分类精度,提出将多个BP神经网络并联,类似陀螺的分类器,该分类器的主要思想就是通过在学习和泛化中使用距离作为目标函数来实现,分类器中的一个网络代表一个类,这样就能使得一个网络对应一个类。对一个未知模式进行分类就是选取最适合它的一个网络模型,使两者之间具有最小差别。陀螺分类器的优势在于只需要计算全部类数目的距离,与学习数据大小无关[11]。对于N类不同的地基云图像,把提取的图像特征组成特征矩阵,对应的期望输出为一个N×N的矩阵T,T的每一行代表所要分类的某类地基云,其分类实现的主要过程如下。
1)训练得到BP神经网络分类器neti。
2)设待分类地基云图像数据为P,将P输入分类器,计算出BP神经网络分类器的输出矩阵A,输出矩阵A的计算公式为
3)计算输出矩阵A中的最大元素Am=max[A1,A2,A3,A4,…,AN]。
4)输出矩阵 A 位于第m(m∈(1,2,3,4,…,N))列,那么根据Am就可以得出,分类结果就是在期望输出矩阵T的第m行所表示的那类云上。图2为陀螺分类器的结构图。
图2 陀螺分类器结构Fig.2 Structure of gyro classifier
3 实验与分析
为了验证本文中的方法在地基云图分类识别中的效果,实验采用经人工精确判别过的地基云图像作为训练样本,这些样本来自于气象站和《中国云图》数据集等,并且这些图片都是经过灰度化处理的尺寸为18×27像素的图像。
1)将采集到的地基云图样本图例进行适当的灰度化、裁剪等预处理,形成统一的样本库。
2)使用Gabor小波变换提取实验样本的纹理特征,作为该类地基云图的分类识别特征参数。在Gabor小波提取纹理特征时尺度的选择很重要。过大了不能很好地体现图像的局部特性,过小了又容易受噪声影响。
3)定义一个矩阵 F,F[1]存储特征向量 T,F[2]存储分类信息。在实验中,地基云图样本的预期输出为0.9。将F作为BP神经网络的输入输出,进行训练。训练过程中,样本相互之间形成正样本与负样本,例如浓积云为正样本时,其他4类云样本为负样本,以此类推。如图3所示。
图3 神经网络输入输出Fig.3 Input and Output of Neural Network
由此可以得到,具有较强分类能力的神经网络,并以此作为各个地基云图云类的分类依据。经过多次的测试训练,实验中训练函数采用尺度共轭梯度法(scaled conjugate gradient,SCG),训练精度要求为0.001。
4)训练完成后,使用此BP神经网络构成的陀螺分类器来检测未知样本的云类。
针对步骤2)所面临的问题,处理数字图像的Gabor小波通常在当参数σ=2π,kmax=π/2和f=的条件下在5个尺度ν∈{0,…,4}和8个方向μ∈{0°,…,315°}上进行采样。为了获得理想的实验参数,共进行了4次比较试验,每次实验都是在其他条件不变的情况下,分别选取3个尺度、4个方向(3S4D);3个尺度、12个方向(3S12D);5个尺度、8个方向(5S8D);9个尺度、4个方向(9S4D);9个尺度、12个方向(9S12D),共5个有比较意义的参数,得出分类正确率,实验统计结果如表1所示。其中,选取的5个尺度、8个方向的实验参数获得了最好的实验结果。这里选取在5个尺度ν∈{0,…,4}和8个方向μ∈{0,…,7}上提取地基云图的特征向量T。
表1 不同尺度和方向下的实验结果Tab.1 Experiment results with different scales and directions
本实验的对象主要是5类常见的云:浓积云、积雨云、雨层云、透光高层云、卷积云。训练过程中使用浓积云等5类云各200幅图片,共1 000幅作为整个实验的训练样本。
按照上述实验方案,把收集到的训练样本输入,得到图像纹理特征矩阵F,数据分布如图4所示。将矩阵F应用到神经网络训练中,训练神经网络。神经网络训练误差曲线如图5所示。最后,可将训练完成的网络应用于地基云图的分类。
图4 纹理特征数据分布Fig.4 Distribution of texture feature data
本实验方案中提出了将神经网络并联形成陀螺分类器的思想,在同等条件下提高了单独使用BP神经网络分类器的准确率。BP神经网络训练完成之后,用训练好的神经网络进行分类,输入5类云图各50幅进行分类实验,根据神经网络分类输出,得出分类结果统计如图6所示。图6中,每部分中的5个数据统计表示输入的50幅该类云图样本最终得到的分类结果统计,如第1部分表示输入50幅浓积云图,分类得到了41个浓积云分类结果、2个积雨云分类结果、3个雨层云分类结果、1个透光高层云分类结果、3个卷积云分类结果。
图5 神经网络训练误差曲线图Fig.5 Error graph of BPNN training
图6 实验结果统计图Fig.6 Statistic diagram of experimental result
图6中,浓积云分类的正确率为82%;积雨云分类的正确率为78%;雨层云分类的正确率为78%;透光高层云分类的正确率为80%;卷积云分类的正确率为76%;平均正确率达到了78.8%。前文中提到Singh等和Calbo等人也对地基云分类作了相关的研究,并取得了一定的研究成果。从实验结果分类正确率上来看,本方案较优于前两者的方案。但是在3种实验方案中,实验样本并不一致,这可能会导致实验结果有所偏差,所以,将Singh和Calbo 2个人的实验方案结合本文中的实验数据进行实验,平均分类准确率统计图7所示。
从图6和图7中看出,本文提出的方案不仅能有效地应用于地基云图分类,而且取得的效果也是比较理想的,相比以往分类方案的正确率要高出10%~20%。
图7 3种方案正确率比对Fig.7 Comparation of three schemes
但是,同时从图6和图7中看出,实验中出现了部分判断错误的情况,造成判断错误的原因是多因素的。首先,实验样本数量有限,描述不够精细,而且还受到成像设备的局限性、太阳光照、能见度等影响,部分样本的清晰度不高,对某一类云的形态的概括性不强,导致标准特征参数不够全面,在分类的过程中产生了一些误差。然后,在对未知样本进行分类识别的过程中,如果未知样本图片像素较高,整个识别过程时间花费较大。
4 总结
将图像处理、模式识别等技术应用于地基云图像的分类识别中,从实验结果来看,文章提出的方法取得了较好的效果,具有较高的实用价值。同时,在未来的研究过程中,可以从扩大实验样本,提高样本精度,优化特征提取算法、提高识别效率等方面进行改进与完善。另外,实验研究表明,在使用Gabor小波提取纹理特征时,正确的参数选取在特征向量形成中起了至关重要的作用,这也是今后研究的一个重点。
[1]杨俊,吕伟涛,马颖,等.基于自适应阈值的地基云自动检测方法[J]. 应用气象学报,2009,20(006):713-721.YANG Jun,LV Weitao,MA Yin,et al.An automatic ground-based cloud detection method based on adaptive threshold[J].Journal of applied meteorological science,2009,20(006):713-721.
[2]SINGH M,GLENNEN M.Automated ground-based cloud recognition[J].Pattern Analysis & Applications,2005,8(3):258-271.
[3]TIAN B,SHAIKH M A,AZIMI-SADJADI M R,et al.A study of cloud classification with neural networks using spectral and textural features[J].Neural Networks,IEEE Transactions on,1999,10(1):138-151.
[4]CALBO J,SABBURG J.Feature extraction from wholesky ground-based images for cloud-type recognition[J].Journal of Atmospheric and Oceanic Technology,2008,25(1):3-14.
[5]MUTELO R M,WOO W L,DLAY S S.Discriminant analysis of the two-dimensional Gabor features for face recognition[J].IET Computer Vision,2008,2(2):37-49.
[6]曹林,王东峰,刘小军,等.基于二维Gabor小波的人脸识别算法[J].电子与信息学报,2006,28(3):490-494.CAO Lin,WANG Dongfeng,LIU Xiaojun,et al.Face recognition based on two-dimensional Gabor wavelets[J].Journal of electronics& information technology,2006,28(3):490-494.
[7]张刚,马宗民.一种采用Gabor小波的纹理特征提取方法[J].中国图像图形学报,2010,15(002):247-254.ZHANG Gang,MA Zhongmin.An approach of using Gabor wavelets for texture feature extraction[J].Journal of image and graphics,2010,15(002):247-254.
[8]罗亮,金文标,龚勋.基于Gabor小波和支持向量机的人脸识别[J].重庆邮电大学学报:自然科学版,2008,20(2):230-235.LUO Liang,JIN Wenbiao,GONG Xun.Face recognition based on Gabor wavelet and support vector machine[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2008,20(2):230-235.
[9]何源,罗予频,胡东成.基于测地线活动区域模型的非监督式纹理分割[J].软件学报,2007,18(3):592-599.HE Yuan,LUO Yupin,HU Dongcheng.Unsupervised texture segmentation based on geodesic active regions[J].Journal of software,2007,18(3):592-599.
[10]陈美,朱琦.基于改进神经网络的自动调制识别研究[J].重庆邮电大学学报:自然科学版,2009,21(6):764-770.CHEN Mei,ZHU Qi.Research on automatic modulation recognition based on improved neural network[J].Journal of Chongqing University of Posts and Telecommunications:Natural Science Edition,2009,21(6):764-770.
[11]SCHWENK H,MILGRAM M.Constraint tangent distance for on-line character recognition[C]//13th International Conference on Pattern Recognition(ICPR’96).Vienra,Austria:IEEE Press,1996,4:520-524.