APP下载

基于小波变换和K-means算法的遥感影像分类

2016-05-05纵清华王志宇过仲阳

关键词:小波纹理聚类

纵清华,王志宇,过仲阳,马 品

(华东师范大学地理科学学院,上海 200241)

基于小波变换和K-means算法的遥感影像分类

纵清华,王志宇,过仲阳,马 品

(华东师范大学地理科学学院,上海 200241)

在研究K均值聚类算法的基础上,采用小波变换辅助K均值算法对遥感影像进行分类,以此提高遥感影像的分类精度.以云南省玉溪市抚仙湖附近地区作为研究区,结合研究区的具体情况,根据查维茨最佳指数因子法OIF计算得到遥感影像的最佳波段组合,并通过对各类地物的样本图像和遥感影像进行二维小波分解,得出样本特征向量;然后利用K均值算法结合样本特征向量对遥感影像进行分类,得到分类结果并进行精度验证.再与单纯采用K均值算法的分类结果进行对比分析,结果表明:其总体精度和Kappa 系数分别达到 83.74%、0.7753,比单纯采用K-means算法分别高出14.26%、0.1697,尤其是林地、裸地和农田的分类精度得到了显著提高.

遥感影像分类;小波变换;K均值算法

0 前言

遥感影像分类一直是遥感研究领域的重要内容,如何在解决多类别图像分类的同时满足一定的精度,是遥感图像处理研究中的一个关键问题,具有十分重要的意义.在计算机视觉研究领域,纹理是描述图像的一个重要特征,而且随着对高分辨率卫星的探索与应用,遥感影像的空间分辨率在不断提升,地物的内部结构也更加清晰,使遥感影像中的纹理信息更加明显、更加丰富[1].以往仅仅依靠地物的光谱信息进行分类时会出现很多误分和错分,因此为了提高遥感影像的分类精度,可将纹理信息作为扩展的特征向量加入特征空间中[2].

2004年李峰提出了一种基于多进制小波变换的纹理特征提取方法[3],通过对小波系数的标准差作为纹理测度以生成特征向量,利用C均值聚类算法进行纹理分割;他利用小波变换提取出遥感影像的纹理信息,进行遥感影像的分类.1967年J.B.MacQueen提出K-means算法[4],并且直到目前为止,它都是科学和工业应用诸多聚类算法中一种极有影响的算法,同时也是模式识别中的经典算法.K-Means算法是一种以平均值作为聚类中心的分割聚类方法,以其简单的算法思想、较快的聚类速度和良好的聚类效果得到了广泛的应用.

对遥感影像进行小波变换,得到的高频小波可以用作精细信息的表述,而低频小波可以用作为全局的近似表述.通过小波变换能够获得遥感影像的全局和精细特征,对提高遥感影像的分类精度有很大帮助.同时K-means算法计算简单高效、动态聚类、自适应性比较强,能够得到很好的聚类效果.

1 研究方法

1.1 技术路线简介

图1 技术路线图Fig. 1 Technique flow charts

本文技术路线如图1 所示,首先对原始遥感影像进行预处理(包括几何精校正、影像配准与裁剪、辐射校正),再结合研究区域的具体情况,根据查维茨最佳指数因子法OIF计算得到遥感影像的最佳波段组合.然后通过对各类地物的样本图像进行二维小波分解,并分别重构分解得到高频和低频部分,将所有重构图像切分成大小为N*N的若干子块,通过计算每一子块的统计特征,得出样本特征向量.再利用K-Means算法结合样本特征向量对所有子块进行聚类,得到分类结果,并进行精度评价.

1.2 基于小波变换的特征提取

1.2.1 小波变换

小波变换(Wavelet transform WT)是当前应用数学和工程科学中一个迅速发展的领域,沿用图像变换的概念,强调图像信号在不同值域间的变换,即图像多尺度分解[5].小波变换的过程是频率窗和时间窗都可以改变并且小波形状可变但其窗口大小固定不变的时频局部化分析方法,其被誉为信号分析中的“放大镜”和“显微镜”.小波变换通过对信号进行多尺度细化分析,可将图像分解为不同尺度的近似分量和细节分量,并可持续分解当前层的近似分量,直到某个条件不满足为止.这种特性有利于在不同尺度层提取图像特征,或聚焦到感兴趣的任意细节.

相应的小波分解公式为:

对图像进行小波分解可将其分为小波近似与小波细节(水平细节、垂直细节、斜线细节)之和[6].

1.2.2 特征提取

进行遥感影像分类时,为了尽量将所有同类地物归为一类,同时避免特征值相近的非同类地物的干扰,这对提取特征值提出了很高的挑战.小波变换中的关键点就在于母小波的选择,本文中我们选择的母小波是比较常见和基本的母小波函数Daubechies1小波.Daubechies1小波是双正交小波函数,支撑的滤波器长度为2n,支撑宽度为2n-1,对于二维图像小波变换具有很好的滤波作用,在检测边缘信息时具有良好的性能,并且计算简单可靠[7-8].所以本文采用Daubechies1小波进行特征提取.设定小波分解的层数为m,对每个图像子块分别进行m层二维小波分解;对于每个图像子块,均得到4m个分解子频带图像.本文是进行单尺度的小波变换,即m设为1,首先对遥感影像每个类别的样本进行小波分解和重构,共得到4个分解子频带,如图2所示.

(a)表示小波近似子频带图;(b)表示水平细节子频带图;(c)表示垂直细节子频带图;(d)表示斜线细节子频带图.图2 小波变换结果灰度图Fig. 2 Wavelet transform results gray image

1.3 K均值聚类

K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即两个对象的距离越近,其相似性就越大.算法的目的是使各个样本与所在类均值的误差平方和达到最小.其工作原理是:首先确定分类数目K,并随机从数据集中选取K个点作为初始聚类中心,然后计算各个样本到聚类中心的距离,把样本归到离它最近的那个聚类中心所在的类[9].计算新生成的每一个聚类数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛.本算法的一个特点是它属于动态聚类法,其迭代过程采用按批修改方法,即在每次迭代中都要考察每个样本的分类是否正确.如果不正确,就要调整,在全部样本调整完后,再修改聚类中心,进入下一次迭代.最终使得各样本到其判属类别中心的距离平方之和最小.

2 遥感影像分类

本文以云南省玉溪市抚仙湖附近地区的Landsat-5 TM遥感影像作为数据源,影像分辨率是30 m.该地区海拔较高,湖面平均海拔1720 m,地物类型较为丰富,包括林地、农田,水体以及建设用地等多种土地利用类型.根据查维茨最佳指数因子法OIF(The Optimum Index Factor)[10]并结合研究区域的具体情况,计算得到影像的最佳波段组合为一波段、四波段和五波段,将三个波段组合后,生成最初待分类的TM 影像如图3(a).然后先利用K-means算法直接对遥感影像进行分类,得到分类结果如图3(b)所示;再利用小波变换辅助K-means算法进行分类,得到分类结果如图3(c)所示.

图3 原始遥感影像及其分类结果Fig. 3 The original image and image classification results

将此地区遥感影像中的地物类别分成6类,分别为:水体、山林地、林地、裸地、农田和建设用地.对比图3(b),图3(c)分类结果图,同时和图3(a)进行比较,可以看出采用小波变换辅助K-means算法的分类精度较高,尤其对林地、裸地和建设用地的区分效果明显比单纯采用K-means算法的效果要好.

3 实验结果分析

本文利用总体分类精度(Overall Accuracy)、生产者精度(PA)[11]、用户精度(UA)和 Kappa 系数[12]对遥感影像的分类结果进行评价和分析.影像分类后需进行精度评定,在分类后的影像中选取100个具有代表性的点,在原影像上相应的位置也选取100个点,然后把分类后影像的点与原影像的点进行比较,并分别计算两种分类方法的比较结果.最后结合分类结果的混淆矩阵和Kappa系数进行精度比较和效果总结.利用K-means算法对此遥感影像进行分类的精度评价表如表1所示,利用小波变换辅助K-means算法对此遥感影像进行分类的精度评价表如表2所示.

表1 K-means算法分类的精度评价表

Tab. 1 Accuracy evaluation of K-means algorithm classification

分类类型生产者精度用户精度水体96.08%92.70%山林地45.76%51.21%林地45.43%42.15%裸地26.24%25.80%农田53.20%55.35%建设用地92.75%90.50%总体精度=69.48%;Kappa系数=0.6056

表2 小波变换辅助K-means算法分类的精度评价表

Tab. 2 Accuracy evaluation of wavelet transform based on K-means algorithm classification

分类类型生产者精度用户精度水体96.23%93.50%山林地69.01%65.75%林地62.09%63.43%裸地58.70%55.90%农田70.46%78.35%建设用地95.53%94.80%总体精度=83.74%;Kappa系数=0.7753

从上表1可以看出,采用K-means算法进行分类的总体精度为69.48%,Kappa系数为0.6056.可以看出这种方法的总体分类精度是比较低的,特别是对于山林地、林地、裸地和农田这4种类别的区分程度很低,混淆程度十分严重,表现出较低的精度,分别为45.76 %、45.43 %、26.24 %、53.20%.从分类结果图中可以看出把山林地的大部分分到了水体类别,同时把林地的很大一部分分到了山林地类别,农田和裸地这两类严重混淆.以上分析说明在此次遥感影像分类中,单纯的采用K-means算法并不适合本研究区的分类,精度很难满足需求.

从表2可以看出,利用小波变换辅助K-means算法对此遥感影像进行分类时,总体精度和Kappa 系数分别为 83.74%、0.7753,比单纯采用K-means算法分别高出14.26%、0.1697,总体分类效果很好.尤其对于农田、裸地、山林地和林地这4种地物类型,生产者精度分别提升至69.01%、62.09%、58.70%、70.46%,可以看出其生产者精度和用户精度都得到很大程度的提高,使分类效果得到很大改善.

综合几个分类精度评价指标,得到两种分类方法的结果对比图(见图4),可以直接看出:采用小波变换辅助K-means算法进行分类时,这6种用地类型的分类精度都有所提高,所以采用小波变换与K-means算法相结合的分类方法更适合本研究区的遥感影像分类.

图4 两种方法分类精度对比图Fig. 4 Two classification methods accuracy comparison chart

4 小结

对遥感影像进行小波分解时可将其分解为小波近似与小波细节之和,小波近似能够提供丰富的纹理特征,小波细节能够提供图像的边缘信息,并可以很好的保留原来的光谱特征;而K-means算法对于解决模式分布呈现类内团聚状的问题,其聚类效果很好;所以在此将这两种方法相结合,采用小波变换辅助K-means算法对研究区的遥感影像进行分类.经过对比分析验证,采用小波变换和K-means算法相结合对遥感影像进行分类时要比单纯利用K-means算法的分类效果更理想,分类精度更高.

[1] 杨玉静,于彦伟,冯建辉.纹理特征辅助遥感影像分类技术的探讨[J].测绘与空间地理信息,2008,31(6):82-85.

[2] 华媛媛.纹理信息在遥感图像分类中的应用与研究[D].西安:西安科技大学,2009.

[3] 李峰,黄达人,毕宁,等.基于多进制小波变换的纹理图像分割[J].模式识别与人工智能,2004,17(3):286-290.

[4] XU Junling, XU Baowen, ZHANG Weifeng.Stable Initialization Scheme for K-Means Clustering[J]. Wuhan University Journal of Natural Sciences,2009,14(1):24-28.

[5] 王建宇,张峰,周献中,等.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512.

[6] 徐丽华,岳文泽,李先华,等.基于二维小波变换的遥感分类研究[J].遥感技术与应用,2003,18(5):317-321.

[7] 毛安定,管一弘,段锐,等.基于Daubechies小波的图像边缘检测技术[J].图学学报,2012,33(1):63-67.

[8]LEE J D, HSIAO Y L. Extraction of tumor region in color images using wavelets[J].Computers & Mathematics with Applications,2000,40(6):793-803.

[9] 周坚华.遥感图像分析与空间数据挖掘[M].上海:上海科技教育出版社,2010:51-52.

[10] 陈爱京,肖继东,张旭,等.基于TM/ETM+影像的区域土地利用/覆盖变化研究[J].沙漠与绿洲气象,2008,2(4):45-48.

[11] 曾志远.卫星遥感图像计算机分类与地学应用研究[M].北京:科学出版社,2004.

[12] 任建斌.基于小波变换和BP人工神经网络的遥感影像分类研究[D].呼和浩特:内蒙古师范大学,2012.

[13] 刘金亨.基于小波变换的遥感图像处理研究[D].重庆:重庆大学,2010.

Remote Sensing Image Classification Based on Wavelet Transform and K-means Algorithm

ZONG Qinghua, WANG Zhiyu, GUO Zhongyang, MA Pin

(School of Geographic Sciences, East China Normal University, Shanghai 200241, China)

On the basis of studying the K-means clustering algorithm, combine wavelet transform is combined with K-means algorithm for remote sensing image classification to improve the classification accuracy of remote sensing image. Fuxian Lake area in Yuxi city of Yunnan Province is taken as a study area, combined with the specific circumstances of the area, the optimal bands combination of remote sensing image is obtained according to the OIF calculation. Through the two-dimensional wavelet decomposition of various terrain samples and remote sensing image, the sample feature vector is obtained. Using K-means algorithm with the sample feature vector for classifying the remote sensing image, the result of image classification is got and the accuracy is verified. Comparing with the classification result using K-means algorithm simply, the results show that its overall accuracy and Kappa coefficient are 83.74% and 0.7753 respectively, increasing by 14.26%, 0.1697. Especially the classification accuracy of forest land, bare land and farmland is greatly improved.

remote sensing image classification; wavelet transform; K-means algorithm

2015-06-20

国家自然科学基金项目(J1310028).

过仲阳(1964—),男,教授,博士,主要从事遥感影像分析和数据挖掘研究.E-mail:zyguo@geo.ecnu.edu.cn

10.3969/j.issn.1674-232X.2016.02.015

TP751

A

1674-232X(2016)02-0203-05

猜你喜欢

小波纹理聚类
构造Daubechies小波的一些注记
基于BM3D的复杂纹理区域图像去噪
基于MATLAB的小波降噪研究
使用纹理叠加添加艺术画特效
基于DBSACN聚类算法的XML文档聚类
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
TEXTURE ON TEXTURE质地上的纹理
消除凹凸纹理有妙招!
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究