基于TM的陆良县遥感影像分类方法实验研究
2016-01-01高文杰王金亮云南师范大学旅游与地理科学学院云南昆明650500
高文杰,王金亮(云南师范大学旅游与地理科学学院,云南 昆明650500)
基于TM的陆良县遥感影像分类方法实验研究
高文杰,王金亮
(云南师范大学旅游与地理科学学院,云南 昆明650500)
以LandsatTM遥感影像为数据源,以云南省陆良县为研究对象,利用ENVI4.8对陆良县的LandsatTM遥感影像进行图像预处理以及最佳波段组合,运用监督分类中的平行六面体分类、最小距离分类、马氏距离分类以及最大似然分类等四种分类方法,对地物信息进行提取,并对其分类精度进行评价。最后发现,波段146组合适合陆良县的地物提取。在分类方法中,最大似然法分类的总体精度及Kappa系数均高于其他三种分类。
监督分类;最佳波段组合;精度评价;陆良
从遥感数据进行信息提取是一个长期的遥感科学难题。如何综合运用各类信息提取技术,集成多尺度信息提取的结果,以便更好地从各类遥感数据提取定量信息,是值得关注并开展研究的科学问题[1]。遥感信息提取的关键是对图像上的目标进行分类和识别。遥感图像分类是将图像中每个像元根据其在不同波段的光谱亮度空间结构特征或其他信息,按照某种规则或算法划分为不同类别[2]。本文利用LandsatTM遥感影像,以陆良县为研究对象,通过不同分类方法对地物信息进行提取,为陆良县或者坝区地物信息的快速提取提供参考。
1 研究区概况与数据来源
1.1 研究区概况
陆良县位于云南省东部,北纬24°44′~25° 18′,东经103°23′~104°02′。全县东西长65.6km,南北宽62.8km,县域总面积2096km2,常住人口68万左右。陆良县四面环山,中间是开阔平坦的湖积盆地,是云南省第一平坝,平坝面积772km2。最高点龙海山海拔2687m,最低点万家河石板潭海拔1640m,县城海拔1850m。北与马龙县、麒麟区接壤,东与罗平县为邻,南与师宗县、石林市相连,西与宜良县为界。
图1 陆良县位置示意图
1.2 数据来源
本文以LandsatTM遥感数据为数据源,获取时间为2009年11月3日,轨道号/行号:129/43,共7个波段,空间分辨率为30m(TM6除外,TM6的空间分辨率为60m)。以云南省陆良县作为研究区,获得陆良县全县Landsat-5TM遥感影像。但因陆良县地域广阔,地形地貌较复杂,分类具有一定难度,精度无法得到最好的保证,加之本文主要是对遥感影像的分类方法进行研究,无需对整个陆良县进行遥感影像分类,因此选取了该县遥感影像上一块地物特征明显、纹理比较清楚且基本囊括全县地物类型的典型区域进行分类研究。
2 遥感影像最佳波段组合
2.1 遥感影像光谱特征提取
地面地物所具有的信息在遥感影像上以辐射量表达,具体表现为像元灰度值及相关关系,辐射量越大信息量越大。
图2 研究区示意图
表1 遥感影像光谱统计数据
由表1可见影像各波段所带的信息量是不同的。在进行遥感图像分类时,需要找出更多的地物类型特征,这样就要求影像波段信息量尽可能多,但同时信息的重叠、无用信息的增多问题也会更加显著。需要找到一个平衡更多的信息量与冗余信息的方法。通过计算遥感影像各波段间相关系数矩阵,对影像波段进行筛选是很好的方法[3]。
表2 遥感影像各波段间相关系数
由表2可知,各个波段间的相关系数都是不同的,其中1波段、2波段以及3波段的相关系数最大。4波段为独立波段,相关系数最小。5波段和7波段相关系数大,6波段相关系数小。因此,在1波段、2波段和3波段中选择一个波段,4波段和6波段为必选波段。
2.2 遥感影像最佳波段组合
在进行最优波段选择时,应选择波段标准差最大而相关性最小的组合,这样可保证遥感影像包含的信息量不至于大量丢失,而信息的重叠、无用信息冗余的现象最少。具体进行选择计算时,可以采用最佳指数法(OIF)[4]:
式中:Si-第i波段信息的标准差;Rij-第i波段和第j波段的相关系数。
OIF值反映了波段组合保存的信息量大小,OIF值越大,说明波段组合包含的信息量越大,反之则包含的信息量越小。因此选取OIF值最大的波段组合作为分类实验的最佳波段组合。
表3 波段组合的最佳指数结果
由表3可以看出,在波段146、波段246和波段346中,其OIF值大小顺序为:波段146>波段346>波段246。由此可知,波段146的OIF值最大,即波段146所包含的信息量最大,最有利于本研究区遥感影像分类研究。
3 训练样本的选择及评价
从预处理后的遥感影像中选择最普遍、能够准确代表一种地物分类规律的数据区域作为训练样本。所选择的样本应该尽量地物类型多,样本尽可能多。
根据陆良县的实际地形情况,把陆良县地物类型分为水浇地、灌丛草地、居民用地、交通用地、裸地、旱地、水域和林地等八类。
根据样本数据提取的各地类光谱特征及其他信息,可以对训练样本数据的可分离性进行分析。本论文采用Jeffries-Matusita距离对数据进行可分离性分析。
表4 各地物类型训练样本可分离度
训练样本的可分离度代表选择的训练样本是否合格,当可分离度>1.8时说明训练样本的可分离性比较好,属于合格样本。由表4可看出,训练样本的可分离度均>1.8,说明选择的训练样本属于合格样本,可以用于后面的分类研究。
4 遥感影像监督分类方法
4.1 平行六面体分类法
平行六面体分类法,是根据样本训练和学习得到地物类型像元的特征值,利用特征值构成一个平行六面体空间模型,作为分类标准空间。平行六面体空间的尺度大小需要用户根据实际经验和计算,选择合适的标准差阈值充当。分类时,根据像元相似性落在空间内的归属为同一种类地物,落在空间外的不进行地物类型聚类分析[5]。
4.2 最小距离分类法
最小距离法就是对所选样本区进行训练分析,得到要求地物类型标准差和均值,对于研究区全部像元进行均值和标准差的计算,根据两者的相似度及距离远近来判定归属。可对样本地物像元与研究区全部像元标准差和均值的距离进行聚类,把距离最近的一组像元划分到样本种类。距离定义公式[6]如下:
式中:n-波段数;k-某一种特征波段;i-某一种聚类中心;mi-第i类样本象元均值;mik-第i类中心第k波段的像元值;d(x,m)-象元点x到第i类中心mi的欧氏距离。
4.3 马氏距离分类法
除用于等式中的协方差矩阵不一样,马氏距离与最小距离相似。这种距离定义考虑了变量间(样本)相关性的影响,是一种更广义的距离定义[7]。马氏距离的优点在于克服了波段间相关性影响。
4.4 最大似然分类法
最大似然分类法是建立在贝叶斯准则基础上分类错误概率最小的一种非线性分类,是应用比较广泛、比较成熟的一种监督分类方法[8]。它是假设训练区地物的光谱特征和自然界大部分一样,近似地看作服从正态分布。最大似然分类法是总结样本数据地类的正态分布特征,若需要分类的样本数据像元符合样本地类的正态分布,则说明其具有最大的似然性,就把它们归为一类。分布函数如下:
D=In(ac)-[0.5In(|Covc|)]-[0.5(x-mc)T(Covc-1)(x-mc)]
其中:D-加权距离(最大似然概率);C-某一个特征类型;x-像元的特征向量;mc-类型C的样本平均向量;ac-任一个像元属于类型C的概率;Covc-C中的协方差矩阵。
选择不同的分类方法就会出现不同的分类结果。对本研究区来说,分类结果如图3所示。
图3 各分类方法结果图
5 各分类方法精度分析
精度分析是遥感影像分类中不可缺少的一部分。通过精度分析,能够确定分类方法是否高效。在精度分析中,不可能选择所有的像元进行检验,只能选取一定数量的样本来进行检验。
计算和评价某种分类方法分类精度时,主要指标有以下几种[9]:
(1)混淆矩阵:主要用于比较分类结果和实际地物真实情况的差异性,可以通过混淆矩阵表示分类结果的精度。混淆矩阵比较具有相同空间坐标位置的图像像元与实际地物像元的分类结果是否相同。
(2)总体分类精度:正确分类像元数与研究区总像元数的比值。
(3)Kappa系数:通过把所有地表真实分类中的像元总数乘以混淆矩阵对角线的和,再减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果,再除以总像元数的平方差减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果得到。
(4)错分误差:用户定义地物像元未正确归类的数量。
(5)漏分误差:实际地物像元未正确归类的数量。
(6)制图精度:分类结果符合实际地物的百分比。
(7)用户精度:分类结构符合用户定义地物的百分比。
总体分类精度、错分误差、漏分误差和使用者精度都是有关像元数的计算,当其数值较小时,像元数的变动可能很大地影响精度的大小。而Kappa系数法是一种离散型的多元的综合分析方法,不受像元数的影响,能够完整地利用混淆矩阵得到的结果,具有其他精度评价方法不具备的优势。其公式为:
式中:r-混淆矩阵中的总列数;xii-混淆矩阵中第i行、第i列上像元数量(即正确分类的数目);xi+和x+i-分别是第i行和第i列总像元数量;N-总观察值,也就是混淆矩阵中用于精度评估的所有像元数量之和。
本文主要采用混淆矩阵、总体分类精度和Kappa系数来对上面的分类结果进行精度评价。
由表5~表8、图4可知,分类总体精度和Kappa系数最大的是最大似然法,其次是马氏距离法,再次是平行六面体分类法,最小的是最小距离分类法。由此可见,对陆良县地物提取最好的分类方法是最大似然法,其分类精度达到96.66%,Kappa系数为0.9586。
表5 平行六面体分类混淆矩阵
表6 最小距离分类混淆矩阵
表7 马氏距离分类混淆矩阵
表8 最大似然分类混淆矩阵
图4 分类总体精度及Kappa系数比较曲线
[1]宫鹏.遥感科学与技术中的一些前沿问题[J].遥感学报,2009,13(1):11-23.
[2]赵英时.遥感应用分析原理与方法[M].北京:科学出版社,2003:53.
[3]吐热尼古丽,张晓帆.基于人工神经网络的遥感图像分类研究[J].长春师范学院学报(自然科学版),2006,25(l):51-84.
[4]贾永红.人工神经网络在多源遥感影像分类中的应用[J].测绘通报,2000(7):7-8.
[5]张辉.基于BP神经网络的遥感影像分类研究[D].济南:山东师范大学,2013.
[6]钱茹茹.遥感影像分类方法比较研究[D].西安:长安大学,2007.
[7]SivaS.GISandremotesensingbasedinventoryandapplicationfor bamboolivelihooddevelopment[R].VIIWorldBambooCongres NewDelh,India,2000:35-56.
[8]梅安新,彭望琭,秦其明,刘慧平.遥感导论[M].北京:高等教育出版社,2001:198-199.
[9]刘礼,于强.分层分类与监督分类相结合的遥感分类法研究[J].林业调查规划,2007,32(4):37-39.
ResearchonClassificationMethodsofProcessingthe RemoteSensingImagesofLuliang
GAOWen-jie,WANGJin-liang
(CollegeofTourismandGeographicalSciences,YunnanNormalUniversity,KunmingYunnan650500,China)
TheLandsatTMremotesensingimagesofLuliangCountyinYunnanProvincewerebasedtotestthesupervisedclassificationmethodsincludingtheuseofparallelepipedclassification,minimumdistanceclassifier,Mahalanobisdistance,andmaximumlikelihoodclassificationtopre-processandidentifythebestbandcombination onthebasisofENVI4.8.Theresultsfoundthattheband146combinationsoffeatureextractionweremostsuitable forLuliangCounty.TheoverallprecisionobtainedfromthemaximumlikelihoodandtheKappacoefficientwere higherthantheotherthreemethods.
supervisedclassification;thebestbandcombination;precisionassessment;Luliang
X87
A
1673-9655(2015)03-121-06
2014-11-24