地形信息辅助下的全极化SAR数据土地覆盖分类
2016-05-06胡召玲
侯 飞,胡召玲
(1. 江苏师范大学测绘学院,江苏 徐州 221116; 2. 江苏师范大学城市与环境学院,江苏 徐州 221116)
地形信息辅助下的全极化SAR数据土地覆盖分类
侯飞1,胡召玲2
(1. 江苏师范大学测绘学院,江苏 徐州 221116; 2. 江苏师范大学城市与环境学院,江苏 徐州 221116)
Land Cover Classification Based on Fully Polarimetric SAR Data Supported by Topography Information
HOU Fei,HU Zhaoling
摘要:提出了地形参数辅助全极化SAR数据土地覆盖分类的方法,基于规则判断的决策树分类法,建立了全极化SAR数据的H/α-Wishart初步分类结果和地形参数的相关规则,对初步分类结果进行后处理,获得了精度较高的土地覆盖分类结果。以淮北地区为研究区,对全极化SAR数据的H/α-Wishart初步分类结果进行了分析,选取易混淆的土地覆盖类型样本,通过样本统计量确定DEM高程、坡度2种地形参数的阈值,设计决策判断规则,对初步分类结果进行了处理。试验结果表明,该方法能有效地提取出研究区内的水体、山地、林地、建设用地、耕地、未利用地6种土地覆盖类型,水体与建设用地、建设用地与山地的阳面、林地与山地阳面的混淆程度得到很大程度的改善,区分度增大。
关键词:全极化SAR数据;DEM数据;决策树分类;土地覆盖;淮北地区
土地覆盖分类与信息提取是遥感技术的重要应用之一,也是研究区域气候、生态和环境等基本状况的重要基础[1]。由于受频繁的云层覆盖、烟雾、雾霾、沙尘天气等因素的影响,在关键的监测周期,不能获得理想的光学遥感图像[2],因此单纯依靠光学遥感图像进行土地覆盖信息提取与变化监测会受到一定程度的影响。而合成孔径雷达(SAR)因具有全天时、全天候的对地观测能力[3],成为当前遥感发展的前沿技术之一。与光学遥感相比,雷达遥感具有多极化、可变观测角度、宽幅成像等特点,其对探测目标的几何特征和物理特征也非常敏感[4]。随着ALOS PALSAR、TerraSAR-X及Radarsat-2等星载SAR系统的成功运行,多波段(X波段、C波段、L波段、P波段)、全极化SAR系统获取了大量的地面数据,已被用于农业、森林、水文、海洋等应用领域[5-8],也为提取与分析土地覆盖信息提供了必要的数据支持[9]。与单极化SAR相比,全极化SAR数据中蕴含的极化信息在地物分类、目标检测、增强与识别中有着更为巨大的应用潜力[4-9]。由于受到图像斑点噪声及目标的复杂性等因素影响,与数据获取能力相比,全极化SAR数据自动解译与信息提取技术的发展却相对滞后,仅依靠极化SAR数据提取土地覆盖信息的精度不高;另一方面人类在认识周围地理环境的过程中,积累了大量的地学数据和知识,充分利用这些数据和知识辅助全极化SAR数据分类有望提高其土地覆盖分类的精度。
数字高程模型(DEM)作为研究空间变化的基础数据,蕴含着大量的地形结构和特征信息。在光学遥感图像分类中引入地形信息,如高程、坡度、坡向等辅助数据,对于提高土地利用信息提取的精度、分析土地利用变化的特点具有突出的作用[10-11]。地物在极化SAR图像上的后向散射特征也极易受地形因素的影响,如由于接受不到微波信号,山坡的阴面与阳面呈现不同的散射特征。
本文研究利用地形参数作为辅助数据参与全极化SAR数据土地覆盖分类,提出基于规则判断的决策树分类法,建立全极化SAR数据的土地覆盖初步分类结果和地形参数相关规则,对初步分类结果进行后处理,以获得精度较高的土地覆盖分类结果。以淮北地区为研究区,首先对全极化SAR数据进行极化Cloude分解,获得地物的极化特征参数H和α,再利用Wishart分类器进行非监督分类,获得土地覆盖分类的H/α-Wishart初步分类结果,并对易混淆的土地覆盖类型进行分析。在研究区选取易混淆的土地覆盖类型样本,通过样本统计量确定DEM高程、坡度这2种地形参数的阈值,设计决策判断规则,对初步分类结果进行处理,从而获得精度较高的土地覆盖分类图。
一、数据来源与研究区概况
本文的SAR数据来源于加拿大Radarsat-2卫星,波束模式为精细全极化模式,产品级别为地理参考产品的单视复数据(SLC),数据的获取时间是2013年9月12日,其距离向分辨率为5.4 m,方位向分辨率为8.0 m,重采样为12.5 m×12.5 m。选取安徽省淮北市西北部的一景全极化SAR数据为试验数据。数据的行政区范围包括安徽省淮北市相山区、杜集区及烈山区的部分区域、安徽省萧县和濉溪县、河南省永城市的部分区域,如图1所示,面积约625 km2。研究区的东部分布有相山及其周围的小山丘,由东北向西南延伸,其余为冲积平原。南沱河、王引河、洪河、新申河、新港河、湘西河、新濉河、萧濉河贯穿而过。区内分布有大大小小的煤矿,长期采煤塌陷形成的矿山湖点缀其中,有的矿山湖及其周边塌陷的土地经过多年的复垦治理,建成了城市湿地公园,如淮北市南湖国家城市湿地公园和东湖湿地公园。区内主要的土地覆盖类型有城市建设用地、农村居民点、耕地、林地、水体、山地等。
图1 研究区
二、全极化SAR数据的极化分解与分类
1. 极化分解
极化SAR图像上每个像素对应一个极化散射矩阵(即Sinclair矩阵),该矩阵记录了目标散射回波的相位信息、幅度信息及极化信息等,这些信息是研究全极化SAR图像分类与目标识别的理论基础。
将Sinclair散射矩阵记为S矩阵,其表达式为
(1)
式中,Svh表示水平发射极化波时垂直接收到的极化分量。对于互易介质,散射矩阵具有对称形式,即Shv=Svh。
在Pauli基下,SAR图像观测值可由三维极化目标向量k表示
(2)
目标的极化信息可以由相干矩阵T3表示
T3=k·k*T
(3)
式中,上标“T”表示向量的转置;“*”表示矩阵或向量的共轭。
由于相干矩阵T3是半正定的Hermite矩阵,由Cloude分解,将其进一步分解成3个独立的矩阵之和,其中每一矩阵对应一种散射机制
(4)
式中,T3i表示第i种散射机制;λi、ui表示T3的特征值和特征向量,其中λi反映第i种散射机制的散射强度。
散射熵H定义为
式中,αi∈[0°,90°],为散射体的内部自由度,对应一定的散射类型。
H表征的是散射媒质的随机性程度,其取值范围为0~1,表示散射媒质从各向同性散射(H=0)到完全随机散射的随机性(H=1)。若H值偏低,说明整个系统弱去极化,占优势的目标散射矩阵部分为最大特征值对应的特征向量。若H偏高,说明目标去极化效应很强,目标不再只包含唯一等价的散射矩阵,需要考虑所有的特征值。参数α是与散射机制密切相关的一个参数,其取值范围是0~90°,表示从表面散射到体散射,再到二面角散射的平均散射机制。H-α可用来划分不同的散射机制:表面散射、二次散射和体散射。
2. 全极化SAR数据分类
Cloude等通过分解所得的散射熵H和散射角α构成的平面进行区域划分,得到不同散射属性的8种分类结果,Lee等结合H/α与地物的复Wishart统计分布,提出了H/α-Wishart非监督分类法[13]。根据该分类法,参考高分辨率光学遥感图像,将研究区的土地覆盖类型分为6种类型,分别为:水体、山地、林地、建设用地、耕地、未利用地,分类结果如图2(a)所示。
由图2(a)可知,研究区东部的相山及其周围的小山丘等山地,由于受地形因素的影响,电磁波不能到达山地的阴面,地物返回的后向散射信号非常微弱,而研究区的水体也由于表面比较平滑,后向散射信号强度也非常小,单纯依靠H/α这两种极化参数,很难将它们区分开来,导致山地阴面与水体混为一类。由于土地覆盖类型与散射机制之间并非是一一对应的关系,不同的土地覆盖类型在一定程度上存在着分类模糊现象,特别是山地由于受地形、表面覆盖物及其结构的影响,呈现出复杂的后向散射特征,除了山地阴面与水体之间的混淆以外,山地的阳面与建设用地、林地之间均存在一定程度的混淆现象,分类精度不高。
三、DEM参与的SAR数据土地覆盖分类
由图2(a)可知,仅依靠地物的极化信息进行土地覆盖分类,错分、误分现象严重,分类精度低,其中山地阴面与水体、水体与建设用地、建设用地与山地的阳面、林地与山地的区分度均不高,山地由于受其地形、表面覆盖物及结构的影响,在SAR图像上呈现出复杂的图像特征,与其他土地覆盖类型极易混淆。而研究区内的山地地势相比周围的冲积平原要高得多,本文提出DEM参与的全极化SAR数据决策树分类法在对研究区进行土地覆盖分类时,首先在研究区选取易混淆土地覆盖类型的样本,再通过样本观测方法确定地形参数的阈值,建立判断规则,最后将全极化SAR数据的H/α-Wishart的初步分类结果与规则判断相结合,对初步分类结果进行后处理获得土地覆盖的最终分类结果,从而提高了分类精度。
在易混淆的山地、水体、建设用地、林地这4种土地覆盖类型中选取样本区,每种土地覆盖类型选取300个样本点,计算出地形参数高程、坡度的样本统计量最小值(min)、最大值(max)、均值(u)和标准方差(s),见表1。
表1 易混淆土地覆盖类型地形参数的样本统计量
由表1可知,这4种土地覆盖类型的地形参数存在差异,水体的高程值小,坡度为零,与其他3种土地覆盖类型的参数存在显著差异,山地的高程值、坡度值均最大,林地和建设用地的高程值存在一定程度的重叠,仅依靠地形参数很难将这2类土地覆盖类型的区分开。根据图2(a)、表1,采用“IF(条件),THEN(结论)”的基本形式表达判断规则,建立的判断规则如下:
IF DEM>25 & slope>2°(landcover=山地 or 水体)THEN 山地
IF DEM>=19 & DEM<=30 & slope<=2°&(landcover=山地 or 林地) THEN 林地
IF DEM>=21 & DEM<=42 & slope<=2°&(landcover=山地 or 建设用地)THEN建设用地
综上,全极化SAR数据预处理及DEM参与的分类过程如下:
1) 采用增强的Lee滤波法对全极化SAR数据进行滤波处理,窗口尺寸设为5×5。
2) 对滤波后的SAR数据进行几何纠正。
3) 对滤波与几何纠正后的全极化SAR数据进行Cloude分解,提取出极化特征参数H和α。
4) 采用Wishart分类器对H和α进行非监督分类,获得土地覆盖初步分类结果。
5) 对栅格DEM数据进行双线性内插,使每个栅格所对应的地面尺寸与SAR数据的地面分辨率一致,也为12.5 m×12.5 m。利用DEM高程数据计算出坡度参数。
6) 根据DEM原始高程数据、坡度数据和所提出的判断规则,对图2(a)所示的土地覆盖初步分类结果进行后处理,获得最终土地覆盖分类结果,如图2(b)所示。
图2 全极化SAR图像分类图
由图2(b)可以明显看出,DEM参与的全极化SAR图像分类法能有效地区分山地阴面与水体这2种土地覆盖类型,淮北市北部的相山山脉及其附近的小山丘被提取出来,市区南部的南湖和东部矿区的采煤塌陷形成的积水区及流经区内的河流也被提取出来。水体与建设用地、建设用地与山地的阳面、林地与山地阳面的混淆程度也有很大程度的改善,但区内的道路应属于建设用地,它与水体还有所混淆,原因是道路和水体均属于表面散射,地形参数也比较接近,仅凭极化参数H/α和地形参数很难将它们区分开。
四、结束语
全极化SAR数据经极化分解后提取的极化特征参数H和α可反映地物的散射机制,利用H/α-Wishart分类算法所获得的分类结果虽然可以分出一些土地覆盖类型,但由于土地覆盖类型与散射机制之间并非是一一对应的关系,土地覆盖类型的后向散射特征还受地形因素的影响,因此不同的土地覆盖类型在一定程度上存在着分类模糊现象,特别是山地由于受地形、表面覆盖物及其结构的影响,呈现出复杂的后向散射特征,山地的阴面、阳面与水体、建设用地、林地之间均有一定程度的混淆现象,分类精度不高。本文提出了DEM数据参与全极化SAR数据分类的方法,建立了基于全极化SAR数据的土地覆盖初步分类结果和地形参数相关规则,采用基于规则判断的决策树分类法对H/α-Wishart初步分类结果进行了后处理,获得了精度较高的土地覆盖分类结果。试验结果表明,该方法能有效地提取出研究区内的水体、山地、林地、建设用地、耕地、未利用地这6种土地覆盖类型。为进一步提高全极化SAR数据自动分类精度和速度,应充分利用极化分解所产生的相干矩阵,还应提取出一些极化特征参数。而如何利用这些参数和土地覆盖的纹理信息,选择最优的分类特征进行分类还有待于进一步研究。
参考文献:
[1]王贺,陈劲松,余晓敏. 面向对象分类特征优化选取方法及其应用[J]. 遥感学报,2013,17(4):816-829.
[2]BAN Y, JACOB A. Object-based Fusion of Multitemporal Multiangle ENVISAT ASAR and HJ-1B Multispectral Data for Urban Land-cover Mapping [J]. IEEE Transactions on Geoscience and Remote Sensing, 2013,51(4): 1998-2006.
[3]郎丰铠,杨杰,赵伶俐,等.基于Freeman散射熵和各向异性度的极化SAR影像分类算法研究[J]. 测绘学报,2012,41(4):556-562.
[4]徐怡波,赖锡军,周春国. 基于ENVISAT ASAR数据的东洞庭湖湿地植被遥感监测研究[J]. 长江流域资源与环境,2010,19(4):452-459.
[5]郝亚东,李聚方,唐红梅.基于K-L 变换的多极化SAR 图像检索研究[J]. 测绘通报,2012(9):20-25.
[6]PARK S, YAMAGUCHI Y, SINGH G, et al. Polarimetric SAR Response of Snow-covered Area Observed by Multi-temporal ALOS PALSAR Fully Polarimetric Mode [J]. IEEE Transactions on Geoscience and Remote Sensing, 2014,52(1):329-340.
[7]ANTROPOV O, RAUSTE Y, ASTOLA H, et al. Land Cover and Soil Type Mapping from Spaceborne PolSAR Data at L-band with Probabilistic Neural Network [J]. IEEE Transactions on Geoscience and Remote Sensing, 2014,52(9):5256-5270.
[8]JUAN M L, FERNANDO V, DAVID J, et al. Polarimetric Response of Rice Fields at C-band: Analysis and Phenology Retrieval [J]. IEEE Transactions on Geoscience and Remote Sensing, 2014,52(5):2977-2993.
[9]MISHRA P, SINGH D. A Statistical-measure-based Adaptive Land Cover Classification Algorithm by Efficient Utilization of Polarimetric SAR Observables [J]. IEEE Tran-sactions on Geoscience and Remote Sensing, 2014,52(5):2889-2900.
[10]李丹,刘丹丹,赵金祥. 基于DEM的山区土地利用变化分析[J]. 水土保持研究,2014,21(1):66-70.
[11]李巍,翟亮,葛小三,等. 结合DEM的地表覆盖自相关性分析[J]. 测绘与空间地理信息,2014,37(2):74-79.
[12]CLOUDE S R, POTTIER E. An Entropy-based Classification Scheme for Land Application of Polarimetric SAR [J]. IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(1): 68-78.
[13]LEE J, Pottier E. Polarimetric RADAR Imaging from Basics to Applications [M]. Boca Raton, FL:CRC Press, 2009.
中图分类号:P237
文献标识码:B
文章编号:0494-0911(2016)03-0040-04
通信作者:胡召玲
作者简介:侯飞(1972—),男,高级实验师,主要从事测绘与3S应用方面教学及研究工作。E-mail: houfei@jsnu.edu.cn
基金项目:国家自然科学基金(41101428);江苏师范大学自然科学基金(13XLA07)
收稿日期:2015-03-03
引文格式: 侯飞,胡召玲. 地形信息辅助下的全极化SAR数据土地覆盖分类[J].测绘通报,2016(3):40-43.DOI:10.13474/j.cnki.11-2246.2016.0082.