基于MODIS的甘肃省土壤遥感分类
2019-01-07刘春晓李纯斌
刘春晓,吴 静,李纯斌,杨 伟,张 玮
(1.甘肃农业大学 管理学院,甘肃 兰州 730070; 2.甘肃农业大学 资源与环境学院,甘肃 兰州 730070)
遥感图像能直接、客观地反映地表的环境信息,是研究其他环境要素的重要基础[1]。土壤遥感是指通过对遥感影像的解译,识别,划分得出土壤类型,制作出土壤类型图,并分析出其分布规律,为改良和合理利用土壤来提供参考[2]。在土壤调查中,有效地使用遥感资料对土壤进行检测,将大大减轻土壤调查的工作量。计算机自动识别技术的迅猛发展,将土壤调查技术的发展提高一步,同时也为精细化农业提供了服务可能。
目前,国外已经开展采用卫星数据和地形数据进行土壤资源调查和制图的研究。Burrogh[3]利用热红外光谱技术进行土壤属性的估计研究,使近红外光谱和红外光谱分析技术对土壤属性的研究逐渐成熟起来;Odeh等[4]以AVHRR和DEM为数据源,采用普通克里金等方法对土壤性质进行了研究,并结合地形数据,评价了各种研究方法的优缺点;Dobos等[5]基于AVHRR数据空间分辨率为500 m和1 000 m的图像,以DEM数据为辅助对匈牙利土壤进行分类研究,结果发现地形数据的加入对2种分辨率图像的土壤分类精度都有显著提高,且高分辨率图像的分类精度明显高于低分辨率图像;Condi H R[6]研究出一种简化的方法来测土壤反射光谱曲线,是根据分析土壤反射光谱数据得出的结论。近年来,国内也有不少学者借助遥感图像进行土壤调查与分类。沙晋明等[7]利用TM图像作为数据源,对我国植被覆盖率高的东南山区运用不同的分类方法进行土壤分类的研究,结果发现即使运用较好的分类方法,土壤的地形、质地等信息也影响着分类结果;亢庆等[8-9]基于MODIS遥感数据和地形数据,在第2次全国土壤普查数据库的支持下,探讨了遥感技术在受干旱地区的限制进行土壤调查时,对干旱区的土壤效果和适用性;我国学者彭杰等[10],张俊华等[11],史舟等[12],赖宁等[13],司海青等[14],关红等[15]都对土壤高光谱特反射性特性和构建土壤盐分高光谱定量繁衍模型进行了研究。
调查以土壤类型较为复杂的甘肃省为研究区,利用遥感图像和地形数据,结合甘肃省土壤数据和高分辨率遥感图像,综合分析了实地调查数据、遥感信息特征及植被分布情况,并在此基础上建立了适合试验区的土壤遥感分类系统,探讨了遥感技术在甘肃土壤分类中的可行性,以期为研究区域的土壤调查和分类提供新的方法。
1 研究区域及数据来源
1.1 研究区概况
甘肃位于中国地理中心,地理位置N 32°11′~42°57′,E 92°13′~108°46′,地形狭长,横跨多个气候带,地貌错综复杂,山地、高原、平川、河谷、沙漠、戈壁等多种地貌类型并存,是全国各省区中地质地貌和气候类型最为丰富复杂的省份。
甘肃省的土壤类型较为丰富。全省土壤分布大致可按区划分为陇南黄棕壤、棕壤、褐土地区;陇东黄绵土、黑笋土地区;陇中麻土、黄白绵土区;甘南草甸土、草甸草原土地区;河西漠土、灌溉土区和祁连山栗钙土、黑钙土区,共6个地区及19个土坡区。分布特点:(1)水平分布的纬度地带性明显,经度地带性不太明显,由南往北;(2)垂直分布规律显著,甘肃是个多山的省份,山地所处的地理位置、山体的高低大小、山地的坡向坡度,都影响着土壤垂直地带的分布;(3)地域分布规律受各地方土壤的母质、地形、水文、成土年龄等条件的影响,在地带性土壤内部出现非地带性土壤类型,并表现为中域或微域分布,中域分布有枝形、扇形和盆形等;(4)耕种土壤受人为作用的强度不同,在各地有着独特的分布规律。
1.2 数据来源
1.2.1 遥感数据 在研究区域内,考虑植被生长的季节性差异的同时也要考虑地物反射差异。调查采用2011年6月的MODIS MYD09GA 反射率数据(三景)和MODIS MYD13A2植被指数数据(三景)。MYD09GA覆盖面积约为1 100 km×1 100 km,影像大小1 200×1 200像元空间分辨率为500 m,投影方式为等面正弦投影(Sinusoidal),是可见光、近红外到中红外波段的表面反照率参数;MYD13A2数据是空间分辨率为1 000 m的16 d三级产品。该数据来源于美国国家航天局(NASA)的MODIS数据产品分发网站(https://modis.gsfc.nasa.gov/)。
1.2.2 地形数据 地形采用SRTM3数据(数据来源:http://datamirror.csdb.cn/dem),按3弧秒进行采样,其水平分辨率为90 m,综合比例1∶25万。将地形数据作为辅助数据对提高甘肃省土壤分类的精度起到很重要的作用,并提取3个地形参数,高程、坡度、曲率(分别表示为:ELV,SLOP和CAV)。
1.2.3 参考数据 选用全国第2次土壤普查形成的1∶100万全国土壤数据库作为遥感分类的训练数据和验证数据。此数据是我国目前调查覆盖面积最大、精度最高、最完整的土壤数据,其基本制图单元为土壤亚类,共有12个土纲,61个土类,227个亚类,以及10个非土壤单元。其中,研究区内主要涉及约90个土壤亚类,2个非土壤单元。
1.3 数据预处理
覆盖整个甘肃省需要3景MODIS MYD09GA和MODIS MYD13A2影像,使用MODIS产品处理工具MRT对MODIS数据进行投影变换、几何校正、镶嵌和重采样等预处理。投影坐标系为双标准纬线等积圆锥投影(ALBERS),椭球体为Krasovsky,重采样像元尺寸为1 000 m。
1.4 分类特征提取
从MODIS数据产品中提取多波段反射率、植被指数,计算湿度指数、亮度指数,提取纹理特征,并从SRTM3数据中提取坡度和地面曲率等地形特征。
1.4.1 地表反射率 MODIS 09GA数据产品提供了常见的对地观测的7个光学反射率波段(表1)。
表1 MODIS 7个反射率波段Table 1 MODIS seven reflectance bands
1.4.2 植被指数 归一化植被指数(NDVI)是目前应用最广泛的植被指数,是通过两个(或多个)光谱通道的组合而得到的计算公式:
NDVI=(Ref2-Ref1)/(Ref2+Ref1)
(1)
NDVI在高植被盖度区易饱和、低植被区易受土壤背景影响的环境下,MODIS增强性植被指数(EVI)可较好地克服NDVI的弱点。EVI可用MODIS数据公式:
EVI=2.5(Ref2-Ref1)/(Ref2+C1Ref1+C2Ref3+L)
(2)
式中:L=1为土壤调节参数,参数C1和C2分别为6.0和7.5,通过蓝波段(Ref3)来修正大气对红波段(Ref1)的影响。
1.4.3 土壤亮度特征 土壤亮度是区分土壤类型的主要特征之一,采用与TM相对应的MODIS波段反射率数据(Ref1、Ref2、Ref3、Ref4、Ref6、Ref7波段)进行K-T变换[8,16],选择包含土壤信息的亮度分量作为土壤亮度特征。
1.4.4 湿度指数(NDMI) 湿度指数NDMI对湿度、含水量信息非常敏感[8,16],因为短波红外波段(相当于MODIS的Ref6)受水吸收带的影响,并且绿波段(相当于MODIS的Ref4波段)对水体反射敏感强,选用MODIS的这两个波段通过规格化处理的计算公式:
NDMI=(Ref4-Ref6)/(Ref4+Ref6)
(3)
1.4.5 归一化水体指数(NDWI) 研究区域有河流,水库等水体,为了区分水体,把水体指数作为一项分类特征数据,计算公式:
NDWI=(Ref4-Ref2)/(Ref4+Ref2)
(4)
1.4.6 归一化积雪指数(NDSI) 归一化积雪指数(NDSI)是提取积雪信息的一种有效方法,其算法较合理,分类精度高,具有普遍的操作意义。NDSI类似于归一化植被指数(NDVI),对大范围的光照条件不敏感,对大气作用可使其局地归一化并且不依赖于单通道的反射,NDSI的计算公式:
NDSI=(Ref1-Ref4)/(Ref1+Ref4)
(5)
1.4.7 纹理特征 纹理特征是灰度值有规律的分布情况,并且采用表达可视纹理的局部平稳(Homogeneity)特征参与分类[8,17-18],对比分析可视化后的7个波段,选用Ref2波段进行纹理特征提取[18],公式:
(6)
它是对图像局部灰度均匀性的一种度量。其值越大,代表图像局部灰度越均匀。
1.4.8 地形参数 由于地形与土壤类型存在着密切联系,采用分辨率为90 m的DEM数据进行地形特征参数的提取,综合比例尺相当于1∶25万的数字高程图像SRTM3数据,并对地形数据进行特征参数的提取,包括:坡度[16]、表面曲率。
1.4.9 分类数据集生成 将以上根据MODIS数据提取的分类特征:植被指数、积雪指数、湿度指数、水体指数、纹理特征、昼夜地表温度与SRTM3地形数据提取的地形参数:高程、坡度、表面曲率,对以上分类特征进行配准、叠加、裁切,最后得到多层分类数据集。再对多层分类数据集和整理后的土壤矢量数据进行叠加,为数据分析提供基础。
1.5 分类系统分析与训练数据采集
通过对土壤数据库进行统计,甘肃省共有土壤亚类90个,这样的分类体系对于空间分辨率为500 m和1 000 m的MODIS数据来说类别过于复杂,容易造成分类结果不理想,因此对各个类别的图斑面积进行统计,最终舍弃了图斑面积小于0.2 cm的35个亚类,剩余55个亚类。
1.5.1 训练数据样本采集 从1∶100万中国土壤数据库中裁剪出研究区域(甘肃省)的土壤数据,并对矢量数据进行几何修复和拓扑检查,将其转为栅格图像,经过投影转换使其与特征图像有统一的地理坐标,通过ERDAS窗口同步连接(link)方式对比,在各土类图斑上分别对55个分类对象选取样点,并在特征数据集的每一层上分别采集训练样本[19]。
1.5.2 土壤类型可分度分析 为了验证分类训练样本的准确性和分类系统的合理性,采用两种分类模板评价方式对土壤分类进行判别。首先,用分类预警评价的方式对训练的分类模板进行定性的预警评价,结果显示预分类的结果与参考图像基本吻合。其次,使用可能性矩阵对分类模板进行定量评价,结果显示误差矩阵值为82.3%。
1.5.3 分类 现有的分类方法有Mahalanobis距离法[20]、最小距离法、最大似然法等[8],而最大似然法是比较常用并且比较成熟的一种分类方法,使用最大似然法在ERDAS中进行监督分类,技术路线见图1。
2 结果与分析
由于软件进行分类时按照图像的光谱特征进行聚类分析,并且分类具有一定的盲目性,因此,对分类后的图像进行后处理;首先进行聚类统计,由于制度表达受精度的限制,对于分类结果中较小的图斑有必要进行剔除,然后进行重新编码,最后得到分类类别明确和图面比较完整的分类图像。由于后处理前的分类图像存在某一土壤类的图斑太小而被剔除,因此最终输出的结果为34类土壤亚类(图2)。使用验证样本,以混淆矩阵分析方法计算总分类精度R和一致性指数Kappa[21]。结果总体分类精度达到74%,整体Kappa统计值为0.728。
图1 技术路线Fig.1 Technology roadmap
图2 甘肃省土壤遥感分类结果Fig.2 Result of soil remote sensing classification in Gansu province
甘肃省土壤类型分布比例较大的有黄绵土、灰棕漠土、冷钙土、荒漠风沙土,所占比例分别是28.70%、19.70%、13.10%、9.10%。其中,甘肃省中部主要土壤类型有黄绵土、淡灰钙土、黑麻土等。在河西走廊区域主要土壤类型有灰棕漠土、石膏灰棕漠土、荒漠风沙地等。中南部地区土壤类型主要有黑毡土、棕壤、石灰性褐土等。分类结果较差的土壤类型有黄棉土、棕漠土、冷钙土、淡灰冷钙土、高山漠土、黑麻土、灰棕漠土、荒漠风沙土,与实际面积的比差分别是20.6、17.7、9.5、5.6、4.2、4.0、3.4、3.0(图2)。土壤分类结果之所以还存在着一定的误差,是由于甘肃省山地纵横交错,地形错综复杂,在获取数据的时候难免会因为地形起伏,复杂多变引起误差,使得一些土壤亚类出现错分的情况。
3 讨论
(1)数据选择方面。试验采用6月的光谱数据的成像,由于在该时相下植被生长良好,对于多源数据中表观植被的部分(NDVI,EVI等)数据分布良好,特征比较明显,但是由于植被在这个时相下生长旺盛、枝叶繁密,对土壤表面有大面积的覆盖影响,从而导致土壤亮度等数据分布偏离正常值。因此利用多源数据,结合时间分辨率和空间分辨率更高的数据,并且综合考虑土壤分类的多方面因子,才能提高土壤分类的精度。因此合理的选择数据是影响分类精度的重要因素之一。
(2)甘肃省土壤亚类自身差异性的影响。从土壤分布的自身特点分析,土壤亚类间土壤物化性质相似性较大,进而导致地面景观(植被)分布差异性小,而以地面光谱反射率为信息源遥感数据表现出的光谱特征区分度不高,这也是遥感手段土壤分类结果与全国第2次土壤调查结果的差异所在。
(3)空间因素。首先从整体地形来分析,甘肃省地形复杂多样,较为破碎,山脉分布面积广,且纵横交错,另外分布有平川、高山、沙漠戈壁和盆地等类型,海拔相差悬殊。受这种破碎的地形和山脉交错分布特征的影响,对于一些分布面积较小,并未达到数据分辨率要求的水稻土、沼泽土、潮土、灌淤土等未进入分类。因此,研究区域的空间结构在一定程度上会影响着土壤分类。
4 结论
(1)地表反射率、归一化积雪指数、水体指数、湿度指数、纹理特征、昼夜地表温度植被指数等分类特征再结合研究区域的地形参数特征得到理想的分类结果,适合作为甘肃省土壤分类的分类特征。
(2)未被分出的土壤亚类的原因与地理空间因素、数据的选取、数据的分辨率、分类方法和土壤分布的自身特点等因素相关。
(3)根据植被指数等遥感数据产品,提取9种图像特征,并结合DEM生成的地形参数数据,利用计算机自动分类法,对土壤类型进行系统分类。最终获得了34个土壤亚类,分类的总体精度达到74%。