基于决策树分类的济宁市土壤有机碳遥感反演
2018-06-21孙问娟李新举
孙问娟 李新举
摘要:本研究利用Landsat 8遥感影像数据以及土壤有机碳实测数据,以研究区表层0~20 cm土壤的有机碳含量为研究对象,通过SPSS的多元线性回归分析,建立预测模型:Ysoc=23.448+65.958b1-67.703b4-21.778b7(R2=0.744,P<0.01);进而采用基于ENVI的波段运算及决策树分类法,获取了济宁市土壤的有机碳含量与分布状况。结果表明:(1)研究区的土壤有机碳含量平均约为12.45 g/kg,处于中等偏下水平,部分地区有机碳含量接近于零,微山县和任城区含量最高;(2)研究区有机碳含量主要集中在12~18 g/kg,面积约为6 165.13 km2,占研究区土地总面积的59.99%,分布最为广泛,在各个县区均有分布。
关键词:土壤有机碳;遥感反演;多元回归分析;决策树分类;济宁市
中图分类号:S127文献标识号:A文章编号:1001-4942(2018)04-0133-05
Abstract Taking 0~20 cm soil layer as research object, the remote sensing data of soil organic carbon were obtained from Landsat 8 and the actual values were measured in laboratory. Through the multiple linear SPSS regression analysis,the prediction model of Ysoc=23.448+65.958b1-67.703b4-21.778b7(R2=0.744,P<0.01) was established. Then the soil organic carbon content and distribution in Jining City were obtained by the band math and decision tree classification based on ENVI. The results were as follows. (1) The average soil organic carbon content in the study area was about 12.45 g/kg, which was in the lower middle level. The organic carbon content in some areas was close to 0. The highest content was in Weishan and Rencheng districts. (2) The content of organic carbon in the study area was mainly concentrated at 12~18 g/kg,which was about 6 165.13 km2 and accounted for 59.99% of the total study land area. It had the most widely distribution area, even was in each county or district of Jining City.
Keywords Soil organic carbon; Remote sensing retrieval; Multiple regression analysis;Decision tree classification; Jining city
碳作為自然界中的一种元素,在各个圈层之间是不断循环的,尤其是大气圈CO2和岩石圈SOC的存在形式,与人类生存密切相关[1]。土壤有机碳(soil organic carbon,SOC)作为土壤碳库的一部分,直接或间接影响着全球的气候和土地生产力。土壤有机碳的研究至今已有200多年的历史,20 世纪 70 年代以来,随着统计学方法的普及,生命带法、土壤类型法、有机碳模型法等开始大量应用于有机碳含量及其垂直分布的研究[2-7]。近年来基于RS和GIS软件的遥感反演越来越成为研究土壤有机碳空间分布特征的重要方法,空间插值法、光谱反射率、DN值等遥感信息建模法[8,9]都是常用的遥感反演方法。代杰瑞等[10]利用土壤剖面资料和MapGIS 软件中的空间分析功能实现了山东省表层土壤有机碳密度空间分布的可视化;游浩辰[11]利用ArcGIS的空间插值法实现了遥感反演制图,进而研究了顺昌县林地土壤有机碳的空间分布特征;王琼等[12]通过波段运算实现了北疆绿洲区棉田表层土壤有机碳的遥感反演。
决策树法是遥感应用中一种有效的影像分类方法,不仅适用于训练数据集较大的情况,而且构建结构简单、模型效率高、分类精度好[13]。但目前很少有利用决策树分类法进行土壤有机碳空间反演的研究报道。本研究以山东省济宁市耕作层0~20 cm土壤的有机碳含量为研究对象,以遥感影像各波段反射率与土壤有机碳含量为因子进行多元线性回归分析,建立有机碳预测模型,并借助决策树分类法对整个研究区域土壤有机碳含量进行了空间反演。
1 研究区概况与研究方法
1.1 研究区概况
济宁市位于鲁西南腹地,地处黄淮海平原与鲁中南山地交接地带,在34°27′11.83″N~35°58′42.27″N、115°51′28.51″E~117°34′57.24″E之间,南北跨越167 km,东西跨越158 km;地形较为复杂,以平原洼地为主,山地、丘陵、盆地都有分布,地势东高西低;属于暖温带季风气候,平均气温13.3~14.1℃,年均降水量597~820 mm。
济宁市既属于农业型城市又属于资源型城市。土地总面积约为11 187 km2,耕地面积约为6 113.2 km2,包含了棕壤、褐土、砂姜黑土、潮土、水稻土等多种土壤类型。济宁市还是全国八大煤炭开采基地之一,主要含煤地层都在10层以上,可采厚度10 m左右。
1.2 土壤采样与分析方法
根据研究区的耕作机制,为避免其他地物遮挡地面,在2015年10月初,按照试验设计在研究区内共采集134个样点的土样,考虑到样点的均匀性与可靠性,最终选出129个有效样点的数据参与统计。样点分布如图1所示。
每个样点均通过手持式GPS进行定位,采样深度为表层0~20 cm,每份土样均由30 m×30 m范围内按照对角线取样法取得的5份土样混合而成。将土样带回实验室后,挑出植物根系、石子砖块、小动物等侵入物,经晾晒、风干、敲打、研磨过筛后,采用重铬酸钾容量法——外加热法测定土壤有机碳含量。
1.3 遥感影像获取及处理
遥感影像来源于地理空间数据云,选择与采样时间相对应的2015年10月2日的两幅Landsat 8数据影像,条代号-行编号分别为122-35、122-36。
遥感影像经过辐射定标、大气校正、几何校正、镶嵌与裁剪后,利用改进的归一化差异水体指数(NDWI)制作掩膜去除遥感影像中的水域;利用线性混合像元分解法去除植被信息。采用像元二分模型[15-17],把遥感影像的像元反射信息看作是由植被和土壤两者组成,进而通过归一化植被指数(NDVI)[18]和波段运算从像元的混合波谱中去除植被信息,获取只包含土壤信息的遥感影像。
1.4 SOC含量預测模型建立
采用多元回归逐步分析法,构建土壤有机碳含量与遥感影像各波段反射率的反演模型。以相关系数越高、标准差越小且显著性较高为准则优选反演模型。
1.5 决策树分类
决策树分类是基于遥感图像及其他空间数据,通过专家经验总结、简单的数学统计和归纳等获得分类规则,然后进行遥感分类的方法[19]。决策树分类是一种逐级分层分类方法[20],它的分类过程可以用决策树结构很好地表达。决策树由一个父节点和若干个子节点组成,每个节点是一个单独的分类过程,每个节点的末端代表一个分类结果,即一个数据类别。
本研究根据密度分割获得土壤有机碳含量范围,将其划分为4个含量梯度,分别为0~5、5~12、12~18、18~27 g/kg,以预测模型为分类的基本规则,每个含量梯度作为一个节点构建决策树,执行决策树分类,并对其结果进行Majority/Minority 分析、聚类处理以及过滤处理,最后将其转化为矢量文件导入ArcMap出图。
2 结果与分析
2.1 土壤有机碳含量预测模型的建立与检验
根据有机碳测得结果,把样点分为4组,即土壤有机碳含量分别为5~10、10~15、15~20、20~25 g/kg,然后从每组中均匀抽取7个,共计28个样点作为验证点,其余的101个样点作为建模点(表1)。
利用建模点数据及各遥感光谱反射率进行多元逐步回归,结果(表2)显示,模型四的R2最大且RMSE最小,模型五次之,但模型五的显著性明显高于模型四,综合考虑R2、RMSE及P值,择优选择显著性更高的模型五作为济宁市0~20 cm土层土壤有机碳含量的预测模型,即:Ysoc=23.448+65.958b1-67.703b4-21.778b7,其中YSOC为土壤有机碳含量,b1、b4、b7分别为遥感影像第一、四、七波段的反射率。
为了验证模型的可靠性,本研究利用ENVI 4.7提取了与28个验证点相对应的各波段反射率,代入上述反演模型中得到相应的有机碳预测值,对预测值与实测值进行线性拟合,R2=0.797 2,二者存在较好的线性关系(图2),即有机碳含量反演模型有较好的可靠性,可以用于整个研究区土壤有机碳含量的预测。
2.2 土壤有机碳含量反演
2.2.1 土壤有机碳的数量特征 本研究根据有机碳模型采用密度分割法估测了整个研究区土壤有机碳含量范围。考虑到实际情况,有机碳含量不可能小于零,因此把有机碳含量在-1.62~0 g/kg 范围内的计算结果剔除;由于最大值超出样本值过多,在逐级试验计算中,首先对34~39 g/kg进行Aplay,发现肉眼在图像上难以找到此类别,把对应的数据剔除;然后依次查看了30~34、28~30、26~28、27~28、26~27 g/kg,最终发现最大值接近于27 g/kg,于是把27.00~39.14 g/kg范围内的数据也剔除,之后统计出平均值。因此,本研究认为研究区内0~20 cm土层的土壤有机碳含量最高约为27.00 g/kg,最低约为零,平均值为12.45 g/kg(表3)。
2.2.2 决策树分类法反演结果 决策树分类反演结果如图3所示。利用ENVI的数据统计功能对决策树分类结果进行统计分析,结果(表4)表明:研究区有机碳含量主要集中在12~18 g/kg,面积约为6 165.13 km2,占研究区土地总面积的59.99%,各个县区均有分布,分布最为广泛,也表明济宁市土壤有机碳含量的总体水平不高;分布最小的为0~5 g/kg,面积为717.34 km2,不到全区的7%,主要分散在东北部地区;有机碳含量为5~12、18~27 g/kg的两个梯度,面积相当,前者分布较后者广泛,后者集中分布在微山县与任城区,微山县几乎全部地区有机碳含量都处于全市最高水平,而其农林牧渔业也一直领先于其他地区,可见土壤有机碳含量在土地生产中有重要作用。
2.3 决策树分类法与克里金插值法和密度制图法空间反演结果的比较
本研究还利用反演制图中常用的克里金插值制图法和密度制图法对研究区有机碳含量进行了空间反演。结果(图4、图5)表明,完全依赖于样点值的克里金插值法制图效果并不理想,与基于光谱特征的密度制图结果相差较大。克里金插值法是以样点为中心、其值为依据,在插值图中含量呈片状分布,具有明显的几何特征,所以只有在样点分布较密集的情况下,才能保持一定的精度。而密度制图法是基于预测模型及波段计算,含量呈点状分布,反演效果较好,但是图像粗糙。
决策树分类法与密度分割法虽然在分类依据上相似,都是依据光谱特征,精度相同,但是分类过程不同,出图质量不同。决策树分类法可以借助ENVI本身的分类后优化功能对反演图像上的小图斑进行合并或清除,使图像各类别之间的轮廓更加平滑;而密度分割图像后期处理艰难,图像较为粗糙,分类效果不如前者。所以,决策树分类在土壤有机碳的空间反演中是一种较好的制图方法,既保持了分类精度,又保证了较好的视觉效果。
3 结论
(1)通过基于ENVI的波段计算和密度分割,得到济宁市耕作层土壤的有机碳平均含量约为12.45 g/kg,处于中等偏下水平,部分地区有机碳含量接近于零,以微山县和任城区含量最高。
(2)根据遥感反演与统计分析结果,济宁市土壤有机碳含量主要集中在12~18 g/kg,面积约为6 165.13 km2,占研究区土地总面积的59.99%,分布最为广泛,在各个县区均有分布。
(3)与克里金插值法相比,决策树分类法不需要过多的样点,采样工作量相对较少;与密度分割法相比,决策树分类法既保持了反演图像的精度,又提高了分类图像的视觉质量。
參 考 文 献:
[1] 金峰, 杨浩. 土壤有机碳储量及影响因素研究进展[J]. 土壤, 2000, 32(1): 11-17.
[2] Post W M, Emanuel W R, Zinke P J, et al. Soil carbon pools and world life zones [J]. Nature, 1982, 298(5870):156-159.
[3] Foley J A. An equilibrium model of the terrestrial carbon budget [J]. Tellus Series B-chemical & Physical Meteorology, 1995, 47(3): 310-319.
[4] 薛志婧, 侯晓瑞, 程曼, 等. 黄土丘陵区小流域尺度上土壤有机碳空间异质性[J]. 水土保持学报, 2011, 25(3): 160-163.
[5] 苗正红. 1980—2010年三江平原土壤有机碳储量动态变化[D]. 长春: 中国科学院研究生院东北地理与农业生态研究所, 2013.
[6] 黄雪夏, 倪九派, 高明, 等. 重庆市土壤有机碳库的估算及其空间分布特征[J]. 水土保持学报, 2005, 19(1):54-58.
[7] 袁芳, 赵小敏, 乐丽红, 等. 江西省表层土壤有机碳库储量估算与空间分布特征[J]. 生态环境学报, 2008, 17(1): 268-272.
[8] 李玉环, 王静, 吕春燕, 等. 基于 TM/ETM+遥感数据的地面相对反射率反演[J]. 山东农业大学学报(自然科学版), 2005, 36(4): 545-551.
[9] 陈红艳, 赵庚星, 陈敬春, 等. 基于改进植被指数的黄河口区盐渍土盐分遥感反演[J]. 农业工程学报, 2015, 31(5): 107-114.
[10]代杰瑞, 庞绪贵, 曾宪东, 等. 山东省土壤有机碳密度的空间分布特征及其影响因素[J].环境科学研究, 2015, 28(9): 1449-1458.
[11]游浩辰. 林地土壤有机碳遥感反演及空间分异研究[D]. 福州:福建农林大学, 2012.
[12]王琼, 陈兵, 王方永, 等. 基于HJ卫星的棉田土壤有机质空间分布格局反演[J]. 农业工程学报, 2016, 32(1):174-180.
[13]陈文, 史金成. 决策树分类技术研究[J]. 福建电脑, 2005(8):5-6.
[14]双龙, 妮萨娜, 杜江, 等. 重铬酸钾氧化——外加热法测定化探土壤样品中有机碳含量[J].安徽化工, 2016, 42(4): 110-112.
[15]李萍, 赵庚星, 高明秀, 等. 黄河三角洲土壤含水量状况的高光谱估测与遥感反演[J]. 土壤学报, 2015, 52(6): 1262-1272.
[16]吴阳, 甘淑, 王策, 等. 基于综合遥感调查的滇中星云湖流域水资源状况评估分析[J]. 浙江农业科学, 2016, 57(8): 1304-1307.
[17]曹文涛, 康日斐, 王集宁, 等. 基于高光谱遥感的土壤氯化钠含量监测[J]. 江苏农业学报, 2016, 32(4): 817-823.
[18]樊彦国, 张维康, 刘敬一. 基于植被指数-盐分指数特征空间的黄河三角洲盐渍化遥感监测研究[J]. 山东农业科学, 2016, 48(5):137-141.
[19]邓书斌. 遥感图像处理方法[M]. 北京:科学出版社, 2010: 150-164.
[20]张倩. 基于决策树方法的航空高光谱遥感土地覆盖分类研究——以江苏宜兴试验区为例[D]. 青岛:山东科技大学, 2005.