基于主成分分析法的低山丘陵区土壤厚度快速评定方法与实践
——以河南省罗山县为例
2021-02-23戴亮亮罗敏玄黄锦彦聂小力
戴亮亮,罗敏玄,张 涛,黄锦彦,唐 尧,李 新,吴 丰,聂小力
(中国地质调查局长沙自然资源综合调查中心,长沙410600)
土壤厚度是指土壤成土母质层至土壤表面的垂直距离[1],是土壤发育程度的直接反映。土壤厚度直接影响土壤水分的时空分布[2-3]和土壤肥力状况[4],从而影响地表植被盖度[5]和生物量的密度[6],进而决定区域生态景观格局[7];同时土壤厚度还是影响地表水文[8-9]、山体滑坡[10-11]和土壤侵蚀程度的重要指标[12-14]。因此,探索低成本、准确高效的土壤厚度制图方法,对生态保护修复和国土空间规划都具有重要意义。
目前土壤厚度制图主要的研究方法有基于物理机制、基于地统计采样插值、基于遥感方法和基于环境推理等[15],基于物理机制研究方法主要研究土壤风化速率和土壤侵蚀过程,需对研究区进行长周期的定点监测;基于地统计采样插值的研究方法是通过土壤厚度样点进行空间插值,对土壤厚度样点的数量和代表性具有较高的要求;而基于遥感方法更适用于植被覆盖率较低的区域[16]。上述三种土壤厚度制图方法并不适用景观复杂的低山丘陵区,而基于环境推理的方法是利用影响土壤厚度积累的环境因子和土壤厚度相关关系建立模型,在景观复杂的低山丘陵区可以较好的捕捉环境因素的局部变化对土壤厚度的影响,进行土壤厚度的预测性制图。基于环境推理方法的关键在于确定影响土壤厚度的环境因素和各环境因素对土壤厚度的影响程度,前人的大量研究表明这些环境因素主要有成土母质、坡度、土地利用类型、植被覆盖率和海拔等[17];但在判断环境因素的影响程度时,一般运用层次分析法和专家打分法;这会导致以下问题:一是环境因素影响权重的确定过于主观,二是不能消除各环境因素之间的相互影响。因此,如何更加科学的确定各环境因素的权重成为基于环境推理土壤厚度制图方法必须解决的问题。
主成分分析法利用数学的降维思想,通过分析各个环境因素的相关关系,将多个指标转化为少量几个包含原始数据大量信息且互不相关的主成分。主成分分析在确定权重方面优势较为突出,主成分的提取完全基于样本数据,且可以计算各原始指标对于主成分的贡献值,并以此计算各原始指标的综合权重值,最大程度的排除了人为因素和消除了原始指标的相关性,使各指标权重的确定更加科学合理[18-19]。
本文拟通过对大量实测土壤厚度数据进行数学统计来确定影响土壤厚度的环境因子,并运用主成分分析法来确定各因子的权重,旨在探索低山丘陵区土壤厚度快速评定方法并验证其可靠性,为区域性的土壤厚度快速制图提供新的思路方法。
1 研究区概况
研究区位于淮河南岸、大别山北麓的罗山县,地理位置在北纬31°43′至32°09′、东经114°10′至114°42′(图1),属于温带季风性气候与亚热带季风性气候交叉影响区,具有典型的过渡性气候特点,年平均气温和年平均降水量分别为15.1℃和1149.7 mm。区内地貌类型跨度大,地形地貌特征由大别山主脉山地区—北坡低山丘陵区—北麓丘陵隆岗区—冲积平原区依次过渡,海拔主要在43 m至834 m之间。由于地理跨度不大,土壤类型相对单一,主要有暖湿淋溶土亚纲的黄棕壤(包括典型黄棕壤和黄棕壤性土两个亚类)、黄褐土(包括黄褐土和黄褐土性土两个亚类);淡半水成土亚纲的潮土(包括灰潮土一个亚类);人为水成土亚纲的水稻土(包括渗育型、淹育型、潜育型和潴育型水稻土),其中以水稻土分布最为广泛,占全县总面积的54.68%,主要集中在北部平原岗地;其次为黄棕壤,占全县总面积的28.03%,基本分布在罗山县西南山地丘陵。
图1 研究区位置(a)和采样点位图(b)Fig. 1 Geographical location (a) and sampling point location map (b) in the study area
2 数据来源
本文数据来源主要分为3类:实测数据、专题图件、遥感数据。其中实测数据为2020年在研究区内开展生态修复支撑调查项目所取得的593个土壤厚度数据,518个用于确定影响土壤厚度的影响因子及影响因子权重,其余用于土壤厚度制图精度验证;专题图件为罗山县1∶5万土地利用现状图和罗山县1∶5万建造构造图;遥感数据主要包括DEM(分辨率30 m)和高分二号遥感影像(分辨率0.8 m),其中DEM用于提取高程,再利用ArcGIS 10.4.1中3D Analyst Tools功能提取坡度因子,遥感影像主要用于提取植被覆盖度因子。
3 研究方法
通过野外实测土壤厚度数据进行数学统计分析,确定土壤厚度与建造构造、海拔、土地利用类型、植被覆盖率和坡度5个影响因子之间的相关关系。研究区各影响因子空间分布如图2所示,按照五级标准分别对5种单因子影响的土壤厚度分级赋值,利用更加科学的主成分分析法确定每种因子对区内土壤厚度结果的影响权重,按权重对五种因子进行综合叠加分析,确定每一个评价单元的土壤厚度分级;再利用野外实测数据通过累频方法划定每个分级对应的土壤厚度区间,从而得到土壤厚度分级数据;最后,利用ArcScene软件制作罗山县土壤厚度分级图并进行精度验证。
图2 研究区土壤厚度各影响因子空间分布图Fig. 2 Spatial distribution of impact factors of soil thickness in the study area
3.1 土壤厚度影响因素
影响土壤厚度的因素主要有建造构造、海拔、植被覆盖率、土地利用类型、坡度等。
(1)通过对研究区建造构造与实测土壤厚度点的空间叠加分析,发现土壤厚度具有由白垩纪酸性岩浆岩建造、断陷盆地火山-沉积建造、变类复理石建造、变基性火山-沉积建造至山前冲积平原逐渐变厚的基本特征,这主要是由于不同的建造构造中成土母岩的岩性、矿物成分、地球化学特征及构造环境的差异,进而对成土作用的速率、土壤结构、质地及厚度发育具有明显的制约作用[20],据此对研究区建造构造进行土壤厚度分级赋值(表1)。
表1 土壤厚度与建造构造空间分析结果Table 1 Space Analysis results of soil thickness and geological structure
(2)海拔是低山丘陵区地形地貌垂直分带的主要影响因素,海拔的大小会直接影响水文、微地貌、土壤、植被和土地利用类型,进而对土壤厚度的积累造成影响。通过对实测样点的土壤厚度与海拔进行回归分析,发现研究区土壤厚度与海拔具有明显的反相关关系,表明在忽略其他因素干扰情况下,土壤厚度随海拔的升高而降低(图3),据此对研究区海拔进行土壤厚度分级赋值(表2)。
表2 海拔分级赋值Table 2 Altitude classification assignment
图3 土壤厚度与海拔的关系Fig. 3 The relationship between soil thickness and altitude
(3)地表植被覆盖一方面会减少降雨对土壤的冲击和削弱地表径流的冲刷作用,从而降低土壤的侵蚀[21-23],另一方面植被覆盖可以加强土壤涵蓄水分能力和夯实土壤结构[24],同时土壤厚度的积累更加有利于植被覆盖率的增加[25]。通过对研究区实测土壤厚度点的植被覆盖率进行空间叠加分析,发现平均土壤厚度随着植被覆盖率的增加而增大(图4),据此对研究区植被覆盖率进行土壤厚度分级赋值(表3)。
表3 植被覆盖率分级赋值Table 3 Vegetation coverage grading assignment
图4 土壤厚度与植被覆盖率的关系Fig. 4 The relationship between soil thickness and vegetation coverage
(4)土壤厚度在一定程度上决定着土地的利用类型,同时土地利用类型又能影响土壤的发育和厚度积累[26]。通过对土壤厚度实测点与土地利用类型进行叠加分析,发现土壤厚度由水田、旱地、园地、林地至荒草地平均土壤厚度依次变小,这说明不同的土地利用方式对土壤厚度具有不同程度的影响,并对研究区土地利用类型进行土壤厚度分级赋值(表4)。
表4 土壤厚度与土地利用类型空间分析结果Table 4 Spatial analysis results of soil thickness and Land use type
(5)坡度会通过影响地表水系的流速和流量直接影响土壤侵蚀的强度,进而影响土壤厚度的积累[27]。通过对研究区坡度和土壤厚度的空间叠加分析发现,土壤厚度和坡度具有一定的反相关关系,坡度越大,土壤平均厚度越小(图5),并对研究区坡度进行土壤厚度分级赋值(表5)。
图5 土壤厚度与坡度的关系Fig. 5 The relationship between soil thickness and slope
表5 坡度分级赋值Table 5 Grade assignment of slope
3.2 主成分分析确定因子权重
由于专家打分法和层次分析法主观性较强,本研究采取更加客观的主成分分析法来确定各影响因子的权重,排除过多的人为因素影响,获得的权重完全基于数据本身[28]。
3.2.1 基本原理
由于原始数据各指标的衡量尺度不一致,故主成分分析第一步需要对原始数据进行标准化处理,再利用SPSS软件求出各指标主成分的特征值,并建立相关系数矩阵和主成分模型,根据累积频率筛选出相关主成分,最后由主成分的方差贡献率得出各项指标的权重[29]。
(1)相关系数矩阵。原始数据经变换后得出标准化数据矩阵,计算相关系数矩阵R,并得到其特征值与特征向量。
i=1,2,3…n,j=1,2,3,…,p,R的特征值为λi,特征向量为Ei(i=1, 2, 3, ……,n)。
(2)主成分模型。根据累计贡献率确定主成分,一般主成分的累计贡献率不少于80%,在此基础上选取k个主成分,建立主成分模型:
其中,aij代表了指标i在第j个主成分中的得分系数,即第i个指标对第j个主成分的贡献,它与该主成分对应方差的贡献率Ej的加权组合,便是需要确定的第i个指标的权重值。
需要注意的是,用SPSS软件进行主成分分析时,得到的不是决策矩阵系数aij,而是初始因子载荷fij, 二者还需做进一步的转换,转换关系如下:
式中:j=1,2,3,…,m,aij为单位特征向量,即第i个指标在第j个主成分线性组合中的系数;fij为第i个指标在因子负荷矩阵中第j个主成分对应的变量;λj为第j个主成分的初始特征根。
(3)对各指标进行归一化处理。各指标权重之和等于1,因此指标权重需要在综合模型中指标系数的基础上归一化。
3.2.2 权重的确定
对518组实测土壤厚度数据进行主成分分析,先检验数据是否适用主成分分析,数据的KMO统计量为0.662,大于0.5,巴特利特球形度检验显著性小于0.05,说明变量之间具有一定的相关性,可以进行主成分分析[30]。为尽可能多的保留原始数据信息,提取出的前三种主成分其累计方法贡献率达到了75.68%,基本可以反应全部的数据信息。各主成分的特征值、主成分累计贡献率和因子载荷如表6、表7所示。
由表6、表7经(4)式处理后即可得出初始的权重模型:
表6 特征值及主成分累计贡献率Table 6 Eigenvalues and cumulative contribution rate of principal components
表7 主成分中因子载荷Table 7 Factor loading in principal components
再将上述主成分的权重模型根据方差贡献率进行加权平均,最后根据式(5)对权重进行归一化处理得到最终各因子权重:
即坡度、土地利用类型、建造构造、海拔和植被覆盖率所对应得权重为0.151、0.303、0.263、0.184、0.100。
4 结果与分析
4.1 土壤厚度制图
将上述影响因子按权重进行综合叠加得到罗山县土壤厚度分级图(图6),由图可知研究区整体上土壤空间分布连续,由西南向东北逐渐增厚、由山区向水系汇集区逐渐增厚,这与该区的实际情况吻合较好。土壤厚度小于30 cm的区域主要分布在研究区西南部,这里海拔较高,地形起伏较大,土壤侵蚀强烈,不利于土壤厚度的积累。土壤厚度30-60 cm的区域主要分布在缓坡隆岗区,受微地貌的影响较为强烈,土地利用类型主要以旱地为主。大于60 cm的区域主要位于研究区东北部的冲积平原区,主要沿着水系河床分布。
图6 罗山县土壤厚度分级图Fig. 6 Classification of soil thickness in Luoshan county
4.2 土壤厚度图精度评价
选取研究区均匀分布的75个土壤厚度实测点作为验证数据(图7),对土壤厚度预测分级图进行精度验证。验证结果如表8所示,总的正确样点数为54个,总体精度为72%,卡帕系数为0.672,说明研究区土壤厚度预测分级与本区实际情况高度一致。并且当土壤厚度增加时,其模型的正确率也随之增高,其中土壤厚度等级为八级时,正确率达到了90%,而土壤厚度等级较小时,土壤厚度预测模型的正确率相对较低,错误分类的点大多也都被分到临近类别。这主要有两个方面的原因,第一土壤厚度等级较小时,土壤厚度分级区间较小,更容易受野外验证的实测位置代表性误差和人为主观因素的影响而产生相应的偏差;其次,土壤厚度空间的离散性较大,成因条件十分复杂[31],而模型预测都有其局限性和理想性,所以会产生一定的精度误差。
表8 罗山地区土壤厚度分级结果混淆矩阵Table 8 Confusion matrix of soil thickness classification results in Luoshan area
图7 罗山县土壤厚度验证样点分布图Fig. 7 Distribution of soil thickness verification samples in Luoshan county
澳大利亚学者通过决策树模型对不同地区的土壤表层和亚表层土壤厚度进行了预测研究,预测精度范围分别为60%~72%和59%~72%[32];芦园园等[15]应用模糊c均值聚类和决策树方法对复杂景观下的土壤厚度进行了预测研究,预测精度为74.2%。与上述研究对比可知,本文通过研究土壤厚度和环境影响因子的关系进行的土壤厚度制图方法研究,总体精度为72%,可以满足低山丘陵区的土壤厚度预测制图要求,预测分析结果可用。
5 讨论
基于影响因子建模的方法在无需进行大量采样的情况下,可以对研究区进行较高精度的土壤厚度预测制图,具有较高的验证精度,并具有一定区域上的推广性,但该方法也存在一些不足与限制。本文仅运用了建造构造、海拔、土地利用类型、植被覆盖率和坡度五种与土壤厚度密切相关的影响因子,但影响土壤厚度成因的环境要素复杂多样,所以在下一步的研究中可以根据研究区特点加入更多的影响因子,取得更好的效果;此外,对各影响因子内部差异进行分级定量赋值时,没有统一的标准,具有一定的主观影响;另外,该方法是一种半定量的模型,最后对研究区进行土壤厚度分级时,对野外实测土壤厚度点的代表性要求较高,要求实测点尽可能的覆盖土壤厚度由薄到厚的整个区间,使土壤厚度分级图更加接近于实际情况,针对以上的不足与限制,需在后续中的研究中加以改善。
6 结论
(1)通过数学统计发现低山丘陵区土壤厚度与建造构造、海拔、土地利用类型、植被覆盖率和坡度具有相关关系,并通过主成分分析确定各影响因子的权重为0.151、0.303、0.263、0.184、0.100,通过空间叠加分析得到了罗山县土壤厚度分级图。通过野外实测的75个土壤厚度验证点进行精度分析,正确样点54个,正确率72%。土壤厚度分级较大时,模型的正确率较高,此方法可以满足低山丘陵区的土壤厚度预测制图要求,可为土壤厚度预测制图提供一种快速高效精准的制图方法。
(2)罗山县整体上土壤空间分布连续,由西南向东北逐渐增厚、由山区向水系汇集区逐渐增厚,土壤厚度小于30 cm的区域主要分布在西南部,30-60 cm的区域主要分布在缓坡隆岗区,大于60 cm的区域主要位于东北部的冲积平原区,主要沿着水系河床分布,此结果可为罗山县国土空间规划和生态保护修复提供支撑。