基于主成分分析和聚类分析果园土壤养分综合评价
2018-10-23吴湘琳陈署晃赖宁付彦博窦晓静段婧婧王治国
吴湘琳,陈署晃,赖宁,付彦博,窦晓静,段婧婧,王治国
(新疆农业科学院土壤肥料与农业节水研究所,乌鲁木齐 830091)
0 引 言
【研究意义】土壤养分状况是影响作物生长的直接因素,也是评价土壤肥力的重要标志,对土地的可持续利用具有重要作用,因此,如何科学、合理、实用地评价土壤肥力在指导农业生产中显得尤为重要[1-3]。研究对一定区域土壤养分进行综合评价,可为该区域土壤养分管理和施肥决策提供参考。【前人研究进展】前人研究土壤养分综合评价方法主要有主成分分析法[4]、灰色关联度分析方法[5]、模糊综合法[6-8]、人工神经网络法[9]、聚类分析法[10]等。目前,主成分分析方法在土壤质量评价中得到广泛应用[11],一般认为主成分分析可以弱化变量间的自相关性所引起的误差,形成互不相关的主成分,获得各主成分得分,同时通过计算得到综合评价得分,从而达到对土壤养分质量的精确评价[12]。采用主成分分析法和聚类分析方法,以量化形式表现土壤理化性状的综合指标,可以大大减少单个指标所反映出的物理特性带来的差异性[10]。【本研究切入点】前人研究对象多为耕地土壤养分,对林果土壤养分研究较少,研究方法较为单一。研究以新疆叶城县果园土壤为研究目标,采集782 份土壤样本数据,测定有机质、全氮、水解性氮、有效磷、速效钾5个养分指标,通过主成分分析法进行土壤养分含量综合评价,对主成分分析综合得分进行聚类分析得出土壤养分综合得分分级。【拟解决的关键问题】对新疆叶城县果园土壤养分进行综合评价,为叶城县果园土壤合理施肥提供参考。
1 材料与方法
1.1 材 料
新疆叶城县(35°28′~38°25′N,75°30′~78°30′E)位于新疆的西南边,叶尔羌河上游,紧连塔克拉玛干大沙漠,地处塔里木盆地的西南缘,全县土地总面积3.1×106hm2。属暖温带极端干旱型气候,年平均气温11.4℃,年均降水量55.6 mm,年均蒸发量2 480 mm,全年日照2 742 h,平均无霜期为228 d。
1.2 方 法
1.2.1 土壤样品采集
叶城县林果种植区域共有19个乡镇、3个农林牧场、1个管理区(种植核桃、杏等为主)。研究选择叶城县具有代表性的果园。制定详细的土壤野外调查和样品采集计划,准备野外工作用的地图、采样用的标签、调查表、土袋、土钻等。根据田间种植情况,土壤肥力、土壤类型、土壤质地等基础上,采用GPS定位共采集0~60 cm农化样1 586个。所采1 586个0~60 cm土样将部分土样的冠幅内和冠幅外的土样合并后形成782个土样,将土壤样品自然风干后处理,过孔径筛(0.25 mm、1 mm),分析测试土壤有机质、全氮、水解性氮、有效磷、速效钾含量。
1.2.2 土壤样品
土壤样品测定采用森林土壤测定标准[13]。土壤水解性氮的测定采用碱解-扩散法(LY/T1229-1999);土壤有效磷的测定采用碳酸氢浸提法(LY/T1233-1999);土壤速效钾的测定采用乙酸铵-火焰光度法(LY/T1236-1999);土壤全氮采用半微量凯氏法(LY/T1228-1999);土壤有机质的测定采用重铬酸钾氧化-外加热法(LY/T1237-1999)。
1.2.3 主成分分析
主成分分析(PCA)对问题进行简化使变量减少,使多变量的问题简化。通过适当的变换,得到几个有代表性的综合指标,用以描述客观对象的基本特征,即土壤的养分综合指标。
1.2.3.1 主成分得分计算
主成分因子是由原始5项指标数据进行因子分析筛选出的,不能由实验直接测得[14]。样本各个主成分所包含的内容可以被定义为主成分得分(Fnj),根据5项原始指标的标准化数据(Xni)和对应的载荷(eji)得出,即:
(1)
其中:Fnj代表第n个采样点第j项主成分的得分;eji代表第j项主成分第i项原始指标的载荷;Xni代表第n个采样点第i项原始指标的标准化数据。
1.2.3.2 土壤养分综合得分计算公式
研究中土壤样本的综合得分就是以各个主成分方差贡献率作为权重,各个主成分得分与对应的权重线性加权求和得出[15],公式如下:
(2)
式中:F表示综合得分,λj表示第j项主成分贡献率,Fnj代表第n个采样点第j项主成分的得分。
样本数据经过主成分变换得以简化后,为进一步的统计分析(如聚类分析等)打下基础。
1.2.3.3 土壤养分综合得分分类
聚类分析是用多元统计技术进行分类的一种方法。K-均值聚类过程可完成指定类别数的大样本资料的逐步聚类分析。所谓逐步聚类分析就是先把被聚类对象进行初始分类,然后逐步调整,直到得到最终分类[16]。研究采用K-均值聚类过程。
1.3 数据处理
基于新疆叶城县果园 782 份土壤样本数据:有机质、全氮、水解性氮、有效磷、速效钾5个养分指标,通过SPSS软件得出主成分因子, Excel软件得出各样本各主成分得分以及土壤养分综合得分,利用K-均值聚类过程将土壤养分综合得分分级。
2 结果与分析
2.1 土壤养分指标一般性描述
研究表明,研究区土壤养分分布不均匀。变幅最大的指标为速效钾,含量变幅为 45.00~372.00 mg/kg,相差327 mg/kg。其余各养分指标分布差异为:水解性氮>有效磷>有机质>全氮。差值分别为: 水解性氮159.19 mg/kg、有效磷 67.03 mg/kg、有机质 15.18 mg/kg、全氮0.88 mg/kg;各指标养分含量变异系数为:有效磷(69.08%)> 水解性氮 (32.90%)>速效钾(32.61%)>有机质(22.08%)>全氮(20.86%),范围均在 10%~100% ,属中等变异。表1
表1 新疆叶城县果园土壤养分指标一般性描述
Table 1 General description of soil nutrient index of orchard in yecheng county, xinjiang
有机质Organic matter(g/kg)全氮Total nitrogen(g/kg)水解性氮Hydrolysable nitrogen(mg/kg)有效磷Available phosphorus(mg/kg)速效钾Available potassium(mg/kg)变幅amplitude of variation0.69~15.8715.180.22~1.100.8812.63~170.82158.191.39~68.4267.0345.00~372.00327平均值average value8.790.5956.6612.56118.73标准偏差standard deviation1.940.1218.648.6838.72变异系数(%)variable coefficient22.0820.8632.9069.0832.61
2.2 土壤养分综合评价
2.2.1 相关系数矩阵及统计学检验
将782份土壤样本数据中水解性氮、有效磷、速效钾、全氮、有机质5个养分指标数据录入SPSS19.0,首先分析各变量的均数与标准差,其次分析相关数据矩阵:有机质与全氮相关性最高为0.749。经过Bartlett检验表明:Bartlett值=1 069.617,P<0.000 1,即相关阵不是一个单位矩阵,故考虑进行因子分析。KMO测度是用来比较相关系数值与偏相关系数值的一个指标,其值越接近1,表明对这些变量因子分析的效果越好[14]。KMO值=0.719,意味着因子分析的结果可以接受。表2,表3
表2 相关数据矩阵
Table 2 Correlation matrix
有机质Organic matter全氮Total nitrogen水解性氮Hydrolysable nitrogen有效磷Available phosphorus速效钾Available potassium有机质Organic matter1.0000.7490.5050.2420.234全氮Total nitrogen0.7491.0000.5110.2440.267水解性氮Hydrolysable nitrogen0.5050.5111.0000.2950.171有效磷Available phosphorus0.2420.2440.2951.0000.189速效钾Available potassium0.2340.2670.1710.1891.000
表3 Bartlett 检验和KMO 测度
Table 3 Bartlett test and KMO measure
Bartlett 值 Bartlett value1 069.617P0.000Kaiser-Meyer-Olkin测度Kaiser-meyer-olkin measure0.719
2.2.2 主成分分析
以 5项养分指标测定值为基础数据,用 SPSS19.0运行相关矩阵及贡献率可得,前3项主成分累计贡献率为84.209%,前3项主成分可以表达原始数据提供养分信息的84.209%,用前3项主成分信息可以代替原数据信息。其中,第一主成分贡献率49.238%,其中全氮和有机质主成分载荷相对较高,主成分载荷分别为0.860和 0.851,说明第一主成分是全氮和有机质的综合反映;第二主成分贡献率18.326%,速效钾主成分载荷最高,达到了0.697,说明第二主成分反映了速效钾含量对土壤养分的供给状况;第三主成分贡献率16.645%,有效磷在第三主成分中的载荷最高,为0.674,说明第三主成分是对有效磷含量的描述。
参考公式(1)和表4得出主成分线性方程为:
Fn1=0.851×Xn1+0.860×Xn2+0.746×Xn3+0.493×Xn4+0.444×Xn5.
(3)
Fn2=-0.272×Xn1-0.237×Xn2-0.175×Xn3+0.520×Xn4+0.697×Xn5.
(4)
Fn3=-0.120×Xn1-0.148×Xn2+0.192×Xn3+0.674×Xn4-0.552×Xn5.
(5)
注:Fn1、Fn2、Fn3分别代表第n个采样点的第一、二、三主成分因子的得分。
参考公式(2)、线性方程(3)、(4)、(5)和表4得出主成分综合得分线性方程:
F= 0.492Fn1+ 0.183Fn2+ 0.166Fn3.
(6)
注:F为综合得分,Fn1,Fn2,Fn3分别代表第n个采样点的第一,二,三主成分因子的得分。
所得782个土壤样点的综合分值进行一般性统计描述:分值范围在27.98~141.66,平均值为59.89,标准差为14.92,变异系数为24.92%,属中等变异。表4
2.2.3 聚类分析
研究通过综合得分线性方程计算出782个土壤样本的综合得分,用 SPSS 19.0软件中的 K-均值聚类过程进行分类,将分类的结果按照得分区间从高到低排序,即得出结果。研究表明,将782个土壤样本综合得分分为四类:第一类综合评价得分区间141.66~93.20,为极高得分区,样本数所占比率为2.69%;第二类综合评价得分区间76.13~70.58,为高得分区,样本数所占比率为20.46%;第三类综合评价得分区间68.91~53.05,为中得分区,样本数所占比率为41.94%;第四类综合评价得分区间52.14~51.57,为低得分区,样本数所占比率为34.91%;中及低类得分区样本数比率达76.85%。表5
表4 提取3项主成分矩阵及贡献率
Table 4 Extraction of three Principal component Matrices and contribution rate
主成分 Principal component123有机质Xn1Organic matter 0.851-0.272-0.120全氮Xn2Total nitrogen 0.860-0.237-0.148水解性氮Xn3Hydrolysable nitrogen0.746-0.1750.192有效磷Xn4Available phosphorus 0.4930.5200.674速效钾Xn5Available potassium 0.4440.697-0.552贡献率Rate of contribution (%)49.23818.32616.645累积贡献率Accumulating contribution rate (%)49.23867.56484.209
表5 土壤养分综合评价得分分类
Table 5 Classification of scores for comprehensive evaluation of soil nutrients
第一类(极高)First kind第二类(高) Second kind第三类(中)Third kind第四类(低)The Fourth kind样本数(个) Sample number (one)21160328273样本数所占比率(%) Percentage of sample size (%)2.6920.4641.9434.91综合评价得分区间 Comprehensive evaluation score range141.66-93.2076.13~70.5868.91~53.0552.14-51.57
2.2.4 土壤综合评价得分分类分布
依据土壤养分综合评价得分分类结果,查找样点对应的乡级分布,研究区极高养分含量所占样本比例最小,仅为2.69%,主要分布在萨依巴格乡;研究区高养分占样本数20.46%,主要分布在萨依巴格乡、吐古其乡、依提木孔乡和乌夏克巴什乡;研究区中等养分含量比例最大达到41.94%,主要分布在萨依巴格乡、加依提勒克乡、依提木孔乡、江格勒斯粮种场和恰尔巴格乡;研究区低养分含量达34.91%,主要分布在夏合甫乡、依提木孔乡、乌吉热克乡、加依提勒克乡。
3 讨 论
赵月玲等[10]应用主成分分析和聚类分析方法评价了土壤肥力特性,提到采用主成分分析法和聚类分析方法,以量化形式表现土壤理化性状的综合指标,可以大大减少单个指标所反映出的物理特性带来的差异性。黄安等[11]提到主成分分析在土壤评价中得到广泛应用,一般认为主成分分析可以弱化变量间的自相关性所引起的误差,形成互不相关的主成分,获得各主成分得分,同时通过计算得到综合评价得分,从而达到对土壤养分质量的精确评价。黄安等[11]土壤养分综合评价结果为变异系数为22.76%,属中等变异程度;中等及其以下的土壤养分含量空间分布中占全区面积的 73.63%,高养分含量土壤占全区面积的 21.2%,极高养分含量土壤占全区面积的 5.17%。陈吉等[12]在长期施肥土壤质量评价中,采用主成分分析方法。研究区域内采集1 586个0~60 cm土样,将部分土样的冠幅内和冠幅外的土样合并后形成782个土样,测定土壤的有机质、全氮、水解性氮、有效磷、速效钾,采用主成分和聚类分析相结合的方法,建议在以后的研究中增加测定土壤微量元素含量。
4 结 论
4.1 研究区内土壤养分含量分布不均匀。
4.2 主成分分析得出3个主成分,第一主成分是全氮和有机质的综合反映;第二主成分反映速效钾含量对土壤养分供给状况;第三主成分是有效磷含量的描述。
4.3 土壤养分综合得分划分极高、高、中、低四类得分区,样本数所占比率分别为2.69%、20.46%、41.94%、34.91%;中及低类得分区样本数比率达76.85%,叶城县土壤养分综合属于中低水平。
4.4 极高养分主要分布在萨依巴格乡;高养分主要分布在萨依巴格乡、吐古其乡、依提木孔乡和乌夏克巴什乡;中等养分含量主要分布在萨依巴格乡、加依提勒克乡、依提木孔乡、江格勒斯粮种场和恰尔巴格乡;低养分主要分布在夏合甫乡、依提木孔乡、乌吉热克乡、加依提勒克乡。
4.5 依据养分水平及分布建立科学施肥方案。生产中要重视有机肥的使用,以培肥地力;保证氮磷钾肥充足、科学、合理、绿色的施用。