基于SAS与SPSS的改进主成分分析法在邯郸市水资源承载力中的应用
2019-04-08卢泽雨周鹏飞王丹阳
卢泽雨,周鹏飞,王丹阳
(河北工程大学 水利水电学院,河北 邯郸 056006)
0 引 言
面对全球资源日益严重短缺的情况,自1970年以来,联合国粮食及农业组织(FAO)、教科文组织(UNESO)以及经济合作与发展组织(OECD)就承载能力项目进行了大量研究。最早从单一的工程方面研究发展到如今成为囊括土地资源承载力、水资源承载力和人口承载力等不同研究领域在内的科学[1]。水资源作为人类社会生活中必不可少的战略性资源,在各类生产活动中发挥着极其重要的作用。面对水资源短缺、水环境污染严重和水生态系统退化的严峻形势,加强水资源的开发利用已成为当今世界各国关注的焦点问题。水资源承载力(water resources carrying capacity)是应用于水资源领域的承载力概念,国外将其纳入可持续发展问题中进行讨论,国内学者于20世纪80年代末首度提出“水资源承载力”[2]。水资源承载力是指在保证社会经济稳定发展的同时,使当地可用水资源总量保持稳定的最大可承载的农业、工业和人口水平等[2]。 它还指在一定的技术经济和社会水平的生产条件下,工农业生产的供水、生活和生态环境的供水能力,即最大的水资源开发能力[3]。
水资源承载力是当前一个热门研究方向,很多学者都在利用不同的评价方法进行研究,最常用的是综合指标法、主成分分析法、系统动力学法及模糊综合评价法等[4]。
为使所得原始数据信息可以通过几个不同的主要方面进行分析,并使转化后的信息保存率更完整,故以改进的主成分分析法作为本文的主要研究方法[5]。目前,由于邯郸市水资源匮乏,不同用水户之间争水情况严重,地表水水质污染加剧及地下水超采严重等问题导致的可用水量减少,都已严重制约邯郸市社会经济的发展[6]。为改善邯郸市用水现状,提高本地区的用水效率,使有限的水资源得到充分利用,有必要对本地区水资源承载力进行评价,并应以本地区的社会发展和经济条件为基础进行分析[7],这对邯郸市的可持续发展具有深远意义。
1 传统主成分分析法步骤
近年来,邯郸市社会经济和总人口数的增长、工业污水排放对水质的污染及农业对水资源的巨大消耗,都使得本区域人口对水资源的需求量日渐增加,对水资源更加依赖,水资源日益短缺已成为制约本地区社会经济发展的重要因素之一[8]。传统主成分分析法是采用降维的思想,将体系内多种指标简化为与少数几个综合指标相关的表达形式,当中的大部分原始变量信息可以互不重复地通过每个主成分内容进行体现[9]。其步骤为:
1) 选定影响较大的指标作体系变量,对收集的原始数据进行标准化处理。
2) 从标准化数据中获取原始数据的相关矩阵。
原始变量Xi与Xj的相关系数为rij(i,j=1,2,…,p),rij=rji,其计算公式为:
3) 利用SPSS 24统计软件计算相关矩阵R的特征值和相应的特征向量。
4) 计算方差百分比和累积值。
方差百分比:
累积值:
5) 确定主成分数目。主成分的数目通常根据累积值大于85%或总计值λ≥1来确定[10]。
6) 计算主成分得分。各主成分得分的计算方法是:
Ai=β1iX1+β2iX2+…+βpiXp,其中βpi(i=1,2,3,…,m)为主成分Fi在变量Xp上的得分。
2 改进主成分分析法
传统的主成分分析法在对主成分的提取时未对各个因素间量纲进行优化处理,从而易受到量纲影响,本文在传统主成分分析法的基础上对主成分的提取进行改进[11-13]。
对原始数据作标准化处理是实际应用中采用较多的方法:
但此方法过度优化,在消除量纲影响的同时也消除了各指标的变异程度的差异信息。
故在此对传统的主成分分析法进行均值化处理[14]。
设初始矩阵:X=(xij)n×p
得均值化矩阵Y=(yij)n×p
此方法可以更好地提取主成分内容而改变各指标间的相关系数,从而保留各指标间的差异信息。
3 邯郸市区域概况
邯郸市地处N36°04′-N37°01′,E113°28′-E115°28′之间,位于河北省最南部。邯郸市馆陶县以东与山东相接,南接河南,西边与太行山和山西省为邻,北与邢台市接壤。市境南北相距102 km,东西最长178 km,区域面积12 068 km2。其中,山区面积4 468 km2,占总面积的37.0%;平原面积7 600 km2,占总面积的63.0%。
2016年《邯郸统计年鉴》资料显示,2015年底邯郸市总人口1 049.7万人,人口密度为870人/km2。其中,非农业人口382.2万人,占总人口的36.4%。2015年邯郸市地区生产总值3 145.4亿元。其中,第一产业增加值402.80亿元,第二产业增加值1 483.40亿元,第三产业增加值1 259.20亿元。
4 改进主成分分析法体系的建立与结果的分析
对水资源承载力的分析需要考虑到社会发展、经济和水资源量等诸多因素的影响[10]。考虑到以上原因,本文基于《邯郸统计年鉴》(2007-2016年)、《邯郸市水资源公报》(2005-2015年)和《河北省邯郸市水资源评价》等资料,构建全面、合理的邯郸市水资源承载力分析指标体系。具体指标包括10项,分别为:总人口数(X1),人;地区生产总值(X2),万元;水资源总量(X3)(天然来水量,不含引水工程及机电井工程),108m3;农业用水量(X4),108m3;工业用水量(X5),108m3;生活用水量(X6),108m3;降雨量(X7),mm;工业废水年排放量(X8),104m3;生活污水年排放量(X9),104m3;工业万元增加值用水量(X10),m3/万元。
首先,对原始数据进行均值化处理,均值化后的原始数据见表1。
由于部分数据相关性较强,致使求得的相关性矩阵为非正定矩阵,SPSS 24中无法对非正定矩阵进行聚类分析。故特通过SAS 9.2软件编写proc princomp程序对其重新进行主成分提取过程分析并检验,再由proc cluster程序绘制聚类谱系图对SPSS的缺点部分进行补充。
通过SAS9.2及SPSS 24统计分析软件对指标体系中10项经均值化处理后的数据进行了系统分析,得到邯郸市水资源承载力各项指标的相关性矩阵(表2)、相关矩阵的特征值图(图1)及成分荷载矩阵(表3)。
表1 原始数据经均值化处理结果表Tab.1 Raw data averaged processing result table
表2 邯郸市水资源承载力各项指标的相关性矩阵Tab.2 Correlativity matrix of various indicators of water resources carrying capacity in Handan City
图1 相关矩阵的特征值图Fig.1 Eigenvalues of the Correlation Matrix
表3 成分荷载矩阵Tab.3 Component matrix
注:表3提取了3个成分。
在选择主成分分析法的情况下选择特征值大于1的值作为主成分,由相关矩阵的特征值图(图1)可以确定[15-16],应选择前3项为主成分(即A1、A2、A3),且其累积贡献率也达到87.778%。
从表3可以看出,第一主成分在总人口数(X1)、地区生产总值(X2)和生活用水量(X6)3方面相关性较大,这是影响邯郸市水资源承载力最主要的因素,即社会和经济发展对水资源消耗的影响可通过第一主成分进行表示;第二主成分主要与水资源总量(X3)和降雨量(X7)呈正相关,反映了邯郸市水资源本身的匮乏情况;第三主成分与工业用水量(X5)和农业用水量(X4)有着较大的正相关性,可以较好地反映日常生产对水资源承载力的影响。
第一主成分的方差百分比为49.024%,对邯郸市水资源承载力的影响至关重要。由于经济的快速发展,一产、二产、三产近年来用水量较往年普遍增加。为支持经济的发展,水资源作为一项不可缺少的战略性资源消耗量巨大,为推动邯郸市的经济发展提供了支持,但因此造成的水资源承载能力下降不可小觑。邯郸市属于全国著名的重工业重污染城市,其经济的发展主要靠工业的支持,2015年邯郸市工业总产值已占本地区生产总值的41.5%。由于工业污水的大量排放,且部分工厂污水处理未达到排放标准及回用率低等原因,造成河水污染和可用水量减少,这在第三主成分中也有所体现。另外,本地区人口迅速增长,邯郸市2015年总人口数为10 496 969人,比2010年9 634 990人同比增长了89.46‰,比2005年8 714 338人同比增长204.56‰。用水基数不断增加,生活用水量加大,以上两方面是造成邯郸市水资源承载力下降的最重要因素。
第二主成分方差百分比为25.900%,很好地反映了多年来水资源的变化情况。2015年邯郸市降雨量比去年减少66.1 mm,比多年平均降雨量少136.9 mm;比2010年全市平均降雨量472.8 mm减少14.76%,比2005年全市平均降雨量567.9 mm减少37.84%。邯郸市降雨量常低于其多年平均降雨量,水资源总量(天然来水量)也呈总体下降趋势,影响了邯郸市水资源承载能力。
最后一个主成分方差百分比占12.860%,同样是影响水资源承载力的重要因素之一。农业用水量和工业用水量在第三主成分中占有较大的载荷。究其原因是因为邯郸地区农业种植大多采用大水漫灌的浇地方式,节水措施不够到位,地下水水量减少,地下水位持续下降。同时,2013年前,邯郸市工业用水量持续走高,从2005年2.211 4×108m3,稳步增长至2.78×108m3,增加25.79%。第三主成分反映了高耗水型农业生产和工业的快速发展对邯郸市水资源承载力造成了一定压力。
聚类分析可以通过利用数学方法按照某种相似性或差异性指标,再根据样本自身的属性,定量地确定样本之间的亲疏关系,并据此对样本进行聚类[17]。为研究邯郸市水资源承载力发展趋势,故采用SAS对所选数据并对10年数据进行系统聚类分析,并对其进行排序。图2为将3个主成分得分的数据代入proc cluster程序中所绘制的聚类谱系图,现将观测的年份数据分为3类,可分为:
{2006、2007}
{2008、2009、2010、2011}
{2012、2013、2014、2015}
按各类中的第一主成分得分排序得到排序结果为:
2006、2007、2011、2010、2009、2008、2015、2014、2013、2012
图2 按年份聚类谱系图Fig.2 Clustering pedigree by year
另外,用综合得分排名与主成分聚类排名进行对比,综合得分按何晓群教授的编写的《多元统计分析》中的计算方法计算,即由各个主成分得分乘以其相对应的特征值后得到[18]。
现对两种聚类排名结果进行对比,排名结果见表4。
表4 不同方法排序结果表Tab.4 Sorting results table of different methods
5 结 论
由两种排序方法来看,邯郸市水资源承载力变化趋势相对较好,承载力基本呈现逐年上升趋势。尤其是近年来水资源承载能力相对较大,且邯郸市水资源承载力主要受到第一主成分的影响,即社会经济的快速发展和人口的迅速增长是影响邯郸市水资源承载力的最重要因素,因此在促进经济的稳定发展的同时,应该考虑到水环境和人口对水资源紧逼的形势,坚持走可持续发展道路。
由第二主成分可以看出,天然来水量及降水量在这一主成分中所占载荷较大。这是由于漳河、滏阳河等天然来水量不足,卫河水质变差,自20世纪80年代开始引卫水迅速减少等原因造成上游主要河道来水量急剧减少,由此对邯郸市水资源承载力造成了较大压力。
第三主成分体现了工业耗水量和农业耗水量对邯郸市水资源承载力的影响。其中,第一主成分的经济发展主要靠工业带动,这在其中也有所体现。除此之外,邯郸市大部分地区农业灌溉方式多为大水漫灌,严重浪费了地下水,因而成为降低邯郸市水资源承载力的一个因素。