基于PCA的江苏省资源环境承载力分析评价
2021-12-01王玉芳
王 勇,王玉芳
(江苏省测绘工程院,江苏 南京 210013)
0 引 言
资源环境承载力是指在自然生态环境不受危害并维系良好的生态系统前提下,一定地域空间的资源禀赋和环境容量所能承载的人口与经济规模[1]。在《国民经济和社会发展第十三个五年规划纲要》中资源环境承载力涉及产业结构调整及布局、新型城市建设、实施区域发展战略等多个重大工程。开展资源环境承载力的评价研究,能够识别影响承载力的关键因素,为真正践行“创新、协调、绿色、开放、共享”的新发展理念提供理论依据。国外较早开展了关于资源环境承载力的理论研究,如1992年William Rees提出了“生态足迹”评价方法[2],1997年Brown基于“能值分析法”[3],2006年Freckleton等人采用“时间序列法”[4]进行资源环境承载力分析。近年来,国内关于资源环境承载力的研究主要是指标体系及评价方法的研究[5-9]。本文以江苏省为例,构建江苏省各市辖区及县市的资源环境承载力评价指标体系,基于主成分分析(PCA)和K均值聚类分析(K-Means)模型,分析江苏省资源环境承载力状况及空间分布情况,以期为江苏省资源环境承载力评价提供方法支撑和现实依据。
1 资源环境承载力分析评价模型的建立
1.1 资源环境承载力分析评价的方法
本文采用以下方法(图1)对资源环境承载力进行分析评价:确定评估基本单元后建立多层次综合指标体系,从各类统计资料中获取指标统计数据,利用主成分分析法确定各指标权重后进行资源环境承载力计算,并利用聚类分析对计算结果进行等级划分。
图1 资源环境承载力分析评价方法
1.2 评价指标的选择
资源环境承载力评价指标的选择应能体现资源环境承载力复杂系统的结构性和层次性,遵循基础性原则,避免多项因素的综合结果,同时还应从短期内不易发生变化的自然资源和环境容量要素考虑。本文结合江苏省实际情况,综合考虑评价指标的选取原则以及数据的易获得性对指标进行了选择,包含目标层、准则层和指标层3个层次:目标层为江苏省资源环境承载力;准则层包括土地资源、水资源、土地环境、水环境和生态环境5大要素;指标层在准则层中选取单项评价指标组成,共9个指标(表1)。
表1 资源环境承载力评价指标体系
1.3 数据获取及预处理
本文研究的指标数据主要来源于《江苏统计年鉴——2019》以及江苏省各设区市2019年统计年鉴。因各市统计年鉴中,大部分评价指标分为市辖区和县(市)分别统计,故本文研究区域分为江苏省13个设区市的市辖区和41个县(市)。
本文中数据预处理主要是对空值的处理,某些指标项仅能从年鉴中获取设区市整体数值,如南通、连云港等市的城镇污水达标处理率(指标X8)和建成区绿化覆盖率(指标X9)等,对于下辖县市缺少的数值统一采用《江苏统计年鉴——2019》中所在设区市该项指标的统计值。
1.4 指标数据标准化处理
因各项指标具有不同的单位或量纲(表2),为消除不同单位和量纲对评价结果的影响,对原始数据采取极差法进行标准化处理,标准化的结果在[0,1]范围内。
表2 指标数据标准化过程中各指标上限值和下限值
(1)
为减少0值对计算结果的影响,对标准化处理后的0值,统一填入0.000 1,经标准化处理后的部分城市指标数据如表3所示。
表3 指标数据标准化结果示例
1.5 确定指标权重
经过标准化处理的指标数据,采用主成分分析方法(PCA)进行计算,以确定各指标权重,过程如下:
(1)PCA可按照从高到低的顺序返回各主成分方差贡献率,若前k个主成分方差贡献率之和达到85%以上,则认为这k个主成分几乎表达了原有指标的全部信息,可保留这k个主成分。
(2)获取这k个主成分对应的特征根eigenvalue及特征矩阵components。
(3)计算指标在不同主成分线性组合中的系数coefficient:
(2)
式中,Wi,j为第i个指标第j个主成分系数,Cpi,j为特征矩阵中第i个指标第j个主成分对应的特征值,ej为第j个主成分对应的特征根。
(4)计算各指标权重:
(3)
式中,rq为第q个指标的权重,wq,i为第q个指标第i个主成分系数,fi为第i个主成分的方差贡献率。
对各指标权重进行归一化处理,确定归一化后的指标权重。
(4)
式中,wq为归一化处理后,第q个指标的权重。
1.6 聚类评价
确定各个指标的权重后,对标准化处理后的各市县指标进行资源环境承载力得分计算,并对计算结果进行K-Means聚类。
(5)
式中,Sj为第j个区域的资源环境承载力得分,wi为第i个指标对应的权重,Sti为标准化处理后的第i个指标值。
K-Means算法属无监督学习算法,其主要计算方法是:
(1)将数据集分割成独立的K个组,每组为一类,并确定一个初始的质心。
(2)迭代计算样本与K个质心的相似度,将样本归类到最相似的类中,并重新计算新的质心,直到质心不再变化或达到指定的迭代次数。
计算样本与质心的相似度一般采用欧几里得度量(euclidean metric,欧氏距离)来衡量,即两者之间的欧式距离越小,两者之间的相似度越大。N维空间中两点x、y的欧氏距离计算公式如下:
d(x,y)=
(6)
资源环境承载力评价只针对资源环境承载力计算结果这一个指标进行聚类,故样本与质心的欧氏距离可通过公式:d(x,y)=|x1-y1|来计算。K-Means算法如选择随机的初始质心,聚类结果具有不确定性,故选取资源环境承载力计算结果的最小值、25%区间值、50%区间值、75%区间值、最大值为初始质心进行聚类,对应的聚类结果分为:较低、低、一般、高、较高五类,这也是实际进行某项评价时常用的分类方法。
2 结果与分析
根据构建的资源环境承载力评价指标体系,结合2019年江苏省及各设区市统计年鉴数据,选取各市辖区及县(市)资源、环境要素共计9项指标,首先进行主成分分析,前4个主成分方差贡献率分别为:0.41、0.22、0.17、0.08,累计达到88%,能够比较全面地反映影响资源环境承载力变化的因子,故选取前4个主成分,其成分矩阵如表4所示。
成分矩阵反映了各指标在各主成分上的载荷,由表4可知,指标项X2、X3、X5在第一主成分上有较高载荷,X1、X7在第二主成分上有较高载荷,X1、X2、X3、X5在第三主成分上有较高载荷,X1、X4、X6在第四主成分上有较高载荷。根据式(2)、式(3)、式(4)计算各指标权重,如表5所示。
表4 成分矩阵
表5 江苏省资源环境承载力评价指标权重
权重越高表明该指标项在综合评价结果中具有越重要的地位,指标X6的权重最高,其所在的土地环境准则层综合权重达0.339,表明土地环境准则层指标在综合评价中具有相对最重要的地位。
根据各项指标权重,得到综合评价公式:
F=0.122X1+0.142X2+0.168X3+0.063X4+0.133X5+0.206X6+0.139X7+0.012X8+0.015X9
(7)
考虑到资源承载力和环境承载力指标间的相互独立关系,首先分别对资源承载力和环境承载力进行了单要素评价,再与资源环境综合承载力评价结果进行对比,以期发现影响承载能力的关键因素。由南往北,以长江和淮河为分界线,将全江苏分为南部地区、中部地区和北部地区3个大区域,单要素承载力和综合承载力评价结果如表6所示。
表6 江苏省资源环境承载力评价结果
2.1 单要素评价结果分析
2.1.1 资源承载能力评价结果
资源承载能力包括资源支撑和资源压力两个方面。从江苏省整体资源承载能力状况来看,承载能力呈现出南部相对较低,北部相对较高的特点,承载能力最高的地区为中部地区,这里土地面积大,水资源丰富,农业发达,工业集聚程度较低,有较大的发展空间;承载能力较低的地区为长江以南苏州、无锡、常州、镇江4个设区市,这些地区经济建设程度较高,可利用土地面积相对较小,水资源压力较大,发展空间有限。
表6(续)
2.1.2 环境承载能力评价结果
环境承载能力包括环境支撑和环境压力两个方面。从江苏省整体环境承载能力状况来看,承载能力呈现出由北向南逐渐升高的特点,主要原因是长江以北地区农业发达,化肥施用量大,但对工业固体废物、生活污水等污染物的治理却相对落后,因此北部地区整体环境状况不如南部地区。
2.2 综合承载能力评价结果分析
综合指标X1~X9,计算江苏省资源环境综合承载力,整体上呈现南部区域总体较高,北部区域总体较低的特点。结合资源和环境单要素评价结果,可发现综合承载能力与环境承载能力高度相关,环境承载能力高的地区综合承载能力相对较高,如长江以南苏州、无锡、常州及镇江四市;环境承载能力低的地区综合承载能力也相对较低,如连云港市区及下辖县、泗洪县等。
3 结 语
本文通过主成分分析法对江苏省各市辖区及县(市)2018年资源环境承载力进行计算分析,结果表明:江苏省资源环境综合承载力具有南高北低的特点,土地环境污染状况以及治理情况是影响其高低的重要因素。资源环境承载力较低的地区在建设过程中应重视环境问题,不能过于依赖资源,应坚持“创新、协调、绿色、开放、共享”的发展理念,以高质量发展引领“强富美高”新江苏的建设。
影响资源、环境承载能力的指标较多,本文从数据的可得性出发,仅选择了9个指标进行评价分析,是否具有代表性,还需进一步研究。此外,本文仅分析了全省2018年资源环境承载力,未从时间维度对其进行分析。