基于GIS的区域水环境压力分区研究
2011-09-19田富姣
张 培,田富姣
(1.郑州大学 环境政策规划评价研究中心,郑州450002;2.郑州大学 环境技术咨询工程公司,郑州450002;3.郑州大学 水利与环境学院,郑州450002)
水环境压力是一个作用因素繁多、内涵十分复杂的概念,目前国内外对其鲜有专门的研究。袁洪锋认为水环境压力是水环境影响于人口、社会与经济持续发展的阻力,形成水环境压力的因素有自然因素和非自然因素[1]。顾晓薇等人定义环境压力为人类活动引起的能够造成环境服务功能退化的对环境状态的扰动力[2];王恒认为环境压力是人类的各种活动对其周围的环境所施加的影响力,这种影响力介入、扰乱或改变了宏观和微观的自然过程,致使环境状态发生“非自然”变化,引起环境功能的退化,对人类的生存、生活条件和健康带来不利影响,进而制约社会、经济的发展[3]。结合环境压力的内涵,笔者认为水环境压力是人类社会经济活动对水环境所施加的影响,这种影响包括水资源的过度开发、水体的污染、水环境系统功能的退化等。
GIS技术作为一种可视化的数据采集、存储、分析、管理工具,已经被广泛地应用到分区规划中,为分区规划进一步科学化、精确化和合理化提供了可能,同时GIS技术强大的空间分析功能,极大地增强了分区规划的科学性、目的性和现实意义。水环境压力分区是基于人类活动对水环境所产生的影响而提出的,目的是识别出不同区域水环境压力特征。本研究以漯河和平顶山地区(以下简称研究区域)为研究对象,运用GIS技术建立研究区域子流域单元表征指标数据库,并应用分区指标对研究区域进行水环境压力分区,识别不同区域水环境压力状况,为区域水环境管理目标与措施制定提供科学依据和决策支持[4-5]。
1 水环境压力分区指标体系
指标体系的确定应该尽可能体现水环境压力分区的目的与特色,并反映出不同区域水环境压力的空间差异性规律。水环境压力分区应该遵循流域完整性、综合性与主导性、相似性与差异性以及地域发生学与共轭性原则[6],指标在选取的过程中应遵循科学性、全面性、独立性、代表性、适用性、简明性和可操作性的原则,采用理论推导法、专家选取法和文献频数法从人口压力要素、社会经济压力要素、水资源压力要素、水环境污染压力要素和生态环境压力要素等方面进行分析,选取表征各要素层的指标建立区域水环境压力分区指标体系,如表1所示。
表1 水环境压力分区指标体系
2 研究区域与研究方法
2.1 研究区概况
研究区域位于河南省中南部,北纬33°08′-33°59′,东经112°14′-114°16′,总面积10 499 k m2。东部和中部以平原为主,西部和西北部以山地为主,自西北向东南方向倾斜,全境最高海拔2 153 m,最低50.1 m,地形地貌多样。2009年研究区域总人口761.77万人,人口密度为725.56人/k m2,城镇化率为40.93%,人均GDP为22 555.36元。研究区域全年水资源总量22.087亿 m3,总用水量14.060 3亿m3,人均用水量184.7 m3,单位 GDP用水量81.83 m3/万元。2009年研究区域全年废水排放量30 584.3万t,COD排放量49 926.02 t。
2.2 研究方法及技术路线
在大量资料收集、文献阅读和现场调研的基础上,以SRT M 30 m分辨率的高程图为基础,在ARCGIS软件的支撑下对研究区域进行流域提取,获取研究区域子流域单元;通过数字化研究区域行政区划图将收集到的数据分配到各子流域单元,建立子流域单元表征指标数据库,形成表征指标专题图;对表征指标进行相关分析选取具有代表性的指标参与分区,将分区指标专题图进行叠加,运用ERDAS软件将叠加结果聚为2-10类,运用伪F检验方法选出最佳聚类数,并参考研究区域湖库节点完整性对聚类结果进行调整,最终形成研究区域水环境压力分区结果。研究区域水环境压力分区技术路线如图1所示。
图1 研究区域水环境压力分区技术路线
3 结果与分析
3.1 相关分析
由于各表征指标的单位不同,不同指标之间没有可比性,因此在进行相关分析和聚类分析前需要对不同量纲指标的初始数据进行标准化处理,把所有指标数据转换成统一的含义。表征指标标准化量化公式为[9-10]
Ci=(Xi-min Xi)/(max Xi-min Xi)
式中:Ci——第i个指标标准化后的值;Xi——第i个指标的原始值;max Xi——第i个指标原始值中的最大值;min Xi——第i个指标原始值中的最小值。
选用多个表征指标对研究区域进行水环境压力分区能够尽可能全面地表达出区域所受到的各种压力影响,但并非指标越多越好。由于一些表征指标之间存在较大的重复性,会造成水环境压力分区过程中的冗余,因此本研究利用相关分析对表征指标进行筛选。相关系数r表示两个指标之间的相关性,-1≤r≤1,r的绝对值越接近1,说明两个指标之间的相关性越强。本研究运用SPSS软件对量化后的子流域单元表征指标数据进行相关分析,结果如表2所示。
表2 表征指标的相关性分析
从表2中可以看出,人口密度指标综合性最强,富含信息量最大,其与城市化率、人均水资源量、用水负荷、废水排放强度、单位水资源COD排放量、化肥施用强度、土地垦殖率、土地利用程度综合指数等8个指标都有非常强的相关性,其相关系数基本上都在0.6以上,说明人口密度指标能较好地综合反映各相关指标所表达的信息量,具有很强的代表性,故选取人口密度作为分区指标,则与其相关性强的指标不再考虑;剩余的指标有人口增长率、人均GDP、产业结构、单位面积水资源量和单位GDP耗水量,这5个指标中,单位面积水资源量和单位GDP耗水量这两个指标综合性比较强,富含信息量比较大,单位面积水资源量与人口增长率、人均GDP、城市化率、单位GDP耗水量等4个指标具有很强的相关性,单位GDP耗水量与人均GDP、产业结构、城市化率、单位面积水资源量等4个指标具有很强的相关性,同时这两个指标之间又具有很强的相关性,因此需要从这两个指标中选取其一。
从表2中可以看出,这两个指标的综合性相似,且与其相关指标的相关程度也大体一致,本研究运用变异性分析来筛选确定,变异系数越大,说明空间差异特征越明显,因此选择变异系数大的指标。变异系数=标准差/均值,通过计算得知单位面积水资源量的变异系数为0.88,单位GDP耗水量的变异系数为0.76,故选取单位面积水资源量指标作为分区指标,则与其相关的指标不再选取;最后剩余产业结构一个指标,将其纳入到分区指标中。综上所述,最终确定的分区指标是:人口密度、单位面积水资源量和产业结构。
3.2 聚类分析
运用ERDAS软件将研究区域子流域单元分区指标专题图进行叠加,基于非监督分类方法(ISODATA)将研究区域分区2-10类,如附图1所示。
尽管运用ERDAS软件将研究区域划分为2-10类,但是无法确定哪一种分区结果为最好的分类方案,因此需要选择一种检验方法以从众多的分类方案中选择最好的一种。很多文献对最佳聚类个数的确定,提出了相应的检验指标以确定聚类个数在局部或整体最优,用于检验判断最佳聚类个数的指标有R2统计量、半偏相关统计量、伪F统计量(PFS)、伪t2统计量等[11]。本研究应用伪F统计量(PFS)来确定研究区域水环境压力分区最佳聚类方案。伪F统计量计算公式为
式中:G——聚类个数;n——聚类单元数;PG——分类数为G个类时的总类内离差平方和;T——所有变量的总离差平方和。
伪F统计量评价分为G个类的效果,如果分为G个类合理,则类内离差平方和(分母)应该较小,类间平方和(分子)相对较大。考虑PFS值随着分类G值的增大,PG总是趋于下降,而(T-PG)总是趋于上升,但这并不使PFS值始终上升,因为随着G值的增大,比值(n-G)/(G-1)却不断下降。因此可以预知,在规定的聚类数范围内,PFS可能在某一G值处达到最大值,而这个最大值正是我们所要寻找的最佳分类数。
根据伪F统计量的计算公式分别对这9种聚类方案的三个分区指标计算其F值,结果如图2所示。
对一个样本点数为n的数据对象可能有的最佳聚类个数上限,很多研究者使用经验规则为或2l n n下取整[12]。虽然此结论无明显的理论指导,但很多专家已在使用,也有间接旁证文献和实例应用[13]。根据此最佳聚类数取值经验规则,本研究子流域单元个数为33个,其最佳分类数目的取值范围应在2-6类,从图2中可以看出,随着聚类个数的增多,分区指标PFS值加权平均后的值逐渐增大至8类后开始降低,8类处为一个最大值点,同时6类处为一个拐点。结合经验公式及图2,确定本研究区域最佳聚类个数为6,因此将研究区域聚为6类。
图2 各种聚类方案分区指标PFS值趋势
3.3 聚类结果调整
从附图1中可以看出,研究区域水环境压力6类分区方案中研究区域被分成11部分。同时,研究区域内包含三个较大的水库,分别为白龟山水库、昭平台水库和燕山水库,一个完整的湖库具有相似的生态系统特征,因此不能将其分裂开,在进行分区时应保证湖库节点的完整性,即要保证一个湖库完全位于一个分区内。在现有的6类分区方案中,白龟山水库跨越16号、29号和30号子流域单元,也即是横跨3个分区,因此需要对这3个分区进行调整,调整的原则是将白龟山水库划入其落入面积最大的区域内,也即是将其划到16号子流域单元中;昭平台水库跨越11号,25号和30号子流域单元,横跨两个分区,按照同样的原则,将昭平台水库划到11号子流域单元所在的分区;燕山水库完全落于27号子流域单元内,因此不需要对其进行调整。经过调整后的研究区域水环境压力分区结果如附图2所示。
3.4 结果分析
研究区域水环境压力各分区特征如表3所示。
表3 研究区域水环境压力分区结果分析
4 结 论
本研究选择漯河、平顶山地区作为研究案例,主要是由于这两个地区无论从地形地貌、经济发展,还是从污染物排放、生态建设等方面都有着很大的差异性,有利于更好地研究人类活动对水环境产生的压力。
本研究通过参阅大量的文献,初步建立研究区域的指标体系,在运用地理信息系统提取研究区域子流域单元的基础上建立表征指标数据库,并运用相关分析方法结合变异分析选择出人口密度、单位面积水资源量和产业结构作为研究区域的分区指标;在GIS和RS的辅助下,建立研究区域的聚类方案,并运用PFS方法选择出了最优聚类数目,同时在保证湖库节点完整性的基础上对最优聚类结果进行了调整,最终将研究区域分区6类11个区,并阐述了各分区的特点。
本研究尝试运用GIS技术对研究区域进行水环境压力分区,并取得了较好的效果。但是,在分区过程中发现,数据获取和子流域单元提取是一个关键点和难点,如何保证流域提取结果与现状相符及数据可得性是未来要研究的重点。
[1] 袁洪锋.我国水环境压力及其特征分析[J].浙江大学学报:理学版,2002,29(2):219-224.
[2] 顾晓薇,王青,刘敬智,等.环境压力指标及应用[J].中国环境科学,2005,25(3):315-319.
[3] 王恒.四川省环境承载力与压力研究[D].成都:西南交通大学,2008.
[4] 刘木生,林联盛,郭秋忠.基于GIS的生态功能分区技术方法刍议[J].江西农业学报,2008,20(10):111-113.
[5] 张海星,谭斌.基于GIS方法的赣江流域水环境功能区划研究[J].江西科学,2003,21(1):26-29.
[6] 尹民,杨志峰,崔保山.中国河流生态水文分区初探[J].环境科学学报,2005,25(4):423-428.
[7] 程道品,王金叶,胡新添,等.广西生态环境质量的动态驱动机制[J].桂林工学院学报,2006,26(4):591-594.
[8] 庄大方,刘纪远.中国土地利用程度的区域分异模型研究[J].自然资源学报,1997,12(2):105-111.
[9] 丁耕,吴伟.基于GIS的东辽河流域生态安全空间差异评价研究[J].安全与环境学报,2006,6(3):119-122.
[10] 王敏,熊丽君,黄沈发.上海市主体功能区划分技术方法研究[J].环境科学研究,2008,21(4):205-209.
[11] 李斌,郭剑毅.一种带约束的最小离差平方和系统聚类法及应用[J].计算机应用,2005,25(1):45-48.
[12] 吴艳文,胡学钢.一种K-means算法的k值优化方案[J].巢湖学院学报,2007,9(6):21-24.
[13] 于剑,程乾生.模糊聚类方法中的最佳聚类数的搜索范围[J].中国科学:E辑,2002,32(4):274-280.