APP下载

基于相关分析与粗糙集理论的区域水资源承载力评价

2015-12-15刘玉东

水利规划与设计 2015年8期
关键词:和田地区约简粗糙集

刘玉东

(新疆塔里木河流域希尼尔水库管理局,新疆 库尔勒 841000)

基于相关分析与粗糙集理论的区域水资源承载力评价

刘玉东

(新疆塔里木河流域希尼尔水库管理局,新疆 库尔勒 841000)

本文围绕区域水资源承载力指标体系的初始、优化和评价检验三个构建过程,针对构建中的指标信息重复和干扰问题,提出基于相关分析与粗糙集 Horafa属性约简算法相结合的指标体系优化,并采用灰色系统理论与粗糙集耦合的评价方法对优化结果进行评价。以新疆和田地区为例,从水资源系统、社会系统、经济系统和生态环境系统四个方面,构建由 16项指标组成的初始水资源承载力评价体系,通过筛选得到由 10项指标构成的优化ISAWRCC,进而对这两套指标体系进行评价。结果表明:相关分析与粗糙集 Horafa属性约简算法相结合的指标信息优化方案是可靠的;筛除重复和干扰指标信息,简化了繁杂的指标体系,降低了后续评价的计算复杂度,并且信息筛选后的优化水资源承载力评价体系比初始体系评价结果更合理。

水资源;承载力;评价体系;分析;灰色系统理论

水资源承载力是区域可持续发展战略的重要组成部分,区域水资源承载力评价对于区域社会经济的持续发展、生态环境的良性循环具有重要意义。水资源承载力评价指标体系(Indicators System for Assessment of Water Resources Carrying Capacity,ISAWRCC)的构建则是水资源承载力评价的核心内容之一,但关于如何构建 ISAWRCC尚未形成一致观点。目前,ISAWRCC构建的常见方法大致有:①从理论探讨入手构建指标体系,如基于协调论、和谐论和可持续发展理论的内容,以水资源、社会经济和生态环境等系统为准则层,从水资源可供性、开发利用效率、合理配置程度和管理能力等方面选择评价因子;②结合固定模型,划分体系结构及选取评价指标,如 PSR模型或DPSIR模型;③通过指标归类处理或指标使用频度统计,确定体系准则,选取高频指标参与评价,如以总量、比例、强度和效益四类指标构建ISAWRCC。

本文基于ISAWRCC构建的一般方法与步骤,围绕初始、优化和评价检验三个过程构建ISAWRCC;针对常用筛选方法的不足,提出相关分析与粗糙集Horafa属性约简算法相结合的优化方案,进行水资源承载力评价指标的筛选;并采用灰色系统理论与粗糙集耦合的评价方法,对指标筛选后的优化结果进行检验。以新疆和田地区 2005年至2012年8年的基础数据为样本,进行ISAWRCC构建研究,以期为 ISAWRCC构建提供科学合理的方法和指导。

1 水资源承载力指标体系的构建方法

1.1 初始ISAW RCC

依据理论分析和专家经验,建立初始ISAWRCC,这一过程主要涉及体系结构确定、指标选取和指标内涵界定三方面内容。体系结构确定,即通过理论分析设计指标体系的层次和准则,形成构建ISAWRCC的结构框架;指标选取,是在把握区域水资源特性及数据现实性的基础上,依据相关理论及专家经验选取参评指标;指标内涵界定,指遵循通用性和科学性原则,对各项指标所表征的实际意义给出明确规定,且界定各项指标对于评价目标的“正负”向类型,即数据的方向。

1.2 优化ISAW RCC

针对指标信息的重复和干扰,应用适当的数学方法进行指标筛选,有助于简化繁杂的指标体系,提高评价结果的精确度。其中,粗糙集可有效处理数据不确定性,删除冗余信息,与数理统计法相比,具有鲁棒性好、灵活性强的优点,而相关分析能发掘数据间隐含的线性关系,揭示重复指标。本文拟将相关分析与粗糙集属性约简法结合,应用到ISAWRCC构建中,以避免信息重复和干扰。

1.2.1 相关分析

若两组指标数据相关系数的绝对值越大,则它们的相关程度越高,反之独立性越强。设Rij是第

i、j项指标的相关系数,xki为数据无量纲化后第k个评价对象的第 i项指标,且第 i项指标的数据平均值为,则第 i项与第 j项指标的相关系数表示为:

相关系数绝对值|Rij|衡量了第 i项与第 j项指标数据的线性相关程度,对相关关系的显著性检验通常有临界值法和方差分析检验法,这里采用临界值法,结合相关系数显著性检验表,确定高度线性相关的临界值。临界值法中,通过比较 |Rij|和临界值 r(α,n-2)的大小判定线性关系的显著性,其中 n为样本个数,α为显著性水平。为在避免指标误删的前提下发掘高度相关的指标,确定当显著性水平达0.01,即 |Rij|≥r(0.01,n-2)时,可以判定第 i项与第j项指标数据高度线性相关。

1.2.2 Horafa属性约简算法

粗糙集理论常利用二维信息表来描述一个知识系统,描述对象的指标称为属性。粗糙集属性约简是在保留关键信息的前提下对数据进行化简并求得知识的最小表达,常见的属性约简法可归纳为:上、下近似集法;区分矩阵法;属性重要性法。其中,Horafa算法是基于区分矩阵并以属性加权频度为启发信息的属性约简法。该算法摆脱了对原数据表的依赖,结合反映区分矩阵特性的属性加权频度进行计算,使得约简更加灵活。此外,Horafa算法以属性加权频度为指标选取的第二参考信息,而属性加权频度刻画了属性重要性,若属性重要性越大,则输出信息越多、作用越显著,因此该算法优先选取重要度大的指标参与评价,在一定程度上确保了参评指标有显著作用。

1.2.3 基于相关分析与粗糙集的ISAWRCC优化

将相关分析与粗糙集Horafa属性约简算法相结合,以筛除初始ISAWRCC中的重复和干扰信息,步骤如下:

(1)数据无量纲化处理。这里采用极值无量纲化法,对于“正向”类型的指标用公式 Yi=(ximin xi)/(max xi-m in xi)进行无量纲化,对于“负向”类型的指标则采用公式Yi=(max xi-xi)/(max xi-min xi)无量纲化。

(2)利用相关分析筛选高度线性相关指标。得到 n项底层指标的 n×n阶相关系数矩阵,依据相关系数显著性水平α的检验临界值,并结合理论分析筛选重复指标,由于无量纲数据均已转化为正方向,因此当相关系数为正时是真相关。

(3)无量纲数据离散化处理。采用等距离划分法将连续型数据化为 n个等级,如用等级 1、2、3和 4分别代表[0,0.25)、[0.25,0.5)、[0.5,0.75)和[0.75,1]区间上的值。

(4)约简冗余性干扰信息。基于离散化数据表,构造区分矩阵,结合粗糙集 Horafa属性约简算法,约简冗余指标,最终得到信息筛选后的优化ISAWRCC。

1.3 评价检验

指标体系优化结果的评价检验是确定优化方案是否科学合理的必要过程。基于优化ISAWRCC的指标数量少而初始 ISAWRCC指标数量多的特点,并考虑客观赋予指标权重、避免过多主观影响的重要性,这要求所采用的评价方法必须对指标数量改变不敏感,且充分满足指标权重赋予客观的要求。灰色系统理论的灰色关联度评价法,不仅适用于大样本数据量,而且适用于小样本数据量,并依据数据变化发展的状态和趋势客观赋权;而粗糙集赋权法将指标权重转化为属性重要度,通过属性重要度的计算和分析客观确定指标权重。因此,本文将灰色关联度评价法与粗糙集的属性重要度赋权法耦合,对初始ISAWRCC和优化ISAWRCC两套指标体系进行评价,这避免了由于赋权主观或指标数量改变对评价结果造成的影响,该方法计算过程如下:

(1)设水资源承载力评价指标的最优参考序列x0={x0i}(i=1,2,…,n),即无量纲化后的分量值均为1,此时的区域水资源承载力到理想化的最优状态。令水资源承载力评价指标的比较序列 ui={uij}(i=1,2,…,m;j=1,2,…,n),即第 i个评价对象第 j项指标的无量纲值。

计算比较序列与最优参考序列的绝对差列:

(2)根据绝对差列,可得两级最大差 Δ(max)为1和两级最小差 Δ(min)为 0,取分辨系数ρ= 0.5(0<ρ<1),则第 i个评价对象与最优参考序列的关联系数为:

(3)采用加权平均法,计算各评价对象与参考序列的关联度,即第 i个评价对象的综合评价值,计算模型为:

式中:Wk为指标 k的权重。

(4)利用粗糙集属性重要度赋权法确定指标k的权重 Wk。粗糙集理论中,知识是一种对信息系统的分类能力,其属性重要度的计算可依据属性依赖性或信息熵,其中基于信息熵的属性重要度通过从属性集中去掉一属性后对系统分类能力的影响来测度,定义如下:

在信息系统 S=(U,R)中,U为评价对象组成的论域,R为属性集合,则知识 Xi输出的信息熵大小为:

式中:p(Xi)为区分矩阵中知识的概率分布,则对于信息系统 S=(U,R),指标 r∈R的重要度表示为:

由此可见,该评价方法利用灰色关联度和指标属性重要度组合赋权,计算简单易行,所得评价值的大小客观地反映了水资源承载力的优劣。

2 模型应用

2.1 建立初始ISAWRCC

根据文献数据资料,新疆和田地区水资源承载力体系包括 4个方面、16项指标。4个方面包括水资源系统、社会系统、经济系统和生态环境系统。其中水资源系统包括人均水资源量(C1,m3)、水资源开发利用率(C2,%)、单位面积水资源量(C3,万m3·km-2)与供水模数(C4,万 m3·km-2)这4项指标;社会系统包括人口密度(C5,人·km-2)、人口自然增长率(C6,‰)、城镇化率(C7,%)、农村饮用水不安全率(C8,%)4项指标;经济系统包括人均 GDP产值(C9,元)、GDP年增长率(C10,%)、耕地灌溉率(C11,%)与第一产业占GDP比例(C12,%)这 4项指标;生态环境系统包括林 草 地 覆盖 率 (C13,%)、生态 环境 用水 率(C14,%)、地下水开采率(C15,%)与工业废水处理率(C16,%)这 4项指标。和田地区水资源承载力评价指标体系详见表1。

表1 和田地区水资源承载力评价体系

2.2 优化ISAW RCC

根据文献数据资料,借助 SPSS统计分析软件,对表1中的 16项评价指标进行相关分析,得到描述各指标间相关程度的 16×16阶相关系数矩阵。本实例指标的样本个数 n=8,当显著性水平 α= 0.01时,显著性临界值 r(0.01,6)=0.8343,因此当相关系数 Rij≥0.8343时,判定第 i项指标与第 j项指标为真高度相关。根据相关系数法,剔除C1、C2与 C9这3项评价指标。

在相关分析剔除了 3项重复指标的基础上,应用Horafa属性约简算法进一步优化指标体系,对剩余的 13项指标进行知识约简,以筛除冗余性指标,得到各准则层信息系统的最小知识表达,以该最小信息系统反映本准则层的特征。首先将无量纲数据等距离划为“1,2,3,4”四个等级,用 Visual C+ +6.0编程实现区分矩阵的构造算法,依据所构造的区分矩阵及Horafa算法流程进行冗余分析。通过粗糙集的约简分析,筛除了 3项冗余性干扰指标(C6、C13与 C16),得到如表 2所示的约简后保留属性集结果。最终,以此约简后保留属性集构成新疆和田地区优化ISAWRCC。2.3 评价检验

表2 约简后的和田地区水资源承载力评价体系

应用灰色关联度与粗糙集属性重要度耦合的评价方法,分别对新疆和田地区初始ISAWRCC和优化ISAWRCC这两套指标体系进行水资源承载力评价,以检验和分析该指标优化结果是否科学合理,评价结果如表 3所示。

2.4 结果分析

从表 3可知,不同年份研究区水资源承载力均稳定在Ⅱ级,两套指标体系评价结果基本吻合。对评价结果横向对比可知,与初始 ISAWRCC相比,优化ISAWRCC中的指标不存在高度相关指标和冗余指标。高度相关指标重复反映了评价信息,使同一指标数据的趋势在综合评价结果中得到线性增强或减弱,而通过优化的指标体系,确保了指标独立性,避免了重复信息参评。此外,优化ISAWRCC剔除了冗余指标,这改变了权重的赋予状况,使重要指标获得了更大权重。

表3 和田地区初始ISAWRCC和优化ISAWRCC评价结果

因此,可以确定和田地区优化 ISAWRCC比初始ISAWRCC评价结果更加合理,这说明通过相关分析和粗糙集进行指标体系的优化,筛除重复和干扰信息,既减少了参评指标,又得到了更合理的结果。

3 结论

(1)将定性与定量分析有机结合,提出了围绕初始、优化和评价检验三个过程进行 ISAWRCC构建的方法。

(2)提出了相关分析与粗糙集属性约简法相结合的方法,筛除指标体系中的重复和干扰信息,实现了 ISAWRCC的优化。其中,基于相关分析剔除了高度线性相关的重复指标,通过粗糙集Horafa算法进一步约简冗 余性干 扰信息,并 一定程度上确保了参评指标对评价结果有显著作用,解决了指标信息重复和干扰问题;在此基础上,基于对指标数量改变不敏感,及对指标赋权客观的需求,采用了灰色关联度与粗糙集属性重要度耦合的评价方法,进行优化结果的评价检验,为ISAWRCC的构建提供了科学合理的方法和指导。

(3)通过新疆和田地区的实例研究表明,基于相关分析与粗糙集 Horafa属性约简算法相结合的指标信息优化方案是可靠的,筛除重复和干扰信息,简化了繁杂的指标体系,降低了后续评价的计算复杂度,并且信息筛选后的优化 ISAWRCC比初始ISAWRCC评价结果更合理。 参考文献

[1]宋松柏,蔡焕杰.水资源可持续利用指标体系及评价方法研究[J].水科学进展,2003,14(05):647-652.

[2]左东启,戴树声.水资源评价指标体系研究[J].水科学进展,1996,7(04):367-373.

[3]税伟,张启春.当代美国地理学与可持续发展的理论、实践[J].地理与地理信息科学,2004,20(04):56-60.

[4]黄初龙,章光新.中国水资源可持续利用评价指标体系研究进展[J].资源科学,2006,28(02):33-40.

[5]金菊良,丁晶.区域水资源可持续利用系统评价的插值模型[J].自然资源学报,2002,17(05):610-615.

[6]邹积君,刘志文.区域水资源可持续利用指标体系的设计及评价方法研究[J].干旱区资源与环境,2003,17(01):37-40.

[7]楚文海,吴晓微.西南岩溶地区水资源可持续利用评价[J].资源科学,2008,30(03):150-156.

[8]李魏武,陶涛,邹鹰.太湖流域水资源可持续利用评价研究[J].环境科学与管理,2012,37(01):85-89.

[9]刘恒,耿雷华.区域水资源可持续利用评价指标体系的建立[J].水科学进展,2003,14(03):265-270.

[10]吴湘婷.区域水资源可持续利用水平评价指标体系研究[J].人民黄河,2007,29(06):31-33.

[11]崔东文,郭荣.基于 GRNN模型的区域水资源可持续利用评价[J].人民长江,2012,43(05):26-31.

[12]冯海霞.基于 PSR概念模型的水资源可持续利用指标体系研究[J].水资源研究,2002,23(02):13-17.

[13]周丰,郭怀成.湿润区湖泊流域水资源可持续发展评价方法[J].自然资源学报,2007,22(02):290-301.

[14]钟定胜,孙亚梅,张宏伟.水资源可持续开发的综合评价指标体系研究与应用[J].天津工业大学学报,2005,24(02):65-70.

[15]吴雪梅.基于PSO-PPE模型的和田水资源承载力评价[J].干旱地区农业研究,2014,32(02):28-233.

TV211.1

A

1672-2469(2015)08-0057-04

DO I:10.3969/j.issn.1672-2469.2015.08.019

刘玉东(1974年—)男,技术员。

猜你喜欢

和田地区约简粗糙集
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
新疆和田地区察合台文契约文书探析
实值多变量维数约简:综述
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
双论域粗糙集在故障诊断中的应用
一种改进的分布约简与最大分布约简求法
新疆和田地区管花肉苁蓉生产技术标准操作规程(SOP)