基于数据包络分析方法的城市水资源利用效率研究
2020-04-20谢启伟饶凯锋
朱 达,唐 亮,谢启伟,马 梅,饶凯锋
1 湖北大学数学与统计学院,武汉 430062 2 中科水质(无锡)环境技术有限公司,无锡 214024 3 北京工业大学经济管理学院数据挖掘实验室, 北京 100124 4 中国科学院大学资源与环境学院,北京 100049 5 中国科学院生态环境研究中心中国科学院饮用水科学与技术重点实验室,北京 100085 6 中国科学院生态环境科学研究中心环境水化学国家重点实验室,北京 100085
我国是一个缺水严重的国家。虽然淡水资源总量占全球水资源的6%,居世界第五位,但人均只有2100m3,仅为世界平均水平的1/4[1],是全球13个人均水资源最贫乏的国家之一。与此同时我国还存在水资源分布极不均匀的情况,大量淡水资源集中在南方,北方仅为南方水资源的1/4。可见,人多水少、水资源时空分布不均[2]仍是中国的基本国情和水情,要想解决我国水资源短缺与经济社会可持续发展之间的矛盾,只有提高水资源的利用效率,才能从根本上解决水资源危机。
21世纪是“城市的时代”。目前,全世界超过一半的人口生活在占全球面积不到4%的城市中,随着全球城市化的发展,到2030年,我国城市人口将超过9亿,新增的用水需求将主要集中在城市。然而我国城市却普遍缺水,几乎所有省会城市都缺水,从整体上来看全国660座城市中有400多座城市缺水,三分之二的城市存在供水不足,缺水严重的城市达110个之多,现如今水资源供需矛盾已成为制约城市发展的一个关键因素[3]。本文依据数据包络分析方法,分析各省会城市水资源消耗与经济产出情况,以期为各大城市制定贴合实际的用水制度,实现资源和经济社会的可持续发展提供定量依据。
1 水资源评价现状
现有文献通常采用模糊综合评价法[4- 5]、层次分析法[6- 7]、数据包络分析法[8- 9]、随机前沿法[10]等对水资源效率进行评价。其中数据包络分析(Data Envelopment Analysis,DEA)是一种综合考虑决策单元(Decision Making Unit,DMU)投入产出相对效率的评价方法,由于该方法无需考虑投入与产出之间的函数关系,也不用考虑投入产出量纲和数量级上的差异,而是直接通过投入与产出之间的加权和之比,来实现有效计量决策单位的投入产出效率,从而成为广泛用于决策单元效率分析的一种方法。
采用DEA方法研究水资源效率的文献有很多。例如,张家瑞等[11]基于CCR模型,对滇池流域水污染防治绩效进行了评估;贺桂珍等[12]从绩效审计的观点出发探讨了太湖周边6市环保局于2001—2005年间执行太湖水污染防治“十五”规划的相对效率;石广明等[13]结合Malmquist指数,动态研究了1999年至2005年我国31个省、市、自治区工业用水效率情况;陈磊等[14]针对兼具复杂内部结构和非期望要素的生产系统,提出了基于合作博弈的两阶段模型,并对中国各地区工业生产系统水环境效率进行了评价分析;Wang等[15]提出了具有不良产出的DEA方法,并利用DEA-tobit模型对我国30个省份用水效率进行了研究。
然而上述文献虽然从DEA模型或时间维度上对水资源效率进行了不同角度的探究,但对于初始的投入产出指标体系却没有给出量化解释,缺乏说服力。由于DEA结果严重依赖于分析中使用的输入输出变量集,而合理的指标体系应统筹兼顾定性(现实意义)与定量(实验认证)两个方面。Niranjan等[16]总结了8种量化选择的方法并用蒙特卡洛模拟重点比较了其中四种方法的优缺点:包括效率贡献测度[17]、主成分分析法[18]、回归分析法[19]、Bootstrap方法[20]。其中效率贡献测度与回归分析法的结果易受到变量间多重共线性的影响;主成分分析法一般仅取两个主成分即可代表原始变量85%以上的信息,这与实际的DEA模型不符;Bootstrap方法因其检验程序的复杂性导致软件计算时间过长,不符合一般应用需求。此外这些方法还有一个共同的缺点:即每次仅测试一个变量的重要性,没有考虑变量之间的组合影响,这可能会使变量选择结果不稳定。本文采用Li等[21]提出的AIC变量选择法建立科学的指标体系,其优势在于考虑了投入产出间的所有变量组合,结合AIC优化准则[22],剔除了投入产出内部信息冗余的变量,其结果具有稳定性与有效性。
2 用水效率分析框架与评价方法
2.1 分析框架
本文旨在运用DEA方法评价中国省会城市水资源效率问题,并从各地方经济水平与水资源环境两个角度出发提供细节性节水建议。其创新点在于引入了AIC变量选择方法,从定性与定量两个角度构建了合理的指标体系,且结合香农熵指数[23]弥补了变量选择带来的识别能力问题。下图1为具体分析框架。
图1 省会城市水资源效率分析框架Fig.1 Analysis framework of water resource efficiency in provincial capitals
2.2 评价方法
2.2.1传统DEA模型:CCR模型
数据包络分析是Charnes等[24]提出的用来评价同类部门或单位相对有效性的决策方法,以DEA中具有代表性的规模报酬不变、输入为导向的模型CCR为例。假定有n个独立的DMU,并且每个DMUj(j∈N={1,2,…,n})消耗m种投入xij(i∈M={1,2,…,m})得到s种产出yrj(r∈S={1,2,…,s})。
(1)
式中,μr和νi分别是附加到第r个输出和第i个输入的未知乘数,E0(M,S)是DMU0考虑到初始输入变量集M和输出变量集S的最优效率,若E0(M,S)=1,则称DMU0为DEA有效。如果在目标函数与第一个约束左侧加入一个任意的μ0值,模型(1)将会变成规模收益可变的BCC(由Banker R D,Charnes A,Cooper W W提出)模型[25]。
2.2.2AIC变量选择
Akaike基于极大似然估计理论首先制定了AIC信息准则[22],用于不同变量间统计模型的比较,且规定AIC值越小说明模型越好。Li等[21]将AIC准则代入CCR模型中,将CCR效率得分看作因变量,输入与输出变量看作自变量,得到如下线性回归方程(2)式。
(2)
AIC(P,Q)=-3ln[MLE(P,Q)]+2(|P|+|Q|)
(3)
式中,ln[MLE(P,Q)]是基于模型(2)极大似然估计的自然对数变换,|P|和|Q|分别表示为子集P与Q中的变量个数。事实上,2(|P|+|Q|)可以理解为AIC变量选择的惩罚项,其选择的变量越多,识别能力越弱,AIC(P,Q)值越小,模型冗余信息越少,模型越显著。
2.2.3香农熵指数提高识别能力
将输入子集P和输出子集Q的不同组合数设为K,则K=(2p-1)(2q-1),设第k个变量组合为Mk,模型集合为Ω={M1,M2,…,Mk}。基于Mk定义DMUj的效率得分(CCR模型条件下)为Ek,j=1,…,n,k=1,…,K。计算模型(1)K次,可得到如下效率矩阵[Ejk]n×k:
(4)
计算综合效率得分步骤[23](模型5)如下:
①基于模型(1)计算所有可选择的变量组合的效率矩阵[Ejk]n×k
(5)
④计算Mk组合中的多样化程度(区分能力),dk=1-fk,k=1,2,…,K
3 评价指标体系与数据来源
综合考虑社会、经济、生态、环境与数据可得到性等因素的影响,分别从农业指标、工业指标、生活指标以及社会指标来对2016年我国31个省会城市的水资源效率情况进行评价,具体指标体系[9- 14,26]见表1。数据来源于《中国城市统计年鉴》以及各地方水利局水资源公报。
表1 初始输入输出指标体系
4 结果分析
4.1 AIC变量选择结果
基于这篇文章研究的是用水效率问题,用水量是必不可少的输入指标,考虑到农业、工业、生活是三个截然不同的经济过程,选择在输入指标中固定选入农业、工业与生活用水量指标,得到初始输入集合M与输出集合S的不同组合数为:K=(22-1)(26-1)=189。由于篇幅有限,我们以AIC值的升序排列后选取了前10位变量组合列表(见表2),其中“0”、“1”分别表示该变量“未选入”与“选入”变量组合。
显然,组合M1包含变量X1—X5、Y2—Y6时,获得最小的AIC估计值(-49.4962),这说明此时组合内冗余信息最少,变量的重要性程度最高,模型效果最好。同时观察输入指标X4—X5与输出指标Y1—Y3的选取,发现“都选”普遍比“只选一个”的AIC值要小,说明它们对变量体系效率值的联合影响是大于自身的独立影响的,这也呼应了产出变量Y1、Y2、Y3与投入变量X1、X2、X3之间相互匹配的实际经济含义。
4.2 主要城市的用水现状
根据上表2中组合M1,得到了AIC变量选择后的输入输出指标体系。图2、图3、图4反映的是中国各省会城市投入与产出间的对比关系。
从生活用水上来看,北京、上海、重庆的用水量较大,西北地区与部分西南地区城市用水量很少,其余城市生活用水量差距并不明显,这主要与城市常住人口有关,其生活用水量与劳动力基本呈现正比关系;从工业用水量来看,上海、南京、重庆等地消耗最为明显,东南地区与成都等地工业用水量普遍较大,而西北地区与部分西南地区城市工业用水量极少,这与当地工业发展水平与经济技术条件是相匹配的;从农业用水量来看,哈尔滨与乌鲁木齐位居前列,而东南地区与西南部分地区农业用水量也相对较高。总体而言,整体耗水量大的城市集中在中国东南部与重庆、成都等城市,在这些城市中,经济更加发达,固定资产投入较高,人口密度较大,水资源也相对较为丰富,因此用水量也随之增加。
表2 AIC变量选择结果
X1:农业用水量(100 million cu.m);X2:工业用水量(100 million cu.m);X3:生活用水量(100 million cu.m);X4:劳动力(Ten thousand people);X5:固定资产(100 million yuan);Y1:农、林、牧、渔业总产值(100 million yuan);Y2:工业总产值(100 million yuan);Y3:生活污水集中处理率(%);Y4:人均GDP(100 million yuan);Y5:地方财政一般预算内收入(100 million yuan);Y6:居民平均工资(yuan);AIC:赤池信息准则(Akaike information criterion),用于衡量统计模型拟合优良性
图2 各省会城市用水量Fig.2 Water consumption of provincial capitals
图3与图4分别代表用水指标与社会指标投入产生的经济效益,其中,从农、林、牧、渔业总产值来看,重庆、成都的产值较高,而哈尔滨与乌鲁木齐的农业产值却与其农业用水投入量不相匹配,这说明落后的经济市场与技术水平可能导致水资源的大量浪费;从工业总产值与地方财政一般预算内收入来看,依次为北京、天津、上海、重庆四地遥遥领先于其他城市,且东南地区的财政收入与工业总产值普遍比西北地区与西南部分地区城市要高出很多,这与城市实际经济水平是相吻合的;从生活污水集中处理率来看,南京、南宁、西宁这三个城市显著低于其他城市,说明当地政府对于居民生活用水保障以及城市污水处理不够重视,这可能会造成当地生活用水污染与水资源的极大浪费;从居民的平均工资来看,除北京、上海、拉萨外,其他城市差距并不明显,这里应注意西北地区及拉萨、昆明、贵阳等西南地区城市,虽然这些城市GDP普遍不高,但其人均居民工资却一直处于全国中游以上的水平。
图3 用水指标输出效益Fig.3 Output benefit of water consumption index
图4 社会指标输出效益Fig.4 Output benefit of social indicator
综合考虑图2、3、4,相比于北京、天津的投入产出数据,重庆、成都具有典型的高投入、低产出的特点,这些特点也可以从相对较低投入的城市南宁、西宁等城市看出。此外,也存在如拉萨、银川、海口等地相对较低投入,较高产出的城市。
4.3 水资源效率分析
以表2中组合M1选定的输入输出指标体系,计算31个主要城市的综合效率,且通过模型(5)计算综合效率得分(CES)并排序,同时,为了进一步分析,采用有序聚类分析的方法按照人均GDP的高低将我国31个省会城市分为三类:经济发达地区、中等发达地区、欠发达地区;根据人均水资源量的多少分为五类:极度缺水(<500m3/a)、重度缺水(500—1000m3/a)、中度缺水(1000—2000m3/a)、轻度缺水(2000—3000m3/a)、暂不缺水(>3000m3/a)(依据国际公认的缺水指标),得到表3。
表3 我国31个省会城市的水资源利用效率
CCR效率:由Charnes A,Cooper W W, Rhodes E X[24]提出的传统DEA模型效率值;CES:综合效率得分(Comprehensive efficiency score)[23]
4.3.1水资源投入产出分析
(1)从综合效率的角度来看,共有19个城市的水资源投入产出达到最佳状态,占比61.29%,而其他非DEA有效的城市水资源效率也均在0.7以上,分析其原因:一方面,AIC变量选择时会剔除掉变量组合中信息冗余的变量,得到显著有效的最优变量组合,所以各大城市的效率值普遍提升;另一方面,DEA模型中当选入模型变量增多时,会使DMUs的效率值增高,从而扩展出一类有效的决策单元,导致辨识能力降低。在这种情况下,很难对各大城市的水资源效率进行合理有效的比较与评估。
(2)从CES得分的角度来看,31个城市CES效率得分大致服从正态分布,且形成了一个完整的排名,有效的将各城市水资源效率区分开来。其中绝大多数城市的CES得分都在0.6以下,最高效率值为0.8244,相比于CCR模型,效率值普遍下降。分析其原因:CES得分考虑了变量指标体系的所有组合的效率值,而不是单指表2中输入输出,其结果更具有稳定性且更加困难达到DEA有效(当且仅当某决策单元在所有变量组合中均为DEA有效时,此决策单元CES得分才为1)。因此,以CES得分进行水资源效率的比较与评估将更具有可行性与合理性。
表4 CES得分排名与对应经济水平
(3)从CES得分排名与经济水平的角度来看(表4),排名前10的城市中,既有经济发达的城市,如北京、天津、上海;也有经济中等发达的城市,如太原、沈阳;还有经济欠发达的城市,如海口、拉萨,在11—20与21—31的排名范围内也近乎均匀的涵盖了这三种经济水平,这说明了一个城市水资源利用效率的高低与经济发展水平可能没有必然的联系。
表5 CES得分排名与对应缺水情况
(4)从CES得分排名与缺水状况的角度来看(表5),极度缺水的城市CES排名往往靠前,水资源较丰富的城市CES得分排名反而靠后。如南宁市2016年人均水资源量达1620m3/a,居省会城市第6位;重庆市每平方公里水面积居全国第一,人均水资源居省会城市第5位;南昌市全市水域面积达2204.37km2,占29.78%,在全国省会以上城市中排进前三位。而南宁、重庆、南昌市CES得分排名分别位列倒数第一、二、三位,这说明南宁、重庆、南昌等地虽然具有得天独厚的丰富水资源,但其投入并未带来相应的产出,可能存在大量的浪费现象。相反在极度缺水城市中,如北方地区北京、石家庄,西北地区银川、兰州等地区虽然常年缺水,但其水资源利用效率却比重庆、长沙等地要高,说明这些缺水地区均很重视水资源的高效利用,真正做到了用好每一滴水。这也与清华大学国情研究中心课题组的研究结论不谋而合[27]。他们认为,水资源可获得性与水资源利用效率成反比关系,越是易于获取且水资源丰富的地区,水资源利用效率越低;而在水资源匮乏的地区,水资源获取难度越大,取水成本越高,水资源利用效率越高。
4.3.2提高水资源利用效率的对策建议
(1)同经济条件的城市中,用水效率较低的城市应向CES得分靠前的城市学习
经济发达的城市如武汉、长沙等地可向北京、天津学习,充分利用自身经济与技术人才优势,开发新型节水设备,学习国外先进滴灌养殖技术,给予企业单位节水减排等政策与技术支持;中等发达地区如南昌、成都等地可向济南、太原学习,采取经济发展与节水减排并行政策,结合自身产业优势,着重发展当地高产低耗企业;经济欠发达地区如西宁、兰州等地区可以向拉萨、海口学习:如拉萨针对其发达的支柱产业农牧业,采用符合其降雨条件的滴灌农业与旱地农业相结合的方法,通过农艺节水、生理节水、管理节水、工程节水等方法实现了低投入,高产出的节水农业生产链。
(2)同水资源条件的城市中,用水效率较低的城市也应向CES得分靠前的城市借鉴经验
对于水资源储量较丰富的城市,如长沙、福州等地,应向拉萨、海口地区学习优秀的农牧业与水产养殖业节水技术,建立起良好的节水机制,尽可能减少水资源的无效投入,同时,应考虑如何将自身优势转化为产出。一方面可以考虑加大水产养殖、水力发电、旅游文化等方面的投入与利用,优化产业结构,另一方面应保护好水质,减少污染,加强水资源的开发管理力度。
对于水资源稀缺的城市如石家庄、成都、西安等地,应向北京、天津学习如何开源节流、治理同行。一方面要积极寻找优质水源,如南水北调工程、海水淡化技术、雨水收集技术、污水处理再循环技术等,同时也要积极向民众宣传节水意识、可以适当提高水价或采用阶层水价、控制公共场所用水量、减少景观用水、提高水资源的重复使用率等;另一方面应加强水资源的统一管理,对水资源储量的评估、水质的检测、水资源的开发监控等工作,应由各市政府牵头,水利局负责、质检局、财务局、公安局等部门通力合作,依据《中华人民共和国环境保护法》、《中华人民共和国水污染防治法》等相关法律条例,保证水资源的合理开发,限制水资源的不合理利用,减少对水资源的污染。
(3)各大城市要加强交流,建立城际对口帮扶体系,取长补短,互通有无。经济发达或水资源丰富的城市应从大局长远发展考虑,踊跃提供经济欠发达城市财力与技术支持,并积极响应国家“南水北调”工程,齐心协力,携手并进,共同解决我国水资源短缺这一可持续发展难题。
5 结语
鉴于大部分文献在变量选择体系方面的缺失以及传统模型在效率识别能力上的不足,本文采用了AIC变量选择方法以及香农熵指数选择了合适的变量指标体系并提升了传统模型的识别能力,给出了31个省会城市水资源利用效率的完整排名,并对其进行了分析与评价。从方法的选用上来看,AIC变量选择法、数据包络分析与香农熵指数正好可以实现优劣势互补,三种方法结合使用是文章的一个创新点,不仅充分考虑了大量的输入输出变量,使得分析更加贴合实际,分析结果有理可依,同时AIC准则得到的变量指标体系也极好的符合了实际水资源利用效率的含义,最后香农熵指数法弥补了AIC准则带来的传统DEA模型识别力差的问题。文章最后给出了相应的结论和建议,从城市经济水平与水资源情况两个角度建立了城际学习体系,对各大城市部门制定符合实际的水资源战略与政策,优化自身产业结构,同时加快科技节水步伐,减少环境污染,实现资源和经济社会的可持续发展具有现实的指导意义。