APP下载

基于最大互信息系数的城市节水驱动因素分析

2023-01-30武利园潘宇霖陈开宇郭朋朋李海燕

人民黄河 2023年1期
关键词:关联性水量节水

武利园,潘宇霖,陈开宇,郭朋朋,李海燕,金 弈

(1.北京建筑大学 环境与能源工程学院,北京 102616;2.北京建筑大学 城市雨水系统与水环境教育部重点实验室,北京 102616;3.中国电建集团 北京勘测设计研究院有限公司,北京 100084)

1 引 言

作为基础性的自然资源和战略性的经济资源,水资源在国民经济和国家安全中具有重要的战略地位[1]。加强水资源节约、保护和管理是推进水资源可持续利用、实现经济社会高质量发展的重要保障,而水资源高效配置、水循环多维均衡调控需要系统考量自然-社会复合影响[2]。随着经济社会的发展,水资源分布及利用方式因产业结构、人口、城市发展与建设、自然生态环境等因素的变化而不断调整,水资源节约管理政策的区域适用性、时空动态性和复杂性特征日趋明显。节水评价体系作为地区节水考核管理的依据,对地方节水工作具有重要的指导作用。现有节水评价体系研究多基于综合决策评价方法,如层次分析法[3]、模糊综合评价[4]、主成分分析法等[5],在优化现行节水评价标准体系的基础上针对不同区域节水成效进行评估。节水评价体系的核心在于评价指标的选取以及权重的赋值,有针对性的指标选取是实现节水地域差异化管理的基础,但已有研究中评价指标的选取多依赖主观经验,可靠性不足,缺乏科学依据。一方面,在自然-社会二元水循环中,各指标间并非完全独立,而是存在复杂的相互作用,这在一定程度上限制了普通统计学或经济学方法的效力;另一方面,数据的可获得性也制约了方法的适用性[6],因此有必要使用新的方法探明城市水循环中各指标间的深层次关系,为有针对性选取地区差异化节水管理指标提供依据。最大互信息系数(MIC)方法由Reshef等[7]于2011年提出,相比传统方法具有普适性、公平性等特点,具体包括:①对复杂系统的适应性,可以识别变量之间的非线性关系甚至非函数关系;②高泛化能力,对不完整或者有噪声的数据具有抗干扰性;③分析先验信息的潜力;④可以分析不同类型的数据且不需要对数据统计分布(例如正态性)做假设。MIC方法在探究数据间的关联性方面有着优异的性能,常用于复杂系统中重要指标的识别,机器学习、深度学习建模中关键特征的选取,如大气腐蚀钢铁因素识别[8]、珠江三角洲海水侵蚀建模[9]、珠江溶解氧浓度预测指标选取[10]、居民心理健康环境影响因素筛选[11]、铁路事故发生关键因素挖掘[12]、短期电价预测指标选取[13]等。

本研究采用MIC方法,在分析2006—2018年北京、天津、山东、山西、河北、河南6个省(市)城市用水、节水时空演变规律的基础上,综合考虑自然-社会二元复合影响,结合现行节水评价方法与标准,参考用水效率[14]、节水评价[15]、节水潜力[16]、用水驱动因素分解[17]、水足迹[18]等相关研究,选取节水指标、供用水规模、供用水条件、水处理指标、用水效率、地区基本条件6大类共23项可量化指标,分析各指标之间潜在关联情况,以期为城市节水行动规划、节水评价体系建立等提供参考。

2 指标选取和研究方法

2.1 研究区概况

选取北京、天津、山东、山西、河北、河南6个省(市)作为研究区。该地区水资源短缺,经济发展受水资源胁迫较大[19],节水需求迫切。该地区各城市间产业结构、人口分布、经济规模、自然禀赋等均存在较大差异,对节水政策区域差异化管理的精度要求较高,选择该地区研究城市节水驱动因素具有代表性。

2.2 指标选取

本文以城市节水驱动因素为研究对象,以《城市节水评价标准》(GB/T 51083—2015)、《国家节水型城市考核标准》(建城〔2018〕25号)为依据,兼顾数据可获得性,选取节水评价指标,见表1。

表1 节水评价指标

2.3 数据来源

本文所用数据均来源于2006—2018年《中国城市统计年鉴》《中国城市建设统计年鉴》、研究区各省(市)的水资源公报以及国家统计局官网。统计范围为研究区的县(市)城区,城市节约用水量指通过采用各项节水措施(如改进生产工艺、技术、生产设备、用水方式,换装节水器具、加强管理等)节约的水量,不涉及农业节水量。

2.4 研究方法

采用MIC方法对表1的23项指标进行数据关联度分析,考察其与节水指标的关联强度及各指标内部关系。互信息在信息论中代表一种有用的信息度量,表示一个随机变量对于另一个随机变量所包含的信息量,也可以理解为因一个随机变量的确定而降低了另一个随机变量的不确定性[20]。互信息计算公式为

式中:I(X,Y)为变量X、Y的互信息;P(x,y)为X、Y的联合密度函数;P(x)、P(y)分别为X、Y的边缘密度函数。

将有限数据集D(X,Y)构成的散点图按照X轴和Y轴进行x行y列网格化,从而得到x×y的网格G,用D|G表示数据集D在网格G上的分布(即概率密度),可由落入网格G的点在数据集D中所占的比例求得,不同的网格G划分方法会得到不同的D|G概率分布。计算其不同分布下的互信息,并取最大值:

式中:I∗(D,x,y)为按x×y划分网格的最大互信息值。

为便于在不同单位或量级的数据之间进行比较和分析,对数据进行归一化处理:

式中:M(D)x,y为归一化处理后的I∗(D,x,y)。

不同x×y取值划分网格所得M(D)x,y的最大值即为变量X、Y之间的最大互信息系数(MIC值):

式中:B(n)为所划分网格数的上限;n为数据集样本数量。

B(n)太高会使结果趋于保守,B(n)太低会削弱检索复杂关系的能力。根据Reshef等[7]的实证检验:B(n)=nα,参数α由样本量决定,本研究取α=0.75。MIC值反映两个变量之间的关联程度,取值范围为0~1,当MIC值趋于0时可认为两变量关联程度极弱或不存在,当MIC值趋于1时可认为两变量关联程度极高。

3 分析与讨论

3.1 用水时空演变规律分析

根据《中国城市建设统计年鉴》,将城区用水分为城区生产运营用水、公共服务用水、居民家庭用水、其他用水(主要为消防用水)。研究区2006—2018年用水量与用水结构变化趋势如图1所示。研究区用水总量均呈增长趋势,北京、山东、天津年均增幅较大,分别为2.52%、3.07%、2.48%;用水结构总体呈现由以生产运营用水为主向以居民家庭生活用水为主转变的趋势;北京、天津、山西、河南、河北5个省(市)居民家庭用水比重呈上升趋势,生产运营用水比重呈下降趋势;山东用水结构基本稳定,生产经营用水和居民家庭用水维持同步增长趋势。

图1 2006—2018年研究区用水变化趋势

3.2 节水时空演变规律分析

2006—2018年研究区节水变化趋势如图2所示。整体来看,近年来研究区节水发展速度放缓,除河南外其他省(市)均陷入滞涨,节水发展进入瓶颈期;从节水组成来看,研究区以工业节水为主,但近年来非工业节水量在总节水量中的占比逐渐提升,重要性日益凸显。此外,研究区节水存在显著地域差异。在节水量方面,河南近年来发展态势良好,各行业节水量稳步增长;山西节水发展平稳,多年来节水量变化不大;其他4个省(市)节水发展均有所滞缓,节水量波动下降。节水组成方面,除北京外其他省(市)均以工业节水为主,2006—2018年北京非工业节水量在总节水量中占比最高,年平均值为85.4%;河北非工业节水量在总节水量中年平均占比最低,为8.8%。从年均节水量占比来看,尽管河北、山西等省(市)近年来工业节水量占比有所增大,但研究区整体上仍呈现工业节水量占比减小、非工业节水量占比增大趋势。同时,节水量占比存在明显时空差异性,如北京2006—2009年、河南2015—2017年非工业节水量占比减小,河南2007—2015年工业节水量占比增大,而山东2011—2018年、河北2009—2015年工业节水量占比减小;其他省(市)工业和非工业节水量占比没有明显规律。

图2 2006—2018年研究区节水变化趋势

3.3 基于MIC方法的指标关联性分析

在分析2006—2018年研究区用水和节水变化趋势的基础上,对节水指标、供用水规模、用水效率等6类指标进行MIC分析,深入分析各指标之间的潜在关联性,结果见图3。

(1)相对于非工业节水量(MIC=0.657),工业节水量与节水总量关联性更强(MIC=0.810)。由图3可知,现阶段研究区仍以工业节水为主。节水指标与供用水规模和地区基本条件关联性均较高,节水总量与地区人口关联更为紧密(MIC=0.706);工业节水量与各种用水量均关联紧密,非工业节水量与生活供水(MIC=0.834)和生活用水(MIC=0.768)的相关性均较强,说明总节水量与地区人口高度相关,工业节水量与用水规模高度相关,非工业节水与生活供用水规模高度相关。可以预见,随着社会发展和产业转型升级,生活用水量占总用水量的比重将逐渐提高,生活节水尤为关键。

图3 6类指标MIC关联性分析结果

(2)供用水规模中除环境用水外各指标间MIC值均较大,关联性强。其中:生活供水量与供水管道长度之间MIC高达0.969,漏损水量也与供用水规模尤其是生活供用水量密切相关(漏损水量与供水量MIC=0.871,漏损水量与用水量MIC=0.918)。漏损率与供用水规模之间的关联性较弱,关联强度远低于漏损水量的,这可能与研究期内研究区供水管网漏损控制没有明显改善、漏损率波动较小有关。

(3)水处理指标中废水排放量与各供用水指标呈强关联性;污水处理量与生活供用水量、供水条件、地区生产总值、地区人口等密切相关;再生水利用相关指标与各类指标之间的关联性均较弱,原因可能是研究期内研究区再生水利用水平较低、与地区经济发展和城市基础设施建设水平不匹配[21]。

(4)用水效率指标中除万元工业增加值用水量与节水总量存在一定关联性(MIC=0.579)外,与其他指标关联性均不强。万元工业增加值用水量通常代表工业用水综合效率,其与生产工艺、节水技术、管理水平、城市产业结构以及产值计算方法等有关,因此这一指标仅能反映工业用水的经济效率,而无法准确反映工业用水技术效率。结合工业用水重复率这一指标进行对比分析,发现工业用水重复率与节水指标之间关联性极弱(MIC=0.312)。可见,研究期内节水技术的进步并非工业节水的主要驱动因素,结合研究区经济发展变化趋势,推测更关键的驱动因素是企业管理水平提高、产业结构调整等。左其亭等[22]梳理了我国工业节水现状以及不足,刘洋等[23]建立了线性回归模型分析京津冀地区产业结构与用水结构的关系,以上研究均表明研究区工业用水综合效率的提升主要与产业结构转型升级有关。此外,用水效率与地区人口、经济和自然禀赋等指标均无较强的相关性,表明经济发展水平差异对节水技术的普及影响较小,并且人口聚集和资源胁迫对节水技术发展的促进有限。

(5)地区基本条件中人口规模对节水发展的影响更突出,地区人口与除用水效率外的各类指标均呈现较强的关联性,一定程度上反映了人口规模对城市水循环存在较大影响。地区生产总值与供用水规模、条件以及水处理关联较为紧密,表明城市供用水系统建设与经济发展水平高度相关,结合供用水规模与水处理指标的高度相关性,可以推测研究期研究区已经建立了与经济规模高度匹配的供用水系统和污废水处理系统。人均水资源量仅与用水指标、工业节水量等少数指标存在一定的关联性,与大部分指标关联性极弱或不存在关联,表明水资源自然禀赋不是制约地区节水发展甚至城市水循环的主要因素,在自然-社会二元水循环中,社会因素作用更为显著。需要指出的是,这一解释仅基于人均水资源量,未考虑水质和水资源结构等因素。

4 结 论

2006—2018年研究区用水总量均呈增长趋势,用水结构由以生产运营用水为主向以居民家庭生活用水为主转变,居民家庭用水比重呈上升趋势,生产运营用水比重呈下降趋势。供用水规模以及水处理指标中部分指标间关联紧密,一定程度上表明研究区已经建立了与经济规模较高匹配的供用水系统和污废水处理系统。节水发展增速放缓,除河南外其他省(市)均陷入滞涨,节水发展进入瓶颈期,非工业节水比重逐年增加,节水组成结构由以工业节水为主导向工业与非工业节水共同贡献转变。基于MIC的指标关联性分析,发现研究区节水技术的进步并非工业节水的主要驱动因素,推动工业节水发展更有可能源于产业结构调整带来的工业用水综合效率提升;地区人口规模和经济发展水平与节水发展的关联性强于人均水资源量与节水量的关联性;城市自然-社会二元水循环中,社会因素影响效果更为显著。尽管现阶段研究区节水以工业节水为主,但随着经济转型发展,用水结构改变,生活节水将在未来社会整体节水发展中占据更重要的地位。生活节水应在未来得到更多的重视,尤其是城镇公共供水管网漏损率和再生水利用水平与现发展阶段不匹配,仍有较大提升空间,应成为未来研究区节水政策区域差异化管理的重点管控指标。

猜你喜欢

关联性水量节水
坚持节水
小水量超纯水制备系统的最佳工艺选择
节水公益广告
节水公益广告
节水公益广告
四物汤有效成分的关联性分析
基于水力压裂钻孔的注水量及压裂半径的应用研究
如何准确认定排污行为和环境损害之间的关联性
CRP检测与新生儿感染的关联性
抗磨白口铸铁化学成分自关联性分析